diff --git a/paper/latex/chapters/requirement.tex b/paper/latex/chapters/requirement.tex index 169c842..0548afd 100644 --- a/paper/latex/chapters/requirement.tex +++ b/paper/latex/chapters/requirement.tex @@ -18,7 +18,7 @@ \subsubsection{数据持久化功能} -为了确保系统的稳定性、可配置性以及训练过程的可追溯和模型的可复用,本框架需要实现全面的数据持久化功能。这主要包括配置信息的持久化、训练与评估数据集的持久化以及训练后模型的持久化。针对不同的数据特性,将采用混合存储策略,利用关系型数据库存储结构化的配置参数和元数据,例如api配置信息。同时,非结构化或半结构化的数据,例如生成的训练语料、经过处理的技术文档内容,将采用文档型数据库或文件存储的方式进行持久化,以便于灵活存储和快速读取。同时,模型需要支持多种持久化方式,例如单独导出Lora适配器、导出gguf格式模型、导出量化后的模型等。通过有效的数据持久化机制,可以方便地加载历史配置以复现实验、管理和版本控制不同的数据集、以及存储和调用微调后的模型,从而提升整个框架的可用性和效率。 +为了确保系统的稳定性、可配置性以及训练过程的可追溯和模型的可复用,本框架需要实现全面的数据持久化功能。这主要包括配置信息的持久化、训练与评估数据集的持久化以及训练后模型的持久化。针对不同的数据特性,将采用混合存储策略,利用关系型数据库存储结构化的配置参数和元数据,例如API配置信息。同时,非结构化或半结构化的数据,例如生成的训练语料、经过处理的技术文档内容,将采用文档型数据库或文件存储的方式进行持久化,以便于灵活存储和快速读取。同时,模型需要支持多种持久化方式,例如单独导出Lora适配器、导出gguf格式模型、导出量化后的模型等。通过有效的数据持久化机制,可以方便地加载历史配置以复现实验、管理和版本控制不同的数据集、以及存储和调用微调后的模型,从而提升整个框架的可用性和效率。 \subsubsection{前端展示功能} diff --git a/paper/latex/chapters/verification.tex b/paper/latex/chapters/verification.tex index aa2627a..20c9251 100644 --- a/paper/latex/chapters/verification.tex +++ b/paper/latex/chapters/verification.tex @@ -60,7 +60,7 @@ \item 开源许可:采用MIT许可协议,允许学术研究。 \end{itemize} -数据集生成模型通过deepseek ai官方api调用,具体的生成参数如下: +数据集生成模型通过deepseek ai官方API调用,具体的生成参数如下: \begin{itemize} \item temperature:0.9 \item max\_length:4096