diff --git a/paper/latex/chapters/requirement.tex b/paper/latex/chapters/requirement.tex index 072dd9b..169c842 100644 --- a/paper/latex/chapters/requirement.tex +++ b/paper/latex/chapters/requirement.tex @@ -14,7 +14,7 @@ 训练语料生成功能是整个框架的基础。该功能需要选用具备强大长文本生成能力的大参数量模型,例如 GLM4-LONG 或 qwen-max-longcontext,通过对指定格式的 Markdown 技术文档进行深度解析,系统能够准确抽取其中的标题、段落、代码块等关键信息,并生成对应的提示词。随后,通过预设的算法或规则,将提取的提示词转换为适合模型输入的格式,最终生成高质量且覆盖广泛技术领域和编程场景的训练语料库,以确保其数量和质量能够满足后续模型训练的需求。 \subsubsection{模型微调功能} -模型微调功能是提升模型在私有库代码生成能力的关键。本框架计划以 qwen 模型作为微调基础,采用 Qlora 训练方法。利用上一步生成的训练语料对该模型进行有针对性的微调,使其学习将输入的提示词转化为符合语法规则和逻辑的代码片段。为了验证微调效果,需要通过一系列评估指标,如 BLEU 分数、代码执行成功率以及人工评估等,对微调后的模型在特定技术文档相关代码生成任务上的性能进行全面验证,确保其有效性和实用性。 +模型微调功能是提升模型在私有库代码生成能力的关键。本框架计划以 qwen 模型作为微调基础,采用 Qlora 训练方法。利用上一步生成的训练语料对该模型进行有针对性的微调,使其学习将输入的提示词转化为符合语法规则和逻辑的代码片段。 \subsubsection{数据持久化功能}