carry
|
7bd6d2feab
|
docs(verification): 添加实验结果验证章节的详细内容
本章节详细描述了实验环境、实验对象、微调过程中的资源占用和指标变化,以及微调效果的验证。通过文档驱动的自适应微调,成功将通用大语言模型定向优化为具备企业特定代码生成能力的专用模型,验证了框架的有效性。
|
2025-04-27 21:48:17 +08:00 |
|
carry
|
d632029724
|
docs(paper): 更新论文结构安排,增加第五章结果验证
本文结构安排中新增第五章结果验证,详细描述了实验环境、对象、资源占用、训练指标变化以及微调效果的全面验证,证明了框架的有效性和实用价值
|
2025-04-27 18:07:56 +08:00 |
|
carry
|
c6cc73f813
|
docs(paper): 添加验证章节到主文档
在`main.tex`中新增了`verification.tex`章节,用于描述实验设置、评估指标及实验结果与分析,以完善论文结构。
|
2025-04-27 17:56:21 +08:00 |
|
carry
|
47014a6d43
|
docs(paper): 添加验证章节到主文档
在`main.tex`中新增了`verification.tex`章节,用于描述实验设置、评估指标及实验结果与分析,以完善论文结构。
|
2025-04-27 17:38:14 +08:00 |
|
carry
|
ccfc81c1f1
|
docs(paper): 移动监督式微调章节至技术章节并更新训练参数描述
将监督式微调(SFT)概述从实现章节移至技术章节,以更好地组织内容结构。同时更新训练参数描述,修正学习率字段的格式,确保文档一致性和准确性。
|
2025-04-27 17:34:19 +08:00 |
|
carry
|
e8107519ed
|
docs: 删除模型微调功能描述中的冗余内容
删除“模型微调功能”部分中关于验证微调效果的描述,以简化文档内容并提高可读性。
|
2025-04-27 17:00:41 +08:00 |
|
carry
|
2362e43d38
|
docs(technology): 添加模型量化技术的数学公式和详细解释
在技术章节中,补充了模型量化技术的数学公式和详细解释,包括量化过程、反量化过程、量化误差分析以及不同量化技术(如 PTQ、QAT、权重共享等)的具体实现方法。这些补充内容有助于读者更深入地理解模型量化的原理和应用。
|
2025-04-27 17:00:10 +08:00 |
|
carry
|
6dbe9514fb
|
docs(latex): 添加amssymb包并更新技术章节的数学公式
在main.tex中添加amssymb包以支持数学符号,并在technology.tex中补充LoRA的数学原理公式,详细解释了低秩更新的参数减少机制。
|
2025-04-27 14:50:35 +08:00 |
|
carry
|
585f470403
|
docs: 更新第一章绪论内容,精简研究现状部分
删除冗余内容,聚焦大语言模型微调、AI辅助编码和提示工程的研究现状,优化文档结构以提高可读性
|
2025-04-27 01:04:52 +08:00 |
|
carry
|
a94e14831e
|
docs(致谢): 更新致谢章节内容并调整署名
更新了致谢章节的内容,使其更加详细和富有情感,同时调整了署名和日期以反映最新信息。
|
2025-04-26 23:42:57 +08:00 |
|
carry
|
4141e09494
|
docs: 更新引言章节,优化研究现状描述
调整了“国内外研究现状”部分的结构,新增了关于大语言模型微调、2B领域应用、AI辅助编码及提示工程的研究现状描述,使内容更加全面和清晰。
|
2025-04-26 01:58:57 +08:00 |
|
carry
|
634ce8fff8
|
docs: 更新论文摘要和关键词内容
更新了中英文摘要部分,增加了对基于文档驱动的自适应编码大模型微调框架的详细描述,包括核心创新点、技术实现和实验效果。同时更新了关键词列表,以更全面地反映论文内容。
|
2025-04-26 01:58:30 +08:00 |
|
carry
|
75bc9a76d0
|
docs: 更新论文相关章节的LaTeX和Markdown文件
更新了论文的LaTeX和Markdown文件,包括绪论、相关技术介绍、需求分析、关键技术实现、总结与展望等章节。新增了详细的Markdown文件,涵盖了各章节的内容,并对LaTeX文件进行了相应的修改和补充,确保内容一致性和完整性。
|
2025-04-26 01:07:09 +08:00 |
|
carry
|
4a67c20b70
|
docs: 添加并更新论文章节文件
添加了新的章节文件:相关技术介绍、需求分析、关键技术实现,并更新了总结与展望章节的内容。同时在主文件中引入了这些新章节,确保论文结构完整。
|
2025-04-25 20:59:10 +08:00 |
|
carry
|
d210ddcca9
|
docs(paper): 更新引言章节内容,增加研究背景与意义、国内外研究现状等详细描述
本次提交对引言章节进行了大幅更新,增加了研究背景与意义、国内外研究现状等内容的详细描述。通过深入分析人工智能辅助编码的最新进展、应用、潜力、挑战以及未来方向,为后续章节的研究奠定了理论基础。同时,优化了章节结构,使其更加清晰和逻辑严密。
|
2025-04-25 19:51:05 +08:00 |
|
carry
|
97ee546bdf
|
style: 简化 LaTeX 文件中的注释格式
移除冗余的分隔线注释,使代码更简洁易读
|
2025-04-25 18:10:16 +08:00 |
|
carry
|
2af26560b3
|
fix(latex): 删除多余的\quad.
|
2025-04-25 18:08:33 +08:00 |
|
carry
|
0977002c06
|
refactor(paper): 简化结论章节的格式并移除不必要的计数器
移除了结论章节中的计数器设置,直接使用\section命令来定义章节标题,使代码更简洁易读。
|
2025-04-25 18:07:51 +08:00 |
|
carry
|
fa83e06346
|
refactor(paper): 调整章节顺序以优化文档结构
将致谢章节移至参考文献之后,使文档逻辑更加清晰,便于读者阅读
|
2025-04-25 18:06:32 +08:00 |
|
carry
|
03221547bb
|
fix(abstract): 调整摘要和关键词的排版格式
统一中文摘要和英文摘要的排版格式,使用makebox对齐标题和内容,提升文档的可读性和一致性。
|
2025-04-25 17:56:18 +08:00 |
|
carry
|
7cc26feaa9
|
fix(latex): 中文样式
调整了 LaTeX 文档中的标题格式和目录样式,使其更加统一和规范。移除了旧的章节计数器,并重新定义了 `titlesec` 和 `titletoc` 的样式,以更好地符合文档需求。
|
2025-04-25 17:56:05 +08:00 |
|
carry
|
9494c9c913
|
docs: 更新论文各章节内容以完善文档
更新了论文的结论、致谢、引言、封面和摘要章节,填充了具体内容并修正了格式。这些修改旨在完善论文文档,确保内容完整且符合学术规范。
|
2025-04-25 15:11:55 +08:00 |
|
carry
|
ff31213aa8
|
refactor(latex): 将封面部分提取到单独的cover.tex文件中
将main.tex中的封面部分提取到独立的cover.tex文件中,以提高代码的可维护性和可读性
|
2025-04-25 15:01:11 +08:00 |
|
carry
|
aa2f75f67f
|
refactor(paper): 将系统设计信息从main.tex移至abstract.tex并重命名章节文件
将系统设计信息从main.tex移动到abstract.tex以保持内容的一致性,并将chapter1.tex重命名为introduction.tex以提高文件命名的清晰度。
|
2025-04-25 13:00:21 +08:00 |
|
carry
|
4d61a4cffd
|
refactor(paper): 添加绪论章节的LaTeX文件
添加了绪论章节的LaTeX文件,包括课题背景、国内外研究进展、课题目的及意义以及总体研究思路等部分。
|
2025-04-25 13:00:09 +08:00 |
|
carry
|
3e520604ba
|
refactor(paper): 将摘要内容从主文件移至单独章节文件
为了提升代码的可维护性和模块化,将中文和英文摘要从 `main.tex` 文件中提取出来,并放入单独的 `abstract.tex` 文件中。同时,添加了 `titlesec` 包以改进章节标题的格式化。
|
2025-04-25 12:47:09 +08:00 |
|
carry
|
959ff2033d
|
chore: 在.gitignore中添加*.xdv文件类型
在.gitignore文件中添加了*.xdv文件类型,以避免版本控制系统中包含此类文件。此更改有助于保持代码库的整洁。
|
2025-04-25 12:46:18 +08:00 |
|
carry
|
d653e05a61
|
docs(latex): 添加论文LaTeX模板文件并删除旧文档
添加了新的LaTeX模板文件,包括章节文件(chapter1.tex、conclusion.tex、acknowledgement.tex、references.tex)和主文件(main.tex),并删除了旧的document.tex文件。这些文件用于构建毕业论文的结构和内容。
|
2025-04-25 00:35:01 +08:00 |
|
carry
|
6685b742ed
|
chore: 添加LaTeX文档和.gitignore配置
添加了LaTeX文档模板和.gitignore文件中的LaTeX临时文件忽略规则,以支持论文编写和避免不必要的文件提交。
|
2025-04-24 23:18:18 +08:00 |
|
carry
|
7a4388c928
|
featmodel): 添加保存模式选择功能
在模型管理页面中新增保存模式选择功能,用户可以通过下拉菜单选择不同的保存模式(如默认、合并16位、合并4位等)。同时,将保存模型的逻辑抽离到独立的`save_model.py`文件中,以提高代码的可维护性和复用性。
|
2025-04-23 14:09:02 +08:00 |
|
carry
|
6338706967
|
feat: 修改应用启动方式
- 将 app.launch() 修改为 app.launch(server_name="0.0.0.0")
- 此修改使应用能够监听所有网络接口,提高可用性
|
2025-04-22 19:08:23 +08:00 |
|
carry
|
3718c75cee
|
feat(frontend): 添加数据集生成页面的处理进度显示
- 在处理文档片段时添加进度条,提升用户体验
- 优化代码格式,调整缩进和空行
|
2025-04-22 00:14:16 +08:00 |
|
carry
|
905658073a
|
docs(README): 更新项目文档
- 添加项目概述、核心功能、技术架构等详细信息
- 插入系统架构图和技术栈说明
- 细化功能模块描述,包括模型管理、推理、微调等
- 增加QLoRA原理和参数配置说明
- 补充快速开始指南和许可证信息
- 优化文档结构,增强可读性和完整性
|
2025-04-21 14:28:20 +08:00 |
|
carry
|
9806334517
|
fix(train_page): 捕获训练过程中的异常并终止 TensorBoard 进程
- 在训练过程中添加异常捕获,将异常信息转换为 gr.Error 抛出
- 确保在发生异常时也能终止 TensorBoard 子进程
|
2025-04-20 21:40:46 +08:00 |
|
carry
|
0a4efa5641
|
feat(dataset): 添加数据集生成功能
- 新增数据集生成页面和相关逻辑
- 实现数据集名称重复性检查
- 添加数据集对象创建和保存功能
- 优化文档处理和提示模板应用
- 增加错误处理和数据解析
|
2025-04-20 21:25:51 +08:00 |
|
carry
|
994d600221
|
refactor(frontend): 调整 TensorBoard iframe 高度
- 将 TensorBoard iframe 的高度从 500px 修改为 1000px
- 此修改旨在提供更宽敞的显示区域,改善用户体验
|
2025-04-20 21:25:37 +08:00 |
|
carry
|
d5774eee0c
|
feat(db): 添加数据集导出功能
- 新增 save_dataset 函数,用于将 TinyDB 中的数据集保存为单独的 JSON 文件
- 更新 db/__init__.py,添加 get_dataset_tinydb 函数的引用
- 修改 db/dataset_store.py,实现 save_dataset 函数并添加相关逻辑
|
2025-04-20 19:44:11 +08:00 |
|
carry
|
87501c9353
|
fix(global_var): 移除全局变量设置函数set_datasets
- 删除了 global_var.py 文件中的 set_datasets 函数
- 该函数用于设置全局变量 _datasets,但似乎已不再使用
|
2025-04-20 19:14:00 +08:00 |
|
carry
|
5fc3b4950b
|
refactor(schema): 修改 LLMResponse 中 API 响应内容的字段名称
- 将 LLMResponse 类中的 response_content 字段重命名为 content
- 更新字段类型从 dict 改为 str,以更准确地表示响应内容
- 在 reasoning.py 中相应地修改了调用 LLMResponse 时的参数
|
2025-04-20 18:40:51 +08:00 |
|
carry
|
c28e4819d9
|
refactor(frontend/tools): 重命名生成示例 JSON 数据结构的函数
- 将 generate_example_json 函数重命名为 generate_json_example
- 更新相关文件中的函数调用和引用
- 此更改旨在使函数名称更具描述性和一致性
|
2025-04-20 16:11:36 +08:00 |
|
carry
|
e7cf51d662
|
refactor(frontend): 重构数据集生成页面
- 调整页面布局,优化用户交互流程
- 新增数据集名称输入框
- 使用 LLMRequest 和 LLMResponse 模型处理请求和响应
- 添加 generate_example_json 函数用于格式化生成数据
- 改进数据集生成逻辑,支持多轮次生成
|
2025-04-20 16:10:08 +08:00 |
|
carry
|
4c9caff668
|
refactor(schema): 重构数据集和文档类的命名
- 将 dataset、dataset_item 和 doc 类的首字母大写,以符合 Python 类命名惯例
- 更新相关模块中的导入和引用,以适应新的类名
- 此更改不影响功能,仅提高了代码的一致性和可读性
|
2025-04-20 01:46:15 +08:00 |
|
carry
|
9236f49b36
|
feat(frontend): 添加文档切片和并发数功能
- 新增并发数输入框
- 实现文档切片处理
- 更新生成数据集的逻辑,支持并发处理
|
2025-04-20 01:40:48 +08:00 |
|
carry
|
868fcd45ba
|
refactor(project): 重构项目文件组织结构
- 修改模型管理和训练页面的导入路径
- 更新 main.py 中的导入模块
- 调整 tools 包的内容,移除 model 模块
- 新建 train 包,包含 model 模块
- 优化 __init__.py 文件,简化导入语句
|
2025-04-19 21:49:19 +08:00 |
|
carry
|
5a21c8598a
|
feat(tools): 支持 OpenAI API 的 JSON 格式返回结果
- 在 call_openai_api 函数中添加对 JSON 格式返回结果的支持
- 增加 llm_request.format 参数处理,将用户 prompt 与格式要求合并
- 添加 response_format 参数到 OpenAI API 请求
- 更新示例,使用 JSON 格式返回结果
|
2025-04-19 21:10:22 +08:00 |
|
carry
|
1e829c9268
|
feat(tools): 优化 JSON 示例生成函数
- 增加 include_optional 参数,决定是否包含可选字段
- 添加 list_length 参数,用于控制列表字段的示例长度
- 在列表示例中添加省略标记,更直观展示多元素列表
- 优化字典字段的示例生成逻辑
|
2025-04-19 21:07:00 +08:00 |
|
carry
|
9fc3ab904b
|
feat(frontend): 实现了固定参数的注入
|
2025-04-19 17:48:45 +08:00 |
|
carry
|
d827f9758f
|
fix(frontend): 修复dataframe_value返回值只有一列的bug
|
2025-04-19 17:30:10 +08:00 |
|
carry
|
ff1e9731bc
|
fix(tools): 修复call_openai_api的导出
|
2025-04-19 17:13:19 +08:00 |
|
carry
|
90fde639ff
|
feat(tools): 增加 OpenAI API 多轮调用功能
- 在 call_openai_api 函数中添加 rounds 参数,支持多次调用
- 累加每次调用的耗时和 token 使用情况
- 将多次调用的结果存储在 LLMRequest 对象的 response 列表中
- 更新函数返回类型,返回包含多次调用信息的 LLMRequest 对象
- 优化错误处理,记录每轮调用的错误信息
|
2025-04-19 17:02:00 +08:00 |
|