carry
|
aa2f75f67f
|
refactor(paper): 将系统设计信息从main.tex移至abstract.tex并重命名章节文件
将系统设计信息从main.tex移动到abstract.tex以保持内容的一致性,并将chapter1.tex重命名为introduction.tex以提高文件命名的清晰度。
|
2025-04-25 13:00:21 +08:00 |
|
carry
|
4d61a4cffd
|
refactor(paper): 添加绪论章节的LaTeX文件
添加了绪论章节的LaTeX文件,包括课题背景、国内外研究进展、课题目的及意义以及总体研究思路等部分。
|
2025-04-25 13:00:09 +08:00 |
|
carry
|
3e520604ba
|
refactor(paper): 将摘要内容从主文件移至单独章节文件
为了提升代码的可维护性和模块化,将中文和英文摘要从 `main.tex` 文件中提取出来,并放入单独的 `abstract.tex` 文件中。同时,添加了 `titlesec` 包以改进章节标题的格式化。
|
2025-04-25 12:47:09 +08:00 |
|
carry
|
959ff2033d
|
chore: 在.gitignore中添加*.xdv文件类型
在.gitignore文件中添加了*.xdv文件类型,以避免版本控制系统中包含此类文件。此更改有助于保持代码库的整洁。
|
2025-04-25 12:46:18 +08:00 |
|
carry
|
d653e05a61
|
docs(latex): 添加论文LaTeX模板文件并删除旧文档
添加了新的LaTeX模板文件,包括章节文件(chapter1.tex、conclusion.tex、acknowledgement.tex、references.tex)和主文件(main.tex),并删除了旧的document.tex文件。这些文件用于构建毕业论文的结构和内容。
|
2025-04-25 00:35:01 +08:00 |
|
carry
|
6685b742ed
|
chore: 添加LaTeX文档和.gitignore配置
添加了LaTeX文档模板和.gitignore文件中的LaTeX临时文件忽略规则,以支持论文编写和避免不必要的文件提交。
|
2025-04-24 23:18:18 +08:00 |
|
carry
|
3718c75cee
|
feat(frontend): 添加数据集生成页面的处理进度显示
- 在处理文档片段时添加进度条,提升用户体验
- 优化代码格式,调整缩进和空行
|
2025-04-22 00:14:16 +08:00 |
|
carry
|
905658073a
|
docs(README): 更新项目文档
- 添加项目概述、核心功能、技术架构等详细信息
- 插入系统架构图和技术栈说明
- 细化功能模块描述,包括模型管理、推理、微调等
- 增加QLoRA原理和参数配置说明
- 补充快速开始指南和许可证信息
- 优化文档结构,增强可读性和完整性
|
2025-04-21 14:28:20 +08:00 |
|
carry
|
9806334517
|
fix(train_page): 捕获训练过程中的异常并终止 TensorBoard 进程
- 在训练过程中添加异常捕获,将异常信息转换为 gr.Error 抛出
- 确保在发生异常时也能终止 TensorBoard 子进程
|
2025-04-20 21:40:46 +08:00 |
|
carry
|
0a4efa5641
|
feat(dataset): 添加数据集生成功能
- 新增数据集生成页面和相关逻辑
- 实现数据集名称重复性检查
- 添加数据集对象创建和保存功能
- 优化文档处理和提示模板应用
- 增加错误处理和数据解析
|
2025-04-20 21:25:51 +08:00 |
|
carry
|
994d600221
|
refactor(frontend): 调整 TensorBoard iframe 高度
- 将 TensorBoard iframe 的高度从 500px 修改为 1000px
- 此修改旨在提供更宽敞的显示区域,改善用户体验
|
2025-04-20 21:25:37 +08:00 |
|
carry
|
d5774eee0c
|
feat(db): 添加数据集导出功能
- 新增 save_dataset 函数,用于将 TinyDB 中的数据集保存为单独的 JSON 文件
- 更新 db/__init__.py,添加 get_dataset_tinydb 函数的引用
- 修改 db/dataset_store.py,实现 save_dataset 函数并添加相关逻辑
|
2025-04-20 19:44:11 +08:00 |
|
carry
|
87501c9353
|
fix(global_var): 移除全局变量设置函数set_datasets
- 删除了 global_var.py 文件中的 set_datasets 函数
- 该函数用于设置全局变量 _datasets,但似乎已不再使用
|
2025-04-20 19:14:00 +08:00 |
|
carry
|
5fc3b4950b
|
refactor(schema): 修改 LLMResponse 中 API 响应内容的字段名称
- 将 LLMResponse 类中的 response_content 字段重命名为 content
- 更新字段类型从 dict 改为 str,以更准确地表示响应内容
- 在 reasoning.py 中相应地修改了调用 LLMResponse 时的参数
|
2025-04-20 18:40:51 +08:00 |
|
carry
|
c28e4819d9
|
refactor(frontend/tools): 重命名生成示例 JSON 数据结构的函数
- 将 generate_example_json 函数重命名为 generate_json_example
- 更新相关文件中的函数调用和引用
- 此更改旨在使函数名称更具描述性和一致性
|
2025-04-20 16:11:36 +08:00 |
|
carry
|
e7cf51d662
|
refactor(frontend): 重构数据集生成页面
- 调整页面布局,优化用户交互流程
- 新增数据集名称输入框
- 使用 LLMRequest 和 LLMResponse 模型处理请求和响应
- 添加 generate_example_json 函数用于格式化生成数据
- 改进数据集生成逻辑,支持多轮次生成
|
2025-04-20 16:10:08 +08:00 |
|
carry
|
4c9caff668
|
refactor(schema): 重构数据集和文档类的命名
- 将 dataset、dataset_item 和 doc 类的首字母大写,以符合 Python 类命名惯例
- 更新相关模块中的导入和引用,以适应新的类名
- 此更改不影响功能,仅提高了代码的一致性和可读性
|
2025-04-20 01:46:15 +08:00 |
|
carry
|
9236f49b36
|
feat(frontend): 添加文档切片和并发数功能
- 新增并发数输入框
- 实现文档切片处理
- 更新生成数据集的逻辑,支持并发处理
|
2025-04-20 01:40:48 +08:00 |
|
carry
|
868fcd45ba
|
refactor(project): 重构项目文件组织结构
- 修改模型管理和训练页面的导入路径
- 更新 main.py 中的导入模块
- 调整 tools 包的内容,移除 model 模块
- 新建 train 包,包含 model 模块
- 优化 __init__.py 文件,简化导入语句
|
2025-04-19 21:49:19 +08:00 |
|
carry
|
5a21c8598a
|
feat(tools): 支持 OpenAI API 的 JSON 格式返回结果
- 在 call_openai_api 函数中添加对 JSON 格式返回结果的支持
- 增加 llm_request.format 参数处理,将用户 prompt 与格式要求合并
- 添加 response_format 参数到 OpenAI API 请求
- 更新示例,使用 JSON 格式返回结果
|
2025-04-19 21:10:22 +08:00 |
|
carry
|
1e829c9268
|
feat(tools): 优化 JSON 示例生成函数
- 增加 include_optional 参数,决定是否包含可选字段
- 添加 list_length 参数,用于控制列表字段的示例长度
- 在列表示例中添加省略标记,更直观展示多元素列表
- 优化字典字段的示例生成逻辑
|
2025-04-19 21:07:00 +08:00 |
|
carry
|
9fc3ab904b
|
feat(frontend): 实现了固定参数的注入
|
2025-04-19 17:48:45 +08:00 |
|
carry
|
d827f9758f
|
fix(frontend): 修复dataframe_value返回值只有一列的bug
|
2025-04-19 17:30:10 +08:00 |
|
carry
|
ff1e9731bc
|
fix(tools): 修复call_openai_api的导出
|
2025-04-19 17:13:19 +08:00 |
|
carry
|
90fde639ff
|
feat(tools): 增加 OpenAI API 多轮调用功能
- 在 call_openai_api 函数中添加 rounds 参数,支持多次调用
- 累加每次调用的耗时和 token 使用情况
- 将多次调用的结果存储在 LLMRequest 对象的 response 列表中
- 更新函数返回类型,返回包含多次调用信息的 LLMRequest 对象
- 优化错误处理,记录每轮调用的错误信息
|
2025-04-19 17:02:00 +08:00 |
|
carry
|
5fc90903fb
|
feat(tools): 添加 reasoning.py 工具模块
- 新增 reasoning.py 文件,实现与 OpenAI API 的交互
- 添加 call_openai_api 函数,用于发送请求并处理响应
- 支持可选的 LLMParameters 参数,以定制化请求
- 处理 API 响应中的 tokens 使用情况
- 提供错误处理和缓存 token 字段的处理
|
2025-04-19 16:53:48 +08:00 |
|
carry
|
81c2ad4a2d
|
refactor(schema): 重构数据模型以提高可维护性和可扩展性
- 新增 LLMParameters 类以统一处理 LLM 参数
- 新增 TokensUsage 类以统一处理 token 使用信息
- 更新 LLMResponse 和 LLMRequest 类,使用新的 LLMParameters 和 TokensUsage 类
- 优化数据模型结构,提高代码的可读性和可维护性
|
2025-04-19 16:39:18 +08:00 |
|
carry
|
314434951d
|
feat(frontend): 实现了文档、提示和 API 提供商的获取逻辑
|
2025-04-19 14:47:01 +08:00 |
|
carry
|
e16882953d
|
fix(tools): 修复了optional字段无法被解析的问题
|
2025-04-18 22:00:51 +08:00 |
|
carry
|
86bcf90c66
|
feat(frontend): 添加数据集生成轮次控制功能
- 在数据集生成页面添加"生成轮次"输入框,支持设置生成轮数
- 更新生成逻辑,根据设置的轮次进行多次生成
|
2025-04-18 15:47:37 +08:00 |
|
carry
|
961a017f19
|
refactor(frontend): 调整数据集生成页面布局并优化代码结构
- 使用 gr.Column(scale=1) 和 gr.Column(scale=2) 调整列宽比例
- 移除多余的空行和缩进,提高代码可读性
- 优化变量声明和组件创建的顺序,使页面结构更清晰
|
2025-04-18 15:40:15 +08:00 |
|
carry
|
5a386d6401
|
feat(dataset_generate_page): 添加 API 选择功能
- 在数据集生成页面添加 API 选择下拉框
- 实现 API 选择变更时的处理逻辑
- 更新数据集生成函数,增加 API 选择参数
- 优化页面布局和代码结构
|
2025-04-18 15:23:33 +08:00 |
|
carry
|
feaea1fb64
|
refactor(db): 重命名数据库引擎加载函数
- 将 get_sqlite_engine 函数重命名为 load_sqlite_engine
- 更新了相关模块中的导入和调用
- 这个改动是为了更好地反映函数的实际功能,提高代码可读性
|
2025-04-18 15:16:29 +08:00 |
|
carry
|
7242a2ce03
|
feat(frontend): 添加生成数据集进度条功能并优化了界面布局
|
2025-04-18 15:07:46 +08:00 |
|
carry
|
db6e2271dc
|
fix(frontend): 修复 prompt_dropdown 变化时,dataframe没有相应的变化
- 将 prompt_dropdown 变化时的输出从 prompt_state 修改为 [prompt_state, variables_dataframe]
- 这个改动可能会在 prompt 变化时同时更新变量数据框
|
2025-04-18 14:03:26 +08:00 |
|
carry
|
d764537143
|
feat(dataset_generate_page): 更新数据集生成页面功能
- 添加模板变量列表展示和编辑功能
- 实现模板选择后动态更新变量列表
- 增加生成数据集按钮和相关逻辑
- 优化页面布局和交互
|
2025-04-16 12:39:48 +08:00 |
|
carry
|
8c35a38c47
|
feat(frontend): 更新模板选择功能
- 在模板选择变更时,获取所选模板的详细信息
- 创建 PromptTemplate 对象并获取输入变量列表
- 此更新为后续的模板编辑功能做准备
|
2025-04-15 21:31:50 +08:00 |
|
carry
|
7ee751c88f
|
fix(frontend): 移除文档生成页面的冗余事件绑定代码
- 删除了原有的简单事件绑定逻辑,这些逻辑仅将输入值赋给状态变量
- 为后续添加更复杂的文档选择更改事件处理函数做准备
|
2025-04-15 20:44:26 +08:00 |
|
carry
|
b715b36a5f
|
feat(frontend): 更新数据集生成页面并添加独立运行功能
- 重构导入路径,使用绝对路径替换相对路径
- 新增文档和模板选择的事件处理函数
- 添加独立运行数据集生成页面的功能
- 优化代码结构,提高可读性和可维护性
|
2025-04-15 17:13:52 +08:00 |
|
carry
|
8023233bb2
|
feat(prompt): 增加模板变量有效性检查
- 在 promptTempleta 模型中添加字段验证器
- 验证模板内容是否包含必要的 document_slice 变量
- 如果缺少该变量,抛出 ValueError 异常
|
2025-04-15 16:54:17 +08:00 |
|
carry
|
2a86b3b5b0
|
fix(db): 初始化 prompt store 时插入第一条记录的 ID 从 0 改为 1
- 将初始化时插入的第一条记录的 ID 从 0 改为 1
- 修正了文档节选的变量名,从 {content} 改为 {document_slice}
|
2025-04-15 16:45:12 +08:00 |
|
carry
|
ca1505304e
|
fix(tools): 更新 tools/__init__.py 中的导入语句
- 将 from .doc import * 改为 from .document import *
- 这个修改统一了文档处理模块的命名,提高了代码的一致性和可读性
|
2025-04-15 16:31:55 +08:00 |
|
carry
|
df9260e918
|
fix(db): 修复初始提示词的变量花括号的空格问题
|
2025-04-15 16:13:57 +08:00 |
|
carry
|
df9aba0c6e
|
refactor(tools): 重命名模块并更新导入
- 将 scan_doc_dir.py 重命名为 document.py
- 将 socket.py 重命名为 port.py
- 更新 __init__.py 中的导入语句
- 在 port.py 中添加测试代码,用于查找可用端口
|
2025-04-15 15:47:44 +08:00 |
|
carry
|
6b87dcb58f
|
refactor(frontend): 重构数据集生成页面的变量命名逻辑
- 将 prompt_choices 变量重命名为 prompt_list,以更准确地反映其内容
- 更新相关代码中对这两个变量的引用,以保持一致性
|
2025-04-15 15:40:24 +08:00 |
|
carry
|
d0aebd17fa
|
refactor(global_var): 重构全局变量管理
- 移除了 _docs 全局变量
- 更新了 get_docs() 函数,使其在每次调用时重新扫描文档目录
- 优化了全局变量初始化逻辑
|
2025-04-15 15:25:44 +08:00 |
|
carry
|
d9abf08184
|
fix(frontend): 修复表格选择事件的行数据获取问题
- 在 prompt_manage_page 和 setting_page 中更新了 select_record 函数
- 使用 DataFrame.iloc 方法获取选中行的数据,并转换为列表
- 添加了将第一列数据转换为整数的逻辑
- 更新了表格选择事件的参数,增加了输入和输出参数
- 将 gradio 版本升级到 5.25.0
|
2025-04-15 15:10:15 +08:00 |
|
carry
|
a27a1ab079
|
refactor(frontend): 重构训练页面布局并优化用户界面
- 调整数据集下拉框布局位置
- 新增超参数输入组件
- 修改训练日志输出框标签为"训练状态"
- 添加 TensorBoard 可视化 iframe 显示框
|
2025-04-15 00:12:09 +08:00 |
|
carry
|
aa758e3c2a
|
feat(train_page): 添加 TensorBoard 可视化
- 在训练页面添加 TensorBoard iframe 显示框
- 实现动态生成 TensorBoard iframe 功能
- 更新训练按钮点击事件,同时更新 TensorBoard iframe
|
2025-04-14 23:28:43 +08:00 |
|
carry
|
664944f0c5
|
feat(frontend): 优化 TensorBoard 端口占用问题
- 新增端口检测逻辑,动态分配可用端口
- 修改 TensorBoard 启动过程,使用动态分配的端口
- 添加 socket 模块,用于端口检测
|
2025-04-14 17:06:44 +08:00 |
|