2 changed files with 5 additions and 57 deletions
--- a/frontend/init.py
+++ b/frontend/init.py
@ -1,6 +1,6 @@
 from .train_page import *
 from .chat_page import *
 from .setting_page import *
 from .train_page import *
 from .model_manage_page import *
 from .dataset_manage_page import *
 from .dataset_generate_page import *
--- a/frontend/train_page.py
+++ b/frontend/train_page.py
@ -1,12 +1,9 @@
 import unsloth
 import gradio as gr
 import sys
 import torch
 import pandas as pd
 from tinydb import Query
 from pathlib import Path
-from datasets import Dataset as HFDataset
+from datasets import Dataset as HFDataset  
 from transformers import TrainerCallback
 from unsloth import FastLanguageModel
 from trl import SFTTrainer  # 用于监督微调的训练器
@ -46,16 +43,6 @@ def train_page():
        # 训练状态输出
        output = gr.Textbox(label="训练日志", interactive=False)
        # 添加loss曲线展示
        loss_plot = gr.LinePlot(
            x="step",
            y="loss",
            title="训练Loss曲线",
            interactive=True,
            width=600,
            height=300
        )
        def train_model(dataset_name, learning_rate, per_device_train_batch_size, epoch, save_steps, lora_rank):
            # 使用动态传入的超参数
            learning_rate = float(learning_rate)
@ -118,33 +105,6 @@ def train_page():
                                fn_kwargs={"tokenizer": tokenizer},
                                batched=True)
            # 创建回调类
            class GradioLossCallback(TrainerCallback):
                def __init__(self):
                    self.loss_data = []
                    self.log_text = ""
                    self.last_output = {"text": "", "plot": None}
                def on_log(self, args, state, control, logs=None, **kwargs):
                    print(f"on_log called with logs: {logs}")  # 调试输出
                    if "loss" in logs:
                        print(f"Recording loss: {logs['loss']} at step {state.global_step}")  # 调试输出
                        self.loss_data.append({
                            "step": state.global_step,
                            "loss": float(logs["loss"])  # 确保转换为float
                        })
                        self.log_text += f"Step {state.global_step}: loss={logs['loss']:.4f}\n"
                        df = pd.DataFrame(self.loss_data)
                        print(f"DataFrame created: {df}")  # 调试输出
                        self.last_output = {
                            "text": self.log_text,
                            "plot": df
                        }
                    return control
            # 初始化回调
            callback = GradioLossCallback()
            # 初始化SFT训练器
            trainer = SFTTrainer(
                model=model, # 待训练的模型
@ -174,7 +134,6 @@ def train_page():
                    # report_to="tensorboard",  # 将信息输出到tensorboard
                ),
            )
            trainer.add_callback(callback)
            trainer = train_on_responses_only(
                trainer,
@ -184,28 +143,17 @@ def train_page():
            # 开始训练
            trainer_stats = trainer.train(resume_from_checkpoint=False)
            return callback.last_output
        def wrapped_train_model(*args):
            print("Starting training...")  # 调试输出
            result = train_model(*args)
            print(f"Training completed with result: {result}")  # 调试输出
            # 确保返回格式正确
            if result and "text" in result and "plot" in result:
                return result["text"], result["plot"]
            return "", pd.DataFrame()  # 返回默认值
        train_button.click(
-            fn=wrapped_train_model,
+            fn=train_model,
            inputs=[
                dataset_dropdown,
                learning_rate_input,
                per_device_train_batch_size_input,
                epoch_input,
-                save_steps_input,
+                save_steps_input
                lora_rank_input
            ],
-            outputs=[output, loss_plot]
+            outputs=output
        )
    return demo