docs(verification): 更新DeepSeek V3的性能表现描述

更新了DeepSeek V3在Codeforces和LiveCodeBench基准测试中的具体表现，以更准确地反映其最新性能数据。
2025-04-30 01:13:48 +08:00
parent 5543150a9a
commit d35074038e
1 changed files with 2 additions and 2 deletions
@@ -55,8 +55,8 @@

 本实验采用DeepSeek V3作为数据集生成模型，该模型是深度求索公司开发的新一代大语言模型，具有以下特点：
 \begin{itemize}
-    \item 性能表现：在MT-Bench等基准测试中达到开源模型领先水平，推理速度优于同规模模型30\%以上。
-    \item 上下文窗口：在理论上支持 128K tokens 的上下文长度。不过在实际应用中，部分服务商可能会出于硬件或性能优化等考虑，将其限制在 64K tokens
+    \item 性能表现：在 Codeforces 基准测试中，DeepSeek V3 取得了 51.6 分的成绩，刷新了该领域的 SOTA 水平。在 LiveCodeBench（Pass@1 - COT）测试中得分为 40.5，在 LiveCodeBench（Pass@1）测试中成绩为 37.6，均表现出色。
+    \item 上下文窗口：在理论上支持 128K tokens 的上下文长度。不过在实际应用中，部分服务商可能会出于硬件或性能优化等考虑，将其限制在 64K tokens。
    \item 开源许可：采用MIT许可协议，允许学术研究。
 \end{itemize}