docs(verification): 更新DeepSeek V3的性能表现描述

更新了DeepSeek V3在Codeforces和LiveCodeBench基准测试中的具体表现,以更准确地反映其最新性能数据。
This commit is contained in:
carry 2025-04-30 01:13:48 +08:00
parent 5543150a9a
commit d35074038e

View File

@ -55,8 +55,8 @@
本实验采用DeepSeek V3作为数据集生成模型该模型是深度求索公司开发的新一代大语言模型具有以下特点
\begin{itemize}
\item 性能表现:在MT-Bench等基准测试中达到开源模型领先水平推理速度优于同规模模型30\%以上
\item 上下文窗口:在理论上支持 128K tokens 的上下文长度。不过在实际应用中,部分服务商可能会出于硬件或性能优化等考虑,将其限制在 64K tokens
\item 性能表现:在 Codeforces 基准测试中DeepSeek V3 取得了 51.6 分的成绩,刷新了该领域的 SOTA 水平。在 LiveCodeBenchPass@1 - COT测试中得分为 40.5,在 LiveCodeBenchPass@1测试中成绩为 37.6,均表现出色
\item 上下文窗口:在理论上支持 128K tokens 的上下文长度。不过在实际应用中,部分服务商可能会出于硬件或性能优化等考虑,将其限制在 64K tokens
\item 开源许可采用MIT许可协议允许学术研究。
\end{itemize}