docs(verification): 更新DeepSeek V3的性能表现描述
更新了DeepSeek V3在Codeforces和LiveCodeBench基准测试中的具体表现,以更准确地反映其最新性能数据。
This commit is contained in:
parent
5543150a9a
commit
d35074038e
@ -55,8 +55,8 @@
|
||||
|
||||
本实验采用DeepSeek V3作为数据集生成模型,该模型是深度求索公司开发的新一代大语言模型,具有以下特点:
|
||||
\begin{itemize}
|
||||
\item 性能表现:在MT-Bench等基准测试中达到开源模型领先水平,推理速度优于同规模模型30\%以上。
|
||||
\item 上下文窗口:在理论上支持 128K tokens 的上下文长度。不过在实际应用中,部分服务商可能会出于硬件或性能优化等考虑,将其限制在 64K tokens
|
||||
\item 性能表现:在 Codeforces 基准测试中,DeepSeek V3 取得了 51.6 分的成绩,刷新了该领域的 SOTA 水平。在 LiveCodeBench(Pass@1 - COT)测试中得分为 40.5,在 LiveCodeBench(Pass@1)测试中成绩为 37.6,均表现出色。
|
||||
\item 上下文窗口:在理论上支持 128K tokens 的上下文长度。不过在实际应用中,部分服务商可能会出于硬件或性能优化等考虑,将其限制在 64K tokens。
|
||||
\item 开源许可:采用MIT许可协议,允许学术研究。
|
||||
\end{itemize}
|
||||
|
||||
|
Loading…
x
Reference in New Issue
Block a user