DeepSeek V4 正式发布:开源模型迎来世界级推理能力

🤖 AI 里程碑

DeepSeek V4 正式发布:开源模型迎来世界级推理能力

开源模型首次在推理能力上达到闭源顶级水平,意义非凡

671B
总参数量
开源
MIT协议
顶尖
推理能力

DeepSeek 于 4 月 26 日正式发布了 V4 版本的开源大模型。这是由深度求索(DeepSeek)公司开发的 Mixture-of-Experts(MoE)模型,总参数量达到 671B,但每个 token 只激活 37B 参数,兼顾了性能和省钱。最重要的是,V4 在推理能力上已经达到了世界级水平,多项基准测试超越 GPT-4o 和 Claude 3.5 Sonnet。

核心能力
🧠

推理能力

在数学推理(MATH-500)、代码生成(HumanEval)、科学推理(GPQA)等多项基准测试中展现顶级水平,尤其代码能力令人印象深刻。

💬

多语言支持

原生的中英文双语能力,中文理解比 GPT-4o 更自然,英文同样达到顶尖水平。

效率优化

MoE 架构确保 671B 参数的推理效率,每个 token 只激活 37B 参数,大幅降低计算成本。

🔓

完全开源

模型权重、技术论文、训练代码全部公开,支持商用。MIT 协议是目前最宽松的开源协议之一。

💰

极低价格

API 价格仅为同类闭源模型的几分之一,真正做到了「开源 + 低价 + 高性能」的不可能三角。

发表评论