DeepSeek V4 正式发布：开源模型迎来世界级推理能力

🤖 AI 里程碑

DeepSeek V4 正式发布：开源模型迎来世界级推理能力

开源模型首次在推理能力上达到闭源顶级水平，意义非凡

671B

总参数量

开源

MIT协议

顶尖

推理能力

DeepSeek 于 4 月 26 日正式发布了 V4 版本的开源大模型。这是由深度求索（DeepSeek）公司开发的 Mixture-of-Experts（MoE）模型，总参数量达到 671B，但每个 token 只激活 37B 参数，兼顾了性能和省钱。最重要的是，V4 在推理能力上已经达到了世界级水平，多项基准测试超越 GPT-4o 和 Claude 3.5 Sonnet。

核心能力

🧠

推理能力

在数学推理（MATH-500）、代码生成（HumanEval）、科学推理（GPQA）等多项基准测试中展现顶级水平，尤其代码能力令人印象深刻。

💬

多语言支持

原生的中英文双语能力，中文理解比 GPT-4o 更自然，英文同样达到顶尖水平。

⚡

效率优化

MoE 架构确保 671B 参数的推理效率，每个 token 只激活 37B 参数，大幅降低计算成本。

🔓

完全开源

模型权重、技术论文、训练代码全部公开，支持商用。MIT 协议是目前最宽松的开源协议之一。

💰

极低价格

API 价格仅为同类闭源模型的几分之一，真正做到了「开源 + 低价 + 高性能」的不可能三角。