🤖 AI 里程碑
DeepSeek V4 正式发布:开源模型迎来世界级推理能力
开源模型首次在推理能力上达到闭源顶级水平,意义非凡
671B
总参数量
开源
MIT协议
顶尖
推理能力
DeepSeek 于 4 月 26 日正式发布了 V4 版本的开源大模型。这是由深度求索(DeepSeek)公司开发的 Mixture-of-Experts(MoE)模型,总参数量达到 671B,但每个 token 只激活 37B 参数,兼顾了性能和省钱。最重要的是,V4 在推理能力上已经达到了世界级水平,多项基准测试超越 GPT-4o 和 Claude 3.5 Sonnet。
核心能力
🧠
推理能力
在数学推理(MATH-500)、代码生成(HumanEval)、科学推理(GPQA)等多项基准测试中展现顶级水平,尤其代码能力令人印象深刻。
💬
多语言支持
原生的中英文双语能力,中文理解比 GPT-4o 更自然,英文同样达到顶尖水平。
⚡
效率优化
MoE 架构确保 671B 参数的推理效率,每个 token 只激活 37B 参数,大幅降低计算成本。
🔓
完全开源
模型权重、技术论文、训练代码全部公开,支持商用。MIT 协议是目前最宽松的开源协议之一。
💰
极低价格
API 价格仅为同类闭源模型的几分之一,真正做到了「开源 + 低价 + 高性能」的不可能三角。