DeepSeek-V4 预览版发布:百万上下文来了

DeepSeek-V4 预览版今天正式上线,同时开源。简单说几个亮点:百万字超长上下文、Agent 能力大幅提升、推理性能已经能和世界顶级的闭源模型掰手腕了。

两个版本,V4-Pro 和 V4-Flash,今天起就能用。直接去 chat.deepseek.com 或者下个官方 App 就能体验。

API 也同步更新了,改个 model_name 就行:deepseek-v4-pro 或者 deepseek-v4-flash

V4-Pro:性能对标顶级闭源模型

Agent 能力明显变强:代码评测里,V4-Pro 已经是开源模型里最好的那一档了,其他 Agent 相关的测试里也表现优异。目前内部已经用它替代 Sonnet 来做 Agentic Coding 了,交出来的活儿接近 Opus 4.6 非思考模式,不过思考模式下还差一点。

世界知识储备丰富:在知识面评测里大幅领先其他开源模型,只稍微输给 Gemini-Pro-3.1 这个顶级闭源选手。

推理能力顶级:数学、STEM、竞赛级代码这些硬核评测里,V4-Pro 超越了所有已测评的开源模型,成绩已经可以和世界顶级的闭源模型比肩。

DeepSeek-V4-Pro 评测成绩

V4-Flash:更快更省钱

V4-Flash 在知识储备上稍微精简了一点,但推理能力依然在线。因为参数更小,响应更快,API 费用也更便宜。简单任务上和 V4-Pro 差不多,但复杂任务还是有差距。

V4-Pro 与 V4-Flash 对比

技术上的突破

V4 用了一种全新的注意力机制,在 token 维度做压缩,配合 DSA 稀疏注意力,实现了全球领先的长上下文能力。更厉害的是,相比传统方法大幅降低了对显存的需求。

从现在开始,100 万字上下文将成为 DeepSeek 所有服务的标配。

上下文越长,V4 的显存优势越明显

针对主流 Agent 产品做了专门优化

V4 对 Claude Code、OpenClaw、OpenCode、CodeBuddy 等主流 Agent 产品都做了适配调优,代码任务和文档生成类任务的体验都有提升。

怎么调用 API

V4-Pro 和 V4-Flash 都已上线,支持 OpenAI ChatCompletions 和 Anthropic 接口。base_url 不变,把 model 参数改成 deepseek-v4-prodeepseek-v4-flash 就行。

最大上下文 1M,支持普通模式和思考模式。思考模式下可以用 reasoning_effort 参数调整强度(high / max),复杂 Agent 场景建议用思考模式开到 max。

注意:旧的 deepseek-chatdeepseek-reasoner 会在三个月后(2026-07-24)停用,现在这两个名字实际上指向的是 V4-Flash 的普通模式和思考模式。

调用方式和参数调整请参考:DeepSeek 官方 API 文档

开源链接

模型权重已开源:

技术报告:PDF 下载

「不诱于誉,不恐于诽,率道而行,端然正己。」

发表评论