DeepSeek-V4 预览版发布：百万上下文来了

DeepSeek-V4 预览版今天正式上线，同时开源。简单说几个亮点：百万字超长上下文、Agent 能力大幅提升、推理性能已经能和世界顶级的闭源模型掰手腕了。

两个版本，V4-Pro 和 V4-Flash，今天起就能用。直接去 chat.deepseek.com 或者下个官方 App 就能体验。

API 也同步更新了，改个 model_name 就行：deepseek-v4-pro 或者 deepseek-v4-flash。

V4-Pro：性能对标顶级闭源模型

Agent 能力明显变强：代码评测里，V4-Pro 已经是开源模型里最好的那一档了，其他 Agent 相关的测试里也表现优异。目前内部已经用它替代 Sonnet 来做 Agentic Coding 了，交出来的活儿接近 Opus 4.6 非思考模式，不过思考模式下还差一点。

世界知识储备丰富：在知识面评测里大幅领先其他开源模型，只稍微输给 Gemini-Pro-3.1 这个顶级闭源选手。

推理能力顶级：数学、STEM、竞赛级代码这些硬核评测里，V4-Pro 超越了所有已测评的开源模型，成绩已经可以和世界顶级的闭源模型比肩。

DeepSeek-V4-Pro 评测成绩

V4-Flash 在知识储备上稍微精简了一点，但推理能力依然在线。因为参数更小，响应更快，API 费用也更便宜。简单任务上和 V4-Pro 差不多，但复杂任务还是有差距。

V4-Pro 与 V4-Flash 对比

V4 用了一种全新的注意力机制，在 token 维度做压缩，配合 DSA 稀疏注意力，实现了全球领先的长上下文能力。更厉害的是，相比传统方法大幅降低了对显存的需求。

从现在开始，100 万字上下文将成为 DeepSeek 所有服务的标配。

上下文越长，V4 的显存优势越明显

V4 对 Claude Code、OpenClaw、OpenCode、CodeBuddy 等主流 Agent 产品都做了适配调优，代码任务和文档生成类任务的体验都有提升。

V4-Pro 和 V4-Flash 都已上线，支持 OpenAI ChatCompletions 和 Anthropic 接口。base_url 不变，把 model 参数改成 deepseek-v4-pro 或 deepseek-v4-flash 就行。

最大上下文 1M，支持普通模式和思考模式。思考模式下可以用 reasoning_effort 参数调整强度（high / max），复杂 Agent 场景建议用思考模式开到 max。

注意：旧的 deepseek-chat 和 deepseek-reasoner 会在三个月后（2026-07-24）停用，现在这两个名字实际上指向的是 V4-Flash 的普通模式和思考模式。

调用方式和参数调整请参考：DeepSeek 官方 API 文档

模型权重已开源：

技术报告：PDF 下载

「不诱于誉，不恐于诽，率道而行，端然正己。」