DeepSeek-V4 预览版今日开源。两个尺寸、1M token 标配、FLOPs 与 KV Cache 同时压缩至一个数量级。
这不是冲破天花板的世界最佳发布。就在一周前 Opus 4.7 上线、昨天 GPT-5.5 发布,新 SOTA 已在别处。
V4 做的另一件事是,把 1M 超长上下文的 agent 模型,第一次交到每个开发者手里。
论文对标 GPT-5.4 与 Claude Opus 4.6。V4-Flash 用更小激活参数反超 V3.2-Base,成为真正意义上的价格屠夫。
公司内部员工的默认 Agentic Coding 模型。性能接近 Opus 4.6,推理优于 Sonnet 4.5。
论文对标 GPT-5.4 xHigh · Claude Opus 4.6 Max · Gemini 3.1 Pro High
发布时新 SOTA 已是 Opus 4.7(04-16)与 GPT-5.5(04-23)
用 V3.2-Base 五分之一的激活参数,跑出反超 V3.2-Base 的综合得分。
定位 速度与成本优先的生产环境 · API 默认主力
V4 没有发明新的损失函数、没有改 MoE 路由。所有创新都集中在「信号怎么流动」和「梯度怎么更新」。
给残差连接加了一道「只准收缩不准放大」的数学护栏。把残差映射约束到双随机矩阵流形上,谱范数恒 ≤ 1,深层堆叠不再炸。
粗细两把筛子在 Transformer 块之间交替。CSA 用 Lightning Indexer 挑 top-k 做稀疏;HCA 激进压缩、dense 扫全局。1M 上下文 KV cache 仅为 GQA8 baseline 的约 2%。
替代大部分模块的 AdamW。用 Newton-Schulz 迭代把动量矩阵投影成正交矩阵,每个方向更新步长相等。不偏科、更稳、收敛更快,且可以直接复用 AdamW 的超参。
量化感知训练让训练和推理比特级一致。KV 存储用混合精度:RoPE 维度 BF16、其余 FP8、Lightning Indexer 直接 FP4。省显存的同时不掉点。
秘密不在于更大的显卡或更多的参数。CSA+HCA 混合注意力让 query 在不同层之间看「细节」或看「全局」,把多余的注意力当场剪掉。
对标升级:Opus 4.7(2026-04-16)与 GPT-5.5(2026-04-23)。数据取自 DS-V4 技术报告、Opus 4.7 System Card 与 GPT-5.5 官方博客。「—」为原厂未披露或口径不一致。
做题 · 解题 · 形式化证明 · 竞赛编程 —— 这些有明确答案的赛道,V4-Pro 是新上限。
Agent / 工程代码 / 长 horizon 任务 —— V4-Pro 追上开源阵营前列,但仍落后 Opus 4.7 与 GPT-5.5 半个版本代差。
V4 是第一个在数学/编程单科目上反超闭源旗舰的开源模型,但在需要品味的任务上仍输 Opus。这份诚实写在论文里,不是藏着。
日常中文写作 V4-Pro 对 Gemini 3.1 Pro 的写作质量胜率是 77.5%,几乎碾压。但一旦换成高难度多约束的创意场景对标 Claude Opus 4.5,胜率掉到 45.9%,翻车。更别提 Opus 4.6 / 4.7。
Terminal-Bench 2.0 落后 GPT-5.5 整整 14.8 分。HLE w/ tools 甚至输给 K2.6-Thinking。论文原话:「所有开源模型仍落后闭源对手」——不演、不粉饰。
知识类四冠王仍是 Gemini 3.1 Pro。V4-Pro-Max 的 HLE 是 37.7,比 Gemini 低 6.7 分。论文承认:通用世界知识上,开源「缩短到接近但未追平」。
DeepSeek 招的员工大多数是竞赛获奖选手。模型在做题解题上的强势、在品味任务上的弱势,本质上是一种基因的延伸——这一点,论文里写得坦白,发布文里也没藏着。
所有价格为 DeepSeek 官方人民币报价,单位「元 / 百万 token」。缓存命中指已用过的上下文前缀再次使用。
「受限于高端算力,目前 Pro 的服务吞吐十分有限,预计下半年昇腾 950 超节点批量上市后,Pro 的价格会大幅下调。」— DeepSeek 官方价格说明,2026-04-24
不画大饼,先承认约束、给出时间表。这是观点 4「最诚实、本分的模型」的一个切面。
V4-Pro 对标 Opus 4.6 与 GPT-5.4 的能力,Pro 的定价是「对标顶级闭源的开源最佳」,便宜是结果,不是主打。
Flash 的 0.2 元缓存命中价,把 1M 长上下文 agent 第一次做进大多数开发者的日常账单里。
官方明确提到,V4 已针对主流 Agent 产品做了适配和优化。不是再造一个 IDE,是在别人已经铺好的路上,换一个引擎。
API 同时兼容 OpenAI ChatCompletions 接口与 Anthropic 接口。多数 agent 项目只需改一行 model_name。
「不诱于誉,不恐于诽,— 荀子 · 非十二子,DeepSeek 官方发布文结语引用
率道而行,端然正己。」