Skip to content

DeepSeek 宣布 V4-Pro 永久降价 75%:价格打至原价 1/4,百万 Token 仅需 2 分钱

darlingyc

DeepSeek 再次扮演”价格屠夫”角色。5 月 22 日,DeepSeek 官方宣布,DeepSeek-V4-Pro 模型 API 价格将于 2026 年 5 月 31 日结束当前 2.5 折优惠活动后,正式调整为原定价的 1/4——换言之,这场折扣不是限时促销,而是永久降价。

这不是一次普通的”降价”,而是一次对全球大模型定价体系的重新锚定。

价格降到什么程度?

先看数字。调整后的 DeepSeek-V4-Pro API 价格如下:

场景 调整后价格
输入(缓存命中) 0.025 元 / 百万 Tokens
输入(缓存未命中) 3 元 / 百万 Tokens
输出 6 元 / 百万 Tokens

对比原价:输入(缓存未命中)原为 12 元,输出原为 24 元,均降至原来的 1/4。如果折算成美元,缓存命中的输入价格约为 0.0037 美元 / 百万 Tokens,比 GPT-5.5 和 Claude Opus 4.7 的同项价格低了约 138 倍

值得注意的是,这一价格并非”亏损换市场”的补贴价,而是建立在 V4 架构层面极致效率优化基础之上的真实成本下降。

V4-Pro 降价背后的技术底牌

为什么 DeepSeek 能把价格打这么低?答案不在于补贴,而在于架构层面的三项核心突破:

第一,CSA + HCA 混合注意力机制。V4 开创性地在 Token 维度进行压缩,结合 DSA 稀疏注意力(DeepSeek Sparse Attention),在百万 Tokens 的超长上下文场景下,将单 Token 推理 FLOPs 降至 V3.2 的 27%,KV Cache 占用降至 10%。Flash 版本更极端,这两项指标分别压至 10% 和 7%。

第二,mHC 流形约束超连接。通过引入流形约束超连接(manifold Hyper-Connection),不到 7% 的微小开销解决了超深网络的信号衰减难题,大幅提升了训练效率和收敛稳定性。

第三,Muon 优化器全面切换。V4 放弃了前代方案,全面切换至 Muon 优化器,在训练效率和收敛稳定性上实现了代际跃升。

百万上下文成为标配:从高端功能到基础设施

V4 的另一项重大改变是:百万(1M)Token 上下文从此成为 DeepSeek 所有官方服务的标配。

V4 通过 CSA+HCA 混合注意力机制,将百万上下文的 KV Cache 压缩至传统方案的 2%,推理计算量仅需 V3.2 的 27%。DeepSeek 官方在技术文档中加粗标注:「从现在开始,1M 上下文将是 DeepSeek 所有官方服务的标配。

华为昇腾:从”备选”到”首选”

V4 是 DeepSeek 首个在官方技术报告中,同时将英伟达 GPU 和华为昇腾 NPU 写进同一份硬件验证清单的模型,打破了英伟达在 AI 算力上的垄断叙事。

DeepSeek 明确表示:”预计下半年昇腾 950 超节点批量上市后,Pro 版本的价格会进一步下调。“阿里、字节、腾讯目前合计采购昇腾 950 超过 46 万颗,占该芯片全年预计出货量(75 万颗)的 60% 以上。

竞争格局:V4 正在改写什么?

以缓存命中输入价格为例,主流模型对比:

模型 缓存命中输入价格(美元/百万 Tokens)
DeepSeek V4-Pro(调整后) 0.0037
DeepSeek V4-Flash 0.0029
Gemini 3.5 Flash 0.15
Claude Opus 4.7 0.50
GPT-5.5 0.50

上海财经大学特聘教授胡延平指出,DeepSeek 此举意在延揽更多企业用户、开发者和各类 Agent 用户。在 Agent 场景下,V4 的成本优势会被进一步放大——企业可以用远低于海外模型的成本,跑通完整的 Agent 商业闭环。

一条鲶鱼,连续搅动

回顾 DeepSeek 过去一年的动作路径:

  • 2025 年 1 月:DeepSeek R1 发布,以极低价格冲击推理市场
  • 2026 年 4 月 24 日:V4 发布,高性能版 V4-Pro 和轻量版 V4-Flash 同步上线
  • 2026 年 4 月 26 日:V4 上市次日,DeepSeek 宣布全系 API 缓存命中价格降至 1/10,V4-Pro 叠加 2.5 折限时优惠
  • 2026 年 5 月 22 日:2.5 折优惠由限时变为永久,降价 75%,价格锁定在原价 1/4

DeepSeek 不需要永远站在性能榜首。它真正在做的,是一次次用价格和架构创新,拉低 AI 落地的门槛,倒逼整个行业跟进。当”Kimi K2.6″、”智谱 GLM-5.1″、”阿里 Qwen”纷纷加入战局时,国产大模型的集体进化就开始了——这条鲶鱼,正在搅活整个水池。


来源:Reuters、证券时报、每日经济新闻、21 世纪经济报道、IT 之友、鉅亨網、知乎专栏等综合整理 | 2026 年 5 月 23 日