DeepSeek V4 正式版 7 月中旬上线:引入峰谷定价机制,高峰时段价格翻倍

DeepSeek V4 的”预览版”标签即将成为历史。

DeepSeek 官方于 6 月 29 日向 API 用户发送邮件,正式宣布 DeepSeek V4 正式版计划于 2026 年 7 月中旬全面上线,届时当前以”预览版”名义服务的 deepseek-v4-prodeepseek-v4-flash 将结束试运行状态,以正式版身份面向所有用户开放。这是自 4 月 24 日 V4 首次以预览版发布以来,DeepSeek 首次给出明确的正式版时间表。

与此同时,V4 正式版发布后将同步调整 API 定价策略,引入峰谷定价机制——这是大模型 API 领域首次出现的基于时段的动态定价模式,引起了开发者社群的广泛关注。


峰谷定价:每天有 7 个小时按”高峰价”计费

根据 DeepSeek 官方邮件,本次定价调整的核心变化是从单一固定价格变为峰谷两段制定价。高峰时段定义为每天北京时间 9:00~12:00 和 14:00~18:00,共覆盖 7 个小时。在高峰时段内,API 调用价格统一按”平时价”的 2 倍 计算。

具体的定价方案如下:

deepseek-v4-pro

计费项平时价格(每百万tokens)高峰时段价格(每百万tokens)
输入(缓存命中)0.025 元0.05 元
输入(缓存未命中)3 元6 元
输出6 元12 元

deepseek-v4-flash

计费项平时价格(每百万tokens)高峰时段价格(每百万tokens)
输入(缓存命中)0.02 元0.04 元
输入(缓存未命中)1 元2 元
输出2 元4 元

可以看到,V4 Flash 依然是面向高吞吐量场景的经济选择:平时价格下,每百万 tokens 输入(缓存未命中)仅 1 元,输出 2 元,在主流大模型中具备极强的价格竞争力。V4 Pro 则定位更强的推理与编程能力,适合对质量要求更高的复杂任务,价格也相应更高。

值得注意的一点是缓存命中的价格极低——每百万 tokens 仅需 0.02~0.025 元,这意味着在提示词设计时充分利用 Context Caching(上下文缓存)功能,可以显著降低使用成本。


峰谷定价:大模型行业的第一次

严格来说,大模型 API 的定价历史上从未出现过基于时间段的动态定价。Google、OpenAI、Anthropic 等主流厂商均采用固定价格,无论用户在美国西部凌晨 3 点还是北京下午 3 点调用,价格完全一致。DeepSeek 此番引入峰谷定价,打破了这一惯例。

这一机制的逻辑不难理解:大模型推理需要大量 GPU 算力,而 GPU 数据中心的负载并非均匀分布——工作日白天(尤其是北美和中国的上班时段)是全球 API 调用的高峰期,GPU 资源最为紧张。通过价格信号分流需求,鼓励开发者在非高峰时段使用服务,有助于平衡算力利用率、提升整体服务稳定性。

对开发者而言,这意味着在设计调用策略时需要多一层考量。如果你的应用场景对延迟要求不苛刻(比如批量处理、离线分析、内容生成等),可以选择在低谷时段(每天 18:00 后至次日 9:00 前,以及 12:00~14:00)集中调用,以节省一半的费用。但如果你的服务面向实时用户交互、高峰期流量不可回避,则需要在成本和体验之间做出取舍。


V4 正式版的意义:Preview 这一棒,交得差不多了

回顾一下 DeepSeek V4 的发布时间线:

  • 2026 年 1 月:外界开始流传 V4 相关信息,传闻聚焦于代码能力提升和 Engram 记忆架构
  • 2026 年 2 月 11 日:V4 Lite(2000亿参数)悄然上线,属于小规模灰度测试
  • 2026 年 4 月 24 日:V4 预览版正式上线,同时开放 deepseek-v4-prodeepseek-v4-flash 两个模型,API 文档、定价、开放权重全部公开
  • 2026 年 5 月 31 日:V4 Pro 75% 折扣期结束,价格恢复至原价(涨至原来的 4 倍)
  • 2026 年 6 月 16 日:Microsoft 宣布正在评估 DeepSeek V4 作为 Copilot Cowork 的低成本推理引擎,已完成 fine-tune,预计数周内决定是否采纳
  • 2026 年 6 月 29 日:官方邮件确认 V4 正式版 7 月中旬上线,同时引入峰谷定价机制

从 4 月 24 日到 7 月中旬,Preview 阶段持续了将近三个月。这个周期对于一个 1.6 万亿参数(49B 激活参数)、支持 100 万 token 上下文的大模型来说,是一次相当充分的真实世界检验。微软在此期间完成对 V4 的评估和 fine-tune,本身就是对该模型能力的一次重要背书。


开发者需要注意什么

第一,关注 7 月中旬的正式版公告。 虽然 Preview 版在功能上已经相当稳定,但正式版通常会伴随一些变化——可能包括模型行为微调、新功能解锁,或者是 API 端点的调整。建议在正式版上线后留意 DeepSeek 官方的更新日志。

第二,检查现有代码中的模型别名。 deepseek-chatdeepseek-reasoner 这两个旧别名将于 7 月 24 日彻底停用,届时所有调用都将被拒绝。如果你的项目中还在使用旧别名,需要尽快迁移到 deepseek-v4-flashdeepseek-v4-pro。迁移成本很低——官方表示”只需修改 model 参数”,无需更换 API 端点或重写调用逻辑。

第三,重新评估成本模型。 如果你的应用日间流量集中,现在需要将高峰时段 2 倍价格纳入成本计算。建议梳理一下当前 API 调用的时段分布,评估是否有可能将部分非实时任务迁移至低谷时段执行。

第四,充分利用 Context Caching。 考虑到缓存命中价格仅为未命中的百分之一到百分之几,在可能的情况下对重复性高、上下文固定的场景(如长文档分析、客服机器人、代码审查等)启用缓存,可以带来极其显著的成本优化空间。


总结一下: DeepSeek V4 正式版 7 月中旬上线,标志着这款国产开源大模型从”预览”走向”正式商用”。配合新引入的峰谷定价机制,DeepSeek 在价格策略上走出了一条其他大厂没有走过的路——用时间段价格信号来调节算力需求。对开发者来说,这既是成本优化的新课题,也是大模型商业化进程中的一个有趣注脚。7 月中旬,我们拭目以待。


*参考来源:DeepSeek 官方 2026 年 6 月 29 日致用户邮件;DeepSeek API 文档更新日志;Axios、Microsoft AI 博客等相关报道。*