DeepSeek V4 正式版 7 月中旬上线：引入峰谷定价机制，高峰时段价格翻倍

DeepSeek V4 的”预览版”标签即将成为历史。

DeepSeek 官方于 6 月 29 日向 API 用户发送邮件，正式宣布 DeepSeek V4 正式版计划于 2026 年 7 月中旬全面上线，届时当前以”预览版”名义服务的 deepseek-v4-pro 和 deepseek-v4-flash 将结束试运行状态，以正式版身份面向所有用户开放。这是自 4 月 24 日 V4 首次以预览版发布以来，DeepSeek 首次给出明确的正式版时间表。

与此同时，V4 正式版发布后将同步调整 API 定价策略，引入峰谷定价机制——这是大模型 API 领域首次出现的基于时段的动态定价模式，引起了开发者社群的广泛关注。

峰谷定价：每天有 7 个小时按”高峰价”计费

根据 DeepSeek 官方邮件，本次定价调整的核心变化是从单一固定价格变为峰谷两段制定价。高峰时段定义为每天北京时间 9:00～12:00 和 14:00～18:00，共覆盖 7 个小时。在高峰时段内，API 调用价格统一按”平时价”的 2 倍 计算。

具体的定价方案如下：

deepseek-v4-pro

计费项	平时价格（每百万tokens）	高峰时段价格（每百万tokens）
输入（缓存命中）	0.025 元	0.05 元
输入（缓存未命中）	3 元	6 元
输出	6 元	12 元

deepseek-v4-flash

计费项	平时价格（每百万tokens）	高峰时段价格（每百万tokens）
输入（缓存命中）	0.02 元	0.04 元
输入（缓存未命中）	1 元	2 元
输出	2 元	4 元

可以看到，V4 Flash 依然是面向高吞吐量场景的经济选择：平时价格下，每百万 tokens 输入（缓存未命中）仅 1 元，输出 2 元，在主流大模型中具备极强的价格竞争力。V4 Pro 则定位更强的推理与编程能力，适合对质量要求更高的复杂任务，价格也相应更高。

值得注意的一点是缓存命中的价格极低——每百万 tokens 仅需 0.02～0.025 元，这意味着在提示词设计时充分利用 Context Caching（上下文缓存）功能，可以显著降低使用成本。

峰谷定价：大模型行业的第一次

严格来说，大模型 API 的定价历史上从未出现过基于时间段的动态定价。Google、OpenAI、Anthropic 等主流厂商均采用固定价格，无论用户在美国西部凌晨 3 点还是北京下午 3 点调用，价格完全一致。DeepSeek 此番引入峰谷定价，打破了这一惯例。

这一机制的逻辑不难理解：大模型推理需要大量 GPU 算力，而 GPU 数据中心的负载并非均匀分布——工作日白天（尤其是北美和中国的上班时段）是全球 API 调用的高峰期，GPU 资源最为紧张。通过价格信号分流需求，鼓励开发者在非高峰时段使用服务，有助于平衡算力利用率、提升整体服务稳定性。

对开发者而言，这意味着在设计调用策略时需要多一层考量。如果你的应用场景对延迟要求不苛刻（比如批量处理、离线分析、内容生成等），可以选择在低谷时段（每天 18:00 后至次日 9:00 前，以及 12:00～14:00）集中调用，以节省一半的费用。但如果你的服务面向实时用户交互、高峰期流量不可回避，则需要在成本和体验之间做出取舍。

V4 正式版的意义：Preview 这一棒，交得差不多了

回顾一下 DeepSeek V4 的发布时间线：

2026 年 1 月：外界开始流传 V4 相关信息，传闻聚焦于代码能力提升和 Engram 记忆架构
2026 年 2 月 11 日：V4 Lite（2000亿参数）悄然上线，属于小规模灰度测试
2026 年 4 月 24 日：V4 预览版正式上线，同时开放 deepseek-v4-pro 和 deepseek-v4-flash 两个模型，API 文档、定价、开放权重全部公开
2026 年 5 月 31 日：V4 Pro 75% 折扣期结束，价格恢复至原价（涨至原来的 4 倍）
2026 年 6 月 16 日：Microsoft 宣布正在评估 DeepSeek V4 作为 Copilot Cowork 的低成本推理引擎，已完成 fine-tune，预计数周内决定是否采纳
2026 年 6 月 29 日：官方邮件确认 V4 正式版 7 月中旬上线，同时引入峰谷定价机制

从 4 月 24 日到 7 月中旬，Preview 阶段持续了将近三个月。这个周期对于一个 1.6 万亿参数（49B 激活参数）、支持 100 万 token 上下文的大模型来说，是一次相当充分的真实世界检验。微软在此期间完成对 V4 的评估和 fine-tune，本身就是对该模型能力的一次重要背书。

开发者需要注意什么

第一，关注 7 月中旬的正式版公告。 虽然 Preview 版在功能上已经相当稳定，但正式版通常会伴随一些变化——可能包括模型行为微调、新功能解锁，或者是 API 端点的调整。建议在正式版上线后留意 DeepSeek 官方的更新日志。

第二，检查现有代码中的模型别名。 deepseek-chat 和 deepseek-reasoner 这两个旧别名将于 7 月 24 日彻底停用，届时所有调用都将被拒绝。如果你的项目中还在使用旧别名，需要尽快迁移到 deepseek-v4-flash 或 deepseek-v4-pro。迁移成本很低——官方表示”只需修改 model 参数”，无需更换 API 端点或重写调用逻辑。

第三，重新评估成本模型。 如果你的应用日间流量集中，现在需要将高峰时段 2 倍价格纳入成本计算。建议梳理一下当前 API 调用的时段分布，评估是否有可能将部分非实时任务迁移至低谷时段执行。

第四，充分利用 Context Caching。 考虑到缓存命中价格仅为未命中的百分之一到百分之几，在可能的情况下对重复性高、上下文固定的场景（如长文档分析、客服机器人、代码审查等）启用缓存，可以带来极其显著的成本优化空间。

总结一下： DeepSeek V4 正式版 7 月中旬上线，标志着这款国产开源大模型从”预览”走向”正式商用”。配合新引入的峰谷定价机制，DeepSeek 在价格策略上走出了一条其他大厂没有走过的路——用时间段价格信号来调节算力需求。对开发者来说，这既是成本优化的新课题，也是大模型商业化进程中的一个有趣注脚。7 月中旬，我们拭目以待。

*参考来源：DeepSeek 官方 2026 年 6 月 29 日致用户邮件；DeepSeek API 文档更新日志；Axios、Microsoft AI 博客等相关报道。*