DeepSeek 刚降完小米就跟上：AI 大模型定价，彻底卷成「水电煤」

5月22日，DeepSeek 一纸公告把 V4-Pro API 永久降到原价 1/4，输入价格跌到 2.5 厘钱。朋友圈刚转发完，5月27日小米 MiMo 团队直接宣布 V4.5 全系最高降价 99%，输入价格压到 2 分钱——比 DeepSeek 还低。

不到一周，两记重锤。

这不是价格战，是定价逻辑的重写。

一、两个「99%」，两种路径

DeepSeek 的降价，延续了梁文锋一贯的开源逻辑：把价格打下来，让生态活起来。V4-Pro 这一轮永久降价，本质上是把 2.5 折优惠活动的折扣变成了常态，相当于每天都在「做大促」。背后是 450 亿美元估值的融资故事在支撑——用价格换市场，用市场撑估值，逻辑自洽。

小米的降价路径则不同。MiMo 不是纯软件公司，它的商业逻辑建立在硬件生态上。降价 99% 的底气，来自 SGLang HiCache 技术优化带来的真实成本下降——KV Cache 在 GPU 显存、CPU 内存、SSD 多级存储之间的数据搬运量降到了原来的近 1/7，可缓存 token 数量提升了近 5 倍。这是工程上的突破，不是补贴换市场。

两个团队，两套逻辑，同一个结论：AI 模型的价格，已经没有讨论空间了。

二、「水电煤」时代来了

什么叫水电煤？

就是你不关心它多少钱一度，只关心能不能用。大模型定价走到今天这个节点，输入价格已经低到「分」这个单位——2 分钱 100 万 tokens，2 厘钱 100 万 tokens，这个数字在五年前不可想象，在今天已经是常态。

更关键的是，两家都不再区分上下文长度。MiMo 把 Token Plan 用量直接提升了 5 到 8 倍，DeepSeek 的缓存命中价格和正常价格同时下调。这不是促销手段，是定价结构的根本变化——模型厂商已经默认，上下文越长、调用越密，成本越应该被摊薄。

当价格低到不需要比价，开发者还会在意用 DeepSeek 还是 MiMo 吗？

会。但原因变了——不再是价格，而是场景适配。

三、2026 下半年，可能是 AI 开发成本最低的时间窗口

对开发者而言，这轮降价的好处是实实在在的。

做 AI 应用的公司，模型调用成本通常占总成本的 30% 到 50%。输入价格跌掉 90%，意味着同样的预算可以跑 10 倍的量，或者同样的用量只需要付十分之一的钱。对于还在验证商业模式的创业团队，这几乎是送上门的「成本优势窗口期」。

但这个窗口不会一直开着。

价格战打到这个程度，最终受伤的不是头部大厂，而是中间层——那些靠模型调用差价活着的中间件厂商、套壳工具、SaaS 平台。当源模型价格直接到底，它们的溢价空间被压缩殆尽。不是说这些角色会消失，而是生存逻辑要重新设计：要么向上走，做垂直场景的深度优化；要么向下沉，靠数据和用户体验筑墙。

模型层越来越便宜，应用层越来越卷。这件事正在发生。

四、隐忧：大厂专属游戏？

每次有人提价格战，总有人问：中小企业真的能受益吗？

答案没那么乐观。

价格战的发起者，要么是 DeepSeek 这种融资储备充足、有明确生态目标的；要么是小米这种有硬件利润兜底、可以用软件服务补贴的。它们的降价不需要短期盈利支撑，账可以慢慢算。

但纯软件公司、没有外部融资的中小模型厂商，就没这个底气了。价格战打到某个临界点，它们只能跟进或者退场。跟进意味着赔钱抢占市场，退场意味着彻底出局。

换句话说，这一轮降价背后，AI 行业的集中度可能在加速提升。大厂用价格做护城河，中小玩家被迫在夹缝中求生，最终市场会向着头部玩家集中。

这不是危言耸听。每一轮价格战的终局，都是行业洗牌。这次也不例外。

最后

DeepSeek 和小米在五天内连续出拳，把 AI 大模型的价格彻底打到了「成本价时代」。对开发者来说，这是好事——低成本窗口打开了，试错空间变大了。但对于整个行业，价格战的硝烟散去之后，淘汰赛才刚刚开始。

2026 年的 AI 战场，模型本身的壁垒会越来越低，真正的护城河会转向数据、转向场景、转向用户体验。谁能跑通商业模式，谁才能笑到最后。

价格战只是开始。

DeepSeek 刚降完小米就跟上：AI 大模型定价，彻底卷成「水电煤」

一、两个「99%」，两种路径

二、「水电煤」时代来了

三、2026 下半年，可能是 AI 开发成本最低的时间窗口

四、隐忧：大厂专属游戏？

最后

MiniCPM-V 4.6 发布：1.3B 参数挑战多模态极限，手机上就能跑

OpenClaw v2026.5.26 更新发布

DeepSeek 刚降完小米就跟上：AI 大模型定价，彻底卷成「水电煤」

一、两个「99%」，两种路径

二、「水电煤」时代来了

三、2026 下半年，可能是 AI 开发成本最低的时间窗口

四、隐忧：大厂专属游戏？

最后

MiniCPM-V 4.6 发布：1.3B 参数挑战多模态极限，手机上就能跑

OpenClaw v2026.5.26 更新发布

AI 自学笔记