5月22日,DeepSeek 一纸公告把 V4-Pro API 永久降到原价 1/4,输入价格跌到 2.5 厘钱。朋友圈刚转发完,5月27日小米 MiMo 团队直接宣布 V4.5 全系最高降价 99%,输入价格压到 2 分钱——比 DeepSeek 还低。
不到一周,两记重锤。
这不是价格战,是定价逻辑的重写。
一、两个「99%」,两种路径
DeepSeek 的降价,延续了梁文锋一贯的开源逻辑:把价格打下来,让生态活起来。V4-Pro 这一轮永久降价,本质上是把 2.5 折优惠活动的折扣变成了常态,相当于每天都在「做大促」。背后是 450 亿美元估值的融资故事在支撑——用价格换市场,用市场撑估值,逻辑自洽。
小米的降价路径则不同。MiMo 不是纯软件公司,它的商业逻辑建立在硬件生态上。降价 99% 的底气,来自 SGLang HiCache 技术优化带来的真实成本下降——KV Cache 在 GPU 显存、CPU 内存、SSD 多级存储之间的数据搬运量降到了原来的近 1/7,可缓存 token 数量提升了近 5 倍。这是工程上的突破,不是补贴换市场。
两个团队,两套逻辑,同一个结论:AI 模型的价格,已经没有讨论空间了。
二、「水电煤」时代来了
什么叫水电煤?
就是你不关心它多少钱一度,只关心能不能用。大模型定价走到今天这个节点,输入价格已经低到「分」这个单位——2 分钱 100 万 tokens,2 厘钱 100 万 tokens,这个数字在五年前不可想象,在今天已经是常态。
更关键的是,两家都不再区分上下文长度。MiMo 把 Token Plan 用量直接提升了 5 到 8 倍,DeepSeek 的缓存命中价格和正常价格同时下调。这不是促销手段,是定价结构的根本变化——模型厂商已经默认,上下文越长、调用越密,成本越应该被摊薄。
当价格低到不需要比价,开发者还会在意用 DeepSeek 还是 MiMo 吗?
会。但原因变了——不再是价格,而是场景适配。
三、2026 下半年,可能是 AI 开发成本最低的时间窗口
对开发者而言,这轮降价的好处是实实在在的。
做 AI 应用的公司,模型调用成本通常占总成本的 30% 到 50%。输入价格跌掉 90%,意味着同样的预算可以跑 10 倍的量,或者同样的用量只需要付十分之一的钱。对于还在验证商业模式的创业团队,这几乎是送上门的「成本优势窗口期」。
但这个窗口不会一直开着。
价格战打到这个程度,最终受伤的不是头部大厂,而是中间层——那些靠模型调用差价活着的中间件厂商、套壳工具、SaaS 平台。当源模型价格直接到底,它们的溢价空间被压缩殆尽。不是说这些角色会消失,而是生存逻辑要重新设计:要么向上走,做垂直场景的深度优化;要么向下沉,靠数据和用户体验筑墙。
模型层越来越便宜,应用层越来越卷。这件事正在发生。
四、隐忧:大厂专属游戏?
每次有人提价格战,总有人问:中小企业真的能受益吗?
答案没那么乐观。
价格战的发起者,要么是 DeepSeek 这种融资储备充足、有明确生态目标的;要么是小米这种有硬件利润兜底、可以用软件服务补贴的。它们的降价不需要短期盈利支撑,账可以慢慢算。
但纯软件公司、没有外部融资的中小模型厂商,就没这个底气了。价格战打到某个临界点,它们只能跟进或者退场。跟进意味着赔钱抢占市场,退场意味着彻底出局。
换句话说,这一轮降价背后,AI 行业的集中度可能在加速提升。大厂用价格做护城河,中小玩家被迫在夹缝中求生,最终市场会向着头部玩家集中。
这不是危言耸听。每一轮价格战的终局,都是行业洗牌。这次也不例外。
最后
DeepSeek 和小米在五天内连续出拳,把 AI 大模型的价格彻底打到了「成本价时代」。对开发者来说,这是好事——低成本窗口打开了,试错空间变大了。但对于整个行业,价格战的硝烟散去之后,淘汰赛才刚刚开始。
2026 年的 AI 战场,模型本身的壁垒会越来越低,真正的护城河会转向数据、转向场景、转向用户体验。谁能跑通商业模式,谁才能笑到最后。
价格战只是开始。