这是一种微妙的默契,也是一场无声的卡位战。
DeepSeek 沉默了五个月,其他人在狂奔
DeepSeek 的上一次重磅发布,还是 2025年12月1日的 V3.2。但五个月过去了,V3.2 在全球基准排行榜上已滑落至第 16 位,被 OpenAI、Anthropic、Google,以及国内的阿里千问、月之暗面 Kimi、智谱 GLM、MiniMax 陆续超越。
更关键的是,2026 年是 Agent 元年,Coding 能力的差距正在被指数级放大。 Agent 任务靠生成代码来规划和执行任务,Coding 能力的强弱直接决定任务成功率、执行时间和 Token 消耗量。V3.2 在这个维度上已明显掉队。
然而 DeepSeek 的优势仍然可怕:凭借 MIT 最宽松的开源许可、超低定价(每百万 Tokens 输入 0.28 美元),以及"免费可本地部署"的能力,DeepSeek-V3/R1 系列依然在全球开发者中被广泛使用,在 OpenRouter 月调用量中仍稳居全球第三。
所以问题来了:DeepSeek V4 到底能拿出什么?如果它带着万亿参数、华为昇腾 950PR 国产芯片、以及更激进的定价登场——其他厂商抢占的市场份额,能守得住吗?
这就是各厂商赶在 V4 发布前"交作业"的底层逻辑。
这场抢跑有多密集?
据《财经》统计,2025年12月1日至2026年4月20日,中美11家主流模型公司已发布或迭代了 50款模型,几乎每2.8天就有一款。
最近一周尤为密集:
| 时间 | 厂商 | 模型 | 核心亮点 |
|---|---|---|---|
| 4月23日 | 小米 | MiMo-V2.5 系列 | V2.5 / V2.5-Pro / TTS / ASR 四版本齐发 |
| 4月23日 | 腾讯 | Hy3 Preview | 295B 总参数 / 21B 激活,开源 |
| 4月22日 | 月之暗面 | Kimi K2.6 | 深度测评流出,Agent 能力大幅提升 |
| 4月21日 | 阿里 | Qwen3.6-Max-Preview | 超越 GLM5.1,逼近 GPT-6 |
| 4月18日 | 小米 | MiMo-V2.5-Pro | OpenRouter 周榜第一 |
| 4月17日 | 阿里 | Qwen3.6-35B-A3B | 30亿激活参数,顶尖编程能力 |
| 4月15日 | 智谱 | GLM-5-Turbo | 首款"龙虾场景原生模型" |
腾讯 Hy3 Preview:姚顺雨的首秀,混元的最大赌注
这场发布潮中最值得单独说的,是今天同步发布开源的 腾讯混元 Hy3 Preview。
这是腾讯首席 AI 科学家姚顺雨入职腾讯后的首次公开亮相。他给 Hy3 的定位是:"混元大模型重建的第一步。"
核心参数:
- 总参数 295B,激活参数 21B,MTP 层参数 38B
- 支持 256K 上下文
- MoE 架构 + 快慢思考融合
三个主打方向:
- 复杂推理:在 IMOAnswerBench、全国中学生生物学联赛等高难度理工科任务中表现突出
- 代码 & Agent:SWE-Bench Verified、Terminal-Bench 2.0、ClawEval 等基准评测全面提升
- 上下文学习:自建 CL-bench 评估体系,创新衡量长上下文能力
已上线的生态:
- 腾讯系:元宝、CodeBuddy、WorkBuddy、QQ、ima、QQ浏览器、腾讯文档
- 开源生态:OpenClaw、OpenCode、KiloCode 已支持接入
- API 价格:输入最低 1.2 元/百万 tokens,输出最低 4 元/百万 tokens
- Token Plan:个人版最低 28元/月
值得注意的是,Hy3 Preview 选择在这个时间点高调开源,还宣布了 28元/月的平价套餐——这个定价本身就带有明确的竞争意图:在 DeepSeek V4 来袭之前,用低价锁定更多开发者。
抢跑背后的三层逻辑
第一层:锁定开发者心智。
大模型市场有很强的"先用先入"惯性。开发者一旦基于某个模型构建了工作流,迁移成本极高。DeepSeek V4 尚未发布,各厂商想赶在这个窗口期内尽可能多吃掉一些开发者的注意力和使用时长。
第二层:DeepSeek V4 的不确定性太大。
据报道,V4 将是首款完全运行于华为昇腾 950PR 芯片的万亿参数旗舰模型,且定价可能延续 DeepSeek 一贯的激进策略。如果 V4 如预期登场,它对市场的冲击将是全方位的——不仅仅是性能,还有"国产芯片替代"这一战略信号。
第三层:OpenRouter 份额争夺白热化。
OpenRouter 是全球开发者偏好的"风向标"。近期小米 MiMo-V2-Pro 已以 30% 市占率登顶 OpenRouter 周榜,打破了 MiniMax 连续霸榜的格局。中国模型总调用量已连续五周超美国,占比达 61%。 这是一场没有退路的阵地战。
写在最后
4月下旬,DeepSeek V4 将正式登场。它会是那个"大魔王"吗?
国内厂商显然不想把答案交给运气。小米的 MiMo、腾讯的 Hy3、阿里的 Qwen3.6……这场在 V4 发布前的集体冲刺,既是对自身能力的一次检阅,也是对国产大模型市场格局的一次重新划定。
群狼能否撼动大象,月底见分晓。