DeepSeek V4 月底发布前夜，国产大模型”集体抢跑”|AI 自学笔记

DeepSeek V4 发布时间定了——4月下旬。消息一出，国内各厂商似乎像是被按下了加速键：小米、腾讯、阿里、月之暗面、智谱、MiniMax……最近两周扎堆发布，一刻也不肯停。

这是一种微妙的默契，也是一场无声的卡位战。

DeepSeek 沉默了五个月，其他人在狂奔

DeepSeek 的上一次重磅发布，还是 2025年12月1日的 V3.2。但五个月过去了，V3.2 在全球基准排行榜上已滑落至第 16 位，被 OpenAI、Anthropic、Google，以及国内的阿里千问、月之暗面 Kimi、智谱 GLM、MiniMax 陆续超越。

更关键的是，2026 年是 Agent 元年，Coding 能力的差距正在被指数级放大。 Agent 任务靠生成代码来规划和执行任务，Coding 能力的强弱直接决定任务成功率、执行时间和 Token 消耗量。V3.2 在这个维度上已明显掉队。

然而 DeepSeek 的优势仍然可怕：凭借 MIT 最宽松的开源许可、超低定价（每百万 Tokens 输入 0.28 美元），以及"免费可本地部署"的能力，DeepSeek-V3/R1 系列依然在全球开发者中被广泛使用，在 OpenRouter 月调用量中仍稳居全球第三。

所以问题来了：DeepSeek V4 到底能拿出什么？如果它带着万亿参数、华为昇腾 950PR 国产芯片、以及更激进的定价登场——其他厂商抢占的市场份额，能守得住吗？

这就是各厂商赶在 V4 发布前"交作业"的底层逻辑。

据《财经》统计，2025年12月1日至2026年4月20日，中美11家主流模型公司已发布或迭代了 50款模型，几乎每2.8天就有一款。

最近一周尤为密集：

这场发布潮中最值得单独说的，是今天同步发布开源的 腾讯混元 Hy3 Preview。

这是腾讯首席 AI 科学家姚顺雨入职腾讯后的首次公开亮相。他给 Hy3 的定位是："混元大模型重建的第一步。"

核心参数：

三个主打方向：

已上线的生态：

值得注意的是，Hy3 Preview 选择在这个时间点高调开源，还宣布了 28元/月的平价套餐——这个定价本身就带有明确的竞争意图：在 DeepSeek V4 来袭之前，用低价锁定更多开发者。

第一层：锁定开发者心智。

大模型市场有很强的"先用先入"惯性。开发者一旦基于某个模型构建了工作流，迁移成本极高。DeepSeek V4 尚未发布，各厂商想赶在这个窗口期内尽可能多吃掉一些开发者的注意力和使用时长。

第二层：DeepSeek V4 的不确定性太大。

据报道，V4 将是首款完全运行于华为昇腾 950PR 芯片的万亿参数旗舰模型，且定价可能延续 DeepSeek 一贯的激进策略。如果 V4 如预期登场，它对市场的冲击将是全方位的——不仅仅是性能，还有"国产芯片替代"这一战略信号。

第三层：OpenRouter 份额争夺白热化。

OpenRouter 是全球开发者偏好的"风向标"。近期小米 MiMo-V2-Pro 已以 30% 市占率登顶 OpenRouter 周榜，打破了 MiniMax 连续霸榜的格局。中国模型总调用量已连续五周超美国，占比达 61%。 这是一场没有退路的阵地战。

4月下旬，DeepSeek V4 将正式登场。它会是那个"大魔王"吗？

国内厂商显然不想把答案交给运气。小米的 MiMo、腾讯的 Hy3、阿里的 Qwen3.6……这场在 V4 发布前的集体冲刺，既是对自身能力的一次检阅，也是对国产大模型市场格局的一次重新划定。

群狼能否撼动大象，月底见分晓。