Skip to content

MiniMax M3 发布:首个百万上下文的国产旗舰大模型,三项前沿能力一次集结

2026年6月1日,国内AI独角兽MiniMax正式发布新一代文本生成大模型MiniMax M3。这是国内首个同时具备“前沿 Coding 能力”、“百万上下文”和“原生多模态”三大核心能力的旗舰模型,被MiniMax形容为“第一个把完整前沿能力带进开放世界的模型”。

在此之前,能够同时跑通这三种能力的模型在全球范围内仅有极少数顶级闭源模型,而M3的面世,意味着国产大模型正式进入了这一被视为“行业天花板”的前沿阵营。

核心升级:MSA架构带来百万级上下文

M3最核心的技术创新在于其自研的MiniMax Sparse Attention(MSA)架构。传统的Transformer注意力机制在处理长序列时,计算复杂度随序列长度呈平方级增长——上下文每增长10倍,计算量就要膨胀100倍,这在实际应用中带来了严重的效率瓶颈。

MSA是一个简洁且易于扩展的全新稀疏注意力架构,它通过引入索引分支(Index Branch)快速扫描上下文并筛选关键Token,再交由稀疏计算分支(Sparse Branch)进行精准注意力计算。与DSA和MoBA等现有稀疏方案相比,MSA能够更精确地为KV分块,实现更高的有效上下文覆盖。

得益于此,M3的API最高支持100万Token(1M tokens)的上下文窗口,保障至少51.2万Token可用。这对于长程Agent、长程Coding以及长视频理解等场景来说,是真正意义上的基础设施级突破。企业处理百万Token级别的长文档时,算力成本可大幅降低。

原生多模态:文本与视觉,从第零步就绑在一起

区别于市面上不少模型“先训文本再补视觉”的拼凑路线,MiniMax M3采用了原生多模态设计——重构了整个数据管线,将预训练数据规模扩充至百T量级,从训练的第一步起就将文本与视觉信息联合训练,使文本和视觉语义空间高度对齐。

这意味着多模态能力是刻在模型骨子里的原生能力,而非后期贴上去的浅表图层。在多模态测试集OmniDocBench上,M3得分超过Gemini 3.1 Pro,印证了其视觉理解能力的扎实程度。

Coding与Agent能力:多项评测超越GPT-5.5和Gemini 3.1 Pro

Coding与Agent能力是M3重点提升的方向。在涵盖软件工程、终端执行等多个维度的国际权威评测中,M3均达到国际领先水平,以下是部分核心成绩:

  • SWE-Bench Pro(编程能力):M3超过GPT-5.5和Gemini 3.1 Pro,接近Opus 4.7;
  • SVG-Bench(SVG生成性能):M3超过Opus 4.7;
  • OmniDocBench(多模态文档理解):M3得分超过Gemini 3.1 Pro;
  • Claw-Eval(自主Agent端到端评测):M3得到最高分;
  • BrowseComp(智能体自主浏览与信息检索):M3以83.5分超越Opus 4.7(79.3)。

三个真实任务,验证M3的极限能力

MiniMax官方还披露了M3在三个真实任务中的实测表现:

论文复现:12小时自主完成ICLR杰出论文

团队给M3扔了一篇ICLR 2025杰出论文——《Learning Dynamics of LLM Finetuning》,让它独立复现。M3连续运行近12小时,全程自主产出18次commit与23张实验图表,成功跑通核心实验。整个过程依赖其多模态能力看懂论文里的图表公式、长上下文能力将论文+代码+实验日志一次性全部读入窗口,再由编程+Agent能力驱动长线程执行。

CUDA算子优化:147次迭代,9.4倍加速

FP8矩阵乘是大模型推理中计算量最集中的环节之一。MiniMax让M3在NVIDIA Hopper架构GPU上优化该kernel,起点仅有一个任务描述和一个无法运行的Triton骨架代码。约24小时内,M3完成147次benchmark提交、1959次工具调用,将硬件峰值利用率从7.6%推进至71.3%,实现9.4倍加速——全程零人工介入。

PostTrainBench:自己训练模型

团队给M3四个只完成预训练的Base模型,要求在12小时内自主完成数据合成、训练、评测、迭代全流程,让它们在数学推理、代码生成、知识问答等任务上具备能力。全程无人干预,M3最终得分37.1,位列第三,仅次于Opus 4.7(42.4)和GPT-5.5(39.3),明显领先其余模型。

即将开源:Frontier不再只属于闭源公司

除了性能参数,MiniMax还宣布了一个令开源社区振奋的消息:M3即将在HuggingFace和GitHub上完成开源,支持私有集群部署和微调。

这意味着“前沿能力”不再只属于那几家闭源公司。开发者很快就能在自有基础设施上部署M3,并针对特定场景进行微调优化。

如何体验

M3现已通过以下渠道开放使用:

  • MiniMax Code(code.minimaxi.com):支持直接体验编程智能体能力;
  • Token Plan:订阅服务中已同步上线M3权限,老用户权益完整保留;
  • API:通过 api.minimaxi.com/v1/text/chatcompletion_v2 接入,支持标准版M3,最高1M tokens上下文窗口,自动Cache,无需额外设置。

MiniMax M3的发布,标志着国产大模型在前沿能力上的又一次实质性突破。百万上下文解决的是长程任务的效率问题,原生多模态打通的是跨模态信息的语义对齐,而顶尖的Coding与Agent能力,则让“用AI构建AI”从口号变成了现实。随着M3开源的推进,这一能力也将真正走向开放生态。