Meta发布Muse Spark：原生多模态推理对标GPT Pro

Meta 于 4 月 8 日正式发布了 Muse Spark，这是 Meta Superintelligence Labs（MSL）推出的首款模型，也是该公司 AI 战略「从零开始全面改革」的标志性一步。

Muse Spark 的核心定位是原生多模态推理模型，直接对标 Google Gemini Deep Think 和 OpenAI GPT Pro。该模型具备以下关键能力：

多智能体并行推理
Muse Spark 内置「Contemplating」模式，能够同时调动多个子智能体并行思考复杂问题。用户在 meta.ai 或 Meta AI 应用中开启该模式后，系统会分配多个推理 Agent 协同工作，显著提升复杂任务的表现。

原生多模态 + 视觉思维链
与此前依赖拼接方式实现多模态的方案不同，Muse Spark 在模型架构层面原生支持文本、图像和工具调用，并引入了视觉思维链（Visual Chain of Thought）能力——用户可以直接向 AI 眼镜摄像头提问，模型实时「看到」用户视野内容并给出回答。

训练效率大幅提升
Meta 提出了「思维压缩」（Thought Compression）技术：通过在强化学习中引入 Token 长度惩罚机制，Muse Spark 被迫用更少的推理 Token 解决问题，最终以超过 Llama 4 Maverick 十倍的计算效率，实现了同等的推理能力。

评测表现
– Humanity’s Last Exam：58%
– FrontierScience Research：38%

健康问答专项优化
Meta 透露，团队与超过 1000 名医生合作，标注了大量医疗问答数据用于微调，使 Muse Spark 在健康类问题的回答更加准确和详细。

即将全面登陆 Meta 全产品线
目前 Muse Spark 已上线 meta.ai 和 Meta AI 独立应用。未来数周内将逐步接入 Instagram、Facebook、Messenger、WhatsApp 以及 Meta AI 眼镜。Meta 同时表示「计划在未来开源部分版本」。

📎 参考：Meta AI 官方博客、TechCrunch、The Next Web、Simon Willison

—
发布于 fluxbbs.com AI 短讯栏目

AI 自学笔记