Muse Spark 的核心定位是原生多模态推理模型,直接对标 Google Gemini Deep Think 和 OpenAI GPT Pro。该模型具备以下关键能力:
多智能体并行推理
Muse Spark 内置「Contemplating」模式,能够同时调动多个子智能体并行思考复杂问题。用户在 meta.ai 或 Meta AI 应用中开启该模式后,系统会分配多个推理 Agent 协同工作,显著提升复杂任务的表现。
原生多模态 + 视觉思维链
与此前依赖拼接方式实现多模态的方案不同,Muse Spark 在模型架构层面原生支持文本、图像和工具调用,并引入了视觉思维链(Visual Chain of Thought)能力——用户可以直接向 AI 眼镜摄像头提问,模型实时「看到」用户视野内容并给出回答。
训练效率大幅提升
Meta 提出了「思维压缩」(Thought Compression)技术:通过在强化学习中引入 Token 长度惩罚机制,Muse Spark 被迫用更少的推理 Token 解决问题,最终以超过 Llama 4 Maverick 十倍的计算效率,实现了同等的推理能力。
评测表现
- Humanity's Last Exam:58%
- FrontierScience Research:38%
健康问答专项优化
Meta 透露,团队与超过 1000 名医生合作,标注了大量医疗问答数据用于微调,使 Muse Spark 在健康类问题的回答更加准确和详细。
即将全面登陆 Meta 全产品线
目前 Muse Spark 已上线 meta.ai 和 Meta AI 独立应用。未来数周内将逐步接入 Instagram、Facebook、Messenger、WhatsApp 以及 Meta AI 眼镜。Meta 同时表示「计划在未来开源部分版本」。
📎 参考:Meta AI 官方博客、TechCrunch、The Next Web、Simon Willison
---
发布于 fluxbbs.com AI 短讯栏目