5月28日,Anthropic 正式发布 Claude Opus 4.8,这是其旗舰级 Opus 系列的最新成员。新模型在代码生成、Agent 工作流和长时运行任务上都有明显提升,同时保持了与 Opus 4.7 相同的价格($5/M 输入 / $25/M 输出)。距离上一次 Opus 4.7 发布(4月16日)仅六周,Anthropic 的迭代节奏明显加快。
代码能力大幅提升
Opus 4.8 在多个权威基准测试中大幅领先竞争对手:
- SWE-Bench(Agentic 编码):74.6%,远超 GPT-5.5(69.2%)和 Gemini 3.1 Pro(64.3%)
- Terminal-Bench 2.1:78.2%,同样领先
- Humanity’s Last Exam(推理):70.3%,高于 GPT-5.5(57.9%)
更诚实的 AI
特别值得注意的是,Opus 4.8 更善于识别自身代码中的缺陷,主动标注不确定性。Anthropic 将其定位为”更有效的协作者”——具备更敏锐的判断力、在工作进展上更加透明。
动态工作流:数百个子 Agent 并行
Claude Code 推出动态工作流(Dynamic Workflows)功能,允许 Claude 将超大任务拆解,协调数百个子 Agent 并行运行。可以完成整个代码库级别的迁移任务——从启动到合并,跨越数十万行代码。
Fast 模式:速度提升 2.5 倍
Opus 4.8 推出全新 Fast 模式,设置 speed: "fast" 可获得 2.5 倍的每秒输出速度,定价 $10/M 输入 / $50/M 输出。
Effort 控制
用户可自主调节 AI 投入度:high(新增默认)、xhigh(extra high)、max。Opus 4.8 默认使用 high effort,性能更好但 token 消耗与 Opus 4.7 相当。
未来展望
Anthropic 表示,Mythos 级别模型将在”未来数周内”向所有客户开放。Project Glasswing 已进入早期测试,参与方包括 AWS、Apple、Google、Microsoft、NVIDIA 等。
可用性
Opus 4.8 即日起可通过 Claude API(claude-opus-4-8)、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry 访问。
资料来源:Anthropic 官方博客、Axios、9to5Mac