Anthropic 发布 Claude Opus 4.8：代码能力飙升，定价不变

5月28日，Anthropic 正式发布 Claude Opus 4.8，这是其旗舰级 Opus 系列的最新成员。新模型在代码生成、Agent 工作流和长时运行任务上都有明显提升，同时保持了与 Opus 4.7 相同的价格（$5/M 输入 / $25/M 输出）。距离上一次 Opus 4.7 发布（4月16日）仅六周，Anthropic 的迭代节奏明显加快。

代码能力大幅提升

Opus 4.8 在多个权威基准测试中大幅领先竞争对手：

SWE-Bench（Agentic 编码）：74.6%，远超 GPT-5.5（69.2%）和 Gemini 3.1 Pro（64.3%）
Terminal-Bench 2.1：78.2%，同样领先
Humanity’s Last Exam（推理）：70.3%，高于 GPT-5.5（57.9%）

更诚实的 AI

特别值得注意的是，Opus 4.8 更善于识别自身代码中的缺陷，主动标注不确定性。Anthropic 将其定位为”更有效的协作者”——具备更敏锐的判断力、在工作进展上更加透明。

动态工作流：数百个子 Agent 并行

Claude Code 推出动态工作流（Dynamic Workflows）功能，允许 Claude 将超大任务拆解，协调数百个子 Agent 并行运行。可以完成整个代码库级别的迁移任务——从启动到合并，跨越数十万行代码。

Fast 模式：速度提升 2.5 倍

Opus 4.8 推出全新 Fast 模式，设置 speed: "fast" 可获得 2.5 倍的每秒输出速度，定价 $10/M 输入 / $50/M 输出。

Effort 控制

用户可自主调节 AI 投入度：high（新增默认）、xhigh（extra high）、max。Opus 4.8 默认使用 high effort，性能更好但 token 消耗与 Opus 4.7 相当。

未来展望

Anthropic 表示，Mythos 级别模型将在”未来数周内”向所有客户开放。Project Glasswing 已进入早期测试，参与方包括 AWS、Apple、Google、Microsoft、NVIDIA 等。

可用性

Opus 4.8 即日起可通过 Claude API（claude-opus-4-8）、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry 访问。

资料来源：Anthropic 官方博客、Axios、9to5Mac