Anthropic 正式发布 Claude Fable 5：首个公开的 Mythos 级 AI，能力超 Opus 4.8 但自带「危险禁区」锁

2026 年6 月 9 日，Anthropic 正式宣布推出 Claude Fable 5——这是该公司今年4 月内部限量上线、引发华尔街轰动的 Claude Mythos 模型的首个公开版本。Fable 5 被定位为「Mythos 级模型的安全通用版」，在编程、视觉工具调用、法律分析、科学研究等任务上的能力「超越了我们此前所有已全面开放的模型」，而实现这一点的关键，是 Anthropic 为其量身定制的一套全新的安全护栏系统。

Mythos 为何一度「太危险」？

今年 4 月，Anthropic 悄悄向少数用户推出了 Claude Mythos 预览版，随即引发业界高度关注。彼时 Anthropic 透露，这个模型拥有「全球最强网络安全能力」，但正因如此，它也意味着，一旦落入恶意使用者手中，可能被用来发现零日漏洞、制造生物武器或发动高级持续性威胁（APT）攻击。用 Anthropic 自己的话说，这个模型「太危险了，无法全面开放」。

这就是为什么整整两个月后，Anthropic 并没有直接开放 Mythos 本身，而是发布了一个「加了限制版的 Mythos」——Claude Fable 5。

新的安全护栏：危险问题直接触发降级

Fable 5 的核心创新在于它的「选择性阻断」（selective refusal）能力。与传统的内容政策不同，Fable 5 内置了一套针对高风险领域的专项防护机制：当用户提出的问题触及网络安全或生物安全领域时，Fable 5 会直接拒绝回答，并自动切换到 Claude Opus 4.8 来提供一条安全且合规的回复。

举个例子，如果用户问「如何提取蓖麻毒素」，Fable 5 会直接拒绝响应，并将对话转交给 Opus 4.8 来完成回答——后者拥有同样的世界知识，但没有 Fable 5 那样强大的漏洞挖掘与攻击能力，却也因此不会成为生物武器的制作手册。

Anthropic 表示，这套机制意味着 Fable 5 在长任务和复杂任务上的表现「远超我们所有其他模型」，而风险却控制在可接受范围内。公司 CEO 在博客文章中写道：「这是我们第一次认为，一个处于这个能力级别的模型，可以被认定为对公众足够安全。」

价格定了：$10/$25 每百万 Token

Anthropic 同时公布了 Fable 5 的定价：每百万输入 Token 10 美元，每百万输出 Token 25 美元。这个价格大约是当前 Claude Opus 4.8 的两倍，但仍不到此前 Claude Mythos 预览版价格的一半——Mythos 预览版的 Token 价格曾高达每百万输出 Token 约 60 美元。Fable 5 将向企业客户和付费订阅用户全面开放。

更强的 Mythos 5：只给「网络防御者」

Anthropic 还在同一天宣布，将 Project Glasswing 的合作伙伴从 Claude Mythos Preview 升级至 Claude Mythos 5——这是 Fable 5 的「完整版」，保留了部分被移除的安全限制。Project Glasswing 是 Anthropic 联合美国政府和一批关键基础设施提供商发起的网络防御合作项目，目前Mythos 5 仅对该项目成员开放，但 Anthropic 表示将在不久后逐步扩大访问范围。

公司还透露，正在与美国政府合作，「稳步扩大」对 Mythos 5 的访问权限。这意味着最高能力的 AI 网络安全工具，正在成为国家网络防御体系的一部分。

一句话生成一款可玩游戏：Ethan Mollick 的实测体验

Claude Fable 5 的能力边界究竟在哪里？宾夕法尼亚大学沃顿商学院 AI 研究者 Ethan Mollick 在拿到测试资格后，第一时间在 Substack 上发布了详细测评。他的结论是：Fable 5 在「几乎所有我测试过的任务上，都明显超越了其他所有公开模型」。

最令 Mollick 印象深刻的例子是：在 Claude Code 中，他仅用一条初始提示词，就让 Fable 5 生成了多款完整可运行的视频游戏。虽然游戏画面风格类似一代经典《神秘岛》（Myst）的低分辨率版本，图形并不精致，但从一条提示词直接生成可运行游戏这件事本身，已经足够令人惊讶。他还说，Fable 5 能够处理需要「长达十几个小时执行时间」的多页复杂需求规范文档。

为什么这件事很重要

Claude Fable 5 的发布，标志着 AI 安全领域出现了一个重要转折：Anthropic 找到了一种方法，让拥有顶级能力的模型既能被公众使用，又能将滥用风险降到最低。这种「选择性降级」机制若被验证有效，可能将成为未来超强 AI 模型开放的行业标准模板。

与此同时，Fable 5 的正式上线也正值 Anthropic 冲刺 IPO 的关键时刻——公司已于 6 月 1 日向 SEC 秘密提交 S-1 招股书，目标估值 1.75 万亿美元。在这个时间点推出一款定价更高、能力更强、商业路径更清晰的新模型，对资本市场的影响力不言而喻。

Claude Fable 5 已于2026 年 6 月 9 日正式向企业客户和付费订阅用户开放。