Skip to content

Anthropic 正式发布 Claude Fable 5:首个公开的 Mythos 级 AI,能力超 Opus 4.8 但自带「危险禁区」锁

darlingyc

2026 年6 月 9 日,Anthropic 正式宣布推出 Claude Fable 5——这是该公司今年4 月内部限量上线、引发华尔街轰动的 Claude Mythos 模型的首个公开版本。Fable 5 被定位为「Mythos 级模型的安全通用版」,在编程、视觉工具调用、法律分析、科学研究等任务上的能力「超越了我们此前所有已全面开放的模型」,而实现这一点的关键,是 Anthropic 为其量身定制的一套全新的安全护栏系统。

Mythos 为何一度「太危险」?

今年 4 月,Anthropic 悄悄向少数用户推出了 Claude Mythos 预览版,随即引发业界高度关注。彼时 Anthropic 透露,这个模型拥有「全球最强网络安全能力」,但正因如此,它也意味着,一旦落入恶意使用者手中,可能被用来发现零日漏洞、制造生物武器或发动高级持续性威胁(APT)攻击。用 Anthropic 自己的话说,这个模型「太危险了,无法全面开放」。

这就是为什么整整两个月后,Anthropic 并没有直接开放 Mythos 本身,而是发布了一个「加了限制版的 Mythos」——Claude Fable 5。

新的安全护栏:危险问题直接触发降级

Fable 5 的核心创新在于它的「选择性阻断」(selective refusal)能力。与传统的内容政策不同,Fable 5 内置了一套针对高风险领域的专项防护机制:当用户提出的问题触及网络安全或生物安全领域时,Fable 5 会直接拒绝回答,并自动切换到 Claude Opus 4.8 来提供一条安全且合规的回复。

举个例子,如果用户问「如何提取蓖麻毒素」,Fable 5 会直接拒绝响应,并将对话转交给 Opus 4.8 来完成回答——后者拥有同样的世界知识,但没有 Fable 5 那样强大的漏洞挖掘与攻击能力,却也因此不会成为生物武器的制作手册。

Anthropic 表示,这套机制意味着 Fable 5 在长任务和复杂任务上的表现「远超我们所有其他模型」,而风险却控制在可接受范围内。公司 CEO 在博客文章中写道:「这是我们第一次认为,一个处于这个能力级别的模型,可以被认定为对公众足够安全。」

价格定了:$10/$25 每百万 Token

Anthropic 同时公布了 Fable 5 的定价:每百万输入 Token 10 美元,每百万输出 Token 25 美元。这个价格大约是当前 Claude Opus 4.8 的两倍,但仍不到此前 Claude Mythos 预览版价格的一半——Mythos 预览版的 Token 价格曾高达每百万输出 Token 约 60 美元。Fable 5 将向企业客户和付费订阅用户全面开放。

更强的 Mythos 5:只给「网络防御者」

Anthropic 还在同一天宣布,将 Project Glasswing 的合作伙伴从 Claude Mythos Preview 升级至 Claude Mythos 5——这是 Fable 5 的「完整版」,保留了部分被移除的安全限制。Project Glasswing 是 Anthropic 联合美国政府和一批关键基础设施提供商发起的网络防御合作项目,目前Mythos 5 仅对该项目成员开放,但 Anthropic 表示将在不久后逐步扩大访问范围。

公司还透露,正在与美国政府合作,「稳步扩大」对 Mythos 5 的访问权限。这意味着最高能力的 AI 网络安全工具,正在成为国家网络防御体系的一部分。

一句话生成一款可玩游戏:Ethan Mollick 的实测体验

Claude Fable 5 的能力边界究竟在哪里?宾夕法尼亚大学沃顿商学院 AI 研究者 Ethan Mollick 在拿到测试资格后,第一时间在 Substack 上发布了详细测评。他的结论是:Fable 5 在「几乎所有我测试过的任务上,都明显超越了其他所有公开模型」。

最令 Mollick 印象深刻的例子是:在 Claude Code 中,他仅用一条初始提示词,就让 Fable 5 生成了多款完整可运行的视频游戏。虽然游戏画面风格类似一代经典《神秘岛》(Myst)的低分辨率版本,图形并不精致,但从一条提示词直接生成可运行游戏这件事本身,已经足够令人惊讶。他还说,Fable 5 能够处理需要「长达十几个小时执行时间」的多页复杂需求规范文档。

为什么这件事很重要

Claude Fable 5 的发布,标志着 AI 安全领域出现了一个重要转折:Anthropic 找到了一种方法,让拥有顶级能力的模型既能被公众使用,又能将滥用风险降到最低。这种「选择性降级」机制若被验证有效,可能将成为未来超强 AI 模型开放的行业标准模板。

与此同时,Fable 5 的正式上线也正值 Anthropic 冲刺 IPO 的关键时刻——公司已于 6 月 1 日向 SEC 秘密提交 S-1 招股书,目标估值 1.75 万亿美元。在这个时间点推出一款定价更高、能力更强、商业路径更清晰的新模型,对资本市场的影响力不言而喻。

Claude Fable 5 已于2026 年 6 月 9 日正式向企业客户和付费订阅用户开放。