就在 Google 同一天发布 Nano Banana 2 Lite 的 6月30日,Anthropic 也悄悄放出了另一颗重磅炸弹——Claude Sonnet 5。这家 OpenAI 最强挑战者终于官方确认了几个月来的所有猜测:Sonnet 5 做到了以前只有 Opus 级旗舰模型才能做的事,而且价格只有旗舰的三分之一。
“最agentic的Sonnet”,这意味着什么
Anthropic 在官方公告里毫不客气地称 Sonnet 5 为”迄今为止最具 agentic 能力的 Sonnet 模型”。所谓 agentic,就是模型不再只是回答问题,而是能够自主规划路径、调用工具(浏览器、终端)、多步骤执行任务——以前这些能力只有更大、更贵的 Opus 级系统才有。现在中高端定位的 Sonnet 也能做到了,而且是在保持合理成本的前提下。
Sonnet 5 在推理、编码和专业工作等各项基准测试中,相比上一代 Sonnet 4.6 都有实质性提升。最关键的是,Anthropic 明确表示 Sonnet 5 的表现已经接近公司旗舰 Opus 4.8,但运行成本却大幅低于后者。这意味着用户不用花旗舰的价格,也能得到接近旗舰的体验。
定价:introductory特惠$2/$10,8月31日后调价
Sonnet 5 的定价策略非常有意思,Anthropic 玩了一手”先低后高”的价格歧视:
- 即日起~8月31日(introductory pricing):$2 / 百万输入tokens,$10 / 百万输出tokens
- 9月1日起(标准定价):$3 / 百万输入tokens,$15 / 百万输出tokens
这个定价相比 Opus 4.8 的价格(通常是 Sonnet 的 3-5 倍)有明显优势,也低于 Sonnet 4.6 的常规价格。Anthropic 显然想在模型切换的窗口期尽快吸引开发者迁移,同时通过 introductory pricing 锁定一部分对价格敏感的用户。
安全能力:网络安全保障低于Opus/Mythos级别,默认开启
Sonnet 5 在安全方面也做出了明显的改进。Anthropic 报告称,新模型在幻觉率、谄媚倾向和对抗提示注入攻击等方面均优于上一代 Sonnet 4.6。但有一点值得注意:Anthropic 明确表示,Sonnet 5 的网络安全能力仍然明显低于 Opus 级和 Mythos 级系统,新模型默认开启了网络安全护栏,作为预防措施。
换句话说,如果你需要处理高度敏感的网络安全场景,Sonnet 5 并不是最佳选择——那仍然是 Opus 和 Mythos 的领地。但对于普通的 Agent 场景,这个安全级别已经足够。
同夜连发三条,Anthropic 的”6月最后一天”
值得注意的是,Anthropic 并没有把宝押在 Sonnet 5 一款产品上。6月30日当天,公司还同步宣布了两项重要发布:
- Claude Science:面向科研工作者的 AI 工作台,集成研究人员最常用的工具和软件包,支持可审计的输出产物和灵活计算资源访问
- Fable 5 即将回归:Anthropic 在6月12日曾因美国政府指令暂停 Fable 5 和 Mythos 5 的访问,6月30日宣布将于7月1日全球恢复 Fable 5,并提议与亚马逊、微软、Google 等 Glasswing 合作伙伴共同建立越狱严重程度评分框架
Sonnet 5 vs Opus 4.8 vs Sonnet 4.6:怎么选
目前 Claude 模型家族形成了清晰的四层格局(从高到低):Mythos → Opus → Sonnet → Haiku。Sonnet 5 的出现把 Sonnet 这一档的能力边界大幅往上推,接近了 Opus 4.8 的水准,但价格依然保持在中档区间。
如果你需要处理复杂的 agentic 工作流(自动化任务、多工具调用、代码生成),Sonnet 5 性价比极高;如果你是高度敏感的网络安全场景,Opus 和 Mythos 依然是唯一选择;如果你只是日常对话和简单任务,免费的 Claude Free tier 已经够用。
Sonnet 5 现已在所有 Claude 订阅计划中可用(Free、Pro、Max、Team、Enterprise),同时也通过 API(模型名 claude-sonnet-5)和 Claude Code 对外提供。