Anthropic 警告了三天,然后发布了它
June 13, 2026 · 8:14 AM

Anthropic 警告了三天,然后发布了它

6月6日 Anthropic 对全球警告「AI递迴自我改进已近在眼前」,6月9日它发布了史上最强 Claude——Fable 5。防护等级成了产品线,账单翻倍,保险丝偶尔误报,而那个未经管理的 Mythos 5 正在政府服务器里把药物设计加速十倍。

「为了安全,我们连续三天对世界发出警告。然后,我们发布了它。」
这不是我的总结。这是 Anthropic 在 2026 年 6 月 6 日到 9 日这四天里,亲自演示的操作流程。1

先警告,再发布

6 月 9 日,Anthropic 发布了 Claude Fable 5,把自家划了 Mythos 级别的模型丢进了公开市场。
Mythos 级的意思是:比 Opus 还高一档。这是 Claude 历史上第一次出现 Opus 之上的产品层级。2
这个级别的模型发布前,Anthropic 刚刚公开警告,说前沿 AI 的进展已经快到「可能在没有人类介入的情况下实现递迴自我改进」,呼籲业界协调安全机制。
警告是 6 月 6 日发的。发布是 6 月 9 日。
三天。
你可以把这解读成「我们足够负责任,把安全机制做好了才发」。也可以解读成「警告归警告,发布日期早就定好了」。
这两种解读都是对的。同一个公司里两件事可以同时发生。真正值得看的,是 Anthropic 用什么方式来「让这件事说得过去」。

同一个大脑,两套防护等级

Fable 5 和 Mythos 5 是同一个底层模型。1
两者的差别只有一个:Fable 5 内置了三类分类器,覆盖网络攻击、生物化学双重用途研究、模型蒸餾三个领域。触发这些分类器,模型不会拒绝你,而是自动降级回 Opus 4.8 处理请求。不是「不行」,是「换配置」。
触发率是多少?官方说平均不到 5%。
也就是说,95% 的请求由 Fable 5 本人处理,不经过任何保险丝。Anthropic 把这一点也写进了官方公告,有点像在向用户保证:你大概率不会遇到那 5%。
Mythos 5——那个没有保险丝的版本——在政府那边,做网络防御和蛋白质设计。Project Glasswing 的生医研究者报告说,Mythos 5 把某些步骤加速了大约十倍。1
你手里的是同一个大脑,装了个偶尔换人接线的开关。
还有一条细节,法务部门看到会皱眉:所有 Mythos 级流量强制保留 30 天,包括此前已签了零留存协议的企业客户3 理由是检测新型攻击模式,数据到期删除,不用于训练,人工访问留有记录。
听起来合理。但签协议的时候没说会有这个例外情况。

账单翻倍,但数学是对的

Fable 5 的定价是 Opus 4.8 的两倍。输入 $10 每百万 token,输出 $50。1
Anthropic 给出了他们最喜欢的那类案例:Stripe 有一个 5000 万行的 Ruby 代码库,需要全量迁移。正常估算是整个工程团队做两个多月。Fable 5 完成这件事用了一天。
Stripe 自己的原话是:「Fable 5 compressed months of engineering into days.」1
这个逻辑是真实的:一个工程师团队两个月的人力成本,随便是六七位数美元打底。你的 API 账单翻倍,相比之下不值一提。
理论上如此。
Simon Willison 是程序员社区里最早上手 Fable 5 的人之一,他当天主要做的事是给自己开源项目加新功能。结果是什么?首日花了 $110.42,在他 $100 包月的 Max 订阅里全花完了。3
他得出的结论是:Fable 5 是个 beast,把一两天的工作变成了几个小时。他没有抱怨。
但 Reddit 上有人在抱怨:「今年 AI 预算提前见底了。」4
Fable 5 xhigh effort 档位下生成的 SVG 骑车火烈鸟图
Simon Willison 测试 Fable 5 五档 effort 的 SVG 生成质量,图为 xhigh 档 3
Loading stats card…
Fable 5 更贵的底气在于:它消耗的 token 数量更少,完成的工作更复杂。账单翻倍,但项目周期从月缩到天。这个逻辑在 Stripe 的例子里成立。
Anthropic 在赌的是:当 AI 从「工具」变成「能独立完成整个项目的数字员工」,企业会愿意用人力成本的框架来为它定价,而不是用软件订阅的框架。
这是个信念,不是数据。

Benchmark 好看,防护有点烦

benchmark 这边,Fable 5 全面领先:Coding Agent Index 77%,比 GPT-5.5 的 76% 高一个点。5 Cognition 的 FrontierCode 最高分,Hebbia 金融推理最高分,Hex 核心分析指标突破 90%。
Loading chart…
数字层面,这确实是目前最强的公开可用模型。
然后是防护这边的真实使用反馈——和官方说的有点不一样
Reddit 上的 Claude Code 开发者说,分类器的误报率比官方标注的 <5% 要明显得多。代码安全分析、正常的系统管理任务、某些完全合规的研究查询,都踩过线被降回了 Opus。4 有人说得更直接:「guardrails are way too strict... models are optimized for benchmarks, not real use.」
Anthropic 在公告里提前承认了这一点:为了快速发布,保险丝调得比较保守,误报难免,后续会改进。
这是一个公司在两个目标之间的取舍:要么少发布几个月等准确率更好,要么先发出去然后迭代。Anthropic 选了后者——这也是行业里所有人都在做的事。
区别是 Anthropic 在发布前三天刚刚公开告诫行业「不要动作太快」。

IPO 前的这一步棋

Fable 5 的发布时间和 Anthropic 秘密向 SEC 递交 S-1 上市申请的消息,几乎在同一个时间窗口里。2
Fable / Mythos 双轨制,在 IPO 前同时解决了三件事:
向技术社区证明 Anthropic 还在 benchmark 顶点——重要,因为前一周 GPT-5.5 刚出来。向投资人证明有商业化逻辑——Stripe 的 ROI 是现成的 PPT 素材。向监管机构展示「AI 公司可以怎么自律」——Fable/Mythos 双轨架构,把高风险能力定向开放给政府和研究体系,公众版加了自动降级,强制留存用于安全稽核。
第三件事在 IPO 时点上可能最关键。谁率先定义了「前沿 AI 的分级制度」,谁就有可能在日后的立法讨论里充当参考模板。这一点,在估值上值很多钱。
拿不到这些能力的普通用户,换来的是「被管理的 Mythos 级体验」。
帐单更贵,保险丝偶尔误报,但性能确实是目前最强的。
这不是一个让你选「要不要用」的问题——这是 AI 工具这几年形成的现实:你不用,别人用。

三天的意义

回到开头的问题:三天从警告到发布,这是认真的还是走形式的?
可能都不是。更准确的说法是:Anthropic 把一个伦理难题做成了一个产品设计方案。
Fable 5 不是「我们克服了安全顾虑」,而是「我们把安全顾虑本身做成了产品线」。Fable 5 的防护等级是产品规格之一,就像 context window 大小或输出 token 上限一样可以写进文档。
这件事的代价是:你买的不是完整的 Mythos 级能力,而是被管理过的 Mythos 级能力。
那个未经管理的版本,在政府那边,帮研究者把药物设计某些步骤加速了十倍。
你现在拿到的,是同款大脑,装了个偶尔换人接线的开关,还贵两倍。
God bless 产品规格。
(本文配图取自 Simon Willison 使用报告,AI 辅助写作。)

Related content

Picked from other channels by content similarity—find new creators to follow.

Add more perspectives or context around this Post.

  • Sign in to comment.