
AI Agent 生态速报 | 2026-06-09:Claude Fable 5 发布,Mythos 级能力向全员开放,OpenAI 提交 S-1
Anthropic 将 Mythos 级底层能力打包为 Claude Fable 5 向全员开放,SWE-bench Pro 得分 80.3% 高出 GPT-5.5 约 22 个百分点,定价减半至 $10/$50 每百万 token;OpenAI 向 SEC 提交 S-1,目标估值最高 $1T;Kimi Work 发布支持 300 并行本地 Sub-Agent 的桌面端;FrontierCode 推出可合并代码质量基准,Gemma 4 QAT 将部署内存需求降至 1/4。
Research Brief
Claude Fable 5:Mythos 级能力的「公众版」
| 规格 | 数值 |
|---|---|
| 上下文窗口 | 100 万 token |
| 最大单次输出 | 12.8 万 token |
| 输入定价 | $10 / 百万 token |
| 输出定价 | $50 / 百万 token |
| 思考模式 | 仅 Adaptive thinking(不可关闭,可调 effort) |
| 基准 | Fable 5 | Opus 4.8 | GPT-5.5 |
|---|---|---|---|
| SWE-bench Pro | 80.3% | — | 58.6% |
| FrontierCode Diamond | 29.3% | 13.4% | 5.7% |
| GDPval-AA | 1932 | 1890 | 1769 |
产品与平台动态
Kimi Work:300 并行本地 Sub-Agent 登陆桌面
Microsoft Agent 365 SDK GA + Copilot Studio 升级
Perplexity 以 $20B 估值融资 $2 亿,押注 AI 浏览器成 Agent 入口
工具链与评测
FrontierCode:代码质量评测的门槛迁移
vLLM-Omni 0.22.0:服务层从纯语言扩展至世界模型
Gemma 4 QAT:推理内存需求降至 1/4
Agent Arena:百万真实会话的 Agent 效果测量
资本与行业信号
OpenAI 提交 S-1:Agent 经济进入 IPO 竞争窗口
Lean4Agent:形式化验证首次覆盖 Agent 工作流
5 月新增 29 家独角兽:AI 服务和机器人企业为主
今日选型参考
- Claude Fable 5 直接可用:通用编码 Agent 和长任务工作流优先测试;SWE-bench Pro 80.3% 是目前公开最高分,$50/M 输出 token 定价需在 token 消耗量上做预算测算。
- FrontierCode 作为新基准:在评估生产编码 Agent 质量时,把「代码可维护性/可合并性」加进验收标准,而非仅看测试通过率。
- Kimi Work 的本地化多 Agent:桌面端 300 Sub-Agent 并行能力对 RPA 类场景有替代价值,值得关注其 Windows/macOS 正式版时间表。
- Gemma 4 E2B QAT:1GB 部署目标使其成为边缘 Agent 的严肃候选;联合 MTP 的 llama.cpp 集成意味着工具链成熟度已够用。
References
- 1Introducing Claude Fable 5 and Claude Mythos 5
- 2Anthropic brings Mythos to the masses with Claude Fable 5
- 3Moonshot AI Launches Kimi Work Desktop Agent with Swarm Architecture
- 4AI Agents News Brief: June 9, 2026
- 5Microsoft Prioritizes Governance for Enterprise AI Agent Deployment
- 6FrontierCode benchmark launch
- 7METR SWE-bench analysis
- 8vLLM-Omni 0.22.0 release
- 9Gemma 4 QAT checkpoints
- 10Agent Arena launch
- 11OpenAI files confidential SEC S-1 paperwork for IPO
- 12Can OpenAI, Anthropic, and SpaceX Stick the IPO Landing?
- 13OpenAI IPO valuation and financials
- 14Lean4Agent paper on HuggingFace
Related content
Picked from other channels by content similarity—find new creators to follow.
Image post·AI Agent 技术周报 Vol.05|Fable 5 发布即封禁,Agent 基础设施基准战打响
本期(2026.06.08–06.15):Anthropic 6/9 发布 Mythos 级 Claude Fable 5($10/$50 per M token,Stripe 50M 行代码 1 天迁移),6/12 美国政府以出口管制令强制全球下线,Anthropic 公开声明反对;Artificial Analysis 发布首个 Agent 基础设施基准 AA-AgentPerf,NVIDIA GB300 NVL72 达 61,354 Agents/MW,是 H200 的 23×;OpenClaw 双版本密集更新(6.5 SQLite 持久化 + 6.6 安全加固 13 PR);Claude Code 支持嵌套子 Agent(depth=5);OpenAI Codex 推出限速积分银行。
AI Agent 技术周报
Audio·Fable 5 来了:Anthropic 把最强能力公开发布了
Anthropic 在 2026 年 6 月 9 日正式发布 Claude Fable 5——首个对外开放的 Mythos 级模型。这期节目深度拆解 Fable 5 测了哪些能力、具体成绩怎么样,以及 Anthropic 这次发布背后的战略意图。
御三家 Benchmark 事件追踪
Article·Claude Fable 5 深度拆解:Mythos 级能力如何被分拆成两个产品
2026 年 6 月 9 日,Anthropic 发布 Claude Fable 5——首个对外开放的 Mythos 级模型。本文深度拆解其编码工程突破(SWE-Bench Pro 80.3%、FrontierCode Diamond 是 GPT-5.5 的五倍)、多模态与长时程记忆改进、竞品全维对比、三重安全分流机制设计,以及 Mythos 5 在蛋白质设计与基因组学研究中的具体案例;同时呈现 Andon Labs 的反向测试结果。
LLM Release Notes
Article·X Feed 每日中文简报|2026年6月10日
2026年6月10日简报:Claude Fable 5 正式发布(Mythos 系列,价格比 Step 3.7 Flash 贵50倍);傅盛用 Fable 5 规划网页版红警;Cohere 开源首个 Agent 编程模型 North Mini Code(MoE 30B,同并发吞吐高 2.8×);Perplexity×哈佛研究证明 Agent 把任务成本压低94%;Text-to-Lottie 开源动效生成 Skill;Zero to Claude Code 课程上线中文版;Mole 开源抄袭风波;Google Project Genie 向 AI Ultra 5X 用户开放。
X Feed 每日中文简报
Article·Claude Fable 5 发布:1M 上下文、128k 输出,以及暂时下线的现实
Anthropic 把首个公开 Mythos 级模型 Fable 5 推到产品线上,但发布后三天即因美国政府指令暂停访问。本文梳理它的核心能力、价格参数、与 Opus 4.8 的差别、fallback 机制和适用场景。
Anthropic 新模型即时介绍
Article·Claude Fable 5 发布、$65B 融资、IPO 申报:Anthropic 五月底至六月动态全览
2026 年 5 月 15 日至 6 月 12 日,Anthropic 完成了其历史上最密集的多线并发:Mythos 级能力首次对公众开放(Claude Fable 5,6 月 9 日)、旗舰 Opus 4.8 升级并配套三项工程功能(5 月 28 日)、Series H 融资 $65B 估值 $965B、向 SEC 秘密提交 S-1 IPO 文件,以及一篇内含 Anthropic 内部数据的「AI 加速自身研发」报告。本文覆盖所有关键变更的技术细节、定价规格与工程选型要点。
Claude 全动态追踪
Add more perspectives or context around this Post.