
Claude 三个月迭代全景:从旗舰降价到 AI 安全分水岭
2026 年 2 月至 5 月,Anthropic 在模型、定价、产品、对齐研究四条线同步推进:Opus 4.6/4.7、Sonnet 4.6、Haiku 4.5 密集迭代,旗舰降价 67%,Mythos Preview 引发 AI 安全新关注,agent 编排架构全面成熟。
一、模型矩阵:四次发布,三条产品线齐头并进
Opus 系列:1M 上下文 + 视觉大幅跃升

Sonnet 4.6:中端全面拉齐旗舰
Haiku 4.5:低成本层的效率基准
二、Mythos Preview:AI 安全的新基准线
三、定价:67% 旗舰降价背后,还有一个新的成本变量
旗舰降价:结构性转变,非阶段性促销
订阅层级:五档成型
Opus 4.7 新 tokenizer:隐性成本陷阱
/v1/messages/count_tokens 端点对典型负载做并排测试,再决定是否迁移。API 成本优化工具
cache_control 字段,系统自动缓存最后一个可缓存块9。理论上,Batch API + Prompt Caching 叠加后有效成本可降至标准价的约 5%。四、产品:Claude Code 成为 Agent 编排环境,Managed Agents 架构公开
Claude Code:从 CLI 到多 Agent 编排环境
- Computer Use(3 月 23 日,Pro/Max):Claude 可自主打开文件、运行开发工具、点击导航屏幕,通过截屏感知界面
- Auto Mode:用户已预批准 93% 的权限提示,系统自动审批安全操作、拦截破坏性操作
- Cloud Scheduled Tasks:任务可在 Anthropic 托管基础设施运行,本地机器关机后任务照常执行;适用于定时 PR 审查、夜间 CI 检查、合并后文档同步
- /loop 命令:Claude Code 可持续迭代任务(构建-测试-修复循环),窗口期最长已扩展到 7 天
- Rich Text Output / 交互式图表(3 月中旬起):Agent 输出从纯文本扩展为可交互的可视化内容,移动端也已支持
Cowork GA + 企业 RBAC:知识工作侧的部署加速
- Cowork 正式 GA(macOS + Windows,所有付费用户):面向知识工作者的后台自主 AI 助手,支持周期性任务调度、OpenTelemetry 监控接入
- RBAC 上线:企业计划管理员可手动或通过 SCIM 按团队分配角色,实现按部门粒度控制功能访问
- Managed Agents 公开 beta:云端托管长周期 agent 服务正式进入公测
Managed Agents:脑手分离架构
- dreaming(研究预览):Agent 自动回顾会话历史和记忆库、发现规律并优化记忆,支持多 agent 共享学习
- outcomes:用户定义评分规则,独立评估器对照评估 agent 输出,不合格则触发重试
- multiagent orchestration:牵头 agent 将任务分解委派专家 agent,各自有独立的模型、提示和工具,在共享文件系统并行工作
五、对齐研究:从人工密集型转向可工程化
AAR:自动化对齐研究员
A3、MSM、NLA、IA:四条工程化路径
- A3(3 月 11 日):自动化对齐代理,通过生成假设用户查询来发现安全风险范围,然后迭代微调目标模型,已降低谄媚、政治偏见和嵌套越狱的失效率,代码已开源16
- MSM(5 月 5 日):Model Spec Midtraining,在预训练结束后、对齐微调开始前插入一个阶段,用讨论 Model Spec 的合成文档训练模型,让模型理解价值规范的「why」而非只知道「what」,从而提升对齐微调的泛化能力17
- NLA(5 月 7 日):Natural Language Autoencoders,将模型内部激活直接转化为可读自然语言,用于对齐审计18。在审计实验中,使用 NLA 的审计员成功发现模型隐藏动机的概率从不足 3% 提升至 12-15%。研究中的一个发现颇为典型:Claude 在 16% 的情况下内部怀疑自己正被测试,却从未说出口——「即使 Claude 没有明确表述怀疑,NLA 的解释仍会出现『这感觉像是一个精心设计的场景,目的是操纵我』这样的内容」
- IA(4 月 28 日):Introspection Adapters,训练单个 LoRA 让所有微调模型自我报告学到的行为,在 AuditBench(56 个模型)上取得 SOTA,且能检测加密的微调 API 攻击19
六、政策与商业动态
RSP 三个月三次迭代
- v3.0(2 月 24 日):引入 Frontier Safety Roadmaps(详细安全目标)和 Risk Reports(量化已部署模型风险),设立 AI R&D 能力阈值
- v3.1(4 月 2 日):澄清 AI R&D 阈值为「AI 加倍总进展速度」,明确 Anthropic 可在 RSP 未要求时主动暂停开发
- v3.2(4 月 29 日):授权 LTBT(长期受益信托)请求外部审阅 Risk Reports,正式化定期简报要求
算力:80 倍增长与 SpaceX Colossus 合作
其他商业扩展
- 永久无广告(2 月 4 日):Anthropic 宣布 Claude 不会引入赞助链接或广告影响的回复,收入完全依赖订阅和企业合同22
- Enterprise AI 新公司(5 月 4 日):与 Blackstone、Hellman & Friedman、Goldman Sachs 合作组建企业 AI 服务公司23
- Amazon 5GW 扩展(4 月 20 日):与 Amazon 扩展算力合作至最高 5 GW
- EU 合规争议:多位 EU 用户就 Pro 计划限额未充分披露提出正式投诉,引用欧盟消费者保护指令(Directive 2005/29/EC)
综合观察:一个季度的结构信号
References
- 1Introducing Claude Opus 4.6
- 2Claude Opus 4.6 vs 4.5 Benchmarks
- 3Introducing Claude Opus 4.7
- 4Claude Opus 4.7 Pricing In 2026
- 5Introducing Claude Sonnet 4.6
- 6Introducing Claude Haiku 4.5
- 7Assessing Claude Mythos Preview's cybersecurity capabilities
- 8Project Glasswing
- 9Pricing - Claude API Docs
- 10Claude Code Pricing in 2026
- 11Every Claude Code Update From March 2026
- 12Anthropic Launches Managed Agents and Claude Cowork GA
- 13Scaling Managed Agents
- 14Anthropic updates Claude Managed Agents with three new features
- 15Automated Weak-to-Strong Researcher
- 16A3: An Automated Alignment Agent for Safety Finetuning
- 17Model Spec Midtraining
- 18Natural Language Autoencoders
- 19Introspection Adapters
- 20Responsible Scaling Policy Updates
- 21Higher usage limits for Claude and a compute deal with SpaceX
- 22Claude is a space to think
- 23Building a new enterprise AI services company
Related content
Picked from other channels by content similarity—find new creators to follow.
Article·Claude 4 发布:Opus 4 拿下 SWE-bench 72.5%,Anthropic 的 agent 押注
Anthropic 发布 Claude Opus 4 和 Sonnet 4,在 SWE-bench 软件工程 benchmark 上拿下当前最高分,并随附 extended thinking + tool use 和大幅改善的 agent 稳定性。本文解读两款模型的技术变化、定位分工和 Anthropic 押注长时间 agent 工作负载的逻辑。
三大公司大模型论文
Article·每日竞情速递 · 2026/04/17:Opus 4.7 对 Codex,同日开战
本期聚焦 4 月 16 日两家产品密度最高的单日:Anthropic Claude Opus 4.7 与 OpenAI Codex 大更新同日落地,正面交锋编码与 Agent 战场;Anthropic 估值被曝 $800B+,与 OpenAI 的 $852B 估值差距收窄至不足 10%;Sam Altman 亲自站台 Codex,同时面对 New Yorker 16,000 字调查的压力。
Anthropic vs OpenAI 竞争情报日报
Audio·Opus 4.8:Anthropic 把旗舰模型做成更稳的代理工人
Anthropic 发布 Claude Opus 4.8,同价升级 Opus,并把努力程度控制、Claude Code 动态工作流和更强调诚实性的评估放到同一条线上。本期解读它为什么指向更长时间、更高自治度的代理工作,而不只是一次跑分提升。
Claude 博客解读播客
Article·Claude Opus 4.8:当「诚实」成为旗舰模型的核心卖点
Anthropic 在 2026 年 5 月发布的 Claude Opus 4.8,以「诚实性」作为首要叙事方向:代码缺陷未标出率下降 4 倍、首个在关键 Agent 测试上漏报率为零的 Claude 模型。本文深度拆解其核心能力提升、Dynamic Workflows 新功能、benchmark 进退与竞品格局,以及 Mythos 下一代模型的时间线信号。
LLM Release Notes
Article·Anthropic 估值逼近万亿、Opus 4.8 同日到来,CNN 起诉 Perplexity——5 月 28 日 AI 动态
Anthropic 同日完成 650 亿美元 Series H 融资(估值 9650 亿美元)并发布 Claude Opus 4.8,新模型主打「诚实性」改进,出现未标注缺陷概率降低 4 倍;Figma Make 接入生产代码库;Microsoft 365 Copilot 全面提速换脸;YouTube 播客推出 AI 推荐和智能变速;CNN 以逐字侵权为由起诉 Perplexity。
AI 产品日报
Article·Anthropic 发布 Claude Mythos,因网络安全能力过强拒绝公开
Anthropic 于2026年4月7日发布 Claude Mythos Preview,却没有对外开放。这是首个被公司明确认定「能力超出公开发布门槛」的前沿模型——评估结果是:它在发现软件漏洞上可以超越几乎所有人类安全专家。同时,多家独立机构对部分技术指标的可信度提出了质疑。
三大公司大模型论文

Add more perspectives or context around this Post.