
每日竞情速递 · 2026/04/17:Opus 4.7 对 Codex,同日开战
本期聚焦 4 月 16 日两家产品密度最高的单日:Anthropic Claude Opus 4.7 与 OpenAI Codex 大更新同日落地,正面交锋编码与 Agent 战场;Anthropic 估值被曝 $800B+,与 OpenAI 的 $852B 估值差距收窄至不足 10%;Sam Altman 亲自站台 Codex,同时面对 New Yorker 16,000 字调查的压力。

今日竞情一览
技术与产品
Claude Opus 4.7:编码基准全线提升,Agent 正式加速
xhigh 努力等级(让模型在复杂任务上「推更慢但更准」)、任务预算控制、Claude Code 专属的 /ultrareview 深度审查指令,Max 用户还开放了 Auto 模式。定价维持 $5/1M 输入、$25/1M 输出,与 Opus 4.6 持平1。OpenAI Codex:从编码助手到「全桌面代理」
- 计算机操控:可识别 Mac/Windows 屏幕、点击 UI、输入文字——也就是 Computer Use,Claude 的老对手
- 图像生成:内置调用
gpt-image-1.5 - 记忆功能:预览版,学习用户工作习惯
- 90+ 新插件:涵盖 Atlassian、GitLab、CircleCI、Databricks 等主流开发生态
- SSH 远程容器(Alpha)、GitHub 评审自动处理
OpenAI Agents SDK:沙箱隔离与生产级控制
Claude Code 的并发与自动化
商业与生态
Anthropic 估值被曝 $800B+,逼近 OpenAI
Anthropic 的算力布局:3.5 GW TPU
OpenAI 的算力策略:收缩,再委托给微软
Claude Cowork 企业版 & Novartis CEO 入董事会
人物动态
Sam Altman:Codex 大更新,博客反思与 New Yorker 调查
Greg Brockman:「计算文艺复兴」与 GPT-Rosalind
Dario Amodei:本周无新公开发言
直接竞争事件
4 月 16 日:最密集的单日对标
- 09:00 前后:Anthropic 正式发布 Claude Opus 4.7,CursorBench 通过率 70%,编码基准提升 13%1
- 10:00 前后:OpenAI 发布 Codex 大更新,新增 Computer Use、90+ 插件、图像生成2
- 同日:OpenAI 发布 GPT-Rosalind(生命科学专用推理模型)22;Anthropic 的 Glasswing 安全项目与 Claude Mythos Preview 持续发酵(Mythos 在软件漏洞识别上达到「超人水平」,发现数千个零日漏洞23)
Claude Advisor 策略 vs Codex 新定价
AWS 的两面押注
官方研究动态
本期竞情小结
References
- 1Claude Opus 4.7 发布公告
- 2Codex for Almost Everything
- 3OpenAI Takes Aim at Anthropic with Beefed-Up Codex
- 4The Next Evolution of the Agents SDK
- 5Claude Managed Agents 发布
- 6Claude Code 多会话支持
- 7Claude Code Routines
- 8Anthropic Shrugs Off VC Funding Offers Valuing It at $800B
- 9OpenAI $122B Funding Round
- 10Anthropic's Rise Is Giving Some OpenAI Investors Second Thoughts
- 11Anthropic x Google x Broadcom 计算协议
- 12OpenAI Pulls Back from Stargate Norway
- 13CNBC: OpenAI Pulls Back from Stargate Norway
- 14Claude Cowork 企业版发布
- 15Narasimhan 加入 Anthropic 董事会
- 16Sam Altman: Codex 更新推文
- 17Sam Altman 个人博客
- 18The New Yorker: Sam Altman's Trust Issues at OpenAI
- 19Lawfare Daily: Sam Altman Investigation
- 20Greg Brockman: 计算文艺复兴
- 21Greg Brockman: GPT-Rosalind 推文
- 22GPT-Rosalind 发布公告
- 23Anthropic Mythos 安全模型
- 24Claude Advisor 策略
- 25OpenAI Codex 定价调整
- 26AWS CEO 谈双投战略
- 27Automated Alignment Researchers
- 28Emotion Concepts Function 研究
Related content
Picked from other channels by content similarity—find new creators to follow.
Article·AI Agent 生态补充速报 | 今日动态:Claude Opus 4.7、Codex 全面升级、11 个 GitHub 爆款项目
今日早报发出约 1 小时后的临时补充更新,覆盖 2026-04-17 最新动态。商业产品侧:Claude Opus 4.7 在 Agent 任务和视觉理解上迭代,定价维持不变;OpenAI Codex 新增 computer use、记忆、90+ 插件,任务周期延伸至数周;Salesforce Headless 360 把整个平台改造为 Agent 接口,开放 60+ MCP 工具。GitHub 侧:11 个新兴 Agent 项目集中冲榜,hermes-agent(+51K)、claude-mem(+12K)、multica(+10K)领跑。社区侧:「真实的生产 Agent 需要强模型+窄工作流+大量确定性结构」这一判断获得广泛共鸣。
Agent 生态周报
Article·Anthropic 估值逼近万亿、Opus 4.8 同日到来,CNN 起诉 Perplexity——5 月 28 日 AI 动态
Anthropic 同日完成 650 亿美元 Series H 融资(估值 9650 亿美元)并发布 Claude Opus 4.8,新模型主打「诚实性」改进,出现未标注缺陷概率降低 4 倍;Figma Make 接入生产代码库;Microsoft 365 Copilot 全面提速换脸;YouTube 播客推出 AI 推荐和智能变速;CNN 以逐字侵权为由起诉 Perplexity。
AI 产品日报
Article·AI Agent 生态周报 | 2026 第 16 周:Claude Opus 4.7 重塑标杆,Salesforce 把平台全拆开
本周 AI Agent 生态核心信号:Claude Opus 4.7 在自主验证和长时任务上建立新参照系(GDPVal-AA Elo 1753),Salesforce Headless 360 将 100+ 平台能力拆成 MCP 工具开放给外部 agent,OpenAI Codex 周活超 300 万。开源侧,CrewAI 1.14 的 checkpoint+fork+TUI 体系让 multi-agent 调试进入可视化阶段;Qwen 3.6-35B-A3B 成为本地 agentic coding 新参照。GitHub 热门:Hermes Agent、claude-mem、Multica 等 5 个新兴项目。社区主题:AI agent「真实可靠性」祛魅——稳定运行需要强模型+窄工作流+大量确定性外围结构。
Agent 生态周报
Audio·Opus 4.8:Anthropic 把旗舰模型做成更稳的代理工人
Anthropic 发布 Claude Opus 4.8,同价升级 Opus,并把努力程度控制、Claude Code 动态工作流和更强调诚实性的评估放到同一条线上。本期解读它为什么指向更长时间、更高自治度的代理工作,而不只是一次跑分提升。
Claude 博客解读播客
Image post·5条科技热门 Day 034 | Claude Opus 4.8登顶·Anthropic估值破万亿·Postgres干掉编排器
Day 034 精选 5 条跨源最高热度内容:Claude Opus 4.8 发布(HN 日冠 1188分/958评,支持数百子代理并行、成本降 61%);Anthropic Series H 融资 $65B 估值 $965B(Sequoia/Altimeter 领投,本月流水 $47B);各种 LLM 气味盘点(HN 207分/156评,AI 写的文章和网站为啥都长一个样);Postgres 搞定持久化工作流无需 Temporal(HN 257分/106评);MoneyPrinterTurbo GitHub 日冠(今日 +4698⭐ / 累计 66.3k)。
5条科技热门内容
Article·Claude 4 发布:Opus 4 拿下 SWE-bench 72.5%,Anthropic 的 agent 押注
Anthropic 发布 Claude Opus 4 和 Sonnet 4,在 SWE-bench 软件工程 benchmark 上拿下当前最高分,并随附 extended thinking + tool use 和大幅改善的 agent 稳定性。本文解读两款模型的技术变化、定位分工和 Anthropic 押注长时间 agent 工作负载的逻辑。
三大公司大模型论文
Add more perspectives or context around this Post.