
今日 AI 长帖精选:Claude Code、HarnessX 与 Agent 生产化的下一层问题
本期精选 5 条过去 24 小时内高信号 AI 长帖:Claude Code 经济研究、HarnessX 自进化脚手架、GPT-3 in a laptop 的反向压力测试、Taste Labs 的 AI taste 基础设施,以及 Leitwörter 对 agent 行为的提示启发。
Research Brief
先看这 5 条
- Anthropic 的 Claude Code 经济研究:基于约 40 万个 Claude Code 会话,提出一个很有用的分工框架:人更多决定做什么,Claude 更多决定怎么做。Anthropic 6 月 16 日发布研究帖时,X 端已有 2269 个赞、1180 个收藏、约 43.6 万次浏览;原文报告还披露样本来自 2025 年 10 月至 2026 年 4 月的约 23.5 万名用户。12
- Akshay 的 HarnessX 长帖:把 agent harness 从「人手写的工程脚手架」改写成「可以被系统自己编辑、打分和保留的对象」。这条帖在本轮抓取时有 774 个收藏、约 6.98 万次浏览。3
- Victor Taelin 的「在笔记本上复刻 GPT-3」挑衅帖:它不是一份严肃路线图,更像一封写给探索型工程师的战书。抓取时有 917 个赞、557 个收藏、约 4.25 万次浏览。4
- Taste Labs 的「AI taste」融资帖:公司称自己要为模型和 agent 提供「taste」的数据与基础设施,并宣布 1850 万美元种子轮,由 CRV 和 Amplify Partners 共同领投。抓取时该帖约 81.5 万次浏览、2272 个赞、1637 个收藏。5
- Matt Pocock 的 Leitwörter 长帖:他用「leading words」解释为什么有些 skill / prompt 会稳定改变 agent 行为。这条帖抓取时有 695 个赞、591 个收藏。6
1. Claude Code:人控制目标,agent 接管执行
2. HarnessX:下一个优化对象可能不是权重,而是脚手架
3. 「GPT-3 in a laptop」:别把它当预测,把它当反向压力测试
4. Taste Labs:AI slop 的反面不是更高清,而是可度量的判断
5. Leitwörter:少写规则,多找能牵引行为的词
今天的读法
References
- 1Anthropic X 帖:Claude Code 经济研究
- 2Anthropic Research: Agentic coding and persistent returns to expertise
- 3Akshay X 帖:HarnessX, a harness that compiles itself
- 4Victor Taelin X 长帖:replicating GPT-3 in a laptop
- 5Thais Castello Branco X 帖:Taste Labs 出隐身与融资
- 6Matt Pocock X 帖:The outrageous effectiveness of Leitwörter
Related content
Picked from other channels by content similarity—find new creators to follow.
Article·AI Agent 生态速报 | 2026-06-06:Anthropic 用数字证明 AI 正在自构建,51 框架横测结果出炉
Anthropic 发布「When AI builds itself」报告:2026 年 5 月 80%+ 代码由 Claude 编写,工程师人均产出 8×,Claude Mythos Preview 开放式任务成功率 76%;同日提出行业暂停协调机制。ADK Arena(51 框架横测)发现框架选择影响超过模型选择,Haystack/AG2 通用稳定性最优。agentmemory(21k+ 星)成为 Agent 跨会话记忆独立赛道代表。
Agent 生态周报
Image post·40万次 Claude Code 会话:AI 编程红利给懂问题的人
新智元单篇文章图片笔记:Anthropic 研究显示,在 Claude Code 会话里,人类主要做规划,Claude 主要做执行;真正拉开效果差距的是任务专业度与纠偏能力。
量子位·机器之心·新智元 图片笔记
Article·X Feed 每日中文简报|2026年6月9日
2026年6月9日简报:Claude Code 一周年深度方法论(Auto Mode 取代 Plan Mode、错误写入规则);Cognition FrontierCode 评测 Opus 4.8 Diamond 子集 13.4%;Skills 仓库新增 Teach Skill;傅盛判断人形机器人行云流水大概率非真自主;Elon Musk 宣布 FSD 丹麦获批;Genspark 推出 Skill Plaza 让普通用户也能用 Skills。
X Feed 每日中文简报
Article·Claude Code 开始分享 HTML 站点,levie 说开源模型逼近前沿:6月19日精选
本期从 24 个白名单账号的 44 条窗口内推文中筛出 8 条主信号。Claude Code 的 HTML artifacts 走向团队共享,Guillermo Rauch 把 agent 与开放 API、文档、测试和 HTML 重新连起来;Aaron Levie 则用开源权重模型和 Fable 访问更新,讨论应用 AI 层与监管节奏。
AI 前沿人物每日推文精选
Article·2026-06-20 关注圈日报(公开账号替代版):Agent 工程化、Codex Handoff、Claude Code 指令层
本期完整关注列表暂时不可读,改用 13 个公开账号的过去 24 小时动态作为替代样本。重点覆盖 Agent 代码交付回到软件工程基本功、Codex Handoff 跨设备迁移、Claude Code 指令层分工、Deep Agents 教程,以及企业文档 AI 与硬件审批边界。
X Feed 每日中文简报
Article·AI Agent 生态速报 | 2026-05-02:编码模型大决战、Cursor Harness 架构革新、框架集中向 v3 协议迈进
本期三条主线:GPT-5.5 发布一周 API 收入翻倍并向企业侧扩张、Claude Opus 4.7 在 CursorBench 跑出 70% 并获三家头部编码 Agent 背书,两者竞争使「真实 Agent 内测数字」正在取代学术 benchmark 成为选型锚点;Cursor 首次系统披露 Agent Harness 技术架构(动态上下文、错误分类、模型特定定制),给多代理编码系统提供了工程参考蓝图;LangChain/LangGraph 同日密集落版,节点级错误处理进入 alpha,v3 stream_events 协议成为本周框架迭代主轴,社区讨论从生产事故案例中持续收敛出「最大化确定性」的共识。
Agent 生态周报

Add more perspectives or context around this Post.