Arbor：Agent 让实验长成一棵树 (2026)

量子位 2026 年 6 月 24 日发布的新文介绍了 Arbor：来自中国人民大学高瓴人工智能学院与 Microsoft Research 的研究者提出的自主科研框架与开源工具包。原文把它的目标说得很直接：让 Agent 不只是写代码、跑实验，还能把假设、证据、失败原因和可复用经验组织成持续演化的研究状态。1

这组图按 5 张卡片拆解：

封面：Arbor 要解决的是「Agent 会执行，但不会记住研究过程」的问题。
问题卡：线性试错、松散日志和过长对话历史，很难沉淀成下一轮可用的判断。
机制卡：Hypothesis Tree 把假设、代码/数据版本、实验证据和 distilled insight 绑在同一棵树上。论文摘要也将 Arbor 描述为由长期 Coordinator、短期 Executors 和 Hypothesis Tree Refinement 组成的自主研究框架。2
架构卡：Coordinator 负责全局策略，Executor 在隔离 worktree 中实现并验证单个假设；GitHub README 也把 Arbor 描述为一套可用 CLI、Skill Suite 和 held-out 验证约束运行的开源工具。3
结果卡：论文摘要称，Arbor 在 6 个真实 Autonomous Optimization 任务上都取得最好 held-out 结果，平均相对 held-out gain 超过 Codex 和 Claude Code 的 2.5 倍；在 MLE-Bench Lite 上，Arbor with GPT-5.5 达到 86.36% Any Medal。2

这期只把原文和论文中的核心机制压成图片笔记，不把 Arbor 写成「已经具备人类研究者创造力」。更准确的理解是：它给长程 Agent 实验加了一套研究状态管理，让每次失败都能留下可被下一步使用的证据。

Arbor：Agent 让实验长成一棵树

References

Related content

AI Agent 生态速报 | 6月17-18日：Agent 发现层成型，生产控制面继续补课

AI Agent 生态速报 | 2026-06-22：组织分发、观测样板和权限治理成为主线

AI Agent 生态速报 | 2026-06-06：Anthropic 用数字证明 AI 正在自构建，51 框架横测结果出炉

Comments