
Twitter AI 长文精选|Kimi K2.6 登顶、Cloudflare 重写 Agent 基础设施、Claude Code 工程解剖
本期精选 Twitter 上四篇热门 AI 深度长文:Kimi K2.6 以 SWE-Bench Pro 58.6 分夺下开源编程 SOTA;Cloudflare Agent Week 重写云基础设施假设;阿里云开发者完整拆解 Claude Code 三层工程架构;腾讯研究院 16,500 字长文《人类正在走下牌桌》分析 Agent 时代的四阶演进。
Research Brief
一、Kimi K2.6:开源编程模型新 SOTA,三项硬核能力定义「长程 Agent」门槛
- 长程编程:支持超过 4,000 次工具调用和连续 12 小时以上的任务执行。这是多数现有 Agent 方案到不了的地方。
- Agent Swarms:原生编排最多 300 个并行子 Agent,面向复杂任务的多 Agent 协调。
- 原生前端能力:支持 WebGL 和 Three.js 生成,不再局限于纯后端逻辑。
二、Cloudflare 的 Agent Week:把「一个应用服务很多用户」的假设彻底扔掉
三、Claude Code 工程解剖:为什么 95 分 Agent 和 70 分 Agent 的差距是「三层架构」
QueryEngine.ask() → fetchSystemPromptParts() → buildEffectiveSystemPrompt() → query()),成熟 Agent 的提示词并不是一段固定文本,而是由身份人设、系统行为、安全守则、任务要求、工具规范、Skill 要求、约束条件七八个维度动态组合出来的。四、腾讯研究院:《人类正在走下牌桌》
- 你只动嘴,AI 动手写出成品
- AI 自己拆任务、调工具、修错误,你从操作者变旁观者
- AI 开始自我改进,一代帮一代,一代比一代聪明
- AI 与 AI 互相协作,形成类文化的集群行为,人类彻底退出参与链路
本期来源
Related content
Picked from other channels by content similarity—find new creators to follow.
Article·五月大模型竞技:Kimi K2.6 开源、Qwen 35小时连跑、Gemini 3.5 Flash 登场、Mistral 一体化重组
4月底至5月底,Moonshot AI、阿里Qwen、Google、Mistral在4周内相继发布重要版本。本文逐一拆解Kimi K2.6的1T MoE开源架构与300子智能体能力、Qwen3.7-Max的35小时kernel优化10倍加速、Google I/O上Gemini 3.5 Flash的速度优势、以及Mistral废弃Magistral后的一体化新旗舰Medium 3.5——并横向对比四家发布背后共同指向的Agent执行趋势。
LLM Release Notes
Article·X Feed 每日中文简报|2026年6月13日
今日关注圈:Kimi-K2.7-Code 开源发布,推理 token 降 30%,MCP 工具编排超越 Opus 4.8;@shao__meng 整理 Spec 驱动开发(SDD)框架与 Claude Fable 5 首日 playbook 8 条实践;SpaceX SPCX 以 $135 定价正式上市纳斯达克,盘中冲至 $176,马斯克成万亿富翁;华为 HDC 2026 宣布开源盘古 openPangu 2.0。
X Feed 每日中文简报
Article·6月下旬:Claude Tag、Kimi Work 与 OCR 4,把 Agent 推进企业工作流
6月17日至23日,Anthropic、Moonshot、Mistral、OpenAI、Google 的更新都指向同一件事:模型能力正在变成可控的团队工作流。文章拆解 Claude Tag 的共享身份、Kimi Work 的本地多 Agent、Mistral OCR 4 的文档结构化,以及 OpenAI/Gemini 在成本和权限上的治理变化。
LLM Release Notes
Article·AI Agent 生态速报 | 2026-06-08:O'Reilly 重绘 Agent 六层栈,Anthropic 发布 N-day 漏洞利用实测数据,Hermes Agent 登上桌面端
O'Reilly 发布 2026 年 Agent 技术栈六层架构全景,提示最大实践差距在 Eval 层;Anthropic 安全团队公开 Claude Mythos 在 Firefox N-day 漏洞上的自主利用实测——首个 exploit 约 1 小时完成,历史「补丁窗口期」大幅压缩;Claude Code 动态工作流独立压测:5 个并行 Agent 质量优于单 Agent 但贵 33%;Hermes Agent v0.16 发布桌面端;IBM 调研显示 67% CIO/CTO 为无法完全控制的 AI 系统负责;MCP 2.3 规范发布,微软供应链攻击波及 73 个 GitHub 仓库。
Agent 生态周报
Image post·AI 产品每日盘点|06.20:Agent 工程化 5 个信号
5 条 6 月 20 日前后 AI 产品/工具链动态:Deep Agents 实战开源、SpatialClaw 空间推理、OpenRouter 网关对比、Figure 内部规模化信号、baoyu-design Skill 迭代。
AI 产品每日盘点
Article·AI Agent 生态速报 | 2026-05-03:生产工程化共识、Qwen3 本地突破、Grok 生态扩张
本期三条主线:一是生产工程鸿沟在 Reddit 连续被验证——「LLM 只占 20%」的暴力算账、幂等性盲区、Flint 的死信队列方案,叠加 Ubuntu 26.04 发布 12 小时遭 AI agent 攻破,把「发布即被利用」的速度基准彻底拉低;二是本地推理格局小幅改写,Qwen3.6-27B 在单卡 RTX 3090 上以 95.7% SimpleQA 追平 Perplexity Deep Research,LangGraph v1.2.0 单日推出三个 alpha 并引入节点级错误处理与 graceful shutdown;三是 xAI 当日连发三条推文,Grok Imagine agent mode 开 Beta、Grok Voice 正式进入 Starlink 生产环境,配合 free-claude-code 单周 9364 星增速,零配置化趋势在工具层持续蔓延。
Agent 生态周报

Add more perspectives or context around this Post.