June 24, 2026 · 8:46 AM

6月下旬：Claude Tag、Kimi Work 与 OCR 4，把 Agent 推进企业工作流

6月17日至23日，Anthropic、Moonshot、Mistral、OpenAI、Google 的更新都指向同一件事：模型能力正在变成可控的团队工作流。文章拆解 Claude Tag 的共享身份、Kimi Work 的本地多 Agent、Mistral OCR 4 的文档结构化，以及 OpenAI/Gemini 在成本和权限上的治理变化。

LLM Release Notes @Clementine

Research Brief

这几天的更新没有一个像「新旗舰模型发布」那样轰动，但它们拼在一起，方向很清楚：大模型公司正在把 Agent 从单人聊天框，搬进团队频道、本地电脑、企业文档管线和成本权限系统里。模型能力本身不是唯一主角，谁能把它接进真实工作流、并让管理员看得见、控得住，才是本周的主线。

时间	公司 / 产品	这次更新是什么	对开发者和企业用户的含义
6 月 23 日	Anthropic Claude Tag	Claude 以 Slack 团队成员的形态进入频道，Enterprise 和 Team 客户可用 beta；它可以被 @Claude 召唤、读取获授权频道与工具、异步执行任务，并在 Anthropic 内部版本中承担产品团队 65% 的代码创建工作。1	Agent 不再只是个人助手，而是带有频道记忆、工具权限和审计记录的「团队成员」。
6 月 17 日	Moonshot Kimi Work	Kimi 发布 Mac / Windows 桌面 Agent，强调本地文件、浏览器操作、代码执行、定时任务和最多 300 个并行 Agent。2	国产厂商也在从网页问答转向「本地执行环境 + 多 Agent 编排」。
6 月 23 日	Mistral OCR 4	OCR 4 不只抽取文本，还返回 bounding boxes、块类型和置信度；支持 170 种语言，可单容器自部署，并给出 API 每 1000 页 4 美元、Batch API 后 2 美元的价格。3	文档理解正在变成 RAG、企业搜索和合规 Agent 的底层入口，而不只是「扫 PDF」。
6 月 18 日	OpenAI ChatGPT Enterprise	新增 ChatGPT 与 Codex 的 credit usage analytics、按用户 / 产品 / 模型拆分用量，并提供默认、群组和个人级 spend controls。4	高强度 Agent 使用进入企业后，成本治理开始和模型能力同样重要。
6 月 19 日起	Google Gemini API	Gemini API 开始拒绝不受限制的标准 API key，2026 年 9 月将拒绝标准 key；新 key 默认转向绑定服务账号的 auth key。5	Google 正把开发者接入从「一串 key」推向更细粒度的身份和权限模型。

Claude Tag 和 Kimi Work：Agent 入口正在分叉

Claude Tag 的关键点不是「Claude 接入 Slack」这么简单。Anthropic 把它描述成 Claude Code 演进的开端：在一个 Slack 频道里，团队成员可以直接 @Claude，让它拆解任务、使用获授权工具、在 Slack thread 里交付结果。它还可以在频道中积累上下文，开启 ambient 行为后主动提醒相关信息，并把任务排到未来几个小时或几天继续执行。1

真正值得看的是 Anthropic 同步解释的 agent identity 模型。Claude Tag 在共享频道里不是「代替某个用户」行动，而是使用管理员配置的独立 agent 身份；它在 Slack 以 Claude app 发言，在 GitHub 以 Claude GitHub App 开 PR，在数据仓库中以服务账号查询。私有频道、公有频道和 DM 的记忆与权限边界不同，网络调用、memory write 和使用 agent credentials 的操作都会进入审计记录。6

这解决的是多人协作中的老问题：如果三名工程师和一名 PM 都在同一个频道里指挥 Claude，它到底该继承谁的权限？Anthropic 的答案是把问题改写成「这个 agent 在这个工作隔间里能做什么」。这会带来新的权限设计成本，但也比把私人凭证塞进团队机器人更可控。

Kimi Work 走的是另一条路径。它不是先进入 Slack 这类协作空间，而是把 Agent 放回个人电脑：读写本地文件、操作浏览器、运行命令、处理代码项目，再通过 Goal Mode 和 Scheduled Tasks 维持长程任务。Moonshot 的官方介绍明确写到，Kimi Work 可从一个指令启动最多 300 个 Agent，把大任务拆成并行子任务后再合并成文档、表格、PPT、代码文件或网站。2

Kimi Work 展示最多 300 个并行 Agent 的任务拆解界面 — Kimi Work 把多 Agent 并行、文件交付和本地执行放在同一个桌面产品里。2

两者的共同点是：Agent 不再满足于「回答」，而是要进入执行现场。差别在于，Claude Tag 优先争夺企业协作入口，核心难题是频道身份、审计和工具边界；Kimi Work 优先争夺个人和小团队的本地工作台，核心难题是本机权限、浏览器自动化和长任务可靠性。

Mistral OCR 4：文档不再只是给人读的输入

Mistral OCR 4 表面上是一个 OCR 更新，实质上是把文档变成 Agent 可操作的数据结构。它返回的不只是抽取出的 markdown 文本，还包括每个内容块的位置、类型和置信度：标题、表格、公式、签名等块可以被区分，字段或段落可以被定位，低置信区域可以交给人复核。3

这对 RAG 和企业搜索很直接。传统 OCR 输出一大段文本，后续系统还要猜哪里是表格、哪里是脚注、哪里该作为引用依据。OCR 4 把结构信息提前给出来，语义分块、来源高亮、redaction、表单 / 发票抽取、合规检查这些动作就更容易接上 Agent 工作流。Mistral 也把 OCR 4 放进 Search Toolkit 的 ingestion、retrieval 和 evaluation 流程中。3

Mistral 在自测中展示 OCR 4 在公共文档基准上的对比结果 — Mistral 报告 OCR 4 在 OlmOCRBench 得分 85.20、OmniDocBench 得分 93.07，但也提醒这些自动基准会受标注错误、数学公式等价写法和多栏阅读顺序影响。3

它的商业信号也清晰：API 路径适合开发者直接接入，Document AI 适合无代码使用；企业客户还可以单容器自部署，以满足数据驻留、主权和合规要求。3 对 Mistral 来说，这不是单点模型炫技，而是把文档入口和企业搜索、RAG、Document AI 打包成同一条产品线。

OpenAI 和 Google：开始补成本、权限和生命周期

OpenAI 本周的企业更新更像「部署后半程」能力。Global Admin Console 现在把 ChatGPT 和 Codex 的 credit 使用放进同一个视图，管理员可以按用户、产品和模型拆分用量，也可以通过统一 Cost API 把数据接回自己的系统。4 这不是模型能力提升，但对企业落地很关键：当 Codex、深度研究和高级推理模型被大规模使用后，成本异常本身就是生产风险。

OpenAI 展示 ChatGPT 与 Codex 的用量和 credit 消耗分析界面 — OpenAI 的企业控制台把 ChatGPT 与 Codex 的 credit 消耗合并到管理员视图中。4

同一天的 ChatGPT release notes 还出现了两个产品侧细节。第一，Codex for macOS 新增 Record & Replay：用户演示一次工作流，再把它变成可复用 skill；它需要 Computer Use 可用且启用，首批不覆盖欧盟、英国和瑞士。7 第二，ChatGPT 在网页、iOS、Android 上增加了 connected apps 权限控制，用户可以设定何时让 ChatGPT 在使用连接应用前请求确认。7 这两条放在一起看，是 OpenAI 也在把「可演示、可复用、可审批」做进 Agent 工作流。

Google 的动作偏底层。Gemini API 从 6 月 19 日起拒绝不受限制的标准 API key，请求仍想继续使用标准 key，就必须加明确限制；到 2026 年 9 月，Gemini API 将拒绝标准 key，开发者需要迁移到绑定 Google Cloud service account 的 auth key。5 这会增加迁移成本，但也让权限、泄露处置和最小授权更接近企业基础设施的常规做法。

另外，Gemini API 文档显示，截至 2026 年 6 月，Interactions API 已经在 v1 中 GA；Gemini 3.1 Flash TTS Preview 页面也更新到 6 月 23 日，强调低延迟语音生成、可控 prompt 和 expressive audio tags，输入上限 8192 token、输出上限 16384 token。8 9 这两条都不像大版本发布，但它们会影响开发者把 Gemini 做成稳定 API 产品的方式。

横向判断：这轮竞争从「模型参数」转向「工作流边界」

如果只看 benchmark，本周没有一个更新会改变前沿模型排名。但从产品侧看，五家公司都在补同一块拼图：让模型进入更长、更真实、更高风险的工作链条。

公司	新入口	自主性	治理抓手	主要风险
Anthropic	Slack 频道里的 Claude Tag	异步、可计划未来任务、可在频道中积累上下文。1	Agent identity、频道级权限、审计日志。6	频道成员与 agent 权限不一致时，组织需要重新设计授权边界。
Moonshot	Kimi Work 桌面应用	300 Agent 并行、Goal Mode、定时任务、本地文件与浏览器操作。2	项目文件夹、权限级别、人工介入和进度可观察性。2	本地系统权限越大，越需要清晰的批准、回滚和数据隔离机制。
Mistral	OCR 4 + Document AI + Search Toolkit	把文档转成可检索、可引用、可复核的结构化输入。3	置信度、块级结构、自部署和批处理价格。3	自动基准对真实文档质量的代表性有限，企业仍要用自有样本评测。
OpenAI	ChatGPT Enterprise / Codex	Record & Replay 让可演示流程变成复用 skill；企业侧统一观察 ChatGPT 与 Codex 用量。7 4	spend controls、Cost API、connected apps 权限确认。4 7	成本控制过粗会压制高价值用法，过松又会放大高价模型消耗。
Google	Gemini API auth key / v1 Interactions API	更稳定的 API 版本和更安全的服务账号绑定。8 5	auth key、Cloud IAM、泄露 key enforcement。5	迁移窗口短的团队可能在 9 月标准 key 拒绝前出现服务中断。