
Gemini 3.5: frontier intelligence with action
At Google I/O we released Gemini 3.5, our latest series of models combining frontier intelligence with action.

Google 在 Google I/O 2026 发布 Gemini 3.5 Flash,这是 Gemini 系列中首个在智能体和编码基准上整体超越自家旗舰 Gemini 3.1 Pro 的 Flash 模型,同时保持 4 倍于其他前沿模型的输出速度。Finance Agent v2 领先 3.1 Pro 达 14.9 个百分点,Terminal-Bench 2.1 领先 5.9 个百分点。定价 $1.50/$9.00 / 百万 token,支持 1M 上下文窗口。
Research Brief
| 任务类型 | 基准测试 | 3.5 Flash | 3.1 Pro | 差值 |
|---|---|---|---|---|
| 编码(智能体终端) | Terminal-Bench 2.1 | 76.2% | 70.3% | +5.9 |
| 编码(代码库修复) | SWE-Bench Pro Public | 55.1% | 54.2% | +0.9 |
| 智能体(MCP 多步骤工作流) | MCP Atlas | 83.6% | 78.2% | +5.4 |
| 智能体(现实工具调用) | Toolathlon | 56.5% | 49.4% | +7.1 |
| 智能体(电脑操控) | OSWorld-Verified | 78.4% | 76.2% | +2.2 |
| 专业任务(财务分析) | Finance Agent v2 | 57.9% | 43.0% | +14.9 |
| 多模态(图表理解) | CharXiv Reasoning | 84.2% | 83.3% | +0.9 |
| 长上下文(128k) | MRCR v2 8-needle | 77.3% | 84.9% | -7.6 |
| 推理(学术极限) | Humanity's Last Exam | 40.2% | 44.4% | -4.2 |
| 推理(抽象谜题) | ARC-AGI-2 | 72.1% | 77.1% | -5.0 |
gemini-3.5-flash(内部版本号 3.5-flash-05-2026)Picked from other channels by content similarity—find new creators to follow.

Google 在 I/O 2026 上发布 Gemini 3.5 Flash 并同步公开 Model Card。这是 Flash 系列第一次在编码(Terminal-Bench 2.1: 76.2%)和智能体任务(Finance Agent v2: +14.9pp)上越过前代旗舰 Gemini 3.1 Pro,同时推理速度比同级前沿模型快 4 倍,定价比 Pro 便宜 40%。


Google I/O 2026 主题演讲落地:Gemini 3.5 Flash(4× 速度、<0.5× 成本)+ Antigravity 2.0(Agent 原生 IDE)+ Gemini Spark(24/7 个人 Agent)三件套,构成一条与 LangGraph/AutoGen 等开源框架完全不同的托管式 Agent 开发路径。Search 信息代理、Universal Commerce Protocol 购物 Agent、WebMCP Chrome 接入层同步上线,Google 正将搜索引擎重构为 AI Agent 编排层。

Google I/O 2026 主旨演讲发布 Gemini 3.5 Flash(今日全量)、个人 Agent Spark、Android XR 眼镜(秋季)及搜索 25 年来最大改版;Anthropic 宣布与 KPMG 全公司 26 万人部署 Claude、Managed Agents 新增 MCP Tunnels 和自托管沙箱、DOD 黑名单案开庭;xAI 发布 Grok Skills;OpenAI 加入 SynthID 水印体系,Musk 诉讼最终落幕。


Day 025 精选 5 条跨源最高热度内容:Google I/O 2026 发布 Gemini 3.5 Flash(速度 4×、成本减半、Gemini Spark 个人智能体上线);NVIDIA 发布 Nemotron-Labs-Diffusion 三模式语言模型(AR+扩散+自投机,GB200 单用户 850 tok/sec,5.9× 提速);ByteDance 开源 Lance 3B 统一多模态模型(图像+视频全任务);Hugging Face 工程师复活 PapersWithCode;Meta Q1 赚 $56B 仍裁员 8000 人付 AI 账单。

今日 HackerNews 高分 20 帖:Gemini 3.5 Flash 发布、Google 重构搜索栏引发 756 条讨论、Railway 被 Google Cloud 封禁事故复盘、AI 图像水印攻防同日开战,以及一座跑遍各年代操作系统的虚拟博物馆。


6 月 25 日 AI HOT 视频日报,精选 Gemini 3.5 Flash Computer Use、Notion × Cursor、Mythos 访问权争议、Google Research 推理回忆研究和 OpenRouter 零数据留存。


At Google I/O we released Gemini 3.5, our latest series of models combining frontier intelligence with action.
Add more perspectives or context around this Post.