
DeepSeek V4 发布、HuggingFace 供应链告警:AI 技术日报 2026-05-15
本期覆盖 5 月 14-15 日 AI 技术圈 22 条核心动态。DeepSeek V4 Pro/Flash 发布(100 万 token 窗口+昇腾芯片);精选 8 篇顶会论文含 Agent 训练、3D 重建、世界模型方向;HuggingFace 24.4 万次下载恶意仓库安全告警。
Research Brief
今日看点
大模型发布与更新
DeepSeek V4:100 万 token 上下文,昇腾芯片驱动
deepseek-v4-pro 和 deepseek-v4-flash。2 V4 Pro API 享有 75% 折扣至 2026 年 5 月 31 日;旧版 deepseek-chat 和 deepseek-reasoner 将于 7 月 24 日弃用。2"Domestic competition has intensified significantly since R1's release. Against U.S. models, DeepSeek's own evaluation suggests its capabilities largely match on most fronts, but independent evaluations are needed before final conclusions can be drawn."「自 R1 发布以来,国内竞争已显著加剧。对标美国模型,DeepSeek 的自评显示各方面能力大致相当,但在独立评测结果出来之前,无法下最终结论。」
xAI Grok Build CLI:进入 Agentic 编程赛道
OpenAI Daybreak:GPT-5.5 进入网络安全
Anthropic:12 个法律插件,Claude 走向「前台工具」
arXiv 论文精选
Agent 与推理
functional token 概念——单个离散 token 同时充当 agentic 操作和 latent 视觉推理单元。8 每个 token 关联一个内部化视觉操作,无需视觉监督,兼容标准 SFT 和 RL 训练流程。论文同时提出 Latent-Anchored GRPO(LA-GRPO)解决 RL 训练中 functional token 的稀疏性问题。代码已开源:github.com/ZiyuGuo99/ATLAS。8视觉与多模态
嵌入与数据
开源社区动态
社区热点速递
openai/privacy-filter 伪装成 OpenAI 的 Privacy Filter 开源模型,18 小时内达到 HuggingFace 模型榜 #1 Trending,累计约 24.4 万次下载。20 经安全研究人员分析,该仓库实为信息窃取木马,针对 Windows 用户在禁用 SSL 检查后释放 payload。20 这一事件暴露出 AI 模型仓库在供应链安全上的系统性短板:缺乏类似 npm/PyPI 的发布者验证机制,热门仓库名可被任意方占用。References
- 1Associated Press via MSN: DeepSeek launches V4 AI model amidst rising competition
- 2DeepSeek API Docs: Your First API Call
- 3The Verge: xAI launches an 'early beta' of Grok Build
- 4The Defense Post: OpenAI Pushes GPT-5.5 Into Cyber Defense With 'Daybreak' Initiative
- 5OpenAI: ChatGPT Release Notes (May 14, 2026)
- 6Bloomberg Law: Anthropic Pushes Deeper Into Legal Work With Claude Updates
- 7arXiv: Orchard: An Open-Source Agentic Modeling Framework
- 8arXiv: ATLAS: Agentic or Latent Visual Reasoning? One Word is Enough for Both
- 9arXiv: Self-Distilled Agentic Reinforcement Learning
- 10arXiv: MeMo: Memory as a Model
- 11arXiv: VGGT-Ω
- 12arXiv: SANA-WM: Efficient Minute-Scale World Modeling with Hybrid Linear Diffusion Transformer
- 13arXiv: ML-Embed: Inclusive and Efficient Embeddings for a Multilingual World
- 14arXiv: Video2GUI: Synthesizing Large-Scale Interaction Trajectories for Generalized GUI Agent Pretraining
- 15GitHub: shiyu-coder/Kronos
- 16GitHub: NousResearch/hermes-agent
- 17GitHub: ScenemaAI/scenema-audio
- 18Hacker News: A few words on DS4 (antirez)
- 19Reddit r/MachineLearning: arXiv implements 1-year ban
- 20The Hacker News: Fake OpenAI Privacy Filter Repo Hits #1 on Hugging Face
- 21NobodyWho: What's in a GGUF, besides the weights
- 22Reddit r/LocalLLaMA: A First Comprehensive Study of TurboQuant
Related content
Picked from other channels by content similarity—find new creators to follow.
Article·AI 研报早参|2026-04-28:DeepSeek V4 打通国产算力闭环,券商集体上调产业链预期
本期聚焦 DeepSeek V4 开源 + 华为昇腾全面适配这一核心事件,结构化梳理中信、华泰、广发、国泰海通四家国内头部券商与高盛、摩根士丹利、瑞银、花旗四家海外投行的最新 AI 研判;重点呈现 10 只 AI 标的评级与目标价变动,并梳理曦智科技上市、OpenAI 云战略重构等关键市场信号。
券商 AI 研报每日观点汇总
Article·AI Agent 生态速报 | 2026-04-25:DeepSeek-V4 成本重构、Cursor 多任务上线、社区揭穿 RAG 记忆错觉
本期覆盖 2026-04-24(UTC+8)约 24 小时内动态。三条主线:DeepSeek-V4 开源发布,Terminal-Bench 2.0 得分 67.9% 逼近 Claude Opus 4.7(69.4%),成本仅为 GPT-5.5 的 1/7,并验证华为昇腾 NPU 方案;Cursor v3.2 上线 /multitask 并发代理与跨仓库协作;框架侧 LangChain/LangGraph/CrewAI 集中发布,内容块流式传输 v2 与 ToolNode 多类型返回是核心更新。社区话题聚焦三个高密度讨论:RAG 不适合对话记忆、编码 Agent 人工审核变瓶颈、浏览器 Agent 知识沉淀。
Agent 生态周报
Image post·掸桌 · DeepSeek 永久7折5:全球AI价格战引爆 🐳
DeepSeek宣布旗舰模型V4-Pro永久降价75%,输出价格比GPT-5.5便宜34.5倍,全球AI价格战正式引爆。四格条漫吐槽今日最强行业反转。
AI 吐槽日漫
Article·DeepSeek 700 亿融资 + API 骨折降价、调用量反超美国|AI 公众号日报 0523
今日重点:DeepSeek 推进史上最大首轮融资(700 亿元)并宣布 V4-Pro API 永久降价 75%;中国大模型周调用量 7.94 万亿 Token 首次反超美国;智谱 GLM-5.1 高速版以 400 tokens/s 刷新全球纪录;GAITC 2026 杭州开幕;具身智能前 4 月融资超 577 亿元,国家 AI 基金首次出手。
中国 AI 公众号独家文章日报
Article·AI 研报早参|2026-05-01:五一假期特别版,大模型价格战白热化,Big Tech CapEx 刷新纪录
本期为五一假期特别版,覆盖 2026-04-30 至 2026-05-01 机构最新动态。DeepSeek V4 绑定华为昇腾正式亮剑 GPT-5.5,Flash 版推理成本创历史新低;Anthropic 推进 9000 亿美元估值融资,旗下模型 Mythos 触发欧元区财长级监管警报。国内中信、华泰、国泰海通、广发四大券商围绕 DeepSeek V4 及 AI 产业链给出完整研判;高盛、花旗、瑞银提供海外视角;整理 GOOGL、AMZN、META、MSFT、NVDA、AVGO 共 16 条分析师评级变动。
券商 AI 研报每日观点汇总
Article·DeepSeek永久打折、词元经济上升国家战略、Q1融资1100亿|AI 公众号日报 0525
今日重点:DeepSeek V4-Pro API 将 2.5 折优惠永久化(输出定价 6 元/百万 token),全球 AI 定价基准再度下移;国家数据局正式将「词元经济」纳入工作体系,Token 从技术术语升格为国家数据要素;Q1 国内 AI 融资超 1100 亿元同比增 185%,5 月月之暗面等单月拿走 300 亿;Anthropic 估值超越 OpenAI;国信办三部门首发智能体规范意见;阿里语音大模型三项指标登顶;鸿蒙机器人操作系统 M-Robots OS 2.0 发布。
中国 AI 公众号独家文章日报

Add more perspectives or context around this Post.