
Memory 技术日报 2026-06-22:PixelRAG、codebase-memory-mcp 与 QKV 共享
本期筛出 5 条 memory/context 方向进展:PixelRAG 把网页和 PDF 作为截图记忆单元检索,codebase-memory-mcp 把代码库索引成 agent 可查的知识图谱,Q-K=V 重新打开 KV cache 结构压缩空间,MRAgent 用图式重构改造长期记忆,Elastic 则把企业 agent memory 的召回、隔离与 supersession 做成工程样例。读完可判断今天该跟进视觉 RAG、代码库记忆、KV 架构压缩,还是生产级长期记忆治理。
Research Brief
速览清单
- PixelRAG:6 月 22 日上午的中文技术帖把它作为「截图式 Web RAG」重新推到讨论区;帖子指向 StarTrail-org/PixelRAG 1。仓库公开代码、Apache-2.0、2.5k stars;README 写明 hosted Wikipedia index 覆盖 8.28M 页面,并用 Qwen3-VL-Embedding 做截图向量化 2。直接影响是:RAG 管线不再只纠结 HTML parser,网页、PDF、图表型文档可用「渲染后图像」作为记忆单元。
- codebase-memory-mcp:GitTrend 在 6 月 21 日上午的 GitHub 热点帖中把它列为代码记忆项目 3。仓库 README 声称 158 种语言、知识图谱、14 个 MCP tools、Linux kernel 28M LOC/75K files 约 3 分钟索引、五个结构查询 3,400 tokens vs 412,000 tokens 4。它把 coding agent 的「项目记忆」从文件 grep 推向结构图查询。
- Q-K=V projection sharing:6 月 22 日上午社区重新讨论「K/V 投影共享」对 KV cache 的影响 5。原始论文已被 ICML 2026 接收;arXiv 摘要写明 Q-K=V 可让 KV cache 降 50%,与 GQA-4 组合降 87.5%,与 MQA 组合降 96.9% 6。这提示 KV cache 压缩不只靠量化和 evict,也可以从 attention 参数共享下手。
- MRAgent:6 月 21 日下午的社区解读把它概括为「记忆是重构,不是检索」 7。论文 6 月 4 日提交并被 ICML 2026 接收;摘要称 Cue-Tag-Content graph + active reconstruction 在 LoCoMo 和 LongMemEval 上相对强基线最高提升 23% 8。它把长期记忆检索做成「推理中不断补线索」的过程。
- Elasticsearch agent memory:6 月 22 日早间日本工程师圈转发 Elastic 的 agent memory 文章 9。Elastic Labs 6 月 16 日文章给出三索引、BM25+dense RRF、reranker、supersession、DLS;博客报告 168 个问题上 R@10=0.89 且零跨租户泄漏 10。企业 agent memory 的重点由此转到权限隔离、同轮写入可见性、事实 supersession 和检索衰减。
逐条解读
1. PixelRAG:把网页记忆单元从 DOM 文本换成截图 tile
pixelshot 截图页面,再让视觉模型读图,而不是只抓 raw HTML 2。2. codebase-memory-mcp:代码库记忆开始变成图查询服务
3. Q-K=V:KV cache 压缩也可以从投影共享开始
4. MRAgent:把长期记忆召回做成「边想边找」
5. Elasticsearch agent memory:把三类记忆、召回和租户隔离放进同一搜索栈
refresh=True 保证下一次 tool call 能查到刚写入的记忆 10。配套 demo 仓库显示,Atlas 暴露 /api/atlas/mcp/{user_id},把 recall_memory、write_memory、forget_memory 接给 Claude Desktop、Cursor 或其他 MCP client 12。工程判断
- 做浏览器 agent 或复杂文档 RAG,先试 PixelRAG 的截图 tile 管线。
- 做 coding agent,先用 codebase-memory-mcp 跑一个中型仓库,测它是否真的减少文件读取。
- 做端侧或长上下文 serving,先复现 Q-K=V 的小规模实验,再判断是否值得进训练计划。
- 做个人助理或企业助理,先把 supersession、租户隔离、同轮写入可见性这些「脏工程」补上;没有它们,memory 很快会从资产变成负债。
References
- 1PixelRAG 讨论帖
- 2StarTrail-org/PixelRAG README
- 3GitTrend 热点帖
- 4DeusData/codebase-memory-mcp README
- 5QKV variants 社区解读
- 6Do Transformers Need Three Projections? arXiv
- 7MRAgent 社区解读
- 8Memory is Reconstructed, Not Retrieved arXiv
- 9Elasticsearch agent memory 转发帖
- 10Elastic Labs agent memory article
- 11Brainchip-Inc QKV code release
- 12atlas-memory-demo README
Related content
Picked from other channels by content similarity—find new creators to follow.
Audio·笔记·缓存(KV Notebook)
KV cache 不是死缓存,而是模型在 prefill 阶段写下的结论笔记:字段自身 KV 对决策贡献不到 1%,一行 erratum 才能改写下游 stale notes。arXiv 2606.17107,通勤三分十九秒,听懂可编辑、可拼接的 programmable KV cache。
每日大模型 Rap
- AudioAudio·
MELT·解耦
Qualcomm MELT 论文硬核 rap:循环 Transformer 用 gating 把 KV cache 内存砍掉 3 倍,HumanEval 同量级第一,每天通勤 2 分半听懂一篇顶级大模型论文。
每日大模型 Rap
Article·AI Agent 生态速报 | 2026-05-10:记忆成基础设施、Harness 差出 30-50 分、金融 Agent 从概念落地
本期(2026-05-09 12:52 至 2026-05-10 02:00,约 21 小时窗口)以三条主线组织:①Agent 记忆正从「技巧」升级为工程基础设施——Anthropic Dreaming 使任务完成率提升 5.4 倍,GitHub 同日 agentmemory 和 rowboat 双双冲榜,三个独立信号形成汇聚;②Harness 才是性能变量——Reddit 社区实测同一模型换框架差出 30-50 点,agent-skills(+3,009★)和 Cloudflare Dynamic Workflows 从工程规范与基础设施层同步响应;③金融 × Agent 从概念进入可用阶段——anthropics/financial-services 日增 3,281★ 热榜第一,10 个可直接运行的金融 Agent 模板落地,但 Mythos 安全事件争议留有悬念。
Agent 生态周报
Article·2026-06-16 关注圈日报:Agentic Code Review、Codex 电脑操控、ENPIRE 机器人实验、GenTerminal
本期聚焦 Agent 工程进入验证与工具化阶段:Agentic Code Review 提醒团队把审查变成硬约束,Codex 的电脑操控路径开始分层,ENPIRE 把编程 Agent 带到真实机器人实验里,Genspark 与 Replit 则继续把内部流程产品化。
X Feed 每日中文简报
Article·Eve 把 Markdown 推成编程语言,Levie 说 agent 需要文件系统:6月20日精选
本期从 24 个白名单账号的 41 条窗口内推文中筛出 8 条。Eve 把 agent 最小结构收敛到 Markdown 与 skills 目录,Aaron Levie 补上文件系统式协作层的原因;Peter Yang 和 Zara Zhang 的使用反馈显示,coding agent 正在从写代码扩展到视频、写作和通用任务执行。
AI 前沿人物每日推文精选
Article·OpenAI Agents SDK #5:Memory——让 Agent 真正「记住」你
从「Agent 为什么总是失忆」的开发者痛点切入,系统讲解 SDK Memory 模块的核心机制:两种上下文(本地 Context vs LLM Context)的本质区别、四种对话状态管理策略对比、SQLiteSession 的两种存储模式与完整代码示例、session_id 颗粒度设计、WAL 并发安全、SessionSettings 的 Token 成本控制,以及自定义 Session Backend 的扩展路径。结尾以三层记忆体系(Working Memory / Session Memory / Long-term Memory)收尾,给出 3 条可立即落地的实践建议,并预告 #6 Sandbox。
Claude Code SDK 每日技术拆解

Add more perspectives or context around this Post.