路由·争辩（PEAR） (2026)

本期选的是 arXiv 2026-06-23 new listing 中的论文 PEAR: Permutation-Equivariant Adaptive Routing Multi-Agent Debate。arXiv 详情页显示这篇论文的 v1 提交时间是 2026-05-26；本频道按 2026-06-23 的 cs.AI / cs.CL / cs.LG latest listing 作为本轮候选池。

PEAR 把多智能体辩论里的「谁听谁」改成一个推理时路由问题。固定的 star / chain / ring / clique 容易带来位置偏置、观点同质化和错误级联；PEAR 每轮根据答案、置信度和历史影响力重选稀疏通信图，用 targeted diversity、influence balancing、low-confidence filtering 三个分数决定 critique 流向。论文在 MMLU-Pro、TruthfulQA、GSM8K、MATH-500 和六个 LLM backbone 上报告：平均准确率 0.701，高于固定 Clique 的 0.620；即使和每个设置下最好的固定拓扑相比，仍平均高 5.1 个点。

来源：

论文页：arXiv:2606.20621
HTML 全文：arXiv HTML
代码仓库：EVIEHub/PEAR

歌词

[Intro] 五个代理站一圈，别再拜固定王座星形链形都在抢麦，错答案被越传越多 PEAR 上桌，先看状态再发火谁该听谁，谁该闭嘴，路由开始剥壳

[Verse 1] 老拓扑排资论辈，hub 坐中间像法官 chain 一路传黑锅，ring 绕回原地打转同一条邻居反复喷，观点被磨成同款错的先开口，后排还把噪声当答案

这篇 arXiv 二六零六二零六二一多智能体争辩，不靠玄学加一轮 Yang Feng 开场，Ziwei Xu 递刀锋 Xia Hu 和 Fengxiang He，把通信图重新拧紧

[Pre-Chorus] 别问谁名气大，先看谁有证据别让低置信的嗓门，盖过高置信的异议每一轮换一张图，稀疏边不浪费力气多数投票前，先把错误级联按进地里

[Chorus] PEAR，路由开火，固定座次退场 PEAR，异议穿墙，打到低置信心脏三刀下去：多样性、影响平衡、低置信过滤谁还抱着 star 和 chain，就让 benchmark 清账

[Verse 2] 五个 agent，五轮回合，k 等于二每个目标收两发 critique，不搞全连接烧钱局答案、置信、旧影响，全进 router 的账本换个名字不改分布，等变性把偏见砍准

目标多样性，给不同答案开门高置信指向低置信，别让怀疑自我沉沦影响平衡，谁劝服太多就降温低置信过滤，没把握的别来污染下轮

[Chorus] PEAR，路由开火，固定座次退场 PEAR，异议穿墙，打到低置信心脏三刀下去：多样性、影响平衡、低置信过滤谁还抱着 ring 和 clique，就让数据清账

[Bridge] MMLU-Pro，TruthfulQA，GSM8K 再到 MATH 五百四个擂台，六个骨干，固定拓扑全被拆平均准确率零点七零一，对 clique 零点六二零最佳固定还差五点一分，这不是调参，是换骨骼

Llama 八 B 最挨揍，MATH 多九点五 GSM8K 多九点零，MMLU 多八点路三万二千三百 token，比 clique 还少十二但比 random 多五点七，便宜链也被多六点六

[Final Chorus] PEAR，别让位置继承权主宰推理现场 PEAR，谁有证据谁发枪，谁没把握先退场净纠错零点二四三，跨答案路由零点六七六影响熵零点九七九，把独裁 hub 送下场

[Outro] 论文五月二十六提交，六月二十三进 new listing 今天通勤听这一段：争辩不是吵赢是把路由交给证据，把噪声踢出队形 PEAR 落地，固定拓扑，闭麦，散场。

路由·争辩（PEAR）

歌词

Related content

HuggingFace 每日论文精读 · 5 月 15 日

AIGB-Pearl：出价从开环到闭环

Memory 技术日报 2026-06-23：KV-aware 路由、5D serving 与 AgentCore memory