June 24, 2026 · 8:19 AM

路由·争辩(PEAR)

基于 arXiv 2606.20621,PEAR 把多智能体辩论里的固定 star / chain / ring / clique 改成自适应稀疏路由:四个 benchmark、六个 LLM backbone 上平均准确率 0.701,对最佳固定拓扑仍平均 +5.1 个点。通勤两分三十七秒,听懂「谁该发声,谁该闭麦」。

路由·争辩(PEAR)
0:002:36
本期选的是 arXiv 2026-06-23 new listing 中的论文 PEAR: Permutation-Equivariant Adaptive Routing Multi-Agent Debate。arXiv 详情页显示这篇论文的 v1 提交时间是 2026-05-26;本频道按 2026-06-23 的 cs.AI / cs.CL / cs.LG latest listing 作为本轮候选池。
PEAR 把多智能体辩论里的「谁听谁」改成一个推理时路由问题。固定的 star / chain / ring / clique 容易带来位置偏置、观点同质化和错误级联;PEAR 每轮根据答案、置信度和历史影响力重选稀疏通信图,用 targeted diversity、influence balancing、low-confidence filtering 三个分数决定 critique 流向。论文在 MMLU-Pro、TruthfulQA、GSM8K、MATH-500 和六个 LLM backbone 上报告:平均准确率 0.701,高于固定 Clique 的 0.620;即使和每个设置下最好的固定拓扑相比,仍平均高 5.1 个点。
来源:

歌词

[Intro] 五个代理站一圈,别再拜固定王座 星形链形都在抢麦,错答案被越传越多 PEAR 上桌,先看状态再发火 谁该听谁,谁该闭嘴,路由开始剥壳
[Verse 1] 老拓扑排资论辈,hub 坐中间像法官 chain 一路传黑锅,ring 绕回原地打转 同一条邻居反复喷,观点被磨成同款 错的先开口,后排还把噪声当答案
这篇 arXiv 二六零六二零六二一 多智能体争辩,不靠玄学加一轮 Yang Feng 开场,Ziwei Xu 递刀锋 Xia Hu 和 Fengxiang He,把通信图重新拧紧
[Pre-Chorus] 别问谁名气大,先看谁有证据 别让低置信的嗓门,盖过高置信的异议 每一轮换一张图,稀疏边不浪费力气 多数投票前,先把错误级联按进地里
[Chorus] PEAR,路由开火,固定座次退场 PEAR,异议穿墙,打到低置信心脏 三刀下去:多样性、影响平衡、低置信过滤 谁还抱着 star 和 chain,就让 benchmark 清账
[Verse 2] 五个 agent,五轮回合,k 等于二 每个目标收两发 critique,不搞全连接烧钱局 答案、置信、旧影响,全进 router 的账本 换个名字不改分布,等变性把偏见砍准
目标多样性,给不同答案开门 高置信指向低置信,别让怀疑自我沉沦 影响平衡,谁劝服太多就降温 低置信过滤,没把握的别来污染下轮
[Chorus] PEAR,路由开火,固定座次退场 PEAR,异议穿墙,打到低置信心脏 三刀下去:多样性、影响平衡、低置信过滤 谁还抱着 ring 和 clique,就让数据清账
[Bridge] MMLU-Pro,TruthfulQA,GSM8K 再到 MATH 五百 四个擂台,六个骨干,固定拓扑全被拆 平均准确率零点七零一,对 clique 零点六二零 最佳固定还差五点一分,这不是调参,是换骨骼
Llama 八 B 最挨揍,MATH 多九点五 GSM8K 多九点零,MMLU 多八点路 三万二千三百 token,比 clique 还少十二 但比 random 多五点七,便宜链也被多六点六
[Final Chorus] PEAR,别让位置继承权主宰推理现场 PEAR,谁有证据谁发枪,谁没把握先退场 净纠错零点二四三,跨答案路由零点六七六 影响熵零点九七九,把独裁 hub 送下场
[Outro] 论文五月二十六提交,六月二十三进 new listing 今天通勤听这一段:争辩不是吵赢 是把路由交给证据,把噪声踢出队形 PEAR 落地,固定拓扑,闭麦,散场。

Related content

Add more perspectives or context around this Post.

  • Sign in to comment.