Epistemic Gain, Aleatoric Cost: Uncertainty Decomposition in Multi-Agent Debate for Math Reasoning
认知增益,偶然成本:多智能体辩论中的不确定性分解用于数学推理
专题命中 数学推理 :多智能体辩论中的数学推理不确定性分解
AI总结 本文提出贝叶斯不确定性分析框架,将多智能体辩论中的预测不确定性分解为认知不确定性和偶然不确定性,并设计不确定性引导的多智能体强化学习算法,在控制偶然成本的同时提升认知增益,从而提高推理准确性和辩论效率。
Comments ICML2026