Breaking the Reward Barrier: Accelerating Tree-of-Thought Reasoning via Speculative Exploration
发表机构 * Institute for Artificial Intelligence, Peking University School of Integrated Circuits, Peking University(人工智能研究院,北京大学集成电路学院,北京大学) ; School of Integrated Circuits, Peking University(集成电路学院,北京大学) ; ByteDance Seed(字节跳动种子)
AI总结 树-of-Thought(ToT)推理通过树状搜索结构提升大语言模型在复杂任务中的表现,但其效率受限于奖励依赖性屏障带来的同步瓶颈。本文提出SPEX方法,通过推测性探索打破该限制,引入路径选择、资源分配和早停机制等关键技术,显著提升ToT推理效率。实验表明,SPEX在多种ToT算法和模型上实现了1.2到3倍的加速,并与令牌级推测解码结合后最高达到4.1倍的加速效果,为高效可扩展的ToT推理提供了重要进展。
Comments OSDI 2026