OpenDeepThink: Parallel Reasoning via Bradley-Terry Aggregation
OpenDeepThink: 通过布拉德利-蒂尔利聚合实现并行推理
发表机构 * UC San Diego(UC圣地亚哥大学) ; Princeton University(普林斯顿大学) ; University of Washington(华盛顿大学) ; UC Berkeley(伯克利大学)
AI总结 该研究提出OpenDeepThink框架,通过布拉德利-蒂尔利聚合方法在测试时扩展计算资源,以提高大语言模型的推理能力,通过并行选择候选方案并消除选择瓶颈,从而提升模型在Codeforces等领域的表现。
Comments 19 pages, 4 figures