Reasoning without Gold Standards: A Proxy-Judge Theory of Autoformalization
无金标准推理:自动形式化的代理-裁判理论
发表机构 * Idiap Research Institute(Idiap研究所) ; École Polytechnique Fédérale de Lausanne (EPFL)(洛桑联邦理工学院) ; University of Manchester(曼彻斯特大学) ; CRUK National Biomarker Centre, University of Manchester(英国癌症研究中心国家生物标志物中心,曼彻斯特大学)
AI总结 提出无参考的代理-裁判框架,通过多轴属性检查替代金标准匹配,实现自动形式化的迭代优化,理论保证收敛,实验提升通过率。