2605.25246
2026-06-02
cs.AI
FrontierOR: Benchmarking LLMs' Capacity for Efficient Algorithm Design in Large-Scale Optimization
FrontierOR:基准测试大语言模型在大规模优化中高效算法设计的能力
Minwei Kong, Chonghe Jiang, Ao Qu, Wenbin Ouyang, Zhaoming Zeng, Xiaotong Guo, Zhekai Li, Junyi Li, Yi Fan, Xinshou Zheng, Xi Jing, Yikai Zhang, Zhiwei Liang, Seonghoo Kim, Runqing Yang, Zijian Zhou, Sirui Li, Han Zheng, Wangyang Ying, Ou Zheng, Chonghuan Wang, Jinglong Zhao, Hanzhang Qin, Cathy Wu, Paul Pu Liang, Jinhua Zhao, Hai Wang
发表机构
*
Singapore-MIT Alliance for Research and Technology(新加坡-麻省理工联盟研究技术)
;
Massachusetts Institute of Technology(麻省理工学院)
;
Northeastern University(东北大学)
;
Uber
;
Shanghai Jiaotong University(上海交通大学)
;
Boston University(波士顿大学)
;
Emory University(埃默里大学)
;
Northwestern University(西北大学)
;
National University of Singapore(国立新加坡大学)
;
Microsoft(微软)
;
University of Texas at Dallas(德克萨斯大学达拉斯分校)
;
Singapore Management University(新加坡管理学院)
AI总结
提出FrontierOR基准,系统评估大语言模型在现实大规模优化问题中设计可扩展算法(而非仅生成求解器代码)的能力,发现最强模型仅在31%案例中优于Gurobi。