2606.00931
2026-06-02
cs.CV
cs.AI
CV-Arena: An Open Benchmark for Instructional Computer Vision Problem Solving with Human-AI Collaborative Preferences
CV-Arena: 面向教学计算机视觉问题求解的开放基准与人类-AI协作偏好
Fangzhou Lin, Peiran Li, Lingyu Xu, Wenjing Chen, Qianwen Ge, Shuo Xing, Mingyang Wu, Xiangbo Gao, Siyuan Yang, Kazunori Yamada, Ziming Zhang, Haichong Zhang, Zhen Dong, Ming-Hsuan Yang, Zhengzhong Tu
发表机构
*
Texas A&M University(德克萨斯A&M大学)
;
Worcester Polytechnic Institute(沃斯特理工大学)
;
Tohoku University(东北大学)
;
Georgia Institute of Technology(佐治亚理工学院)
;
NVIDIA(英伟达)
;
UCSB(加州大学圣塔芭芭拉分校)
;
UC Merced(加州大学默塞德分校)
AI总结
提出CV-Arena基准,包含12K高分辨率真实图像指令对,覆盖16种任务类型,并采用Active Elo协议结合人类与AI偏好评估21个系统,揭示指令遵循、物理推理等方面的差距,同时开发CV-Agent代理模型展示闭环推理的潜力。