2511.07332
2026-06-11
cs.LG
cs.AI
版本更新
Grounding Computer Use Agents on Human Demonstrations
基于人类演示的计算机使用智能体基础构建
Aarash Feizi, Shravan Nayak, Xiangru Jian, Kevin Qinghong Lin, Kaixin Li, Rabiul Awal, Xing Han Lù, Johan Obando-Ceron, Juan A. Rodriguez, Nicolas Chapados, David Vazquez, Adriana Romero-Soriano, Reihaneh Rabbany, Perouz Taslakian, Christopher Pal, Spandana Gella, Sai Rajeswar
发表机构
*
Mila - Quebec AI Institute(魁北克AI研究所)
;
McGill University(麦吉尔大学)
;
Université de Montréal(蒙特利尔大学)
;
ServiceNow Research(ServiceNow研究)
;
University of Waterloo(滑铁卢大学)
;
University of Oxford(牛津大学)
;
National University of Singapore(新加坡国立大学)
;
Polytechnique Montréal(蒙特利尔理工学院)
;
École de Technologie Supérieure(高级技术学院)
;
CIFAR AI Chair(CIFAR人工智能主席)
AI总结
为解决桌面环境高质量基础数据稀缺问题,构建了包含87个应用、56K截图和3.56M人工标注的GroundCUA数据集,并基于此训练GroundNext模型,在5个基准上以少于先前十分之一的数据取得最优结果。