2606.12485
2026-06-12
cs.LG
cs.AI
新提交
Speculative Rollback Correction for Quality-Diverse Web Agent Imitation
面向质量多样性的Web智能体模仿的推测性回滚修正
Longkun Hao, Hongyu Lin, Hao Li, Zhichao Yang, Haojie Hao, Dongshuo Huang, Haitao Yang, Hongyu Ge, Ming jie Xie, Yanjun Wu, Zi Hao Yin, Yan Bai, Yihang Lou
发表机构
*
Beihang University(北京航空航天大学)
;
Institute of Software, Chinese Academy of Sciences(中国科学院软件研究所)
;
The Hong Kong University of Science and Technology(香港科技大学)
;
Northwestern Polytechnical University(西北工业大学)
;
Tsinghua University(清华大学)
;
The Hong Kong University of Science and Technology (Guangzhou)(香港科技大学(广州))
;
Peking University(北京大学)
AI总结
提出推测性回滚修正(SRC)框架,通过固定视野分支审查和回滚机制,在减少教师查询的同时保持轨迹多样性,在WebArena-Infinity上收集了977条通过验证的轨迹和9183个下一步动作示例。