2606.16295
2026-06-16
cs.CV
cs.CL
新提交
VisualClaw: A Real-Time, Personalized Agent for the Physical World
VisualClaw:面向物理世界的实时个性化智能体
Haoqin Tu, Jianwen Chen, Zijun Wang, Siwei Han, Juncheng Wu, Hardy Chen, Haonian Ji, Kaiwen Xiong, Jiaqi Liu, Peng Xia, Jieru Mei, Hongliang Fei, Jason Eshraghian, Zeyu Zheng, Yuyin Zhou, Huaxiu Yao, Cihang Xie
发表机构
*
UC Santa Cruz(加州大学圣克鲁兹分校)
;
UNC-Chapel Hill(北卡罗来纳大学教堂山分校)
;
Google(谷歌)
;
UC Berkeley(加州大学伯克利分校)
AI总结
提出VisualClaw,一种自进化多模态智能体,通过混合编码和技能进化机制降低部署成本并提升准确性,在多个视频QA基准上实现平均-98%的API成本削减和最高+15.80%的准确率提升。