2605.28634
2026-05-28
cs.RO
PrimitiveVLA: Learning Reusable Motion Primitives for Efficient and Generalizable Robotic Manipulation
PrimitiveVLA:学习可复用的运动基元以实现高效且可泛化的机器人操作
Yutai Li, Shaohui Peng, Jiaming Guo, Di Huang, Zihao Zhang, Yuxuan Guo, Yunkai Gao, Siming Lan, Ling Li, Xing Hu, Yunji Chen
发表机构
*
State Key Lab of Processors, Institute of Computing Technology, CAS(处理器国家重点实验室,计算技术研究所,中国科学院)
;
Jiangsu Key Laboratory of AI for Industries, Institute of AI for Industries, CAS(江苏人工智能工业重点实验室,人工智能工业研究所,中国科学院)
;
University of Chinese Academy of Sciences(中国科学院大学)
;
Cambricon Technologies(寒武科技)
;
Intelligent Software Research Center, Institute of Software, CAS(软件研究所智能软件研究中心,中国科学院)
;
University of Science and Technology of China(中国科学技术大学)
AI总结
提出PrimitiveVLA框架,通过将视觉-语言-动作模型从直接指令到控制映射转向以基元为中心的拆解与组装范式,利用多模态规范表示和自动化流水线,提升数据效率并实现零样本泛化。