EquiVLA: A General Framework for Rotationally Equivariant Vision-Language-Action Models
EquiVLA: 旋转等变视觉-语言-动作模型的通用框架
专题命中 VLA模型 :提出旋转等变VLA框架,用于机器人操作。
AI总结 提出EquiVLA,首个端到端SO(2)等变VLA框架,通过EquiPerceptor和EquiActor实现从视觉到动作的近似等变链,在LIBERO、CALVIN和真实机器人任务上显著提升性能。
Comments Comment: First version 22 pages, project site: https://equivla.github.io/