视觉与机器人
机器人 / 具身智能
机器人、具身智能、机器人学习、操作、导航和具身世界模型。
1. 机器人操作 13 篇
WorkBenchMark: A LEGO-Based Assembly Benchmark with an Assembly-by-Disassembly Baseline for the Smart Manufacturing League
WorkBenchMark:面向智能制造联盟的基于乐高积木的装配基准与通过拆卸进行装配的基线方法
专题命中 机器人操作 :基于乐高的机器人装配基准。
AI总结 提出一个基于乐高Duplo的机器人装配基准,包含400个任务和四个复杂度层级,并提供一个基于规划的基线方法,在所有层级上优于现代视觉-语言-动作方法。
Comments RoboCup Symposium 2026 accepted paper
TaCauchy: An Extensible FEM Framework for Vision-Based Tactile Simulation
TaCauchy:面向视觉触觉仿真的可扩展有限元框架
专题命中 机器人操作 :触觉仿真框架用于机器人操作中的力计算
AI总结 提出TaCauchy框架,基于UIPC求解器在Isaac Sim中集成有限元法,直接计算柯西应力张量并投影为接触力,实现高保真触觉仿真,支持多种传感器,物理验证SSIM>0.93。
Comments Accepted to IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), 2026
2. 机器人学习 12 篇
Physical Atari: A Robust and Accessible Platform for Real-time Reinforcement Learning on Robots
Physical Atari: 一个用于机器人实时强化学习的鲁棒且可访问的平台
专题命中 机器人学习 :机器人实时强化学习平台,验证算法在物理世界学习
AI总结 提出Physical Atari平台,通过机器人操作Atari控制器和实时渲染游戏帧,实现物理世界中的强化学习研究,验证了算法可直接在机器人上学习,并指出分布偏移会显著降低策略性能。
Comments To appear at RLC 2026
VOiLA: Vectorized Online Planning with Learned Diffusion Model for POMDP Agents
VOiLA: 基于学习扩散模型的向量化在线规划用于POMDP智能体
专题命中 机器人学习 :提出POMDP在线规划框架,用于机器人规划。
AI总结 提出VOiLA框架,利用条件扩散模型学习POMDP模型,通过蒸馏加速采样并与向量化在线规划器集成,在三个基准任务和实物机器人上实现高效在线规划。
Comments Submitted to the 2026 International Symposium of Robotics Research (ISRR)
Bidirectional Tutoring for Developmental Motor Learning in Robots: Co-Developed Interaction Dynamics Support Stable Learning
机器人发展性运动学习的双向辅导:共同发展的交互动力学支持稳定学习
专题命中 机器人学习 :提出双向辅导框架用于机器人运动技能学习。
AI总结 提出双向辅导框架,通过人类或AI导师与机器人动态适应,利用自由能原理神经网络实现稳定序列学习,在物体操作任务中验证了行为一致性和泛化能力。
Comments 16 pages, 14 figures
Comparative Study on Agility, Efficiency, and Impact Absorption of Bipedal Robots with Active Toes
具有主动脚趾的双足机器人敏捷性、效率和冲击吸收的比较研究
专题命中 机器人学习 :比较双足机器人有无主动脚趾的性能。
AI总结 提出一种14自由度双足机器人,模拟人类脚趾的轻量、高扭矩、坚固特性,通过高保真仿真训练环境,对比有无主动脚趾的配置,发现脚趾机器人以1.33米/秒行走时,CoT降低17.5%,脚跟冲击力降低5.0%,路径偏差平均和最大分别降低25.0%和34.0%。
Comments 6 pages, 7 figures
Playful Agentic Robot Learning
趣味性具身机器人学习
专题命中 机器人学习 :机器人通过自主探索学习可复用技能。
AI总结 提出RATs框架,让机器人通过自主探索学习可复用技能,在LIBERO-PRO和MolmoSpaces上分别提升20.6和17.0个百分点。
Comments Project page: https://playful-rats.github.io/
HumanScale: Egocentric Human Video Can Outperform Real-Robot Data for Embodied Pretraining
HumanScale: 以自我为中心的人类视频在具身预训练中可超越真实机器人数据
专题命中 机器人学习 :人类视频用于具身基础模型预训练
AI总结 本文通过系统比较发现,经过精心设计的过滤和标注流程,以自我为中心的人类视频在具身基础模型预训练中不仅可行,而且性能优于遥操作真实机器人数据,验证了“预训练于人类视频+少量机器人数据适配”的可扩展范式。
Comments Github: https://github.com/DAGroup-PKU/HumanNet/
CoLI: A Reproducible Platform for Continuum Robot Learning via Monolithic 3D Printing and Isomorphic Teleoperation
CoLI: 通过整体3D打印和同构遥操作实现连续体机器人学习的可复现平台
专题命中 机器人学习 :连续体机器人学习平台,支持模仿学习和遥操作。
AI总结 提出一种基于多材料3D打印和同构遥操作的连续体机器人平台,简化制造流程并实现无奇异映射控制,支持模仿学习自主控制,通过硬件表征和操作任务验证其可复现性和学习就绪性。
Comments 8 pages, 7 figures, 1 table, accepted by IROS2026
Robust Assembly State Reasoning from Action Recognition for Human-Robot Collaboration
面向人机协作的基于动作识别的鲁棒装配状态推理
专题命中 机器人学习 :人机协作中的装配状态推理。
AI总结 研究从动作识别输入跟踪装配状态的方法,比较逻辑、HMM和神经网络方法,发现最优方法因任务而异,逻辑方法在多变场景更鲁棒。
Comments Preprint accepted to the 35th IEEE International Conference on Robot and Human Interactive Communication (RO-MAN 2026). 8 pages, 9 figures, 3 tables