机器人 / 具身智能 - arXivDaily 专题

2606.19357 2026-06-19 cs.RO cs.AI 新提交专题 95

Physical Atari: A Robust and Accessible Platform for Real-time Reinforcement Learning on Robots

Physical Atari: 一个用于机器人实时强化学习的鲁棒且可访问的平台

Khurram Javed, Joseph Modayil, Gloria Kennickell, Richard S. Sutton, John Carmack

专题命中机器人学习：机器人实时强化学习平台，验证算法在物理世界学习

AI总结提出Physical Atari平台，通过机器人操作Atari控制器和实时渲染游戏帧，实现物理世界中的强化学习研究，验证了算法可直接在机器人上学习，并指出分布偏移会显著降低策略性能。

Comments To appear at RLC 2026

URL PDF HTML

2601.02379 2026-06-19 cs.RO cs.AI 版本更新专题 95

Movement Primitives in Robotics: A Comprehensive Survey

机器人运动基元：综合综述

Nolan B. Gutierrez, Joseph M. Cloud, William J. Beksi

专题命中机器人学习：全面综述机器人运动基元，属于机器人学习

AI总结综述机器人运动基元框架，涵盖从人类示教中编码轨迹的方法，分析弹簧-阻尼系统、概率耦合、神经网络等特性，并讨论应用与挑战。

Comments 105 pages, 3 figures, and 6 tables

URL PDF HTML

2606.19729 2026-06-19 cs.RO cs.AI 新提交专题 90

VOiLA: Vectorized Online Planning with Learned Diffusion Model for POMDP Agents

VOiLA: 基于学习扩散模型的向量化在线规划用于POMDP智能体

Marcus Hoerger, Rishikesh Joshi, Rahul Shome, Ian Manchester, Hanna Kurniawati

专题命中机器人学习：提出POMDP在线规划框架，用于机器人规划。

AI总结提出VOiLA框架，利用条件扩散模型学习POMDP模型，通过蒸馏加速采样并与向量化在线规划器集成，在三个基准任务和实物机器人上实现高效在线规划。

Comments Submitted to the 2026 International Symposium of Robotics Research (ISRR)

URL PDF HTML

2606.19728 2026-06-19 cs.RO cs.AI 新提交专题 90

Bidirectional Tutoring for Developmental Motor Learning in Robots: Co-Developed Interaction Dynamics Support Stable Learning

机器人发展性运动学习的双向辅导：共同发展的交互动力学支持稳定学习

Rui Fukushima, Jun Tani

专题命中机器人学习：提出双向辅导框架用于机器人运动技能学习。

AI总结提出双向辅导框架，通过人类或AI导师与机器人动态适应，利用自由能原理神经网络实现稳定序列学习，在物体操作任务中验证了行为一致性和泛化能力。

Comments 16 pages, 14 figures

URL PDF HTML

2606.19699 2026-06-19 cs.RO cs.LG cs.SY eess.SY 新提交专题 90

Comparative Study on Agility, Efficiency, and Impact Absorption of Bipedal Robots with Active Toes

具有主动脚趾的双足机器人敏捷性、效率和冲击吸收的比较研究

Joong-Gil Kim, Wontae Ye, Geunwoo Cho, Seong-Ho Yun, Se-Hyoung Cho, Yong-Jae Kim

专题命中机器人学习：比较双足机器人有无主动脚趾的性能。

AI总结提出一种14自由度双足机器人，模拟人类脚趾的轻量、高扭矩、坚固特性，通过高保真仿真训练环境，对比有无主动脚趾的配置，发现脚趾机器人以1.33米/秒行走时，CoT降低17.5%，脚跟冲击力降低5.0%，路径偏差平均和最大分别降低25.0%和34.0%。

Comments 6 pages, 7 figures

URL PDF HTML

2606.19419 2026-06-19 cs.RO cs.AI 新提交专题 90

Playful Agentic Robot Learning

趣味性具身机器人学习

Junyi Zhang, Jiaxin Ge, Hanjun Yoo, Letian Fu, Zihan Yang, Yaowei Liu, Raj Saravanan, Shaofeng Yin, Justin Yu, Dantong Niu, Zirui Wang, Roei Herzig, Ken Goldberg, Yutong Bai, David M. Chan, Ion Stoica, Angjoo Kanazawa, Jiahui Lei, Haiwen Feng, Trevor Darrell

专题命中机器人学习：机器人通过自主探索学习可复用技能。

AI总结提出RATs框架，让机器人通过自主探索学习可复用技能，在LIBERO-PRO和MolmoSpaces上分别提升20.6和17.0个百分点。

Comments Project page: https://playful-rats.github.io/

URL PDF HTML

2605.23733 2026-06-19 cs.RO cs.AI 版本更新专题 90

Any2Any: Efficient Cross-Embodiment Transfer for Humanoid Whole-Body Tracking

Any2Any: 高效跨本体迁移用于人形机器人全身跟踪

Ming Yang, Tao Yu, Feng Li, Hua Chen

专题命中机器人学习：人形机器人全身跟踪跨本体迁移

AI总结提出Any2Any范式，通过运动学对齐和动力学微调，实现预训练全身跟踪模型高效迁移至新的人形机器人本体，仅需少量数据和计算即可达到竞争性跟踪性能。

Comments Project Page: https://any2any.top/

URL PDF HTML

2605.08525 2026-06-19 cs.RO cs.SY eess.SY 版本更新专题 90

Model-Reference Adaptive Flight Control of a 95-mg Insect-Scale Flapping-Wing Aerial Robot

95毫克昆虫尺度扑翼飞行机器人的模型参考自适应飞行控制

Francisco M. F. R. Gonçalves, Conor K. Trygstad, Néstor O. Pérez-Arancibia

专题命中机器人学习：昆虫尺度扑翼飞行机器人的自适应飞行控制

AI总结针对昆虫尺度扑翼飞行机器人参数不确定性和扰动问题，提出模型参考自适应控制（MRAC）架构，结合混合乘性扩展卡尔曼滤波，实现高精度位置控制，并通过95毫克机器人实验验证了悬停和轨迹跟踪性能。

Comments Under review, 8 pages, 7 figures

URL PDF HTML

2602.04037 2026-06-19 cs.LG cs.RO 版本更新专题 90

DADP: Domain Adaptive Diffusion Policy

DADP: 领域自适应扩散策略

Pengcheng Wang, Qinghang Liu, Haotian Lin, Yiheng Li, Guojian Zhan, Masayoshi Tomizuka, Yixiao Wang

专题命中机器人学习：提出领域自适应扩散策略用于机器人控制

AI总结提出DADP，通过无监督解耦和领域感知扩散注入，实现跨动态环境的鲁棒零样本适应，在运动与操控任务上超越先前方法。

URL PDF HTML

2505.17006 2026-06-19 cs.CV cs.RO 版本更新专题 90

CoMo: Learning Continuous Latent Motion from Internet Videos for Scalable Robot Learning

CoMo: 从互联网视频中学习连续潜在运动以实现可扩展的机器人学习

Jiange Yang, Yansong Shi, Haoyi Zhu, Mingyu Liu, Kaijing Ma, Yating Wang, Gangshan Wu, Tong He, Limin Wang

专题命中机器人学习：从视频学习运动用于机器人，属于机器人学习

AI总结提出CoMo方法，通过早期时间差分和时序对比学习从互联网视频中学习连续潜在运动，避免离散化信息损失，实现零样本泛化生成伪动作标签，联合训练策略在仿真和真实实验中表现优异。

Comments CVPR 2026

URL PDF HTML

2601.03040 2026-06-19 cs.RO cs.AI cs.LG 版本更新专题 90

PiDR: Physics-Informed Inertial Dead Reckoning for Autonomous Platforms

PiDR：面向自主平台的物理信息惯性航位推算

Arup Kumar Sahoo, Itzik Klein

专题命中机器人学习：提出物理信息惯性航位推算框架，用于自主平台

AI总结提出PiDR框架，将惯性导航原理作为物理信息残差融入网络训练，在纯惯性导航中减少轨迹漂移，在移动机器人和水下自主航行器数据集上定位精度提升超29%。

Comments 11 pages and 7 figures

URL PDF HTML

2511.16223 2026-06-19 cs.RO 专题 90

DynaMimicGen: A Data Generation Framework for Robot Learning of Dynamic Tasks

DynaMimicGen：一种用于机器人动态任务学习的数据生成框架

Vincenzo Pomponi, Paolo Franceschi, Stefano Baraldo, Loris Roveda, Oliver Avram, Luca Maria Gambardella, Anna Valente

专题命中机器人学习：提出DynaMimicGen框架生成动态任务数据用于机器人学习。

AI总结本文提出DynaMimicGen框架，通过少量人类示范生成数据，支持动态任务学习，产生适应性强的轨迹，提升机器人在复杂环境中的表现。

URL PDF HTML

2509.19658 2026-06-19 cs.RO cs.AI 版本更新专题 90

RoboSSM: Scalable In-context Imitation Learning via State-Space Models

RoboSSM: 基于状态空间模型的可扩展上下文模仿学习

Youngju Yoo, Jiaheng Hu, Yifeng Zhu, Bo Liu, Qiang Liu, Roberto Martín-Martín, Peter Stone

专题命中机器人学习：状态空间模型用于机器人上下文模仿学习

AI总结提出RoboSSM，用状态空间模型替代Transformer实现上下文模仿学习，在LIBERO基准上对未见和长时任务泛化更优，首次证明SSM是ICIL高效可扩展的骨干网络。

Comments IROS 2026

URL PDF HTML

2606.20521 2026-06-19 cs.CV 新提交专题 85

HumanScale: Egocentric Human Video Can Outperform Real-Robot Data for Embodied Pretraining

HumanScale: 以自我为中心的人类视频在具身预训练中可超越真实机器人数据

Juncheng Ma, Jianxin Bi, Yufan Deng, Xuanran Zhai, Kewei Zhang, Ye Huang, Bo Liang, Shukai Gong, Jiankai Tu, Xiaotian Tang, Jiaxin Li, Kaiqi Chen, Duomin Wang, Yuqi Wang, Bingyi Kang, Eric Huang, Zhiyang Dou, Zhen Dong, Enze Xie, Wojciech Matusik, Tat-Seng Chua, Daquan Zhou

专题命中机器人学习：人类视频用于具身基础模型预训练

AI总结本文通过系统比较发现，经过精心设计的过滤和标注流程，以自我为中心的人类视频在具身基础模型预训练中不仅可行，而且性能优于遥操作真实机器人数据，验证了“预训练于人类视频+少量机器人数据适配”的可扩展范式。

Comments Github: https://github.com/DAGroup-PKU/HumanNet/

URL PDF HTML

2606.20495 2026-06-19 cs.RO 新提交专题 85

Increasing Resilience of Continuum Robots via Motion Planning Algorithms

通过运动规划算法提高连续体机器人的韧性

Oxana Shamilyan, Ievgen Kabin, Zoya Dyka, Oleksandr Sudakov, Peter Langendoerfer

专题命中机器人学习：研究连续体机器人的运动规划算法

AI总结本文实验研究运动规划算法对连续体机器人韧性的影响，通过改进遗传算法和A*算法，结合层次分析法评估路径质量，发现遗传算法生成更多样化路径，提升机器人韧性。

URL PDF HTML

2606.20389 2026-06-19 cs.RO 新提交专题 85

CoLI: A Reproducible Platform for Continuum Robot Learning via Monolithic 3D Printing and Isomorphic Teleoperation

CoLI: 通过整体3D打印和同构遥操作实现连续体机器人学习的可复现平台

Ziyuan Tang, Chenxi Xiao*

专题命中机器人学习：连续体机器人学习平台，支持模仿学习和遥操作。

AI总结提出一种基于多材料3D打印和同构遥操作的连续体机器人平台，简化制造流程并实现无奇异映射控制，支持模仿学习自主控制，通过硬件表征和操作任务验证其可复现性和学习就绪性。

Comments 8 pages, 7 figures, 1 table, accepted by IROS2026

URL PDF HTML

2606.20365 2026-06-19 cs.RO cs.MA 新提交专题 85

An Infrastructure-less, Control-Independent Solution to Relative Localisation of a Team of Mobile Robots using Ranging Measurements

基于测距的移动机器人团队相对定位的无基础设施、控制无关解决方案

Paolo Golinelli, Tommaso Faraci, Daniele Fontanelli

专题命中机器人学习：移动机器人团队协作定位算法

AI总结提出一种无锚点、完全去中心化的协作定位算法，仅依赖局部里程计、稀疏测距和短程通信，无需控制机器人运动即可实现团队可观测性，采用多假设贝叶斯框架保证鲁棒性。

URL PDF HTML

2606.20209 2026-06-19 cs.RO cs.AI 新提交专题 85

FlowMaps: Modeling Long-Term Multimodal Object Dynamics with Flow Matching

FlowMaps: 使用流匹配建模长期多模态物体动态

Francesco Argenziano, Miguel Saavedra-Ruiz, Sacha Morin, Charlie Gauthier, Daniele Nardi, Liam Paull

专题命中机器人学习：FlowMaps建模物体动态，提升机器人导航性能。

AI总结提出FlowMaps模型，通过潜在流匹配学习物体位置的多模态时空分布，预测动态物体未来位置，提升机器人在变化家庭环境中的导航性能。

URL PDF HTML

2606.20150 2026-06-19 cs.RO 新提交专题 85

Robust Assembly State Reasoning from Action Recognition for Human-Robot Collaboration

面向人机协作的基于动作识别的鲁棒装配状态推理

James Fant-Male, Roel Pieters

专题命中机器人学习：人机协作中的装配状态推理。

AI总结研究从动作识别输入跟踪装配状态的方法，比较逻辑、HMM和神经网络方法，发现最优方法因任务而异，逻辑方法在多变场景更鲁棒。

Comments Preprint accepted to the 35th IEEE International Conference on Robot and Human Interactive Communication (RO-MAN 2026). 8 pages, 9 figures, 3 tables

URL PDF HTML

2606.20104 2026-06-19 cs.LG cs.AI 新提交专题 85

Sensorimotor World Models: Perception for Action via Inverse Dynamics

传感器运动世界模型：通过逆动力学实现面向行动感知

Petr Ivashkov, Randall Balestriero, Bernhard Schölkopf

专题命中机器人学习：世界模型用于机器人控制

AI总结提出传感器运动世界模型（SMWM），通过逆动力学正则化端到端训练潜空间世界模型，防止表示崩溃并学习与行动对齐的紧凑表示，在2D和3D控制任务中实现竞争性规划性能。

URL PDF HTML

2606.20056 2026-06-19 cs.RO 新提交专题 85

VFILC: Accurate Frequency Extrapolations in Imitation Learning via Sampling Frequency ILC

VFILC: 通过采样频率迭代学习控制实现模仿学习中的精确频率外推

Nozomu Masuya, Toshiaki Tsuji, Sho Sakaino

专题命中机器人学习：提出模仿学习方法用于机器人速度外推。

AI总结提出VFILC方法，结合可变频率模仿学习与前馈-反馈迭代学习控制，在三种任务中实现精确的速度外推，频率误差降低最高81%。

Comments 8 pages, 17 figures. Accepted at IROS 2026

URL PDF HTML

2606.20048 2026-06-19 cs.RO 新提交专题 85

MirrorDuo: Reflection-Consistent Visuomotor Learning from Mirrored Demonstration Pairs

MirrorDuo：基于镜像演示对的反射一致视觉运动学习

Zheyu Zhuang, Ruiyu Wang, Giovanni Luca Marchetti, Florian T. Pokorny, Danica Kragic

专题命中机器人学习：提出镜像演示增强行为克隆，用于机器人学习。

AI总结提出MirrorDuo方法，通过反射一致性为每个原始演示生成镜像副本，实现数据增强，在相同数据预算下显著提升行为克隆性能，并支持零/少样本技能迁移。

Comments Published in CoRL 2025

Journal ref CoRL 2025

URL PDF HTML

2606.19990 2026-06-19 cs.AI 新提交专题 85

Reward as An Agent for Embodied World Models

奖励作为具身世界模型的智能体

Pu Li, Zhigang Lin, Qiang Wu, Yongxuan Lv, Fei Wang, Shan You

专题命中机器人学习：提出奖励智能体框架用于具身世界模型

AI总结提出奖励智能体框架和动态感知 rollout 多样化方法，通过鲁棒验证支持更广泛探索，缓解奖励黑客问题，提升世界模型性能。

URL PDF HTML

2606.19928 2026-06-19 cs.RO 新提交专题 85

SWAP: Symmetric Equivariant World-Model for Agile Robot Parkour

SWAP: 用于敏捷机器人跑酷的对称等变世界模型

Kaixin Lan, Ze Wang, Hongyi Li, Lei Jiang, Chaojie Fu, Chengkai Su, Choi Lam Wong, Yongbin Jin, Hongtao Wang

专题命中机器人学习：提出对称等变世界模型用于四足机器人跑酷

AI总结提出SWAP框架，将对称等变性嵌入世界模型和演员-评论家网络，实现四足机器人跑酷记录突破（跨越2.13米间隙、攀爬1.63米平台），并展现出对未见镜像地形的几何泛化与零样本迁移能力。

URL PDF HTML

2606.19774 2026-06-19 cs.RO 新提交专题 85

Start Right, Arrive Right: Asynchronous Execution via Initial Noise Selection

开始正确，到达正确：通过初始噪声选择实现异步执行

Trong-Bao Ho, Quang-Tan Nguyen, Thien-Loc Ha, Gia-Binh Nguyen, Viet-Thanh Nguyen, Long Dinh, Minh N. Vu, Duy M. H. Nguyen, An Thai Le, Ngo Anh Vien

专题命中机器人学习：通过初始噪声选择解决机器人异步执行中的动作块不一致。

AI总结针对流式策略异步执行中的动作块边界不一致问题，提出无需训练的PAINT方法，通过初始噪声选择而非轨迹引导实现前缀一致性，在12个模拟和6个真实操作任务中提升执行一致性与任务性能。

Comments First version 19 pages, project site: https://paint-action-chunking.github.io

URL PDF HTML

2606.19752 2026-06-19 cs.RO cs.AI 新提交专题 85

Temporal Self-Imitation Learning

时间自我模仿学习

Yinsen Jia, Boyuan Chen

专题命中机器人学习：时间自我模仿学习提升长时域机器人操作效率。

AI总结提出时间自我模仿学习框架，通过挖掘高效成功轨迹并转化为可重用监督信号，提升长时域机器人操作任务的学习效率与鲁棒性。

URL PDF HTML

2606.19633 2026-06-19 cs.RO cs.AI 新提交专题 85

CTS-MoE: Implicit Terrain Adaptation via Mixture-of-Experts for Perceptive Locomotion

CTS-MoE: 基于混合专家模型的隐式地形适应感知运动

Francisco Affonso, Matheus P. Angarola, Ana Luiza Mineiro, Aditya Potnis, Marcelo Becker, Girish Chowdhary

专题命中机器人学习：提出CTS-MoE用于感知运动，隐式地形适应。

AI总结针对非连续地形上的感知运动问题，提出CTS-MoE方法，通过密集混合专家策略与感知门控组合共享行为，并用多批评家防止价值干扰，实现端到端训练和隐式地形适应，在仿真和硬件上优于基线。

URL PDF HTML

2606.19598 2026-06-19 cs.RO 新提交专题 85

Fail-RAG : A Retrieval Augmented Generation Informed Framework for Robot Failure Identification

Fail-RAG：一种基于检索增强生成的机器人故障识别框架

Ameya Salvi, Jie Hu

专题命中机器人学习：针对仓库机器人操作故障检测，属于机器人学习

AI总结提出Fail-RAG框架，利用检索增强生成和视觉语言模型，通过嵌入故障图像和上下文信息并查询数据库，实现机器人操作故障的高效检测，在仓库自动化任务中平均检测准确率提升25个百分点。

URL PDF HTML

2606.19531 2026-06-19 cs.CV cs.RO 新提交专题 85

ImageWAM: Do World Action Models Really Need Video Generation, or Just Image Editing?

ImageWAM：世界动作模型真的需要视频生成，还是只需要图像编辑？

Yuyang Zhang, Wenyao Zhang, Zekun Qi, He Zhang, Haitao Lin, Jingbo Zhang, Yao Mu, Xiaokang Yang, Wenjun Zeng, Xin Jin

专题命中机器人学习：用图像编辑模型进行机器人动作预测

AI总结提出ImageWAM框架，利用预训练图像编辑模型替代视频生成进行机器人动作预测，通过编辑去噪的KV缓存作为世界动作上下文，在多个模拟和真实实验中优于基线，计算量降至1/6，延迟降至1/4。

Comments Project Page: https://zhangwenyao1.github.io/ImageWAM/

URL PDF HTML

2605.28654 2026-06-19 cs.RO cs.SY eess.SY math.OC 版本更新专题 85

Integrated Exploration-Aware UAV Route Optimization and Path Planning

集成探索感知的无人机路径优化与轨迹规划

Jimin Choi, Grant Stagg, Cameron K. Peterson, Max Z. Li

专题命中机器人学习：提出探索感知的无人机路径优化与规划。

AI总结提出一种集成探索感知的无人机路径优化与轨迹规划框架，通过风险地图、不确定兴趣区域建模、B样条轨迹优化和在线重规划，在灾害监测中平衡报告点访问与新信息探索，实现平均KL散度降低15.9%。

URL PDF HTML