Playful Agentic Robot Learning
趣味性具身机器人学习
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; Impossible Research
AI总结 提出RATs框架,让机器人通过自主探索学习可复用技能,在LIBERO-PRO和MolmoSpaces上分别提升20.6和17.0个百分点。
Comments Project page: https://playful-rats.github.io/
趣味性具身机器人学习
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; Impossible Research
AI总结 提出RATs框架,让机器人通过自主探索学习可复用技能,在LIBERO-PRO和MolmoSpaces上分别提升20.6和17.0个百分点。
Comments Project page: https://playful-rats.github.io/
DF-ExpEnse: 扩散滤波探索用于高效样本微调
发表机构 * Stanford University(斯坦福大学) ; Brown University(布朗大学)
AI总结 提出DF-ExpEnse探索技术,利用生成控制策略的多模态建模能力和评论家集成,在微调中高效收集在线经验,提升样本效率。
Comments ICML 2026
机器人发展性运动学习的双向辅导:共同发展的交互动力学支持稳定学习
发表机构 * Okinawa Institute of Science and Technology Graduate University(冲绳科学技术大学院大学)
AI总结 提出双向辅导框架,通过人类或AI导师与机器人动态适应,利用自由能原理神经网络实现稳定序列学习,在物体操作任务中验证了行为一致性和泛化能力。
Comments 16 pages, 14 figures
时间自我模仿学习
发表机构 * Duke University(杜克大学)
AI总结 提出时间自我模仿学习框架,通过挖掘高效成功轨迹并转化为可重用监督信号,提升长时域机器人操作任务的学习效率与鲁棒性。
开始正确,到达正确:通过初始噪声选择实现异步执行
发表机构 * VinRobotics ; VinUniversity ; DFKI(德国人工智能研究中心) ; University of Stuttgart(斯图加特大学) ; IMPRS-IS(国际马克斯·普朗克智能系统研究学院)
AI总结 针对流式策略异步执行中的动作块边界不一致问题,提出无需训练的PAINT方法,通过初始噪声选择而非轨迹引导实现前缀一致性,在12个模拟和6个真实操作任务中提升执行一致性与任务性能。
Comments First version 19 pages, project site: https://paint-action-chunking.github.io
MirrorDuo:基于镜像演示对的反射一致视觉运动学习
AI总结 提出MirrorDuo方法,通过反射一致性为每个原始演示生成镜像副本,实现数据增强,在相同数据预算下显著提升行为克隆性能,并支持零/少样本技能迁移。
Comments Published in CoRL 2025
Journal ref CoRL 2025
VFILC: 通过采样频率迭代学习控制实现模仿学习中的精确频率外推
发表机构 * Grad. School of Science ; Technology University of Tsukuba Tsukuba, Japan ; Engineering Saitama University Saitama, Japan ; Information Engineering University of Tsukuba Tsukuba, Japan
AI总结 提出VFILC方法,结合可变频率模仿学习与前馈-反馈迭代学习控制,在三种任务中实现精确的速度外推,频率误差降低最高81%。
Comments 8 pages, 17 figures. Accepted at IROS 2026
频率感知流匹配用于连续且一致的机器人动作生成
发表机构 * Beihang University(北京航空航天大学) ; Peking University(北京大学) ; The Chinese University of Hong Kong(香港中文大学) ; PKU-Psibot Lab(北大-智源机器人实验室) ; Zhongguancun Laboratory(中关村实验室) ; Hefei Comprehensive National Science Center(合肥综合性国家科学中心)
AI总结 提出频率感知流匹配(FAFM),通过离散余弦变换将离散动作序列转换到频域进行流匹配,并正则化一阶时间导数以生成平滑连续的动作,提升成功率、多模态表达性和运动平滑性。
MemoryWAM:具有持久记忆的高效世界动作建模
发表机构 * The Chinese University of Hong Kong(香港中文大学) ; Tsinghua University(清华大学) ; Zhejiang University(浙江大学)
AI总结 提出MemoryWAM,通过混合记忆设计和定制注意力机制,在长时域机器人操作任务中实现高效记忆依赖决策,优于现有VLA和WAM基线。
非惯性地面上仿人机器人的本体感觉不变状态估计
发表机构 * Purdue University(普渡大学)
AI总结 提出一种仅使用本体感觉的InEKF方法,利用足部IMU和运动学约束,实现非惯性地面上仿人机器人的实时状态估计,收敛速度提升96%,位置误差降低80%。
CTS-MoE: 基于混合专家模型的隐式地形适应感知运动
发表机构 * University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校) ; University of São Paulo(圣保罗大学)
AI总结 针对非连续地形上的感知运动问题,提出CTS-MoE方法,通过密集混合专家策略与感知门控组合共享行为,并用多批评家防止价值干扰,实现端到端训练和隐式地形适应,在仿真和硬件上优于基线。
具有主动脚趾的双足机器人敏捷性、效率和冲击吸收的比较研究
发表机构 * School of Electrical, Electronics and Communication Engineering, Korea University of Technology and Education(韩国技术教育大学电气、电子与通信工程学院) ; Artificial Intelligence and Robotics Institute, Korea Institute of Science and Technology(韩国科学技术研究院人工智能与机器人研究所) ; Robot Innovation Hub, WIRobotics Inc.(WIRobotics公司机器人创新中心)
AI总结 提出一种14自由度双足机器人,模拟人类脚趾的轻量、高扭矩、坚固特性,通过高保真仿真训练环境,对比有无主动脚趾的配置,发现脚趾机器人以1.33米/秒行走时,CoT降低17.5%,脚跟冲击力降低5.0%,路径偏差平均和最大分别降低25.0%和34.0%。
Comments 6 pages, 7 figures
VOiLA: 基于学习扩散模型的向量化在线规划用于POMDP智能体
发表机构 * Australian National University(澳大利亚国立大学) ; The University of Sydney(悉尼大学)
AI总结 提出VOiLA框架,利用条件扩散模型学习POMDP模型,通过蒸馏加速采样并与向量化在线规划器集成,在三个基准任务和实物机器人上实现高效在线规划。
Comments Submitted to the 2026 International Symposium of Robotics Research (ISRR)
拥挤环境中的拥塞感知机器人巡视规划
发表机构 * Istituto Italiano di Tecnologia(意大利理工学院) ; Università di Genova(热那亚大学) ; University of Birmingham(伯明翰大学)
AI总结 提出一种基于概率的巡视规划器,通过学习人流预测模型并在线构建马尔可夫决策过程,在拥挤环境中高效规划机器人路径,减少拥塞影响。
Comments Accepted to IEEE IROS 2026
Journal ref IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), 2026
SWAP: 用于敏捷机器人跑酷的对称等变世界模型
发表机构 * Center for X-Mechanics, Zhejiang University(浙江大学交叉力学中心) ; ZJU-Hangzhou Global Scientific and Technology Innovation Center(浙江大学杭州国际科创中心) ; Mirrorme Technology Co., Ltd.(魔镜科技有限公司)
AI总结 提出SWAP框架,将对称等变性嵌入世界模型和演员-评论家网络,实现四足机器人跑酷记录突破(跨越2.13米间隙、攀爬1.63米平台),并展现出对未见镜像地形的几何泛化与零样本迁移能力。
稳定的Transformer-Actor-Critic模型预测控制:一种收缩分析方法
AI总结 提出一种Transformer-Actor-Critic MPC架构,通过证明Transformer满足增量输入-状态稳定性并利用黎曼收缩理论分析互联动力学,将理论界作为训练正则化项,实现可证明鲁棒的控制策略。
通过运动规划算法提高连续体机器人的韧性
AI总结 本文实验研究运动规划算法对连续体机器人韧性的影响,通过改进遗传算法和A*算法,结合层次分析法评估路径质量,发现遗传算法生成更多样化路径,提升机器人韧性。
DiffusionVS:基于扩散策略的鲁棒视觉伺服生成框架
AI总结 提出基于扩散策略的视觉伺服方法,通过条件去噪生成相机速度,并采用在线训练增强泛化能力,仿真成功率近100%,物理实验93%。
Comments 8 pages, 4 figures, 7 tables
一个演示胜过千条轨迹:用于视觉运动策略的动作-视角增强
发表机构 * Stanford University(斯坦福大学) ; Columbia University(哥伦比亚大学) ; Toyota Research Institute(丰田研究所)
AI总结 提出一种数据增强框架,通过高斯泼溅和轨迹优化生成逼真的鱼眼图像序列和物理可行的动作轨迹,提升操作策略在场景变化和障碍物下的成功率。
Comments Project website: https://chuerpan.com/1001-demos.github.io/. Published at CoRL 2025
Journal ref Proceedings of The 9th Conference on Robot Learning, PMLR 305:3902-3914, 2025
一对二执行:一种面向单臂智能体动作扩展至双臂的新框架
发表机构 * Chongqing University(重庆大学) ; Xi’an Jiaotong-Liverpool University(西交利物浦大学) ; Lumos Robotics
AI总结 提出ExS2D层次化动作扩展框架,利用单臂监督实现双臂操作,通过时间优先关系提取、子任务引导动作映射和碰撞避免协调规划,在仿真中减少54.4%执行步骤并保持成功率。
Comments 6 pages, 5 figures, 3 tables
Belt-Finger: 一种经济实惠的软带驱动夹爪,用于灵巧的手内操作
发表机构 * University of Tübingen(图宾根大学) ; Max Planck Institute for Intelligent Systems(马克斯·普朗克智能系统研究所)
AI总结 提出一种双软带手指模块,为平行夹爪增加三个手内自由度(平移、俯仰、滚动),在保持低成本、易集成的同时提升灵巧操作能力,并通过MPC和遥操作验证其有效性。
Co-VLA:面向双臂视觉-语言-动作系统的协调感知结构化动作建模
发表机构 * Donghua University(东华大学) ; Samsung R&D Institute China-Beijing (SRCB)(三星中国北京研究院) ; Samsung AI Center, DS Division(三星DS部门AI中心)
AI总结 针对双臂紧耦合任务中隐式协调不足的问题,提出Co-VLA框架,通过结构化动作专家和潜在感知控制器显式引入协调先验,在仿真和真实场景中显著提升成功率和效率。
从人类演示生成机器人手
发表机构 * University of California San Diego(加州大学圣迭戈分校) ; Amazon Frontier AI & Robotics(亚马逊前沿人工智能与机器人)
AI总结 提出数据驱动框架,利用人类日常操作中超过400万帧指尖运动数据,通过逆运动学匹配指尖位置,优化树状结构机器人手的设计,生成通用6自由度手和低自由度任务专用手,并训练强化学习智能体加速设计搜索。
人类通用抓取
发表机构 * New York University(纽约大学) ; Tsinghua University(清华大学) ; University of Michigan(密歇根大学)
AI总结 提出HUG模型,利用人类抓取数据(1M-HUG数据集)和流匹配方法,从单张RGB-D图像生成多样化抓取姿态,并重定向到机器人手,实现零样本抓取,在HUG-Bench上超越基线23%-34%。
Comments 28 pages, 20 figures, 7 tables
3D场景图:开放挑战与未来方向
AI总结 本文统一综述3D场景图(3DSG)的构建、应用与评估,分析现有建模选择与开放挑战,旨在推动鲁棒部署。
Comments Invited article for the Annual Review of Control, Robotics, and Autonomous Systems Volume 10
SCAN-Planner:用于路线引导的远程四足导航的空间碰撞感知局部规划
发表机构 * Shanghai Jiao Tong University(上海交通大学)
AI总结 提出SCAN-Planner框架,通过偏航感知双圆柱足迹和投影A*搜索实现空间碰撞感知的局部规划,在密集杂乱、3D非结构化环境和远程导航中生成安全平滑轨迹。
MEMS/GNSS组合导航中无人地面车辆在GNSS退化环境下的路径约束鲁棒融合估计
发表机构 * State Key Laboratory of Precision Space-time Information Sensing Technology, Tsinghua University(清华大学精密时空信息感知技术国家重点实验室) ; Xiaomi Inc.(小米公司)
AI总结 针对GNSS信号严重遮挡下结构化道路环境中无人地面车辆的累积定位漂移,提出一种鲁棒的路径约束状态估计方法,利用历史航位推算轨迹与高精地图匹配生成伪位置观测,通过扩展卡尔曼滤波持续注入道路级约束,抑制位置偏差并改善方位估计。
Comments Accepted workshop paper, 1st Workshop on Robot Meets GNSS and Ranging for Seamless Autonomy, IEEE ICRA 2026
Journal ref 1st Workshop on Robot Meets GNSS and Ranging for Seamless Autonomy, IEEE ICRA 2026, Vienna, Austria, June 5, 2026
MMD-SLAM:结构增强的多元高斯分布引导视觉SLAM
发表机构 * HFIPS, Chinese Academy of Sciences(中国科学院合肥物质科学研究院) ; University of Science and Technology of China(中国科学技术大学) ; Aarhus University(奥胡斯大学) ; University of Tokyo(东京大学) ; Beijing University of Chemical Technology(北京化工大学) ; North China Electric Power University(华北电力大学)
AI总结 提出MMD-SLAM,利用亚特兰大世界假设引导多元高斯表示,通过点线融合、主导方向编码和高斯进化策略,提升视觉SLAM的跟踪精度与建图质量。
Comments ICRA 2026
FlowMaps: 使用流匹配建模长期多模态物体动态
发表机构 * Sapienza University of Rome(罗马大学) ; Université de Montréal(蒙特利尔大学) ; Mila - Quebec AI Institute(米拉-魁北克人工智能研究所)
AI总结 提出FlowMaps模型,通过潜在流匹配学习物体位置的多模态时空分布,预测动态物体未来位置,提升机器人在变化家庭环境中的导航性能。
基于旋转声纳数据的3D喀斯特水下场景重建
发表机构 * U2IS, ENSTA, Institut Polytechnique de Paris(巴黎综合理工学院ENSTA学院U2IS实验室) ; Lab-STICC, ENSTA, Institut Polytechnique de Paris(巴黎综合理工学院ENSTA学院Lab-STICC实验室) ; Informatics XVII – Robotics, Julius-Maximilians-Universität Würzburg(尤利乌斯-马克西米利安-维尔茨堡大学信息学XVII – 机器人学)
AI总结 针对声纳数据稀疏噪声大、导航漂移导致3D重建困难的问题,提出结合连续时间SLAM校正轨迹与两阶段深度学习表面重建的流水线,生成可沉浸导航的3D网格。
Comments 1st Workshop on Long-term Deployments in the Wild (LoWi)
LIT-GS: 面向光照鲁棒建图的激光雷达-惯性-热高斯泼溅
发表机构 * College of Mechatronics and Control Engineering, Shenzhen University(深圳大学机电与控制工程学院) ; Department of Mechanical Engineering, The University of Hong Kong(香港大学机械工程系)
AI总结 提出LIT-GS框架,利用激光雷达平面几何约束联合优化位姿与高斯,解决光照变化和纹理缺失场景下RGB依赖的脆弱性问题,提升几何精度与渲染质量。
Comments Accepted to IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2026)
慢速大脑,快速规划器:延迟鲁棒的VLM增强城市导航
发表机构 * Amazon FAR(亚马逊 FAR) ; UCLA(加州大学洛杉矶分校) ; Independent(独立) ; Zhejiang University(浙江大学)
AI总结 针对移动机器人在人行道导航中轨迹评分差距问题,提出一种无需训练的延迟鲁棒轨迹级融合层,利用VLM选择候选轨迹并与规划器输出融合,在挑战场景下降低ADE 30%。
GroundControl: 通过轨迹一致的不确定性估计预测视觉语言智能体中的导航失败
发表机构 * University of Illinois at Chicago (UIC)(伊利诺伊大学芝加哥分校)
AI总结 提出轨迹一致的不确定性估计方法GroundControl,通过卡尔曼滤波建模距离变化并结合轨迹特征,有效预测导航失败,在选择性风险-覆盖评估中优于基线。
用于自主导航中注视引导主动感知的快速人类注意力预测
发表机构 * Norwegian University of Science and Technology (NTNU)(挪威科技大学)
AI总结 提出GazeLNN,一种基于液态神经网络和MobileNetV3的轻量级扫描路径预测模型,在MIT低分辨率数据集上达到最优性能,计算成本降低99.40%,推理速度提升6倍,并集成到强化学习训练的主动相机-机器人控制策略中,实现自主导航中的注视引导感知。
Comments Accepted to the IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2026)
Co-policy: 响应式人机音乐共创框架
发表机构 * School of Computer Science, Wuhan University(武汉大学计算机学院) ; College of Computing and Data Science, Nanyang Technological University(南洋理工大学计算与数据科学学院) ; School of Automation, Wuhan University of Technology(武汉理工大学自动化学院) ; School of Geodesy and Geomatics, Wuhan University(武汉大学测绘学院) ; School of Robotics, Wuhan University(武汉大学机器人学院)
AI总结 提出Co-policy框架,通过语义锚定、约束变分和视觉运动策略实现人机音乐实时共创,在真实钟琴实验中优于扩散策略基线。
基于增强现实的机器人辅助经食管超声心动图直观界面评估:用户研究
AI总结 本研究提出并评估了一种基于增强现实的直观界面,用于机器人辅助经食管超声心动图,通过3D可视化与尖端控制显著提升空间精度并降低操作误差。
用于将自然语言协议翻译为机器人实验室平台的双智能体跨模型验证框架
AI总结 提出双智能体框架,通过解析器形式化协议、规则映射引擎生成控制命令、异构LLM验证器纠错,实现自然语言微孔板协议到机器人平台可执行命令的转换,并验证了端到端自主执行。
面向人机协作的基于动作识别的鲁棒装配状态推理
发表机构 * Cognitive Robotics group, Unit of Automation Technology and Mechanical Engineering, Tampere University(坦佩雷大学自动化技术与机械工程系认知机器人组)
AI总结 研究从动作识别输入跟踪装配状态的方法,比较逻辑、HMM和神经网络方法,发现最优方法因任务而异,逻辑方法在多变场景更鲁棒。
Comments Preprint accepted to the 35th IEEE International Conference on Robot and Human Interactive Communication (RO-MAN 2026). 8 pages, 9 figures, 3 tables
EquiVLA: 旋转等变视觉-语言-动作模型的通用框架
发表机构 * VinRobotics ; VinUniversity ; DFKI(德国人工智能研究中心) ; University of Stuttgart(斯图加特大学) ; IMPRS-IS(国际马克斯·普朗克智能系统研究学院)
AI总结 提出EquiVLA,首个端到端SO(2)等变VLA框架,通过EquiPerceptor和EquiActor实现从视觉到动作的近似等变链,在LIBERO、CALVIN和真实机器人任务上显著提升性能。
Comments Comment: First version 22 pages, project site: https://equivla.github.io/
微调视觉-语言-动作模型所需的层数比你想象的少
发表机构 * Center for AI Research, VinUniversity(VinUniversity人工智能研究中心) ; VinRobotics ; University of Arkansas(阿肯色大学) ; Technical University of Denmark(丹麦技术大学) ; Hanoi University of Science and Technology(河内科技大学) ; KAIST(韩国科学技术院) ; Monash University(莫纳什大学) ; Oldenburg University(奥尔登堡大学) ; DFKI(德国人工智能研究中心) ; University of Stuttgart(斯图加特大学) ; IMPRS-IS(国际马克斯·普朗克智能系统研究学院) ; Stanford University(斯坦福大学) ; Technische Universität Darmstadt(达姆施塔特工业大学)
AI总结 本文发现VLA模型存在层间表示冗余,提出无需训练的压缩方法,通过去除冗余层将模型深度减少50%,实现40-50%训练加速和30%推理加速,性能不变。
通过决策树蒸馏对学习到的多智能体通信策略进行形式化验证
发表机构 * University of Arkansas at Little Rock(阿肯色大学小石城分校)
AI总结 提出通过决策树蒸馏将多智能体强化学习策略转化为可解释模型,并利用PRISM进行形式化验证,确保安全属性转移至原始网络,在无人机编队任务中实现88.9%属性满足率。
Comments 9 pages, 3 figures, 7 tables. Accepted at the 2026 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2026), Pittsburgh, Pennsylvania, USA, September 27-October 1, 2026
深度展开协调
发表机构 * Autonomous Control and Decision Systems Laboratory Georgia Institute of Technology United States(佐治亚理工学院自主控制与决策系统实验室)
AI总结 提出Deep Coordinator框架,通过深度展开ADMM-DDP迭代学习动态调整超参数,实现非凸优化器求解时自适应惩罚参数,在车队和四旋翼仿真中速度提升6.18-9.44倍且可扩展至8倍规模。
Comments The second and third authors contributed equally (equal second authorship). 35 pages (10 pages main text), 17 figures, 3 tables
一种用于机器人移动履行系统高效路径规划的神经形态强化学习框架
发表机构 * The Hong Kong University of Science and Technology (Guangzhou)(香港科技大学(广州)) ; JD Explore Academy(京东探索研究院)
AI总结 提出SDQN-RMFS框架,通过ANN到SNN的转换和硬标签知识蒸馏,在神经形态芯片上实现超低功耗路径规划,相比GPU能耗降低11281倍,延迟减少近一半。
不完美感知下的移动目标搜索:一种部分可观测随机博弈论方法
发表机构 * Shanghai Research Institute for Intelligent Autonomous Systems, Tongji University(同济大学上海自主智能无人系统科学中心) ; Department of Control Science and Engineering, Tongji University(同济大学控制科学与工程系)
AI总结 针对传感器限制、恶意干扰或通信噪声导致的不完美感知,采用部分可观测随机博弈(POSG)框架建模搜索者与目标间的对抗互动,提出可检测性概念和基于随机递归分析的充分判据,并开发服务器辅助分布式算法。
基于测距的移动机器人团队相对定位的无基础设施、控制无关解决方案
发表机构 * Department of Industrial Engineering, University of Trento(特伦托大学工业工程系) ; Department of Information Engineering and Computer Science, University of Trento(特伦托大学信息工程与计算机科学系)
AI总结 提出一种无锚点、完全去中心化的协作定位算法,仅依赖局部里程计、稀疏测距和短程通信,无需控制机器人运动即可实现团队可观测性,采用多假设贝叶斯框架保证鲁棒性。
扩展端到端驾驶的自我对弈
发表机构 * Mila(米拉研究所) ; Université de Montréal(蒙特利尔大学) ; Polytechnique Montréal(蒙特利尔理工学院) ; Torc Robotics ; NYU Tandon School of Engineering(纽约大学坦登工程学院) ; McMaster University(麦克马斯特大学) ; Princeton University(普林斯顿大学)
AI总结 提出大规模自我对弈训练策略,通过高效模拟器Gigapixel实现像素级自我对弈,结合DAgger蒸馏和感知适应,提升端到端驾驶模型性能。
阿克曼转向机器人在未映射环境中的安全局部导航
发表机构 * McMaster University(麦克马斯特大学)
AI总结 提出一种控制框架,通过局部障碍物检测确定最安全航向角,构建边界线并优化车辆-障碍物间距,实现阿克曼转向机器人在无全局目标环境中的安全局部导航。
Comments Presented at the 23rd Conference on Robots and Vision (CRV 2026)
Journal ref Proc. 23rd Conference on Robots and Vision (CRV), 2026
一种可微复合近似框架:基于海试数据的自主水下航行器机动建模
发表机构 * College of Shipbuilding Engineering, Harbin Engineering University(哈尔滨工程大学船舶工程学院) ; China Academy of Aerospace Aerodynamics(中国航天空气动力技术研究院) ; Institute of Artificial Intelligence, Shanghai University(上海大学人工智能研究院) ; China Ship Scientific Research Center(中国船舶科学研究中心)
AI总结 提出可微复合近似框架,结合多项式基与数据自适应基联合校准,并引入转向运动电流估计补偿,提升AUV机动预测精度。
World Engine:迈向自动驾驶后训练时代
AI总结 提出World Engine生成式框架,通过从真实日志重建高保真交互环境并外推安全关键变体,利用强化后训练对齐策略与安全约束,显著减少罕见安全关键场景故障,提升自动驾驶安全性。
Comments Technical Report. Project Page: https://opendrivelab.com/WorldEngine/
多旋翼无人机状态估计中的电机角速度预积分
AI总结 针对无人机振动导致IMU精度下降的问题,提出基于电机转速加速度预积分的方法,替代IMU进行状态传播,并构建因子用于图优化,结合LiDAR形成MAS-LO算法,相比LIO-SAM位置精度提升28%,速度精度提升65%。
多模态不确定性下基于优先级排序STL规范的自动驾驶
发表机构 * Eindhoven University of Technology(埃因霍温理工大学)
AI总结 提出一种不确定性感知的轨迹规划框架,通过信号时序逻辑的词典序优先级处理冲突目标,并结合模型预测路径积分控制实现,在仿真中验证了有效性。
CoLI: 通过整体3D打印和同构遥操作实现连续体机器人学习的可复现平台
AI总结 提出一种基于多材料3D打印和同构遥操作的连续体机器人平台,简化制造流程并实现无奇异映射控制,支持模仿学习自主控制,通过硬件表征和操作任务验证其可复现性和学习就绪性。
Comments 8 pages, 7 figures, 1 table, accepted by IROS2026
Physical Atari: 一个用于机器人实时强化学习的鲁棒且可访问的平台
AI总结 提出Physical Atari平台,通过机器人操作Atari控制器和实时渲染游戏帧,实现物理世界中的强化学习研究,验证了算法可直接在机器人上学习,并指出分布偏移会显著降低策略性能。
Comments To appear at RLC 2026
WorkBenchMark:面向智能制造联盟的基于乐高积木的装配基准与通过拆卸进行装配的基线方法
发表机构 * Chair of Machine Learning and Reasoning (i6), RWTH Aachen University(亚琛工业大学机器学习与推理教席(i6)) ; MASCOR Institute, FH Aachen University of Applied Science(亚琛应用技术大学MASCOR研究所)
AI总结 提出一个基于乐高Duplo的机器人装配基准,包含400个任务和四个复杂度层级,并提供一个基于规划的基线方法,在所有层级上优于现代视觉-语言-动作方法。
Comments RoboCup Symposium 2026 accepted paper
模拟沙地中的机器人运动:开源物理引擎中的阻力理论
发表机构 * Case Western Reserve University(凯斯西储大学) ; University of Vermont(佛蒙特大学)
AI总结 将三维颗粒阻力理论(3D RFT)集成到MuJoCo物理引擎中,实现沙地行走模拟,验证了足端形状、速度和负载对运动的影响,并在六足机器人实验中预测行走距离和沉陷误差在20%以内。
Comments 12 pages, 7 figures
ForEnt: 用于表征四足机器人在森林环境中被困的多模态数据集
发表机构 * University of Southampton(南安普顿大学)
AI总结 针对四足机器人在森林中因植被缠绕而倾覆的问题,提出多模态数据集ForEnt,包含RGB-D、LiDAR、本体感知和第三人称视频,记录69次被困事件,支持可重复的基准测试。
Comments 8 pages, 7 figures
人形机器人数据标准:物理AI缺失的基础设施
AI总结 本文论证数据标准是人形机器人可扩展性的关键基础设施,通过提出ISO/WD 26264-1标准,解决数据非累积性问题,使具身经验可解释、可共享、可追溯和可复用。
TIDY: 基于小波域熵和方向条纹指数的热红外图像去噪
发表机构 * Dept. of Mechanical Engineering, SNU(首尔大学机械工程系)
AI总结 提出轻量级小波域去噪器TIDY,利用真实噪声数据训练,通过小波熵和方向条纹指数损失项抑制随机噪声和条纹伪影,在室内恶劣条件下提升热红外图像质量及下游机器人任务性能。
Pose6DAug: 用于机器人数据增强的物理合理多视图物体替换
AI总结 提出Pose6DAug,一种基于失败驱动的数据增强框架,通过3D网格和6D姿态轨迹替换成功轨迹中的物体,生成多视图一致的物理合理演示,无需额外数据收集,在新型物体上提升VLA策略成功率16.5%。
高效连接真实场景与合成数据生成以支持基于AI的认知机器人和计算机视觉应用
发表机构 * Fraunhofer IPK(弗劳恩霍夫生产设备和设计技术研究所) ; TU Berlin(柏林工业大学)
AI总结 本文讨论当前AI视觉模型在认知机器人应用中的局限,并提出通过连接仿真与真实世界训练数据生成来弥合领域差距的方法。
Comments Accepted and best paper award at MHI-Kolloquium 2024
TaCauchy:面向视觉触觉仿真的可扩展有限元框架
发表机构 * Shenzhen International Graduate School, Tsinghua University(清华大学深圳国际研究生院) ; Huawei Inc.(华为技术有限公司)
AI总结 提出TaCauchy框架,基于UIPC求解器在Isaac Sim中集成有限元法,直接计算柯西应力张量并投影为接触力,实现高保真触觉仿真,支持多种传感器,物理验证SSIM>0.93。
Comments Accepted to IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), 2026
pdSTL: 面向随机系统的概率可微信号时序逻辑
发表机构 * Oklahoma State University(俄克拉荷马州立大学)
AI总结 提出pdSTL框架,将概率语义与可微鲁棒性结合,通过区间值概率语义和LSTM式展开实现线性时间可微监控,在障碍物规避、换道和真实四旋翼飞行实验中优于确定性可微STL。
通过可微可达性实现非线性系统的安全、实时主动模型辨识与故障诊断
发表机构 * Institute of Robotics and Intelligent Machines (IRIM), Georgia Institute of Technology(佐治亚理工学院机器人与智能机器研究所) ; Department of Aerospace Engineering, University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校航空航天工程系)
AI总结 针对不确定非线性系统,提出一种基于可微可达性近似的实时主动故障诊断算法,通过优化控制输入使输出集分离,在保证安全的同时实现快速模型辨识。
Fail-RAG:一种基于检索增强生成的机器人故障识别框架
发表机构 * Hitachi America, Ltd.(日立美国有限公司)
AI总结 提出Fail-RAG框架,利用检索增强生成和视觉语言模型,通过嵌入故障图像和上下文信息并查询数据库,实现机器人操作故障的高效检测,在仓库自动化任务中平均检测准确率提升25个百分点。
Tri-Info: 基于信息论的VLA模型可泛化、可解释的故障预测
发表机构 * InfoBodied AI Lab, The University of Hong Kong(香港大学信息具身人工智能实验室) ; HKU Musketeers Foundation Institute of Data Science(香港大学赛马会数据科学研究院)
AI总结 提出Tri-Info方法,通过信息论信号捕捉动作多样性、时间一致性和状态耦合,实现跨架构、环境及仿真到现实的零样本故障检测,准确率达83%。
ARC:自适应鲁棒联合状态与协方差估计
AI总结 提出统一块坐标下降框架,结合自适应鲁棒损失、迭代重加权最小二乘状态更新和最小加权协方差行列式估计器,实现离群值下状态与协方差的自适应联合估计。
Comments Submitted to information IEEE Robotics and Automation Letters (RA-L), June 2026. 8 pages, 7 figures, 1 table
自主组件集合的范畴与层论语义
AI总结 针对自主组件集合语言SCEL,提出基于范畴论和层论的多层数学模型,将机器人社会建模为拓扑空间上的层,通过层上同调量化系统故障,将分布式系统验证转化为几何分析。
面向空间自主性的智能体自动研究:用于航空航天控制问题的可审计、LLM驱动的研究代理
发表机构 * Department of Aeronautics and Astronautics(航空航天学系)
AI总结 提出AutoResearch框架,利用大语言模型作为离线研究代理,自动迭代开发航天控制策略,并通过内置可信层审计结果,消除种子噪声影响,在交会和对接问题上验证了有效性。