Playful Agentic Robot Learning
趣味性具身机器人学习
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; Impossible Research
AI总结 提出RATs框架,让机器人通过自主探索学习可复用技能,在LIBERO-PRO和MolmoSpaces上分别提升20.6和17.0个百分点。
Comments Project page: https://playful-rats.github.io/
趣味性具身机器人学习
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; Impossible Research
AI总结 提出RATs框架,让机器人通过自主探索学习可复用技能,在LIBERO-PRO和MolmoSpaces上分别提升20.6和17.0个百分点。
Comments Project page: https://playful-rats.github.io/
DF-ExpEnse: 扩散滤波探索用于高效样本微调
发表机构 * Stanford University(斯坦福大学) ; Brown University(布朗大学)
AI总结 提出DF-ExpEnse探索技术,利用生成控制策略的多模态建模能力和评论家集成,在微调中高效收集在线经验,提升样本效率。
Comments ICML 2026
机器人发展性运动学习的双向辅导:共同发展的交互动力学支持稳定学习
发表机构 * Okinawa Institute of Science and Technology Graduate University(冲绳科学技术大学院大学)
AI总结 提出双向辅导框架,通过人类或AI导师与机器人动态适应,利用自由能原理神经网络实现稳定序列学习,在物体操作任务中验证了行为一致性和泛化能力。
Comments 16 pages, 14 figures
时间自我模仿学习
发表机构 * Duke University(杜克大学)
AI总结 提出时间自我模仿学习框架,通过挖掘高效成功轨迹并转化为可重用监督信号,提升长时域机器人操作任务的学习效率与鲁棒性。
开始正确,到达正确:通过初始噪声选择实现异步执行
发表机构 * VinRobotics ; VinUniversity ; DFKI(德国人工智能研究中心) ; University of Stuttgart(斯图加特大学) ; IMPRS-IS(国际马克斯·普朗克智能系统研究学院)
AI总结 针对流式策略异步执行中的动作块边界不一致问题,提出无需训练的PAINT方法,通过初始噪声选择而非轨迹引导实现前缀一致性,在12个模拟和6个真实操作任务中提升执行一致性与任务性能。
Comments First version 19 pages, project site: https://paint-action-chunking.github.io
MirrorDuo:基于镜像演示对的反射一致视觉运动学习
AI总结 提出MirrorDuo方法,通过反射一致性为每个原始演示生成镜像副本,实现数据增强,在相同数据预算下显著提升行为克隆性能,并支持零/少样本技能迁移。
Comments Published in CoRL 2025
Journal ref CoRL 2025
VFILC: 通过采样频率迭代学习控制实现模仿学习中的精确频率外推
发表机构 * Grad. School of Science ; Technology University of Tsukuba Tsukuba, Japan ; Engineering Saitama University Saitama, Japan ; Information Engineering University of Tsukuba Tsukuba, Japan
AI总结 提出VFILC方法,结合可变频率模仿学习与前馈-反馈迭代学习控制,在三种任务中实现精确的速度外推,频率误差降低最高81%。
Comments 8 pages, 17 figures. Accepted at IROS 2026
频率感知流匹配用于连续且一致的机器人动作生成
发表机构 * Beihang University(北京航空航天大学) ; Peking University(北京大学) ; The Chinese University of Hong Kong(香港中文大学) ; PKU-Psibot Lab(北大-智源机器人实验室) ; Zhongguancun Laboratory(中关村实验室) ; Hefei Comprehensive National Science Center(合肥综合性国家科学中心)
AI总结 提出频率感知流匹配(FAFM),通过离散余弦变换将离散动作序列转换到频域进行流匹配,并正则化一阶时间导数以生成平滑连续的动作,提升成功率、多模态表达性和运动平滑性。
MemoryWAM:具有持久记忆的高效世界动作建模
发表机构 * The Chinese University of Hong Kong(香港中文大学) ; Tsinghua University(清华大学) ; Zhejiang University(浙江大学)
AI总结 提出MemoryWAM,通过混合记忆设计和定制注意力机制,在长时域机器人操作任务中实现高效记忆依赖决策,优于现有VLA和WAM基线。
FlexLAM: 解决潜在动作学习中的瓶颈权衡
发表机构 * University of Tsukuba(筑波大学) ; The University of Tokyo(东京大学)
AI总结 针对潜在动作模型中固定容量瓶颈导致的权衡问题,提出FlexLAM,通过嵌套dropout实现变长潜在动作,在不增加架构或损失的情况下,在稀缺标签和低回报任务中优于固定容量模型,并支持推理时调整令牌预算。
RoboSSM: 基于状态空间模型的可扩展上下文模仿学习
发表机构 * The University of Texas at Austin(德克萨斯大学奥斯汀分校) ; KAIST(韩国科学技术院) ; FAIR at Meta(元宇宙FAIR) ; Amazon(亚马逊) ; Sony AI(索尼人工智能)
AI总结 提出RoboSSM,用状态空间模型替代Transformer实现上下文模仿学习,在LIBERO基准上对未见和长时任务泛化更优,首次证明SSM是ICIL高效可扩展的骨干网络。
Comments IROS 2026
CoMo: 从互联网视频中学习连续潜在运动以实现可扩展的机器人学习
发表机构 * Nanjing University(南京大学) ; Shanghai AI Lab(上海人工智能实验室) ; University of Science and Technology of China(中国科学技术大学) ; Zhejiang University(浙江大学) ; Fudan University(复旦大学) ; Tongji University(同济大学)
AI总结 提出CoMo方法,通过早期时间差分和时序对比学习从互联网视频中学习连续潜在运动,避免离散化信息损失,实现零样本泛化生成伪动作标签,联合训练策略在仿真和真实实验中表现优异。
Comments CVPR 2026
DADP: 领域自适应扩散策略
发表机构 * University of California, Berkeley, California, USA(加州大学伯克利分校) ; Peking University, Beijing, China(北京大学) ; Tsinghua University, Beijing, China(清华大学)
AI总结 提出DADP,通过无监督解耦和领域感知扩散注入,实现跨动态环境的鲁棒零样本适应,在运动与操控任务上超越先前方法。
非惯性地面上仿人机器人的本体感觉不变状态估计
发表机构 * Purdue University(普渡大学)
AI总结 提出一种仅使用本体感觉的InEKF方法,利用足部IMU和运动学约束,实现非惯性地面上仿人机器人的实时状态估计,收敛速度提升96%,位置误差降低80%。
CTS-MoE: 基于混合专家模型的隐式地形适应感知运动
发表机构 * University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校) ; University of São Paulo(圣保罗大学)
AI总结 针对非连续地形上的感知运动问题,提出CTS-MoE方法,通过密集混合专家策略与感知门控组合共享行为,并用多批评家防止价值干扰,实现端到端训练和隐式地形适应,在仿真和硬件上优于基线。
具有主动脚趾的双足机器人敏捷性、效率和冲击吸收的比较研究
发表机构 * School of Electrical, Electronics and Communication Engineering, Korea University of Technology and Education(韩国技术教育大学电气、电子与通信工程学院) ; Artificial Intelligence and Robotics Institute, Korea Institute of Science and Technology(韩国科学技术研究院人工智能与机器人研究所) ; Robot Innovation Hub, WIRobotics Inc.(WIRobotics公司机器人创新中心)
AI总结 提出一种14自由度双足机器人,模拟人类脚趾的轻量、高扭矩、坚固特性,通过高保真仿真训练环境,对比有无主动脚趾的配置,发现脚趾机器人以1.33米/秒行走时,CoT降低17.5%,脚跟冲击力降低5.0%,路径偏差平均和最大分别降低25.0%和34.0%。
Comments 6 pages, 7 figures
VOiLA: 基于学习扩散模型的向量化在线规划用于POMDP智能体
发表机构 * Australian National University(澳大利亚国立大学) ; The University of Sydney(悉尼大学)
AI总结 提出VOiLA框架,利用条件扩散模型学习POMDP模型,通过蒸馏加速采样并与向量化在线规划器集成,在三个基准任务和实物机器人上实现高效在线规划。
Comments Submitted to the 2026 International Symposium of Robotics Research (ISRR)
拥挤环境中的拥塞感知机器人巡视规划
发表机构 * Istituto Italiano di Tecnologia(意大利理工学院) ; Università di Genova(热那亚大学) ; University of Birmingham(伯明翰大学)
AI总结 提出一种基于概率的巡视规划器,通过学习人流预测模型并在线构建马尔可夫决策过程,在拥挤环境中高效规划机器人路径,减少拥塞影响。
Comments Accepted to IEEE IROS 2026
Journal ref IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), 2026
SWAP: 用于敏捷机器人跑酷的对称等变世界模型
发表机构 * Center for X-Mechanics, Zhejiang University(浙江大学交叉力学中心) ; ZJU-Hangzhou Global Scientific and Technology Innovation Center(浙江大学杭州国际科创中心) ; Mirrorme Technology Co., Ltd.(魔镜科技有限公司)
AI总结 提出SWAP框架,将对称等变性嵌入世界模型和演员-评论家网络,实现四足机器人跑酷记录突破(跨越2.13米间隙、攀爬1.63米平台),并展现出对未见镜像地形的几何泛化与零样本迁移能力。
稳定的Transformer-Actor-Critic模型预测控制:一种收缩分析方法
AI总结 提出一种Transformer-Actor-Critic MPC架构,通过证明Transformer满足增量输入-状态稳定性并利用黎曼收缩理论分析互联动力学,将理论界作为训练正则化项,实现可证明鲁棒的控制策略。
通过运动规划算法提高连续体机器人的韧性
AI总结 本文实验研究运动规划算法对连续体机器人韧性的影响,通过改进遗传算法和A*算法,结合层次分析法评估路径质量,发现遗传算法生成更多样化路径,提升机器人韧性。
具有碰撞避免保证的机器人操作器鲁棒凸模型预测控制
发表机构 * ABB robotics(ABB机器人公司) ; Department of Mechanical Engineering, Imperial College London(帝国理工学院机械工程系) ; Department of Information Technology, Uppsala University(乌普萨拉大学信息科技系)
AI总结 提出一种结合鲁棒管MPC与走廊规划算法的凸MPC方案,在模型不确定下实现工业机器人快速无碰撞运动,优于基准方法。
DIFF-IPPO:基于扩散的开放词汇信念地图信息路径规划
发表机构 * Intelligent Space Robotics Laboratory, CDE, Skoltech(智能空间机器人实验室,CDE,斯科尔科沃科学技术研究院)
AI总结 提出DIFF-IPPO框架,结合开放词汇信念地图生成器与扩散规划器,在非高斯信念图上生成全局轨迹,实现高效目标搜索,检测得分达81.49%-86.55%。
平面跟踪中的反馈速度控制
发表机构 * Department of Mechanical and Aerospace Engineering, University of South Florida(南佛罗里达大学机械与航空航天工程系)
AI总结 针对领航-跟随平面跟踪问题,提出一种反馈速度控制律与恒定方位角转向策略,实现并排编队并证明渐近稳定性,扩展至N-agent链网络。
DiffusionVS:基于扩散策略的鲁棒视觉伺服生成框架
AI总结 提出基于扩散策略的视觉伺服方法,通过条件去噪生成相机速度,并采用在线训练增强泛化能力,仿真成功率近100%,物理实验93%。
Comments 8 pages, 4 figures, 7 tables
一个演示胜过千条轨迹:用于视觉运动策略的动作-视角增强
发表机构 * Stanford University(斯坦福大学) ; Columbia University(哥伦比亚大学) ; Toyota Research Institute(丰田研究所)
AI总结 提出一种数据增强框架,通过高斯泼溅和轨迹优化生成逼真的鱼眼图像序列和物理可行的动作轨迹,提升操作策略在场景变化和障碍物下的成功率。
Comments Project website: https://chuerpan.com/1001-demos.github.io/. Published at CoRL 2025
Journal ref Proceedings of The 9th Conference on Robot Learning, PMLR 305:3902-3914, 2025
一对二执行:一种面向单臂智能体动作扩展至双臂的新框架
发表机构 * Chongqing University(重庆大学) ; Xi’an Jiaotong-Liverpool University(西交利物浦大学) ; Lumos Robotics
AI总结 提出ExS2D层次化动作扩展框架,利用单臂监督实现双臂操作,通过时间优先关系提取、子任务引导动作映射和碰撞避免协调规划,在仿真中减少54.4%执行步骤并保持成功率。
Comments 6 pages, 5 figures, 3 tables
Belt-Finger: 一种经济实惠的软带驱动夹爪,用于灵巧的手内操作
发表机构 * University of Tübingen(图宾根大学) ; Max Planck Institute for Intelligent Systems(马克斯·普朗克智能系统研究所)
AI总结 提出一种双软带手指模块,为平行夹爪增加三个手内自由度(平移、俯仰、滚动),在保持低成本、易集成的同时提升灵巧操作能力,并通过MPC和遥操作验证其有效性。
Co-VLA:面向双臂视觉-语言-动作系统的协调感知结构化动作建模
发表机构 * Donghua University(东华大学) ; Samsung R&D Institute China-Beijing (SRCB)(三星中国北京研究院) ; Samsung AI Center, DS Division(三星DS部门AI中心)
AI总结 针对双臂紧耦合任务中隐式协调不足的问题,提出Co-VLA框架,通过结构化动作专家和潜在感知控制器显式引入协调先验,在仿真和真实场景中显著提升成功率和效率。
从人类演示生成机器人手
发表机构 * University of California San Diego(加州大学圣迭戈分校) ; Amazon Frontier AI & Robotics(亚马逊前沿人工智能与机器人)
AI总结 提出数据驱动框架,利用人类日常操作中超过400万帧指尖运动数据,通过逆运动学匹配指尖位置,优化树状结构机器人手的设计,生成通用6自由度手和低自由度任务专用手,并训练强化学习智能体加速设计搜索。
人类通用抓取
发表机构 * New York University(纽约大学) ; Tsinghua University(清华大学) ; University of Michigan(密歇根大学)
AI总结 提出HUG模型,利用人类抓取数据(1M-HUG数据集)和流匹配方法,从单张RGB-D图像生成多样化抓取姿态,并重定向到机器人手,实现零样本抓取,在HUG-Bench上超越基线23%-34%。
Comments 28 pages, 20 figures, 7 tables
VibeCheck: 使用主动声学触觉传感进行接触丰富的操作
发表机构 * Dept. of Mechanical Engineering(机械工程系) ; Dept. of Computer Science(计算机科学系) ; Dept. of Electrical Engineering(电气工程系) ; Columbia University(哥伦比亚大学)
AI总结 本文构建了带有两个压电手指的主动声学传感夹爪,通过物体传递声学振动来感知其声学特性和接触状态,用于物体分类、抓取位置估计、内部结构姿态估计以及外部接触类型分类,并基于接触分类模型实现了鲁棒的插销任务。
Comments Published at IROS 2025. 8 pages, 7 figures
基于虚拟模型控制的周期性鲁棒机器人砍切
发表机构 * University of Cambridge(剑桥大学) ; University of Tokyo(东京大学)
AI总结 提出一种物理结构化的虚拟模型控制器,通过切换虚拟机构生成鲁棒的周期性砍切运动,无需预规划轨迹,在Franka机械臂上实现多种蔬菜的亚毫米级精确切割。
从我们所拥有的学习:在线推理过去交互的历史感知验证器
发表机构 * Robotics Institute, Carnegie Mellon University(卡内基梅隆大学机器人研究所) ; Computer Science and Technology, Tsinghua University(清华大学计算机科学与技术系)
AI总结 提出历史感知验证器HAVE,通过解耦动作生成与验证,利用历史交互在线消除歧义,理论证明其提升期望动作质量,在多个模拟和真实环境中验证有效性。
Comments CoRL 2025
PTLD: 从仿真到现实的触觉潜在知识蒸馏用于灵巧操作
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; University of Washington(华盛顿大学) ; FAIR at Meta(Meta的FAIR团队) ; UC Berkeley(伯克利大学)
AI总结 提出PTLD方法,通过真实世界触觉策略数据蒸馏鲁棒状态估计器,解决触觉仿真困难问题,在灵巧操作任务中相比纯本体感策略提升182%和57%。
传递接触,而不仅仅是运动:跨灵巧手的柔顺抓取
发表机构 * University of California San Diego(加州大学圣迭戈分校)
AI总结 提出跨本体力-位置接口,通过校准力矩和指尖力实现异构灵巧手间的接触感知抓取,结合流匹配视觉运动策略和混合力位控制器,实现可迁移的柔顺抓取。
Comments Website(overview): transferring-contact-not-just-motion.github.io/
Mem-World:用于持久机器人操作的内存增强动作条件世界模型
发表机构 * Dalian University of Technology(大连理工大学) ; Samsung R&D Institute China-Beijing (SRCB)(三星中国北京研究院)
AI总结 提出Mem-World,通过4D腕部视角曲面元索引内存W-VMem,解决操作中因遮挡和运动导致的场景遗忘问题,实现持久世界建模,提升策略评估与改进效果。
3D场景图:开放挑战与未来方向
AI总结 本文统一综述3D场景图(3DSG)的构建、应用与评估,分析现有建模选择与开放挑战,旨在推动鲁棒部署。
Comments Invited article for the Annual Review of Control, Robotics, and Autonomous Systems Volume 10
SCAN-Planner:用于路线引导的远程四足导航的空间碰撞感知局部规划
发表机构 * Shanghai Jiao Tong University(上海交通大学)
AI总结 提出SCAN-Planner框架,通过偏航感知双圆柱足迹和投影A*搜索实现空间碰撞感知的局部规划,在密集杂乱、3D非结构化环境和远程导航中生成安全平滑轨迹。
MEMS/GNSS组合导航中无人地面车辆在GNSS退化环境下的路径约束鲁棒融合估计
发表机构 * State Key Laboratory of Precision Space-time Information Sensing Technology, Tsinghua University(清华大学精密时空信息感知技术国家重点实验室) ; Xiaomi Inc.(小米公司)
AI总结 针对GNSS信号严重遮挡下结构化道路环境中无人地面车辆的累积定位漂移,提出一种鲁棒的路径约束状态估计方法,利用历史航位推算轨迹与高精地图匹配生成伪位置观测,通过扩展卡尔曼滤波持续注入道路级约束,抑制位置偏差并改善方位估计。
Comments Accepted workshop paper, 1st Workshop on Robot Meets GNSS and Ranging for Seamless Autonomy, IEEE ICRA 2026
Journal ref 1st Workshop on Robot Meets GNSS and Ranging for Seamless Autonomy, IEEE ICRA 2026, Vienna, Austria, June 5, 2026
MMD-SLAM:结构增强的多元高斯分布引导视觉SLAM
发表机构 * HFIPS, Chinese Academy of Sciences(中国科学院合肥物质科学研究院) ; University of Science and Technology of China(中国科学技术大学) ; Aarhus University(奥胡斯大学) ; University of Tokyo(东京大学) ; Beijing University of Chemical Technology(北京化工大学) ; North China Electric Power University(华北电力大学)
AI总结 提出MMD-SLAM,利用亚特兰大世界假设引导多元高斯表示,通过点线融合、主导方向编码和高斯进化策略,提升视觉SLAM的跟踪精度与建图质量。
Comments ICRA 2026
FlowMaps: 使用流匹配建模长期多模态物体动态
发表机构 * Sapienza University of Rome(罗马大学) ; Université de Montréal(蒙特利尔大学) ; Mila - Quebec AI Institute(米拉-魁北克人工智能研究所)
AI总结 提出FlowMaps模型,通过潜在流匹配学习物体位置的多模态时空分布,预测动态物体未来位置,提升机器人在变化家庭环境中的导航性能。
基于旋转声纳数据的3D喀斯特水下场景重建
发表机构 * U2IS, ENSTA, Institut Polytechnique de Paris(巴黎综合理工学院ENSTA学院U2IS实验室) ; Lab-STICC, ENSTA, Institut Polytechnique de Paris(巴黎综合理工学院ENSTA学院Lab-STICC实验室) ; Informatics XVII – Robotics, Julius-Maximilians-Universität Würzburg(尤利乌斯-马克西米利安-维尔茨堡大学信息学XVII – 机器人学)
AI总结 针对声纳数据稀疏噪声大、导航漂移导致3D重建困难的问题,提出结合连续时间SLAM校正轨迹与两阶段深度学习表面重建的流水线,生成可沉浸导航的3D网格。
Comments 1st Workshop on Long-term Deployments in the Wild (LoWi)
LIT-GS: 面向光照鲁棒建图的激光雷达-惯性-热高斯泼溅
发表机构 * College of Mechatronics and Control Engineering, Shenzhen University(深圳大学机电与控制工程学院) ; Department of Mechanical Engineering, The University of Hong Kong(香港大学机械工程系)
AI总结 提出LIT-GS框架,利用激光雷达平面几何约束联合优化位姿与高斯,解决光照变化和纹理缺失场景下RGB依赖的脆弱性问题,提升几何精度与渲染质量。
Comments Accepted to IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2026)
慢速大脑,快速规划器:延迟鲁棒的VLM增强城市导航
发表机构 * Amazon FAR(亚马逊 FAR) ; UCLA(加州大学洛杉矶分校) ; Independent(独立) ; Zhejiang University(浙江大学)
AI总结 针对移动机器人在人行道导航中轨迹评分差距问题,提出一种无需训练的延迟鲁棒轨迹级融合层,利用VLM选择候选轨迹并与规划器输出融合,在挑战场景下降低ADE 30%。
GroundControl: 通过轨迹一致的不确定性估计预测视觉语言智能体中的导航失败
发表机构 * University of Illinois at Chicago (UIC)(伊利诺伊大学芝加哥分校)
AI总结 提出轨迹一致的不确定性估计方法GroundControl,通过卡尔曼滤波建模距离变化并结合轨迹特征,有效预测导航失败,在选择性风险-覆盖评估中优于基线。
用于自主导航中注视引导主动感知的快速人类注意力预测
发表机构 * Norwegian University of Science and Technology (NTNU)(挪威科技大学)
AI总结 提出GazeLNN,一种基于液态神经网络和MobileNetV3的轻量级扫描路径预测模型,在MIT低分辨率数据集上达到最优性能,计算成本降低99.40%,推理速度提升6倍,并集成到强化学习训练的主动相机-机器人控制策略中,实现自主导航中的注视引导感知。
Comments Accepted to the IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2026)
BIM 引导的视觉 SLAM 在建筑环境中的应用
发表机构 * Automation and Robotics Research Group, Interdisciplinary Centre for Security, Reliability, and Trust (SnT), University of Luxembourg(自动化与机器人研究组,安全、可靠与信任跨学科研究中心(SnT),卢森堡大学)
AI总结 针对建筑环境中视觉SLAM轨迹漂移问题,提出利用建筑信息模型(BIM)的结构先验增强RGB-D SLAM系统,通过墙面对应与几何约束优化减少漂移,提升全局一致性,实验显示轨迹误差降低25.23%,地图精度提升7.14%。
Comments 9 pages, 7 tables, 4 figures
从单实例RGB演示中学习类别级最后米导航
发表机构 * University of Minnesota, Twin Cities(明尼苏达大学 Twin Cities 分校)
AI总结 提出面向对象的模仿学习框架,利用RGB观测实现四足移动机械臂在最后米阶段的精确导航,无需深度或地图先验,在类别级泛化中达到高成功率。
PiDR:面向自主平台的物理信息惯性航位推算
发表机构 * Autonomous Navigation and Sensor Fusion Lab (ANSFL)(自主导航与传感器融合实验室(ANSFL)) ; Hatter Department of Marine Technologies(海洋技术系) ; Charney School of Marine Sciences(海洋科学学院) ; University of Haifa(海法大学)
AI总结 提出PiDR框架,将惯性导航原理作为物理信息残差融入网络训练,在纯惯性导航中减少轨迹漂移,在移动机器人和水下自主航行器数据集上定位精度提升超29%。
Comments 11 pages and 7 figures
AION: 基于双策略强化学习的空中室内目标导航
发表机构 * Department of Electrical and Computer Engineering, National University of Singapore(新加坡国立大学电子与计算机工程系)
AI总结 提出AION,一种端到端双策略强化学习框架,解耦探索与目标到达行为,用于视觉空中目标导航,无需外部定位或全局地图,在AI2-THOR和IsaacSim中验证了优越性能。
Comments Accepted to IROS 2026
安全关键的激光雷达-惯性里程计与在线流形确定性保护级别
发表机构 * School of Automation, Southeast University(东南大学自动化学院) ; Key Laboratory of Measurement and Control of CSE, Ministry of Education(教育部测控CSE重点实验室)
AI总结 本文提出一种安全关键的激光雷达-惯性里程计,通过在线流形确定性状态估计提供确定性保护级别,以提升移动机器人在安全关键场景中的导航安全性。
基于深度学习的月球陨石坑地形相对导航
发表机构 * NASA(美国国家航空航天局) ; University of Texas at Austin(德克萨斯大学奥斯汀分校)
AI总结 提出一种结合深度学习陨石坑检测器和扩展卡尔曼滤波的地形相对导航算法,在初始位置偏差达5公里时仍能将导航误差降至数百米。
一种智能调度混合(SSH)EKF-FGO状态估计方法
发表机构 * GitHub ; arXiv
AI总结 本文通过智能调度混合EKF-FGO框架,实验性地将优化调度作为独立设计变量,研究其在平衡估计精度与计算成本中的作用,并在平面SLAM仿真中验证了调度对预优化漂移、瞬态误差和运行时间的显著影响。
Comments This work has been accepted for presentation/publication at the 2026 IEEE Canadian Conference on Electrical and Computer Engineering (CCECE). The final published version will appear in IEEE Xplore
Qwen-RobotNav 技术报告:为智能体导航系统设计的可扩展导航模型
发表机构 * Qwen Team(通义实验室)
AI总结 提出 Qwen-RobotNav 可扩展导航模型,通过参数化接口支持多种任务模式和可调观测参数,在15.6M样本上训练,联合视觉语言数据防止行为坍缩,在多个导航基准上取得新最优结果,并展示零样本泛化能力。
高精度事件相机水下SLAM系统
AI总结 针对事件相机水下SLAM中时间曲面成像质量差和匹配失败问题,提出基于结构感知度量和贝叶斯优化的高精度立体SLAM系统,并贡献首个高质量水下事件数据集UWE。
GenTrack:新一代多目标跟踪
发表机构 * SDU Robotics, University of Southern Denmark(SDU机器人实验室,南丹麦大学)
AI总结 提出GenTrack多目标跟踪方法,采用随机与确定性混合策略,结合粒子群优化与社会交互,在弱检测器、遮挡等场景下有效维持目标身份一致性并减少ID切换。
Comments This work has been submitted to the IEEE for possible publication
GenTrack2: 一种改进的多目标跟踪混合方法
发表机构 * SDU Robotics, University of Southern Denmark(SDU机器人研究所,南丹麦大学)
AI总结 提出结合随机粒子滤波与确定性关联的多目标跟踪方法,通过粒子群优化和新型代价矩阵解决非线性动态下的标识一致性问题,性能优于现有方法。
Comments The content of this paper was included in the full manuscript of GenTrack family which has been submitted to the journal for possible publication
潜在高斯泼溅用于4D全景占据跟踪
发表机构 * University of Freiburg(弗赖堡大学) ; Bosch Research(博世研究院) ; University of Haifa(海法大学)
AI总结 提出潜在高斯泼溅(LaGS)方法,通过特征高斯体作为动态关键点实现多视图特征聚合,用于4D全景占据跟踪,在Occ3D nuScenes和Waymo上达到最优性能。
Comments Accepted to IEEE Robotics and Automation Letters (RA-L), 2026
Co-policy: 响应式人机音乐共创框架
发表机构 * School of Computer Science, Wuhan University(武汉大学计算机学院) ; College of Computing and Data Science, Nanyang Technological University(南洋理工大学计算与数据科学学院) ; School of Automation, Wuhan University of Technology(武汉理工大学自动化学院) ; School of Geodesy and Geomatics, Wuhan University(武汉大学测绘学院) ; School of Robotics, Wuhan University(武汉大学机器人学院)
AI总结 提出Co-policy框架,通过语义锚定、约束变分和视觉运动策略实现人机音乐实时共创,在真实钟琴实验中优于扩散策略基线。
基于增强现实的机器人辅助经食管超声心动图直观界面评估:用户研究
AI总结 本研究提出并评估了一种基于增强现实的直观界面,用于机器人辅助经食管超声心动图,通过3D可视化与尖端控制显著提升空间精度并降低操作误差。
用于将自然语言协议翻译为机器人实验室平台的双智能体跨模型验证框架
AI总结 提出双智能体框架,通过解析器形式化协议、规则映射引擎生成控制命令、异构LLM验证器纠错,实现自然语言微孔板协议到机器人平台可执行命令的转换,并验证了端到端自主执行。
面向人机协作的基于动作识别的鲁棒装配状态推理
发表机构 * Cognitive Robotics group, Unit of Automation Technology and Mechanical Engineering, Tampere University(坦佩雷大学自动化技术与机械工程系认知机器人组)
AI总结 研究从动作识别输入跟踪装配状态的方法,比较逻辑、HMM和神经网络方法,发现最优方法因任务而异,逻辑方法在多变场景更鲁棒。
Comments Preprint accepted to the 35th IEEE International Conference on Robot and Human Interactive Communication (RO-MAN 2026). 8 pages, 9 figures, 3 tables
TASC:面向关系遥操作的任务感知共享控制
发表机构 * KU Leuven, Dept. Mechanical Engineering, Research unit Robotics, Automation and Mechatronics(KU莱顿机械工程系,机器人、自动化与机电一体化研究单位) ; KU Leuven, Dept. Electrical Engineering, Research unit Processing Speech and Images(KU莱顿电气工程系,语音与图像处理研究单位)
AI总结 提出TASC框架,通过视觉构建开放词汇交互图推断任务级用户意图,并基于空间约束提供共享控制辅助,提升关系遥操作效率与泛化能力。
Comments Accepted to IROS 2026
增强现实的沉浸式可穿戴热渲染
发表机构 * Vanderbilt University(范德比大学)
AI总结 提出一种掌戴式热反馈原型,通过间接反馈、主动热透传和时空变化渲染策略,在增强现实中实现沉浸式热触觉体验,实验验证了其可行性与权衡。
EquiVLA: 旋转等变视觉-语言-动作模型的通用框架
发表机构 * VinRobotics ; VinUniversity ; DFKI(德国人工智能研究中心) ; University of Stuttgart(斯图加特大学) ; IMPRS-IS(国际马克斯·普朗克智能系统研究学院)
AI总结 提出EquiVLA,首个端到端SO(2)等变VLA框架,通过EquiPerceptor和EquiActor实现从视觉到动作的近似等变链,在LIBERO、CALVIN和真实机器人任务上显著提升性能。
Comments Comment: First version 22 pages, project site: https://equivla.github.io/
微调视觉-语言-动作模型所需的层数比你想象的少
发表机构 * Center for AI Research, VinUniversity(VinUniversity人工智能研究中心) ; VinRobotics ; University of Arkansas(阿肯色大学) ; Technical University of Denmark(丹麦技术大学) ; Hanoi University of Science and Technology(河内科技大学) ; KAIST(韩国科学技术院) ; Monash University(莫纳什大学) ; Oldenburg University(奥尔登堡大学) ; DFKI(德国人工智能研究中心) ; University of Stuttgart(斯图加特大学) ; IMPRS-IS(国际马克斯·普朗克智能系统研究学院) ; Stanford University(斯坦福大学) ; Technische Universität Darmstadt(达姆施塔特工业大学)
AI总结 本文发现VLA模型存在层间表示冗余,提出无需训练的压缩方法,通过去除冗余层将模型深度减少50%,实现40-50%训练加速和30%推理加速,性能不变。
3D-DLP:自监督3D物体中心场景表示学习
AI总结 提出3D-DLP模型,通过自监督学习将场景级RGB-D或体素观测分解为3D潜在粒子,每个粒子编码解耦属性,实现可解释的逐粒子分割图,并支持场景操控和下游机器人操作。
Comments ICML 2026. Project webpage: https://eubooks3003.github.io/3d-dlp
ImageWAM:世界动作模型真的需要视频生成,还是只需要图像编辑?
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; Eastern Institute of Technology(东方理工学院) ; Tencent Robotics X(腾讯机器人X) ; Tsinghua University(清华大学) ; Zhongguancun Academy(中关村学院)
AI总结 提出ImageWAM框架,利用预训练图像编辑模型替代视频生成进行机器人动作预测,通过编辑去噪的KV缓存作为世界动作上下文,在多个模拟和真实实验中优于基线,计算量降至1/6,延迟降至1/4。
Comments Project Page: https://zhangwenyao1.github.io/ImageWAM/
Bring My Cup! 使用视觉注意力提示个性化视觉-语言-动作模型
发表机构 * GSAI, POSTECH(POSTECH 人工智能研究所) ; IME, POSTECH(POSTECH 信息媒体研究所)
AI总结 针对VLA模型难以处理个性化指令的问题,提出无需训练的视觉注意力提示(VAP)方法,通过参考图像作为非参数记忆,利用开放词汇检测和嵌入匹配定位个人物品,并以视觉提示注入模型,在多个仿真和真实场景中显著提升成功率和正确物体操作。
Comments ICML 2026. Project page: https://vap-project.github.io/
Any2Any: 高效跨本体迁移用于人形机器人全身跟踪
发表机构 * LimX Dynamics(LimX动力学)
AI总结 提出Any2Any范式,通过运动学对齐和动力学微调,实现预训练全身跟踪模型高效迁移至新的人形机器人本体,仅需少量数据和计算即可达到竞争性跟踪性能。
Comments Project Page: https://any2any.top/
通过决策树蒸馏对学习到的多智能体通信策略进行形式化验证
发表机构 * University of Arkansas at Little Rock(阿肯色大学小石城分校)
AI总结 提出通过决策树蒸馏将多智能体强化学习策略转化为可解释模型,并利用PRISM进行形式化验证,确保安全属性转移至原始网络,在无人机编队任务中实现88.9%属性满足率。
Comments 9 pages, 3 figures, 7 tables. Accepted at the 2026 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2026), Pittsburgh, Pennsylvania, USA, September 27-October 1, 2026
深度展开协调
发表机构 * Autonomous Control and Decision Systems Laboratory Georgia Institute of Technology United States(佐治亚理工学院自主控制与决策系统实验室)
AI总结 提出Deep Coordinator框架,通过深度展开ADMM-DDP迭代学习动态调整超参数,实现非凸优化器求解时自适应惩罚参数,在车队和四旋翼仿真中速度提升6.18-9.44倍且可扩展至8倍规模。
Comments The second and third authors contributed equally (equal second authorship). 35 pages (10 pages main text), 17 figures, 3 tables
一种用于机器人移动履行系统高效路径规划的神经形态强化学习框架
发表机构 * The Hong Kong University of Science and Technology (Guangzhou)(香港科技大学(广州)) ; JD Explore Academy(京东探索研究院)
AI总结 提出SDQN-RMFS框架,通过ANN到SNN的转换和硬标签知识蒸馏,在神经形态芯片上实现超低功耗路径规划,相比GPU能耗降低11281倍,延迟减少近一半。
不完美感知下的移动目标搜索:一种部分可观测随机博弈论方法
发表机构 * Shanghai Research Institute for Intelligent Autonomous Systems, Tongji University(同济大学上海自主智能无人系统科学中心) ; Department of Control Science and Engineering, Tongji University(同济大学控制科学与工程系)
AI总结 针对传感器限制、恶意干扰或通信噪声导致的不完美感知,采用部分可观测随机博弈(POSG)框架建模搜索者与目标间的对抗互动,提出可检测性概念和基于随机递归分析的充分判据,并开发服务器辅助分布式算法。
基于测距的移动机器人团队相对定位的无基础设施、控制无关解决方案
发表机构 * Department of Industrial Engineering, University of Trento(特伦托大学工业工程系) ; Department of Information Engineering and Computer Science, University of Trento(特伦托大学信息工程与计算机科学系)
AI总结 提出一种无锚点、完全去中心化的协作定位算法,仅依赖局部里程计、稀疏测距和短程通信,无需控制机器人运动即可实现团队可观测性,采用多假设贝叶斯框架保证鲁棒性。
通过多智能体强化学习实现超人类安全且敏捷的赛车
发表机构 * Robotics and Perception Group, University of Zurich(苏黎世大学机器人与感知组) ; Google DeepMind(谷歌深Mind) ; Nomagic
AI总结 本文提出通过多智能体强化学习在高速四旋翼赛车中实现安全且敏捷的性能,展示了多智能体交互对真实世界交互安全性的关键作用,同时在高速赛车中超越人类飞行员并减少碰撞率。
Comments 12 pages (+4 supplementary). Website: https://rpg.ifi.uzh.ch/marl
扩展端到端驾驶的自我对弈
发表机构 * Mila(米拉研究所) ; Université de Montréal(蒙特利尔大学) ; Polytechnique Montréal(蒙特利尔理工学院) ; Torc Robotics ; NYU Tandon School of Engineering(纽约大学坦登工程学院) ; McMaster University(麦克马斯特大学) ; Princeton University(普林斯顿大学)
AI总结 提出大规模自我对弈训练策略,通过高效模拟器Gigapixel实现像素级自我对弈,结合DAgger蒸馏和感知适应,提升端到端驾驶模型性能。
阿克曼转向机器人在未映射环境中的安全局部导航
发表机构 * McMaster University(麦克马斯特大学)
AI总结 提出一种控制框架,通过局部障碍物检测确定最安全航向角,构建边界线并优化车辆-障碍物间距,实现阿克曼转向机器人在无全局目标环境中的安全局部导航。
Comments Presented at the 23rd Conference on Robots and Vision (CRV 2026)
Journal ref Proc. 23rd Conference on Robots and Vision (CRV), 2026
一种可微复合近似框架:基于海试数据的自主水下航行器机动建模
发表机构 * College of Shipbuilding Engineering, Harbin Engineering University(哈尔滨工程大学船舶工程学院) ; China Academy of Aerospace Aerodynamics(中国航天空气动力技术研究院) ; Institute of Artificial Intelligence, Shanghai University(上海大学人工智能研究院) ; China Ship Scientific Research Center(中国船舶科学研究中心)
AI总结 提出可微复合近似框架,结合多项式基与数据自适应基联合校准,并引入转向运动电流估计补偿,提升AUV机动预测精度。
World Engine:迈向自动驾驶后训练时代
AI总结 提出World Engine生成式框架,通过从真实日志重建高保真交互环境并外推安全关键变体,利用强化后训练对齐策略与安全约束,显著减少罕见安全关键场景故障,提升自动驾驶安全性。
Comments Technical Report. Project Page: https://opendrivelab.com/WorldEngine/
多旋翼无人机状态估计中的电机角速度预积分
AI总结 针对无人机振动导致IMU精度下降的问题,提出基于电机转速加速度预积分的方法,替代IMU进行状态传播,并构建因子用于图优化,结合LiDAR形成MAS-LO算法,相比LIO-SAM位置精度提升28%,速度精度提升65%。
多模态不确定性下基于优先级排序STL规范的自动驾驶
发表机构 * Eindhoven University of Technology(埃因霍温理工大学)
AI总结 提出一种不确定性感知的轨迹规划框架,通过信号时序逻辑的词典序优先级处理冲突目标,并结合模型预测路径积分控制实现,在仿真中验证了有效性。
强化孪生用于扑翼无人机的混合控制
发表机构 * Environmental and Applied Fluid Dynamics, von Karman Institute for Fluid Dynamics(环境与应用流体动力学,冯·卡门流体动力学研究所) ; Department of Mechanical Engineering, Vrije Universiteit Brussel(机械工程系,自由大学布鲁塞尔) ; Department of Electromechanical, Systems and Metal Engineering, Ghent University(机电系统与金属工程系,根特大学) ; Aero-Thermo-Mechanics Laboratory, École Polytechnique de Bruxelles, Université Libre de Bruxelles(航空热力学力学实验室,布鲁塞尔理工学院,自由大学布鲁塞尔) ; Experimental Aerodynamics and Propulsion Lab, Universidad Carlos III de Madrid(实验空气动力学与推进实验室,马德里卡洛斯三世大学)
AI总结 提出一种混合无模型/基于模型的扑翼无人机控制方法,通过强化孪生算法结合强化学习与自适应数字孪生,利用迁移学习和策略裁判提升样本效率与控制鲁棒性。
95毫克昆虫尺度扑翼飞行机器人的模型参考自适应飞行控制
发表机构 * Washington State University(华盛顿州立大学)
AI总结 针对昆虫尺度扑翼飞行机器人参数不确定性和扰动问题,提出模型参考自适应控制(MRAC)架构,结合混合乘性扩展卡尔曼滤波,实现高精度位置控制,并通过95毫克机器人实验验证了悬停和轨迹跟踪性能。
Comments Under review, 8 pages, 7 figures
集成探索感知的无人机路径优化与轨迹规划
发表机构 * Department of Aerospace Engineering, University of Michigan(密歇根大学航空航天工程系) ; Department of Electrical Engineering, Brigham Young University(BYU 电子工程系) ; Department of Aerospace Engineering, Department of Civil and Environmental Engineering, and Department of Industrial and Operations Engineering, University of Michigan(密歇根大学航空航天工程系、土木与环境工程系和工业与运营管理工程系)
AI总结 提出一种集成探索感知的无人机路径优化与轨迹规划框架,通过风险地图、不确定兴趣区域建模、B样条轨迹优化和在线重规划,在灾害监测中平衡报告点访问与新信息探索,实现平均KL散度降低15.9%。
自动驾驶中基于反事实分析的自监督相关性建模
发表机构 * Networked Systems Lab, Universidad Miguel Hernandez de Elche(网络系统实验室,米格尔·希内斯·埃尔切大学)
AI总结 提出一种基于反事实分析的自监督方法,用于量化自动驾驶中物体的相关性,实现毫秒级实时估计,并生成相关性热图以辅助感知与规划。
类别增量运动预测
发表机构 * Department of Computer Science, University of Freiburg, Germany(弗赖堡大学计算机科学系) ; Qualcomm SARL France(法国.qualcomm SARL) ; Automated Driving, Qualcomm Technologies, Inc.(qualcomm Technologies, Inc. 自动驾驶部门)
AI总结 提出类别增量运动预测新任务,通过端到端框架结合伪标签与开放词汇分割,利用3D-2D投票机制和查询特征方差重放策略,缓解灾难性遗忘并适应新类别。
Comments V3: Change title. Add further experiments
过驱动飞行器的可解释控制效能学习与非线性控制分配集成方法
发表机构 * University of Stuttgart, Faculty of Aerospace Engineering and Geodesy, Institute of Flight Mechanics and Control (iFR)(斯图加特大学航空航天工程与大地测量学院飞行力学与控制研究所)
AI总结 提出一种基于稀疏非线性动力学辨识的学习控制效能映射方法,结合在线自适应机制,实现过驱动飞行器的高效非线性控制分配,兼具可解释性和低计算成本。
CoLI: 通过整体3D打印和同构遥操作实现连续体机器人学习的可复现平台
AI总结 提出一种基于多材料3D打印和同构遥操作的连续体机器人平台,简化制造流程并实现无奇异映射控制,支持模仿学习自主控制,通过硬件表征和操作任务验证其可复现性和学习就绪性。
Comments 8 pages, 7 figures, 1 table, accepted by IROS2026
磁驱动导管集中弯曲的刚度优化:在梯度刚度下保持可操控性
发表机构 * Harbin Institute of Technology (Shenzhen)(哈尔滨工业大学(深圳)) ; The Chinese University of Hong Kong(香港中文大学) ; Macao Polytechnic University(澳门理工学院)
AI总结 针对磁驱动软导管在推送性与近端集中弯曲之间的权衡,提出一种刚度优化的多段磁驱动导管(SO-MAC),通过解耦转向-推进机构和梯度刚度架构,在推进过程中实现稳定的近端枢轴弯曲,同时远端被动自直以传递推进力。
由四杆机构组成的双稳态四边网
发表机构 * University of Innsbruck, Department of Basic Sciences in Engineering Sciences(因斯布鲁克大学工程科学基础科学系) ; Seoul National University, Robotics Laboratory(首尔国立大学机器人实验室)
AI总结 研究由空间四杆机构组成的双稳态机械结构,通过Study二次曲面解释并利用Whiteley去平均化从柔性四边网构造,无需数值优化即可控制几何参数。
Physical Atari: 一个用于机器人实时强化学习的鲁棒且可访问的平台
AI总结 提出Physical Atari平台,通过机器人操作Atari控制器和实时渲染游戏帧,实现物理世界中的强化学习研究,验证了算法可直接在机器人上学习,并指出分布偏移会显著降低策略性能。
Comments To appear at RLC 2026
WorkBenchMark:面向智能制造联盟的基于乐高积木的装配基准与通过拆卸进行装配的基线方法
发表机构 * Chair of Machine Learning and Reasoning (i6), RWTH Aachen University(亚琛工业大学机器学习与推理教席(i6)) ; MASCOR Institute, FH Aachen University of Applied Science(亚琛应用技术大学MASCOR研究所)
AI总结 提出一个基于乐高Duplo的机器人装配基准,包含400个任务和四个复杂度层级,并提供一个基于规划的基线方法,在所有层级上优于现代视觉-语言-动作方法。
Comments RoboCup Symposium 2026 accepted paper
模拟沙地中的机器人运动:开源物理引擎中的阻力理论
发表机构 * Case Western Reserve University(凯斯西储大学) ; University of Vermont(佛蒙特大学)
AI总结 将三维颗粒阻力理论(3D RFT)集成到MuJoCo物理引擎中,实现沙地行走模拟,验证了足端形状、速度和负载对运动的影响,并在六足机器人实验中预测行走距离和沉陷误差在20%以内。
Comments 12 pages, 7 figures
ForEnt: 用于表征四足机器人在森林环境中被困的多模态数据集
发表机构 * University of Southampton(南安普顿大学)
AI总结 针对四足机器人在森林中因植被缠绕而倾覆的问题,提出多模态数据集ForEnt,包含RGB-D、LiDAR、本体感知和第三人称视频,记录69次被困事件,支持可重复的基准测试。
Comments 8 pages, 7 figures
人形机器人数据标准:物理AI缺失的基础设施
AI总结 本文论证数据标准是人形机器人可扩展性的关键基础设施,通过提出ISO/WD 26264-1标准,解决数据非累积性问题,使具身经验可解释、可共享、可追溯和可复用。
TIDY: 基于小波域熵和方向条纹指数的热红外图像去噪
发表机构 * Dept. of Mechanical Engineering, SNU(首尔大学机械工程系)
AI总结 提出轻量级小波域去噪器TIDY,利用真实噪声数据训练,通过小波熵和方向条纹指数损失项抑制随机噪声和条纹伪影,在室内恶劣条件下提升热红外图像质量及下游机器人任务性能。
Pose6DAug: 用于机器人数据增强的物理合理多视图物体替换
AI总结 提出Pose6DAug,一种基于失败驱动的数据增强框架,通过3D网格和6D姿态轨迹替换成功轨迹中的物体,生成多视图一致的物理合理演示,无需额外数据收集,在新型物体上提升VLA策略成功率16.5%。
高效连接真实场景与合成数据生成以支持基于AI的认知机器人和计算机视觉应用
发表机构 * Fraunhofer IPK(弗劳恩霍夫生产设备和设计技术研究所) ; TU Berlin(柏林工业大学)
AI总结 本文讨论当前AI视觉模型在认知机器人应用中的局限,并提出通过连接仿真与真实世界训练数据生成来弥合领域差距的方法。
Comments Accepted and best paper award at MHI-Kolloquium 2024
TaCauchy:面向视觉触觉仿真的可扩展有限元框架
发表机构 * Shenzhen International Graduate School, Tsinghua University(清华大学深圳国际研究生院) ; Huawei Inc.(华为技术有限公司)
AI总结 提出TaCauchy框架,基于UIPC求解器在Isaac Sim中集成有限元法,直接计算柯西应力张量并投影为接触力,实现高保真触觉仿真,支持多种传感器,物理验证SSIM>0.93。
Comments Accepted to IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), 2026
HilDA:利用扩散的分层蒸馏推进自监督LiDAR预训练
发表机构 * KTH Royal Institute of Technology(瑞典皇家理工学院) ; Linköping University(林雪平大学) ; TRATON AB(TRATON公司) ; Qualcomm Auto Ltd Sweden Filial(高通汽车有限公司瑞典分公司)
AI总结 提出HilDA框架,通过分层蒸馏(多层蒸馏和全局上下文蒸馏)结合时间占用扩散目标,自监督预训练LiDAR骨干网络,在3D检测、场景流和语义占用预测任务上达到最先进水平。
Comments Accepted to ECCV 2026. Maciej and Jesper contributed equally
Humanoid Everyday:面向开放世界人形机器人操作的综合机器人数据集
发表机构 * University of Southern California(南加州大学) ; Toyota Research Institute(丰田研究院)
AI总结 提出Humanoid Everyday数据集,包含10.3k轨迹、260个任务的多模态数据,用于人形机器人灵巧操作、人机交互和移动操作研究,并配套云评估平台。
学习标注延迟和误报AEB事件:针对极端类别不平衡和非对称标签噪声的实用系统
发表机构 * Li Auto(理想汽车)
AI总结 提出首个自动化AEB标注框架,通过特定数据增强和噪声抑制技术,解决极端类别不平衡和非对称标签噪声问题,将延迟/误报触发召回率提升80%,人工工作量减少50%。
Comments 8 pages, 5 figures, accepted by IEEE International Conference on Robotics and Automation (ICRA)
Journal ref 2026 IEEE International Conference on Robotics and Automation (ICRA)
UniMM:一种用于多智能体仿真的统一混合模型框架
发表机构 * Zhejiang University(浙江大学) ; Horizon Robotics
AI总结 提出UniMM框架统一回归混合模型与离散NTP模型,通过闭环样本生成缓解分布偏移,并在WOSAC基准上取得最优性能。
Comments Accepted author manuscript. The version of record has been published in IEEE Transactions on Pattern Analysis and Machine Intelligence
Journal ref IEEE Transactions on Pattern Analysis and Machine Intelligence, Early Access, 2026
世界模型批判:一种用于世界建模的生成式潜在预测架构
AI总结 本文从心理学“假设性思维”出发,提出世界模型的核心目标是模拟真实世界的所有可行动可能性,并设计了一种基于状态化、分层、多级、混合连续/离散表示的生成式潜在预测(GLP)架构。
pdSTL: 面向随机系统的概率可微信号时序逻辑
发表机构 * Oklahoma State University(俄克拉荷马州立大学)
AI总结 提出pdSTL框架,将概率语义与可微鲁棒性结合,通过区间值概率语义和LSTM式展开实现线性时间可微监控,在障碍物规避、换道和真实四旋翼飞行实验中优于确定性可微STL。
通过可微可达性实现非线性系统的安全、实时主动模型辨识与故障诊断
发表机构 * Institute of Robotics and Intelligent Machines (IRIM), Georgia Institute of Technology(佐治亚理工学院机器人与智能机器研究所) ; Department of Aerospace Engineering, University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校航空航天工程系)
AI总结 针对不确定非线性系统,提出一种基于可微可达性近似的实时主动故障诊断算法,通过优化控制输入使输出集分离,在保证安全的同时实现快速模型辨识。
Fail-RAG:一种基于检索增强生成的机器人故障识别框架
发表机构 * Hitachi America, Ltd.(日立美国有限公司)
AI总结 提出Fail-RAG框架,利用检索增强生成和视觉语言模型,通过嵌入故障图像和上下文信息并查询数据库,实现机器人操作故障的高效检测,在仓库自动化任务中平均检测准确率提升25个百分点。
Tri-Info: 基于信息论的VLA模型可泛化、可解释的故障预测
发表机构 * InfoBodied AI Lab, The University of Hong Kong(香港大学信息具身人工智能实验室) ; HKU Musketeers Foundation Institute of Data Science(香港大学赛马会数据科学研究院)
AI总结 提出Tri-Info方法,通过信息论信号捕捉动作多样性、时间一致性和状态耦合,实现跨架构、环境及仿真到现实的零样本故障检测,准确率达83%。
ARC:自适应鲁棒联合状态与协方差估计
AI总结 提出统一块坐标下降框架,结合自适应鲁棒损失、迭代重加权最小二乘状态更新和最小加权协方差行列式估计器,实现离群值下状态与协方差的自适应联合估计。
Comments Submitted to information IEEE Robotics and Automation Letters (RA-L), June 2026. 8 pages, 7 figures, 1 table
基于仿真学习的多臂腹腔镜手术机器人碰撞感知操作的神经最小距离估计
发表机构 * Surgical Performance Enhancement and Robotics (SuPER) Centre, Department of Surgery(外科性能增强与机器人中心(SuPER)中心,外科部) ; The Wilfred and Joyce Posluns Centre for Image Guided Innovation & Therapeutic Intervention (PCIGITI)(威廉与乔伊斯·波斯伦中心(PCIGITI)影像引导创新与治疗干预中心) ; The Hospital for Sick Children (SickKids)(儿童医院(SickKids))
AI总结 提出结合分析建模、实时仿真与深度残差神经网络的框架,用于多臂手术机器人最小距离估计与碰撞预警,模型在验证集上R²=0.940,RMSE=42.0 mm。
Journal ref Sensors 2026, 26(12), 3744
自主组件集合的范畴与层论语义
AI总结 针对自主组件集合语言SCEL,提出基于范畴论和层论的多层数学模型,将机器人社会建模为拓扑空间上的层,通过层上同调量化系统故障,将分布式系统验证转化为几何分析。
面向空间自主性的智能体自动研究:用于航空航天控制问题的可审计、LLM驱动的研究代理
发表机构 * Department of Aeronautics and Astronautics(航空航天学系)
AI总结 提出AutoResearch框架,利用大语言模型作为离线研究代理,自动迭代开发航天控制策略,并通过内置可信层审计结果,消除种子噪声影响,在交会和对接问题上验证了有效性。
Token 是群元素:关于矩阵李群上的李代数注意力
发表机构 * New Jersey Institute of Technology(新泽西理工学院)
AI总结 提出李代数注意力机制,将token定义为矩阵李群元素,利用相对位姿的李代数范数作为注意力分数,无需学习核函数或表示论工具,适用于仿射全帧群等非紧致非阿贝尔群。
Comments preprint, 19 pages, 3 figures
机器人运动基元:综合综述
发表机构 * Department of Computer Science and Engineering, The University of Texas at Arlington, Arlington, USA(计算机科学与工程系,德克萨斯理工大学阿灵顿分校,阿灵顿,美国)
AI总结 综述机器人运动基元框架,涵盖从人类示教中编码轨迹的方法,分析弹簧-阻尼系统、概率耦合、神经网络等特性,并讨论应用与挑战。
Comments 105 pages, 3 figures, and 6 tables
发表机构 * Department of Aerospace Engineering, Iowa State University(航空航天工程系,爱荷华州立大学)
Journal ref AIAA 2026 Region V Student Conference, AIAA 2026-108993
发表机构 * Institute of Systems and Technologies for Sustainable Production (ISTePS)(可持续生产系统与技术研究所) ; Department of Innovative Technologies (DTI)(创新技术系) ; University of Applied Science and Arts of Southern Switzerland (SUPSI)(瑞士南部应用科学与艺术大学) ; Istituto Dalle Molle di studi sull’intelligenza artificiale (IDSIA)(达莫尔智能研究 institute) ; Department of Mechanical Engineering(机械工程系) ; Politecnico di Milano (PoliMi)(米兰理工学院) ; Faculty of Informatics(信息学院) ; Università della Svizzera Italiana (USI)(瑞士意大利大学)