视觉与机器人
机器人 / 具身智能
机器人、具身智能、机器人学习、操作、导航和具身世界模型。
WorkBenchMark: A LEGO-Based Assembly Benchmark with an Assembly-by-Disassembly Baseline for the Smart Manufacturing League
WorkBenchMark:面向智能制造联盟的基于乐高积木的装配基准与通过拆卸进行装配的基线方法
专题命中 机器人操作 :基于乐高的机器人装配基准。
AI总结 提出一个基于乐高Duplo的机器人装配基准,包含400个任务和四个复杂度层级,并提供一个基于规划的基线方法,在所有层级上优于现代视觉-语言-动作方法。
Comments RoboCup Symposium 2026 accepted paper
TaCauchy: An Extensible FEM Framework for Vision-Based Tactile Simulation
TaCauchy:面向视觉触觉仿真的可扩展有限元框架
专题命中 机器人操作 :触觉仿真框架用于机器人操作中的力计算
AI总结 提出TaCauchy框架,基于UIPC求解器在Isaac Sim中集成有限元法,直接计算柯西应力张量并投影为接触力,实现高保真触觉仿真,支持多种传感器,物理验证SSIM>0.93。
Comments Accepted to IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), 2026
One Demo is Worth a Thousand Trajectories: Action-View Augmentation for Visuomotor Policies
一个演示胜过千条轨迹:用于视觉运动策略的动作-视角增强
专题命中 机器人操作 :提出动作-视角增强框架提升操作策略成功率
AI总结 提出一种数据增强框架,通过高斯泼溅和轨迹优化生成逼真的鱼眼图像序列和物理可行的动作轨迹,提升操作策略在场景变化和障碍物下的成功率。
Comments Project website: https://chuerpan.com/1001-demos.github.io/. Published at CoRL 2025
Journal ref Proceedings of The 9th Conference on Robot Learning, PMLR 305:3902-3914, 2025
Stiffness Optimization for Concentrated Bending in Magnetically Actuated Catheters: Maintaining Steerability under Gradient Stiffness
磁驱动导管集中弯曲的刚度优化:在梯度刚度下保持可操控性
专题命中 机器人操作 :磁驱动软导管刚度优化与操控
AI总结 针对磁驱动软导管在推送性与近端集中弯曲之间的权衡,提出一种刚度优化的多段磁驱动导管(SO-MAC),通过解耦转向-推进机构和梯度刚度架构,在推进过程中实现稳定的近端枢轴弯曲,同时远端被动自直以传递推进力。
VibeCheck: Using Active Acoustic Tactile Sensing for Contact-Rich Manipulation
VibeCheck: 使用主动声学触觉传感进行接触丰富的操作
专题命中 机器人操作 :主动声学触觉传感用于接触丰富的操作任务。
AI总结 本文构建了带有两个压电手指的主动声学传感夹爪,通过物体传递声学振动来感知其声学特性和接触状态,用于物体分类、抓取位置估计、内部结构姿态估计以及外部接触类型分类,并基于接触分类模型实现了鲁棒的插销任务。
Comments Published at IROS 2025. 8 pages, 7 figures
Bring My Cup! Personalizing Vision-Language-Action Models with Visual Attentive Prompting
Bring My Cup! 使用视觉注意力提示个性化视觉-语言-动作模型
专题命中 机器人操作 :机器人操作个人物品
AI总结 针对VLA模型难以处理个性化指令的问题,提出无需训练的视觉注意力提示(VAP)方法,通过参考图像作为非参数记忆,利用开放词汇检测和嵌入匹配定位个人物品,并以视觉提示注入模型,在多个仿真和真实场景中显著提升成功率和正确物体操作。
Comments ICML 2026. Project page: https://vap-project.github.io/
3D-DLP: Self-Supervised 3D Object-Centric Scene Representation Learning
3D-DLP:自监督3D物体中心场景表示学习
专题命中 机器人操作 :3D潜在粒子用于下游机器人操作。
AI总结 提出3D-DLP模型,通过自监督学习将场景级RGB-D或体素观测分解为3D潜在粒子,每个粒子编码解耦属性,实现可解释的逐粒子分割图,并支持场景操控和下游机器人操作。
Comments ICML 2026. Project webpage: https://eubooks3003.github.io/3d-dlp