Sim-to-Real Transfer of Robotic Control with Dynamics Randomization
机器人控制的仿真到现实转移与动力学随机化
发表机构 * OpenAI
AI总结 本文提出一种简单方法通过随机化仿真动力学来弥合现实与仿真的差距,使策略能适应不同动态,从而在无需真实系统训练的情况下实现现实世界泛化。
机器人控制的仿真到现实转移与动力学随机化
发表机构 * OpenAI
AI总结 本文提出一种简单方法通过随机化仿真动力学来弥合现实与仿真的差距,使策略能适应不同动态,从而在无需真实系统训练的情况下实现现实世界泛化。
在噪声和动态环境中组织新颖性的分类器团队
发表机构 * Graduate School of Information Science(信息科学研究生学校) ; Electrical Engineering Kyushu University Fukuoka, Japan Email(电气工程九州大学福冈日本电子邮件) ; Faculty of Information Science(信息科学学院)
AI总结 该研究提出了一种在噪声和动态环境中有效工作的分类器团队(NOTC),并通过连续动作山车问题及其变体进行验证,展示了NOTC在性能上的优势,尽管其初始化过程需要一些时间。
FastDeepIoT: 向理解和优化移动和嵌入式设备上神经网络执行时间迈进
发表机构 * University of Illinois Urbana Champaign(伊利诺伊大学厄巴纳-香槟分校) ; State University of New York at Buffalo(纽约州立大学布法罗分校)
AI总结 本文提出FastDeepIoT框架,通过揭示神经网络结构与执行时间之间的非线性关系,优化移动和嵌入式设备上执行时间与准确性的权衡,同时无需预先了解硬件规格或深度学习库的实现细节。
Comments Accepted by SenSys '18
多情境模型学习用于自主水下车辆
发表机构 * DFKI - Robotic Innovation Center(DFKI机器人创新中心) ; Robotics Research Group(机器人研究组)
AI总结 本文提出利用LSTM网络学习自主水下车辆的多情境模型,通过实验数据构建仿真模型,生成不同情境并提高分类准确性,展现对噪声的鲁棒性和大数据集的扩展能力。
Comments 6 pages, 7 figures, AUV 2018 author copy
使用扩展卡尔曼滤波在深度神经网络中进行不确定性传播
发表机构 * Massachusetts Institute of Technology(麻省理工学院) ; Department of Mathematics(数学系) ; Lincoln Laboratory Supercomputing Center(林肯实验室超级计算机中心)
AI总结 本文提出利用扩展卡尔曼滤波在深度神经网络中传播和量化输入不确定性,方法在计算效率上优于现有技术,同时自然地将模型误差纳入输出不确定性。
Comments 4 Pages, 8 figures. Accepted at MIT IEEE Undergraduate Research Technology Conference 2018. Publication pending
BaRC:机器人强化学习中的逆向可达性课程
发表机构 * Department of Mechanical Engineering, Stanford University(斯坦福大学机械工程系) ; School of Computing Science, Simon Fraser University(西蒙弗雷泽大学计算机科学学院)
AI总结 本文提出BaRC方法,利用物理先验知识设计课程方案,通过逆向可达性策略加速连续控制MDP中模型无关RL算法的训练,提升性能并减少探索需求。
具有证明鲁棒性的基于学习的方法用于拉格朗日系统高精度跟踪控制
发表机构 * Dynamic Systems Lab(动态系统实验室) ; Institute for Aerospace Studies(航空航天研究院) ; University of Toronto(多伦多大学)
AI总结 本文提出基于高斯过程的新型学习控制方法,确保系统稳定性与高精度跟踪,通过不确定性界保证鲁棒性,并在仿真和实验中验证有效性。
Comments 8 pages, 4 figures, 2 tables, submitted to IEEE Robotics and Automation Letters (RA-L) and the 2019 International Conference on Robotics and Automation (ICRA) (created: March 2018; updated: September 2018)
基于深度强化学习的机器人自动对焦系统
发表机构 * Center of Wireless Communication and Signal Processing(无线通信与信号处理中心)
AI总结 本文提出一种端到端的自动对焦方法,通过深度强化学习在视觉输入中学习对焦策略,实现自动清晰成像。方法通过离散化动作空间和应用DQN,解决自动对焦问题并推广至基于视觉的控制问题。
Comments To Appear at ICARCV 2018
在线算法用于具有连续状态、动作和观察空间的POMDPs
发表机构 * Aeronautics and Astronautics Dept. Stanford University(航空航天系 斯坦福大学)
AI总结 本文提出POMCPOW和PFT-DPW算法,通过加权粒子过滤解决连续状态空间POMDPs的求解问题,验证了改进方法的有效性。
Comments Added Multilane section
四旋翼估计
发表机构 * Brown University(布朗大学) ; Udacity, Inc.(Udacity公司) ; Fotokite(Fotokite公司)
AI总结 本文基于四旋翼模型,推导了扩展卡尔曼滤波器的推导过程,提供EKF、贝叶斯滤波和无迹卡尔曼滤波的伪代码,旨在解决四旋翼状态估计中的噪声和计算限制问题。
去中心化恒定控制:面向多智能体系统的分布驱动感知与探索
发表机构 * Neuroscience and Robotics Laboratory(神经科学与机器人实验室)
AI总结 本文提出一种去中心化恒定控制策略,用于解决多智能体非线性动态系统的时间变化区域覆盖问题,通过共识实现完全去中心化的多智能体控制政策,并展示了其在多智能体地形映射和目标定位中的应用。
Comments 8 pages, Accepted for publication in IEEE Robotics and Automation Letters
ArduSoar:一种为资源受限自动驾驶仪设计的开源热气球控制器
发表机构 * Glasgow, Scotland(格拉斯哥,苏格兰) ; Australian National University(澳大利亚国立大学) ; Microsoft Research(微软研究院)
AI总结 本文提出ArduSoar,首个集成于主流小型无人机自动驾驶软件中的热气球控制器,通过算法设计、与ArduPlane的集成及实飞测试验证其在非理想大气条件下的鲁棒性。
具有共同源图的数据集的典型相关分析
发表机构 * University of Minnesota(明尼苏达大学)
AI总结 本文提出了一种基于图正则化的典型相关分析方法(gCCA),通过引入图结构来利用共同源的知识,以提升数据融合和分类性能。
Comments 10 pages, 7 figures
具有确定性误差边界的扩散张量成像
发表机构 * Faculty of Physics, Lomonosov Moscow State University(莫斯科罗蒙诺索夫国立大学物理系) ; School of Engineering and Materials Science, Queen Mary University of London(伦敦女王玛丽大学工程与材料科学学院)
AI总结 本文在Banach格中利用偏序理论建模逆问题的误差,应用于扩散张量成像中复杂噪声建模问题,通过确定性误差边界方法简化非线性Stejskal-Tanner方程的处理。
智能工业协作机器人安全交互系统
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 本文提出一种安全交互系统,通过并行规划与控制架构提升协作机器人在动态不确定环境中的效率与安全性,实验验证了方法的有效性。
Comments 12 pages
空载合规控制的空中机械臂
发表机构 * German Aerospace Center (DLR)(德国航空航天中心)
AI总结 本文提出了一种空载合规控制方法,通过合理选择末端执行器坐标和时间域被动技术,确保空中机械臂在无动力驱动情况下实现稳定环境交互。
Comments IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS) 2018
可旋转主成分用于空间-频率局部化图像
发表机构 * Department of Applied Mathematics, School of Mathematical Sciences(应用数学系,数学科学学院)
AI总结 本文提出一种快速准确的方法,通过二维Prolate Spheroidal Wave Functions对图像进行展开,获取可旋转主成分,用于图像及其旋转的最优扩展。
基于概率学习的扭矩控制器从运动学和力约束中学习
发表机构 * Department of Advanced Robotics, Istituto Italiano di Tecnologia(意大利先进机器人研究所机器人部) ; Idiap Research Institute(Idiap研究 institute)
AI总结 本文提出一种概率方法,同时学习和合成扭矩控制命令,考虑任务空间、关节空间和力约束,通过概率学习不同扭矩控制器的相关性,结合高斯分布特性生成满足任务特征的新扭矩命令。
Comments Accepted for publication at 2018 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS)
自适应模型预测控制在变化条件下高精度轨迹跟踪中的应用
发表机构 * Dynamic Systems Lab(动态系统实验室) ; University of Toronto Institute for Aerospace Studies(多伦多大学航空航天研究 institute)
AI总结 本文提出一种结合模型预测控制与L1自适应控制器的自适应模型预测控制器,用于在未知和变化的扰动环境下提高系统轨迹跟踪性能。通过实验验证,该方法在四旋翼无人机上表现出更低的轨迹跟踪误差。
自适应图信号处理:算法与最优采样策略
发表机构 * Dept. of Engineering, University of Perugia(工程系,佩鲁吉亚大学)
AI总结 本文提出自适应图信号学习的新策略,通过分析随机采样对算法性能的影响,设计优化采样策略以提升稳态性能和收敛速度。
Comments Submitted to IEEE Transactions on Signal Processing, September 2017
一种多对比MRI方法用于丘脑分割
发表机构 * Department of Applied Mathematics and Theoretical Physics, University of Cambridge(应用数学与理论物理系,剑桥大学) ; Queensland Brain Institute, University of Queensland(昆士兰脑研究所,昆士兰大学) ; Mater Hospital, South Brisbane, Queensland, Australia(马特医院,南布里斯班,昆士兰,澳大利亚) ; Wellcome Centre for Human Neuroimaging, UCL Institute of Neurology, University College London, United Kingdom(wellcome人类神经影像中心,伦敦大学学院神经学研究所,伦敦大学学院,英国) ; German Center for Neurodegenerative Diseases (DZNE), Magdeburg, Germany(德国神经退行性疾病研究中心(DZNE),马格德堡,德国)
AI总结 本文提出一种多模态MRI分割方法,通过多对比数据提高丘脑子核分割精度,结合迭代配准、手动分割模板、监督学习和凸优化,提升分割性能与鲁棒性。
百度 Apollo EM 运动规划器
发表机构 * Baidu USA LLC(百度美国有限公司)
AI总结 本文提出基于百度 Apollo 开源自动驾驶平台的实时运动规划系统,解决工业级4级运动规划问题,兼顾安全性、舒适性和可扩展性,通过分层结构实现多车道和单车道自动驾驶。
通过深度强化学习优化绿色数据中心的冷却系统
发表机构 * School of Computer Science and Engineering, Nanyang Technological University(南洋理工大学计算机科学与工程学院) ; Bell Labs, Nokia(诺基亚贝尔实验室)
AI总结 本文提出利用数据中心监控数据优化冷却控制策略,采用深度强化学习框架设计端到端冷却控制算法,实现冷却成本降低11%的模拟平台结果及15%的实时数据节省。
通过L1自适应反馈和迭代学习实现高精度轨迹跟踪的迁移学习
发表机构 * Institute for Aerospace Studies, University of Toronto, North York, ON M3H 5T6, Canada(多伦多大学航空航天研究 institute, 北York, ON M3H 5T6, 加拿大)
AI总结 本文提出结合L1自适应控制与迭代学习控制的框架,用于在未知动态环境中实现高精度轨迹跟踪,通过迁移学习实现不同系统间的经验传递。
基于类似修正线性单元函数的区域函数网络的函数近似
发表机构 * Institute of Mathematical Sciences, Claremont Graduate University(数学科学研究所,克莱蒙特研究生大学)
AI总结 本文研究了在q维球面上的区域函数网络的近似性质,探讨了非正定激活函数的逼近特性,并建立了相应的光滑性类别和逼近性质。
Comments 18 pages, Title changed from the pervious version
基于动态偏好的激励机制组合博弈问题
发表机构 * Electrical Engineering Department, University of Washington(华盛顿大学电气工程系)
AI总结 本文提出一种多臂老虎机框架,用于在资源受限环境下匹配用户激励,结合贪心匹配、UCB算法和马尔可夫链混合时间,理论分析 regret 并通过合成和现实案例验证性能。
Comments Published as a conference paper in Conference on Uncertainty in Artificial Intelligence (UAI) 2018
对自动化决策中偏见的更广泛视角:反思认识论与动态性
发表机构 * Department of Electrical Engineering and Computer Sciences, University of California Berkeley, USA(加州大学伯克利分校电气工程与计算机科学系) ; Department of Rhetoric, University of California Berkeley, USA(加州大学伯克利分校修辞学系) ; School of Information, University of California Berkeley, USA(加州大学伯克利分校信息学院)
AI总结 本文探讨自动化决策中偏见的根源,将技术偏见视为认识论问题,新兴偏见视为动态反馈现象,强调需反思认识论并采用价值敏感设计方法改进决策系统。
Comments Presented at the 2018 Workshop on Fairness, Accountability and Transparency in Machine Learning during ICML 2018, Stockholm, Sweden
对数图像处理框架中区域的同质性:应用于区域生长算法
发表机构 * Lab. H. Curien, UMR CNRS 5516(H. Curien实验室,CNRS 5516研究单位) ; University of Strathclyde Institute of Global Public Health(斯特拉斯堡大学全球公共卫生研究所) ; International Prevention Research Institute, iPRI(国际预防研究研究所)
AI总结 本文探讨了对数图像处理(LIP)算子在评估区域同质性中的作用,提出两种新的异质性标准,改进了Revol技术以增强对比度变化的鲁棒性,减少区域生长过程中的链式效应。
神经动力系统模型中的切空间正则化
发表机构 * LCCC Linnaeus Center(LCCC 林纳尤斯中心)
AI总结 本文提出神经网络动力系统模型的切空间正则化方法,通过利用动力学函数的切空间特性,改进模型雅可比矩阵的正则化,减少对大量训练数据的依赖,并探讨不同网络架构对输入输出雅可比矩阵学习能力及L2正则化对系统稳定性的影响。
拓展主动推断领域:感知-动作循环中的更多内在动机
发表机构 * Araya Inc.(Araya公司) ; Computational Creativity Group, Department of Computing, Goldsmiths, University of London(Goldsmiths大学计算创意小组) ; Game Innovation Lab, Department of Computer Science and Engineering, New York University(纽约大学游戏创新实验室) ; Sepia Lab, Adaptive Systems Research Group, Department of Computer Science, University of Hertfordshire(赫特福德大学计算机科学系Sepia实验室) ; Institute of Perception, Action and Behaviour, School of Informatics, The University of Edinburgh(爱丁堡大学信息学院感知、行为与行为研究所)
AI总结 本文探讨主动推断中是否可利用其他内在动机替代原有动机,同时保持核心机制,并通过形式化方法连接通用强化学习。
Comments 53 pages, 6 figures, 2 tables