Tangent-Space Regularization for Neural-Network Models of Dynamical Systems
神经动力系统模型中的切空间正则化
发表机构 * LCCC Linnaeus Center(LCCC 林纳尤斯中心)
AI总结 本文提出神经网络动力系统模型的切空间正则化方法,通过利用动力学函数的切空间特性,改进模型雅可比矩阵的正则化,减少对大量训练数据的依赖,并探讨不同网络架构对输入输出雅可比矩阵学习能力及L2正则化对系统稳定性的影响。
神经动力系统模型中的切空间正则化
发表机构 * LCCC Linnaeus Center(LCCC 林纳尤斯中心)
AI总结 本文提出神经网络动力系统模型的切空间正则化方法,通过利用动力学函数的切空间特性,改进模型雅可比矩阵的正则化,减少对大量训练数据的依赖,并探讨不同网络架构对输入输出雅可比矩阵学习能力及L2正则化对系统稳定性的影响。
拓展主动推断领域:感知-动作循环中的更多内在动机
发表机构 * Araya Inc.(Araya公司) ; Computational Creativity Group, Department of Computing, Goldsmiths, University of London(Goldsmiths大学计算创意小组) ; Game Innovation Lab, Department of Computer Science and Engineering, New York University(纽约大学游戏创新实验室) ; Sepia Lab, Adaptive Systems Research Group, Department of Computer Science, University of Hertfordshire(赫特福德大学计算机科学系Sepia实验室) ; Institute of Perception, Action and Behaviour, School of Informatics, The University of Edinburgh(爱丁堡大学信息学院感知、行为与行为研究所)
AI总结 本文探讨主动推断中是否可利用其他内在动机替代原有动机,同时保持核心机制,并通过形式化方法连接通用强化学习。
Comments 53 pages, 6 figures, 2 tables
基于高斯过程地图的可扩展三维磁场SLAM
发表机构 * Delft University of Technology(代尔夫特理工大学) ; Aalto University(阿尔托大学) ; University of Cambridge(剑桥大学)
AI总结 本文提出一种利用磁场局部异常进行三维磁场SLAM的方法,采用高斯过程模型和六边形分块映射,结合降维高斯过程回归与 Rao-Blackwellised 粒子滤波,实现高效计算和存储的SLAM算法。
Comments 11 pages, 5 figures
利用惯性传感器进行位置和姿态估计
发表机构 * Delft Center for Systems and Control, Delft University of Technology, the Netherlands(荷兰代尔夫特理工大学系统与控制中心) ; Xsens Technologies B.V., Enschede, the Netherlands(荷兰恩schede市Xsens技术公司) ; Department of Information Technology, Uppsala University, Sweden(瑞典乌普萨拉大学信息科技系)
AI总结 本文探讨了惯性传感器在位置和姿态估计中的信号处理方法,分析了不同建模选择和关键算法,如优化平滑滤波、扩展卡尔曼滤波和互补滤波,并通过实验和模拟数据验证其性能。
Comments 90 pages, 38 figures
深度核学习的代表定理
发表机构 * Institute for Numerical Simulation, University of Bonn(数值模拟研究所,波恩大学) ; Fraunhofer Institute for Algorithms and Scientific Computing SCAI(算法与科学计算弗劳恩霍夫研究所SCAI)
AI总结 本文为深度核学习中的函数拼接提供了有限和无限样本的代表定理,为分析基于函数组合的机器学习算法提供数学基础,并展示了如何将拼接的机器学习问题转化为神经网络,并应用于最新深度学习方法。
AutoRally:一个用于激进自动驾驶的开放平台
发表机构 * Georgia Tech Autonomous Racing Facility(佐治亚理工学院自动驾驶赛车中心)
AI总结 本文介绍了一个1:5比例的机器人测试平台AutoRally,旨在提供稳健、易用和可重复的自动驾驶研究环境,使非专业人员也能收集真实世界的数据。
在多维动作空间中高效的策略梯度熵
发表机构 * New York University(纽约大学) ; New York University Abu Dhabi(纽约大学阿布扎克分校) ; New York University Shanghai(纽约大学上海分校) ; Massachusetts Institute of Technology(麻省理工学院)
AI总结 本文提出高效计算高维动作空间策略梯度熵的方法,通过改进的无偏估计器提升探索效率,在多猎手多兔子网格游戏和多智能体多臂老虎机问题中验证了其有效性。
对抗性判别仿真到现实的视觉-运动策略转移
发表机构 * Australian Centre for Robotic Vision (ACRV)(澳大利亚机器人视觉中心) ; Queensland University of Technology (QUT)(昆士兰技术大学) ; Monash University(墨尔本大学)
AI总结 本文提出对抗性判别仿真到现实转移方法,减少现实数据标注成本,在桌面上物体抓取任务中,通过视觉观测控制7自由度机械臂在障碍物中抓取蓝色立方体,仅需93个标注和186个未标注图像即可实现97.8%的成功率和1.8厘米的控制精度。
Comments Under review for the International Journal of Robotics Research
快速K均值聚类的安德森加速方法
发表机构 * University of Science and Technology of China(中国科学技术大学) ; Cardiff University(卡迪夫大学)
AI总结 本文提出了一种加速K均值聚类Lloyd算法的新方法,通过将Lloyd算法的分配和更新步骤视为固定点迭代,并应用安德森加速技术,动态调整参数m以实现鲁棒且一致的加速效果。
基于图形模型的图像标注:利用Wasserstein消息与几何分配
发表机构 * Image and Pattern Analysis Group, Heidelberg University, Germany(海德堡大学图像与模式分析组) ; Heidelberg Collaboratory for Image Processing, Heidelberg University, Germany(海德堡图像处理协同实验室)
AI总结 本文提出基于离散图模型的最大后验推断新方法,利用局部Wasserstein距离近似目标函数并实现并行收敛。
自主热力上升作为部分可观测马尔可夫决策过程(扩展版本)
发表机构 * Australian National University(澳大利亚国立大学) ; Microsoft Research(微软研究院)
AI总结 本文提出将自主热力上升建模为POMDP,并设计基于此的递推地平线控制器,通过在ArduPlane中实现并对比现有方法,验证了其在多架sUAV同时热力上升时的显著优势。
简单且实用的ℓp-范数低秩近似算法
发表机构 * IBM T.J. Watson Research Center(IBM T.J. 巴特利特研究中心) ; Rice University(里士满大学)
AI总结 本文提出基于梯度的非凸算法,用于ℓp范数低秩近似,适用于p=1或p=∞。算法易于实现,能更快速且更精确地逼近,理论证明其可达到(1+ε)-OPT近似,且不依赖超参数。
Comments 16 pages, 11 figures, to appear in UAI 2018
非凸非局部流用于显著性检测
发表机构 * Dpt. of Mathematics, Universidad Rey Juan Carlos(数学系,雷乌恩卡洛斯大学) ; Dpt. of Mathematics, Universidad de Oviedo(数学系,奥维多大学)
AI总结 本文提出并求解了新的变分模型用于数字图像自动显著性检测,结合非局部框架和新的二次显著性检测项,用于胶质瘤在MRI-Flair图像中的分割。
小步与巨跃:用于深度学习的最小牛顿求解器
发表机构 * Visual Geometry Group, University of Oxford(视觉几何组,牛津大学)
AI总结 本文提出一种快速的二阶方法,可作为现有深度学习求解器的替代方案。该方法仅需每个迭代两次额外的前向模式自动微分操作,计算成本与两次标准前向传递相当,易于实现。方法解决了现有二阶求解器的长期问题,避免了计算Hessian矩阵的近似逆矩阵的高成本和噪声敏感性。
拟合跳跃模型
发表机构 * IMT School for Advanced Studies Lucca(IMT 高级研究学院卢塞拉分校) ; Dalle Molle Institute for Artificial Intelligence Research - USI/SUPSI(达勒莫莱人工智能研究所 - USI/SUPSI) ; Department of Electrical Engineering, Stanford University(斯坦福大学电气工程系)
AI总结 本文提出了一种新的框架,用于拟合跳跃模型序列数据,通过交替最小化损失函数以拟合多个模型参数和确定每个数据点的活跃参数集,适用于隐马尔可夫模型等主流模型。
Comments Accepted for publication in Automatica
利用Azure机器学习工作室评估医院病例成本预测模型
发表机构 * Microsoft Azure Machine Learning Studio(微软Azure机器学习工作室)
AI总结 本文提出了一种利用Azure机器学习工作室快速评估多种回归模型的工具,评估了鲁棒回归、提升决策树回归和决策森林回归在医院病例成本预测中的优势。
SLAP:通过信念空间中的动态重新规划实现物理移动机器人的同时定位与规划(在不确定性下):扩展版
发表机构 * NASA-JPL, Caltech(NASA-喷气推进中心,加州理工学院) ; Dept. of Aerospace Eng. and Amato is with the Dept. of Computer Science(航空航天工程系和计算机科学系) ; Dept. of Computer Science(计算机科学系)
AI总结 本文提出一种在不确定性环境下通过信念空间动态重新规划实现物理移动机器人同时定位与规划的方法,通过在线重新规划循环改进离线策略,有效应对环境变化和大定位误差,优于FIRM方法。
Comments 20 pages, updated figures, extended theory and simulation results
无需视觉的抓取学习
发表机构 * The Robotics Institute, Carnegie Mellon University(卡内基梅隆大学机器人研究所)
AI总结 本文提出基于触觉感知的抓取方法,通过触觉信号表征和迭代重抓取提升抓取稳定性,实验表明在无视觉信息下可有效抓取新型物体。
基于手势的人群-蜂群交互的编队控制使用解释器
发表机构 * Department of Mechanical and Aerospace Engineering, University of California at San Diego, La Jolla, CA 92093, USA(机械与航空航天工程系,加州大学圣地亚哥分校,拉古拉,CA 92093,美国)
AI总结 本文提出了一种新颖的人群-蜂群交互框架,通过手势控制蜂群形状和编队。该框架利用可穿戴臂带记录手势,通过解释器将手势转化为蜂群控制指令,结合机器学习和最优控制技术实现编队控制。
非参数随机组合梯度下降法在连续马尔可夫决策问题中的Q学习
发表机构 * University of Pennsylvania(宾夕法尼亚大学) ; U.S. Army Research Laboratory(美国陆军研究实验室)
AI总结 本文提出非参数随机组合梯度下降法用于连续马尔可夫决策问题中的Q学习,通过将贝尔曼最优性方程转化为嵌套非凸随机优化问题,并利用核诱导再生核希尔伯特空间进行参数化,最终证明算法在概率意义下收敛于问题的 stationary 点。
支持张量列车机
发表机构 * The Department of Electrical and Electronic Engineering, The University of Hong Kong(香港大学电子与电气工程系)
AI总结 本文提出支持张量列车机,通过将传统支持张量机中的秩一张量替换为张量列车,提升模型表达能力,实验验证其优于SVM和STM。
Comments 7 pages
高效 tensegrity 机器人运动的模型识别
发表机构 * Department of Computer Science, Rutgers University(计算机科学系,罗格斯大学)
AI总结 本文提出一种高效方法,利用物理引擎和贝叶斯优化框架,用于识别高维顺应性tensegrity机器人中的未知机械参数,提升运动控制精度。
CAT车辆测试平台:用于自动驾驶应用的具有闭环硬件的模拟器
发表机构 * Department of Electrical and Computer Engineering(电气与计算机工程系) ; University of Arizona(亚利桑那大学) ; Tucson, USA(美国图森市)
AI总结 本文提出CAT车辆测试平台,通过闭环硬件模拟验证仿真结果,支持自动驾驶技术研究。平台基于ROS和物理车辆模型,支持多车交互和实时数据回放,可快速验证算法性能。
Comments In Proceedings SCAV 2018, arXiv:1804.03406
基于价值函数近似集体多智能体规划的策略梯度
发表机构 * School of Information Systems(信息系统学院) ; Singapore Management University(新加坡管理大学)
AI总结 本文提出一种改进的actor-critic方法,用于优化集体决策多智能体规划问题,通过分解近似动作价值函数提升收敛速度,并在合成任务和出租车车队优化中验证了方法的有效性。
深度网络在机器人学习控制中的应用综述:从强化到模仿
发表机构 * University of Freiburg(弗赖堡大学)
AI总结 本文综述了深度学习在机器人学习控制中的应用,探讨了深度强化学习和模仿学习两大主流方法,分析了其在导航、 manipulation 任务中的应用及现实差距挑战。
Comments 19 pages, 1 figures
蒙特问题最优运输距离用于图像分类
发表机构 * Department of Engineering Design and Mathematics, Centre for Machine Vision, University of the West of England(工程设计与数学系,机器视觉中心,西英格兰大学)
AI总结 本文提出利用Wasserstein距离进行图像比较,通过求解Monge问题的高效数值方法,并用1-NN算法展示其在图像分类中的优势。
Comments 15 pages, 14 figure
通过遗传编程实现强化学习的可解释策略
发表机构 * Technical University of Munich, Department of Informatics(慕尼黑技术大学信息学院) ; Siemens AG, Corporate Technology(西门子股份公司企业技术部)
AI总结 本文提出基于模型驱动批量强化学习和遗传编程的GPRL方法,通过预存的默认状态-动作轨迹样本自动生成可解释的强化学习策略,实验表明其优于传统符号回归方法。
基于图的深度建模与稀疏时空数据的实时预测
发表机构 * Dept of Anthropology, UCLA(人类学系,加州大学洛杉矶分校) ; Dept of Math, UCLA(数学系,加州大学洛杉矶分校)
AI总结 本文提出一种通用框架,用于稀疏时空数据的建模、分析与预测,结合自激发点过程和图结构循环神经网络,实现宏微观尺度的联合建模与实时预测。
Comments 9 pages, 19 figures
基于非操控操作的强化学习:从仿真到物理系统的迁移
发表机构 * University of Washington(华盛顿大学) ; Roboti LLC(Roboti公司)
AI总结 本文提出了一种基于仿真的强化学习方法,用于非操控操作任务,通过在仿真环境中训练策略,成功迁移到物理系统中,且在模型集合训练下提升了策略的鲁棒性。
Comments Accepted at IEEE SIMPAR 2018. Project page: https://sites.google.com/view/phantomsim2real
在FPGA上使用结构化矩阵实现高效的循环神经网络
发表机构 * Department of Electrical Engineering and Computer Science, Syracuse University, USA(Syracuse大学电气工程与计算机科学系) ; Center for Energy-efficient Computing and Applications (CECA), Peking University, China(北京大学能源高效计算与应用中心)
AI总结 本文提出在FPGA上使用块循环矩阵实现RNN,以提高模型压缩和加速,实验显示比ESE提升35.7倍的能效。
Comments To appear in International Conference on Learning Representations 2018 Workshop Track