Real-Time Anomaly Detection for Streaming Analytics
实时流分析中的异常检测
AI总结 本文提出基于Hierarchical Temporal Memory算法的实时异常检测方法,通过流数据实时处理与学习实现预测,在金融指标和NAB基准测试中均取得最佳性能。
实时流分析中的异常检测
AI总结 本文提出基于Hierarchical Temporal Memory算法的实时异常检测方法,通过流数据实时处理与学习实现预测,在金融指标和NAB基准测试中均取得最佳性能。
在确定性系统中通过价值函数泛化实现高效的强化学习
AI总结 本文提出OCP算法,通过优化约束传播实现高效探索和价值函数泛化,在有限时间 horizon 确定性系统中实现最优动作选择,并提供效率和渐进行为保证。
混合策略用于受约束的随机最优控制
AI总结 本文提出混合策略用于受约束的随机最优控制,证明随机化控制输入在非凸优化问题中可降低成本,等于对偶间隙,并提出基于对偶优化的高效求解方法。
Comments 11 pages. 9 figures.Preliminary version of a working journal paper
基于最近邻的稀疏连接移动体 rendezvous
AI总结 本文提出一种收敛的最近邻控制协议,用于非平凡动力学的移动体。协议保证即使每个体仅与单个最近邻通信,也能收敛到共同点。最近邻需位于任意小的优先区外,协议由两层结构组成,第一层为一阶动力学提供 rendezvous 信号,第二层将信号转换为适合现实体的控制信号。
通过Bootstrap DQN进行深度探索
AI总结 本文提出Bootstrap DQN算法,通过随机价值函数实现高效探索,提升复杂环境中的学习速度和性能,尤其在Atari游戏中表现优异。
基于多变量样条的近似动态规划在自适应控制中的应用
AI总结 本文提出基于RLSTD算法和多变量简单样条的SDP框架,引入局部遗忘因子以保持样条连续性,通过实验展示SDP在跟踪时变系统和提升控制性能方面的优势。
Comments 23 pages
一种谐波势场方法用于通用无人机平台的同时规划与控制
AI总结 本文提出利用谐波势场方法实现多种无人机的同时规划与控制,通过生成密集参考速度场调节无人机速度,确保其向目标点移动并满足行为约束。
无乘法器16点DCT近似用于低复杂度图像和视频编码
AI总结 本文提出一种无需乘法和位移操作的16点近似DCT变换,通过矩阵分解快速算法仅需44次加法,实现了最低的算术成本,并在图像和视频编码中表现出最佳的成本效益比。
Comments 12 pages, 5 figures, 3 tables
在向量成本的Stackelberg随机博弈中可接近性的研究
AI总结 本文提出在动态变化环境中多目标优化问题中,针对向量成本的Stackelberg随机博弈的可接近性策略,并设计了计算可行的算法和强化学习方法。
Comments 18 Pages, Submitted to Dynamic Games and Applications
协同总变分:向量总变分模型的通用框架
AI总结 本文提出协同总变分(CTV)模型,通过不同维度的范数测量颜色图像张量的平滑性,探讨其理论性质和应用效果,实验比较了多种CTV方法在去噪、去模糊和修复等逆问题中的性能。
通过数据关联意识的信念空间规划实现鲁棒的主动感知
AI总结 本文提出一种结合数据关联推理的信念空间规划方法,以应对定位不确定性和感知模糊环境中的挑战,通过设计新的成本函数提升主动解歧能力。
肌骨机器人中的自组织控制
AI总结 本文提出了一种自组织控制方法,通过无功能控制器实现机器人与环境的动态交互,展示了其在肌肉驱动臂肩系统中的自组织行为及与物体动态的共振效应。
Comments 11 pages, 4 figures, 1 table
受限离散不变性与自同步用于双足机器人稳定行走
AI总结 本文研究了双足机器人稳定行走的低维子流形不变性,提出自同步概念,通过3D线性倒立摆模型分析,扩展至9自由度双足机器人,验证渐近稳定行走的可行性。
Comments Conference
智能微电网中的辅助能源管理
AI总结 本文研究了通过正向合同缓解竞争需求导致的服务中断问题,设计了基于策略的经纪人并利用神经网络实现学习经纪人,以降低赔付成本并提高整体利润。
利用结构回收随机性以实现子线性时间核展开
AI总结 本文提出通过结构矩阵近似各种核函数的方法,扩展了快速食品构造,并通过理论分析和实验验证了结构化矩阵在提升核方法性能中的有效性。
低秩张量补全:黎曼流形预条件方法
AI总结 本文提出了一种基于黎曼流形预条件的方法用于具有秩约束的张量补全问题,通过引入新的黎曼度量利用最小二乘结构和Tucker分解的对称性,开发出预条件非线性共轭梯度和随机梯度下降算法,实验表明其在不同数据集上优于现有方法。
Comments The 33rd International Conference on Machine Learning (ICML 2016). arXiv admin note: substantial text overlap with arXiv:1506.02159
强化学习中的双重鲁棒离策略价值评估
AI总结 本文提出一种双重鲁棒估计器,用于离策略价值评估,兼顾无偏性和低方差性,并在基准问题中验证其有效性。
Comments 14 pages; 4 figures; ICML 2016
多机器人搜索救援中的去中心化自主导航策略
AI总结 本文提出三种基于三角网格模式的算法,用于多机器人搜索任务,通过数学证明算法收敛性,并通过仿真和实验验证其有效性,同时探讨了去中心化编队形成与障碍物避让问题。
Comments arXiv admin note: substantial text overlap with arXiv:1402.5188 by other authors
无线系统中的无线电变换网络:用于学习同步的注意力模型
AI总结 本文提出利用空间变换网络和新无线电领域适应的变换,引入学习注意力模型以提升调制识别的准确率,通过优化分类精度、稀疏表示和正则化实现信号同步与归一化。
Comments 5 pages, 8 figures
行为组合的监督控制
AI总结 将AI中的行为组合合成任务与离散事件系统领域的监督控制理论联系起来,通过协调可用行为实现目标模块,利用离散事件系统的理论基础和工具。
通过双臂机械手实现折叠组装
AI总结 本文提出一种适用于双臂机械手的折叠组装基本操作,用于更高层次的组装策略。通过实验验证了该方法在两个部件接触时的可行性。
Comments 7 pages, accepted for ICRA 2016
基于自由端点参数轮廓的图像分割与修复
AI总结 本文提出一种新型自由端点主动轮廓方法,通过离散化穆恩-沙赫功能实现图像分割与修复,结合曲线法向流动和端点切向流动演化规律,采用参数化轮廓与边缘保持去噪实现快速分割与修复。
一种短路径问题的近似算法
AI总结 本文提出了一种改进的近似算法,将短路径问题的解的质量保证从3.04降低到2.04,通过实验证明了该方法的有效性。
逆强化学习与奖励和动态的同时估计
AI总结 本文提出一种基于梯度的逆强化学习方法,同时估计系统动态和奖励函数,提升了样本效率和估计准确性。
Comments accepted to appear in AISTATS 2016
在协同操作任务中实现触觉通信:一种统计状态机模型
AI总结 本文通过轻量化条件下的机械臂实验,探讨物理人机交互中的时间基通信机制,提出统计状态机模型并验证其与人类交互性能的接近性。
在马尔可夫决策过程中的信息处理约束与模型不确定性规划
AI总结 本文提出考虑模型不确定性的马尔可夫决策过程规划方法,通过信息论原理统一解决信息处理约束问题,结合广义变分原理推导价值迭代方案,并在网格世界模拟中验证其有效性。
Comments 16 pages, 3 figures
各向异性网格自适应用于图像表示
AI总结 本文提出基于各向异性网格自适应的GPRAMA方法,通过改进的网格拼接技术实现更高质量的图像表示,同时降低计算成本。
Comments 25 pages, 15 figures
关于超光谱图像分割的距离、路径和连接
AI总结 本文提出η和η连接以增强λ-平坦区的区域信息,通过自顶向下的方法实现更精细的分割。
关于基于ICP的扫描匹配技术的协方差
AI总结 本文研究了ICP算法计算旋转变换协方差的问题,指出点到点版本的ICP应用会导致错误协方差,通过数学证明验证点到平面版本的正确性。
Comments Accepted at 2016 American Control Conference
在线学习采样
AI总结 本文提出AW-SGD算法,通过在线学习优化采样策略,提升在线优化效率,应用于图像分类、矩阵分解和强化学习。
Comments Update: removed convergence theorem and proof as there is an error. Submitted to UAI 2016