Guided Reinforcement Learning for Omnidirectional 3D Jumping in Quadruped Robots
为四足机器人提供全方位三维跳跃的引导强化学习
AI总结 本文提出一种引导强化学习方法,结合贝塞尔曲线与匀加速直线运动模型,提高四足机器人三维跳跃的效率和可解释性,通过仿真和实验验证了其优越性。
为四足机器人提供全方位三维跳跃的引导强化学习
AI总结 本文提出一种引导强化学习方法,结合贝塞尔曲线与匀加速直线运动模型,提高四足机器人三维跳跃的效率和可解释性,通过仿真和实验验证了其优越性。
钙钛矿-R1:一个专门领域的大型语言模型,用于智能发现前驱体添加剂和实验设计
AI总结 本研究提出Perovskite-R1,一个专门用于发现钙钛矿太阳能电池前驱体添加剂和实验设计的大型语言模型,通过系统挖掘和整理1232篇高质量科学文献,并整合33269种候选材料,构建了领域特定的指令微调数据集,从而提升材料发现的效率。
Comments 24 pages; 5 figures
治疗师-外骨骼-患者互动用于步态治疗
AI总结 本文提出了一种基于物理人机人交互(pHRHI)的步态康复新方法,通过让治疗师和中风患者均佩戴下肢外骨骼,并通过弹簧阻尼元件连接在髋膝处,实现双向互动,从而提高康复效果。
面向机器人操作的几何感知4D视频生成
AI总结 本文提出了一种几何感知的4D视频生成模型,通过跨视角点图对齐进行训练,以确保生成视频在多视角下的3D一致性,从而在单个RGB-D图像输入下生成时空一致的未来视频序列,并在不依赖相机姿态的情况下实现稳定的视觉和空间对齐预测。
Comments ICLR 2026; Project website: https://robot4dgen.github.io
CooT: 通过协调转换器学习协调上下文
AI总结 本研究提出CooT框架,通过上下文学习实现实时合作伙伴适应,解决了多智能体系统中协调不熟悉合作伙伴的挑战,其核心方法是通过观察学习对齐动作与合作伙伴意图,主要贡献是实现了在多样合作伙伴行为下的泛化能力。
Comments ICML 2026
HDTree: 用于鲁棒谱系推断的细胞层次生成建模
AI总结 本文提出HDTree,一种用于鲁棒谱系推断的生成建模框架,通过统一的层次代码库和量化扩散过程捕捉细胞层次关系,提升稳定性与可扩展性,并在通用和单细胞数据集上验证了其在谱系推断准确性、重建质量和层次一致性方面的优越性。
Comments accepted by ICML26
辅助人工智能的放射学分析用于检测牙槽骨丧失的严重程度和模式
AI总结 本研究提出了一种新型的基于人工智能的深度学习框架,利用牙内窥镜根尖放射图像自动检测和量化牙槽骨丧失及其模式,通过结合YOLOv8进行牙齿检测和Keypoint R-CNN模型识别解剖标志物,实现了对牙槽骨丧失严重程度的精确计算,并通过几何分析确定水平与角状骨丧失模式,实验结果在1000张专家标注的放射图像上达到了高准确率。
Comments This manuscript is 17 pages with 5 tables and 12 figures. The manuscript is under review at Nature Scientific Reports
通过权重稳定性实现可扩展的无监督特征选择
AI总结 本文提出了一种基于Minkowski加权k-均值的无监督特征选择方法,通过聚合不同Minkowski指数下的特征权重来识别稳定且信息丰富的特征,从而提升聚类性能。
OPeRA: 一个用于评估LLM在模拟人类在线购物行为上的表现的观察、人设、推理和行动数据集
AI总结 本文提出OPeRA数据集,用于评估LLM在模拟人类在线购物行为上的能力,通过收集真实用户在在线购物会话中的观察、人设、推理和行动,建立首个评估LLM预测特定用户下一步行动和推理的基准。
Comments ACL 2026 main
超越RLHF:对齐的统一理论框架
AI总结 本文提出了一种统一的对齐理论框架,通过将对齐视为基于成对偏好的分布学习,推导出三种新的对齐目标,并证明了它们在非渐近情况下具有O(1/n)的收敛性,为RLHF提供了理论支持。
FinTagging: 评估LLM提取和结构化财务信息
AI总结 本文提出FinTagging基准,用于评估LLM在提取和结构化财务信息方面的能力,通过分解为FinNI和FinCL两个子任务,揭示了LLM在细粒度概念链接上的局限性。
稀疏到密集:一种无损加速视频理解的LLM免费午餐
AI总结 本文提出了一种名为Sparse-to-Dense(StD)的解码策略,通过结合稀疏top-K注意力和密集全注意力模块,实现视频大语言模型(Video-LLMs)的无损加速,从而在处理长视频序列时显著提高处理速度。
Comments Accepted by ACL 2025
DexWild:面向真实场景的机器人策略的灵巧交互
AI总结 本文提出DexWild框架,通过结合人类和机器人示范数据,提升机器人在多样化环境中的泛化能力,实验表明其在未见环境中的成功率显著高于传统方法。
Comments In RSS 2025. Website at https://dexwild.github.io
面向个性化联邦智能的基础模型综述
AI总结 本文综述了基础模型在个性化联邦智能中的应用,探讨了联邦学习与基础模型的结合,提出了一种新的个性化联邦智能范式,旨在为实现人工智能个性化提供基础支持。
Comments Accepted ACM Computing Survey
通过平滑改进随机森林
AI总结 本文提出一种基于核的平滑机制,通过引入局部正则性来增强随机森林的预测性能,同时保留其自适应分区能力,特别是在数据稀缺情况下提升了预测效果。
Comments v2: Accepted manuscript. 30 pages (18 main + 12 appendix), 6 figures
镜像均场 Langevin 动力学
AI总结 本文提出镜像均场 Langevin 动力学(MMFLD),用于优化受限在 $\mathbb{R}^d$ 子集上的概率测度,并通过统一的对数 Sobolev 不等式获得连续 MMFLD 的线性收敛性保证,以及其时间-粒子离散化版本的统一时间传播混沌结果。
Comments ICML 2026
LLM-TabLogic: 通过提示引导的潜在扩散模型在合成表格数据中保留列间逻辑关系
AI总结 本文提出LLM-TabLogic方法,利用大语言模型推理捕捉表格列间的复杂逻辑关系,并通过Score-based Diffusion模型在潜在空间中生成数据,以在不需领域知识的情况下有效保持合成表格数据中的列间关系。
基于Dempster-Shafer理论的LiDAR传感器目标检测SOTIF相关用例中的不确定性表示
AI总结 本文提出了一种系统的方法,利用Dempster-Shafer理论构建判定框架,以表示LiDAR传感器目标检测中的不确定性,并通过方差敏感性分析量化和优先处理这些不确定性,以确保自动驾驶场景的安全性。
Comments submitted as extended paper of Vehicle Technology and Intelligent Transport Systems (VEHITS)2024 conference and will be published by Springer in a CCIS Series book later in 2025
协作非holonomic移动机械臂的运动规划
AI总结 本文提出了一种实时可实现的运动规划框架,用于非holonomic移动机械臂机器人在动态环境中协作运输物体。该框架通过静态无障碍区域找到从起点到目标的路径,并利用一种新颖、快速且计算轻量的椭圆技术生成路径周围的凸、静态、无障碍区域。引入了基于非线性模型预测控制(NMPC)的实时可实现规划技术,联合规划移动基底和机械臂的可行运动,并生成可行的、无碰撞的轨迹以实现协作物体运输。仿真和硬件实验验证了所提规划框架的有效性。
Comments Published in ASME Letters in Translational Robotics. This includes supplementary materials
评估合成表格数据生成中列之间的逻辑关系
AI总结 本文提出三种评估指标,用于评估合成表格数据中列间逻辑关系的保持情况,并通过实验证明现有方法在保持逻辑一致性方面存在不足,讨论了改进逻辑关系建模的可能路径。
具有查询意识的可学习图池化标记作为大语言模型的提示
AI总结 本文提出了一种名为可学习图池化标记(LGPT)的新方法,通过引入可学习参数作为大语言模型中的标记,解决节点级投影的可扩展性和图级投影信息丢失的问题,并通过早查询融合技术提升图嵌入效果,在GraphQA基准测试中实现了4.13%的性能提升。
无需训练的零样本时序动作检测与视觉-语言模型
AI总结 本文提出一种无需训练的零样本时序动作检测方法FreeZAD,利用现有的视觉-语言模型直接对未标记视频中的未知活动进行分类和定位,无需额外微调或适应,并通过LogOIC和频率基于的动作校准以及测试时适应策略提升性能。
语义解耦与组合用于具有高效LLM推理和生成扩散的通用图像编码
AI总结 本文提出UniCodec,一种基于语义解耦和组合生成的通用图像编码框架,通过高效LLM推理和生成扩散模型实现人类和机器需求的统一压缩,无需重新训练。
GUIDE-VAE:利用用户信息和模式词典推进数据生成
AI总结 本文提出GUIDE-VAE,一种基于用户嵌入和模式词典的生成模型,通过整合用户信息和复杂特征依赖性,提升多用户数据集下的生成性能和样本真实性。
LightTransfer: 你的长上下文LLM实际上是一个具有轻松适应能力的混合模型
AI总结 本文提出LightTransfer方法,通过将LLaMA等模型转换为混合架构,实现更高效的生成,实验表明在长上下文理解任务中,即使有半数层被识别为懒层,也能在性能损失小于1.5%的情况下提升2.17倍的吞吐量,并在数学基准AIME24上达到53.3%的分数。
Comments Accepted by TMLR 2025
TOAST: 使用自适应和简单变换的Transformer优化
AI总结 本文提出TOAST框架,通过利用Transformer内部的冗余性,用轻量级闭式映射(如线性变换或身份函数)近似整个Transformer块,从而在不额外训练的情况下减少参数和计算量,同时保持甚至提升下游性能。
Comments 33 pages, 16 figures, 22 tables
对Llama3-8b-Instruct自生成文本识别能力的检查与控制
AI总结 本研究探讨了LLM是否能识别自身生成的文本,发现Llama3-8b-Instruct模型能够区分自身输出与人类输出,并通过残差流中的特定向量控制其行为和感知,揭示了模型自我归属的认知机制。
Comments 10 pages, 13 figs, 2 tables, accepted as conference paper to ICLR 2025
利用无监督学习实现高效视觉异常检测
AI总结 本研究提出一种低成本视觉异常检测系统,通过预训练模型和低成本硬件,利用少量数据实现高准确率的异常检测,适用于中小型企业。
急切模式下的捆绑调整
AI总结 本文提出了一种与PyTorch无缝集成的高效急切模式捆绑调整库,通过稀疏感知的自动微分设计和GPU加速的稀疏运算,提升了在机器人应用中捆绑调整的运行效率和性能。
DyDiff: 通过动力学扩散实现离线强化学习中的长周期 rollout
AI总结 本文提出DyDiff,一种通过动力学扩散模型实现离线强化学习中长周期轨迹生成的方法,通过迭代注入学习策略信息,解决行为策略与学习策略不一致的问题,提升长周期rollout的准确性。
Comments 18 pages, 10 figures, 9 tables. The article has been accepted by Frontiers of Computer Science (FCS), with the DOI: {10.1007/s11704-026-52028-5}