FlowMPC: Improving Flow Matching policies with World Models
FlowMPC:利用世界模型改进流匹配策略
发表机构 * Stanford University(斯坦福大学)
AI总结 提出FlowMPC框架,结合流匹配模仿策略与学习的世界模型,通过MPPI规划提升测试时性能,在ManiSkill操作任务中显著提高成功率。
FlowMPC:利用世界模型改进流匹配策略
发表机构 * Stanford University(斯坦福大学)
AI总结 提出FlowMPC框架,结合流匹配模仿策略与学习的世界模型,通过MPPI规划提升测试时性能,在ManiSkill操作任务中显著提高成功率。
HiMPO:面向长周期智能体的后见知情记忆策略优化以减少纠缠信用分配
发表机构 * Unicom Data Intelligence, China Unicom(联通数据智能有限公司,中国联通) ; Data Science & Artificial Intelligence Research Institute, China Unicom(中国联通数据科学与人工智能研究院)
AI总结 提出HiMPO框架,通过比较记忆更新前后的任务相关信息估计局部效用,并利用后见相关性作为回顾性滤波器,减少记忆写入动作的信用纠缠,提升长周期智能体性能。
Comments Preprint. 2 figures
现在谁应该主导解码?跟踪可靠轨迹以集成掩码扩散语言模型
发表机构 * KAIST(韩国科学技术院) ; AITRICS
AI总结 针对掩码扩散语言模型集成问题,提出TIE框架,通过跟踪答案相关位置的置信度动态,迭代识别并传递可靠解码轨迹,实现多模型协同生成。
Comments preprint
RealityBridge: 连接可编辑3D高斯泼溅驾驶模拟与现实世界视频
发表机构 * Sun Yat-sen University(中山大学) ; Guangdong Key Laboratory of Information Security Technology(广东省信息安全技术重点实验室) ; Key Laboratory of Machine Intelligence and Advanced Computing, Ministry of Education(教育部机器智能与先进计算重点实验室)
AI总结 提出RealityBridge框架,利用多模态控制和轻量级GateNet,结合自回归长视频训练与奖励引导后训练,缩小编辑后3DGS驾驶视频的Sim-to-Real差距,提升视觉真实感和时间一致性。
GraphWorld: 基于世界模型的长时域规划实现端到端自动驾驶
发表机构 * Beijing Key Laboratory of Traffic Data Mining and Embodied Intelligence, School of Computer Science and Technology, Beijing Jiaotong University(北京交通大学计算机科学与技术学院,交通数据挖掘与具身智能北京市重点实验室) ; School of Artificial Intelligence (School of Software), Yanshan University(燕山大学人工智能学院(软件学院)) ; School of Mechanical and Aerospace Engineering, Nanyang Technological University(南洋理工大学机械与航空航天工程学院) ; University of Macau(澳门大学) ; The University of Queensland(昆士兰大学)
AI总结 提出GraphWorld框架,通过潜在世界建模增强长时域规划,利用自车中心交互图建模邻车关系,并基于世界状态条件规划实现安全轨迹生成,显著降低碰撞率。
Comments 16 pages, 5 figures
TopoRetarget:面向灵巧操作的交互保持重定向
发表机构 * IIIS, Tsinghua University(清华大学交叉信息研究院)
AI总结 提出TopoRetarget框架,通过稀疏交互图和距离加权拉普拉斯变形,在重定向中保持手-物体交互结构,提升灵巧操作强化学习策略的性能。
Comments Project page: https://toporetarget2026.github.io/TopoRetarget/
基于领域先验的对比学习用于地震层位追踪
发表机构 * IMT Atlantique, LAB-STICC, UMR CNRS 6285(IMT Atlantique, LAB-STICC, CNRS 6285联合实验室) ; TotalEnergies, OneTech(道达尔能源公司, OneTech)
AI总结 提出自监督融合信号与纹理的方法,利用信号导出的局部层位对应作为领域先验训练纹理深度学习模型,通过对比学习保持层位身份,实现跨不连续面的层位追踪。
Comments 5 pages, 5 figures. Submitted to the IEEE GRSL for possible publication
非对数凹采样的方差缩减及其在逆问题中的应用
发表机构 * School of Electrical and Computer Engineering, Purdue University(普渡大学电气与计算机工程学院) ; School of Electrical and Computer Engineering, University of Southern California(南加州大学电气与计算机工程学院) ; School of Biomedical Engineering, Purdue University(普渡大学生物医学工程学院)
AI总结 针对非对数凹分布采样中随机梯度高方差问题,提出统一分析动量、STORM和PAGE等方差缩减方法,证明其在相对Fisher信息和非平方总变差距离下的改进收敛率,并扩展至基于得分的生成先验逆问题求解。
Comments Accepted to Uncertainty in Artificial Intelligence (UAI) 2026
KeepLoRA++: 基于层级缩放残差梯度适应的持续学习
发表机构 * School of Computer Science and Engineering, Southeast University(东南大学计算机科学与工程学院) ; Key Laboratory of Computer Network and Information Integration, Southeast University, Ministry of Education(东南大学计算机网络和信息集成教育部重点实验室) ; Huawei Noah’s Ark Lab(华为诺亚方舟实验室)
AI总结 针对预训练视觉语言模型持续学习中保留预训练知识、旧任务知识和学习新知识的冲突,提出KeepLoRA++,通过层级缩放残差梯度适应方法,限制LoRA参数更新到残差子空间并采用浅到深层缩放,平衡三者,在图像分类、视觉问答和视频理解任务上优于基线。
UniDDT: 使用解耦扩散变换器统一多模态理解与生成
发表机构 * Nanjing University(南京大学) ; ByteDance Seed(字节跳动Seed) ; University of Hong Kong(香港大学)
AI总结 提出UniDDT模型,通过噪声ViT编码器统一视觉语义表示,并采用解耦扩散解码器分离扩散与文本解码,平衡多模态理解与生成任务,在多个基准上取得优异性能。
Comments This work was completed in \textbf{November 2025}
面向视觉-语言-动作模型的图像压缩学习
发表机构 * POSTECH(浦项科技大学) ; Soongsil University(崇实大学) ; Chung-Ang University(中央大学)
AI总结 提出SPARC框架,通过自适应比特率分配和倾斜率损失,在低带宽下保持VLA机器人控制性能,优于传统编解码器。
数据受限语言模型预训练的数据增强
发表机构 * UC San Diego(加州大学圣地亚哥分校) ; RMIT University(皇家墨尔本理工大学)
AI总结 针对数据受限下标准自回归预训练严重过拟合的问题,提出三类数据增强方法(token级噪声、序列排列、目标偏移预测),有效降低验证损失并支持数百epoch训练。
LiFT: 通过线性规划进行局部搜索以实现过拟合可控的Transformer
发表机构 * Department of Management Sciences, Indian Institute of Technology Kanpur(印度理工学院坎普尔分校管理科学系) ; Department of Civil Engineering, Indian Institute of Technology Kanpur(印度理工学院坎普尔分校土木工程系) ; Operations and Decision Sciences, Indian Institute of Management Ahmedabad(印度管理学院艾哈迈达巴德分校运营与决策科学系) ; Brij Disa Centre for Data Science and AI, Indian Institute of Management Ahmedabad(印度管理学院艾哈迈达巴德分校Brij Disa数据科学与人工智能中心)
AI总结 提出基于线性规划的局部搜索框架,通过双层优化联合更新模型参数和正则化超参数,利用验证梯度和Hessian信息构造局部下降方向,在保持训练最优性的同时减少过拟合,实验表明在GPT-2 Small微调中持续改善测试困惑度。
Comments 22 pages, 6 figures, published in The 20th Learning and Intelligent Optimization Conference (LION 2026)
快速投毒:针对快速响应框架的实用投毒攻击
发表机构 * Princeton University(普林斯顿大学)
AI总结 揭示针对快速响应框架的投毒攻击,通过提示注入在训练集中植入恶意样本,实现目标性投毒和概念后门攻击,仅1%投毒率即可导致高达100%误报率和96%漏报率。
Comments Spotlight at ICML 2026
结构-语义协同优化的潜扩散模型用于快速视觉字谜合成
发表机构 * School of Digital Media and Design Arts, Beijing University of Posts and Telecommunications(北京邮电大学数字媒体与设计艺术学院)
AI总结 提出结构-语义协同优化框架S2CO-Anagram,通过空文本结构对齐、语义增强和注意力引导噪声融合,在极低计算成本下生成高分辨率、高视觉和谐度与语义保真度的视觉字谜图像。
创意碰撞:大型语言模型中的导演人格引导与竞争
发表机构 * AI Safety Camp(AI安全训练营)
AI总结 研究通过叠加两种语义相反的导演人格向量(斯皮尔伯格与斯科塞斯)来引导语言模型生成,发现斯皮尔伯格向量主导道德倾向,中间点提升连贯性,且两者在特定层共享道德基调基底。
Comments Accepted at ICML 2026 Workshop on Human-AI Co-Creativity
进化双层奖励塑形以增强强化学习的泛化能力
发表机构 * University of Tsukuba(筑波大学) ; RIKEN Center for Advanced Intelligence Project(理化学研究所革新智能综合研究中心)
AI总结 提出GERS方法,通过双层优化利用标量验证反馈调整奖励函数,在限制轨迹访问下提升强化学习在未见环境中的泛化性能。
Comments Accepted at PPSN 2026
传播结构引导:从眼底图像和稀疏OCT扫描合成荧光素血管造影
发表机构 * School of Computer Science and Engineering, Southeast University(东南大学计算机科学与工程学院) ; Key Laboratory of New Generation Artificial Intelligence Technology and Its Interdisciplinary Applications, Ministry of Education(教育部新一代人工智能技术及其跨学科应用重点实验室) ; Tianyuan Honors School, Nanjing Medical University(南京医科大学天元荣誉学院) ; Nanjing University of Science and Technology(南京理工大学) ; Department of Ophthalmology, The First Affiliated Hospital of Nanjing Medical University(南京医科大学第一附属医院眼科)
AI总结 提出从彩色眼底照片(CFP)和稀疏OCT扫描合成荧光素血管造影(FFA)的框架,通过空间对齐跨模态融合和令牌级对比学习,实现非侵入性FFA合成,提升下游诊断性能。
Comments Accepted to MICCAI 2026 (Early Accept)
PolyMerge: 用多面体覆盖压缩3D高斯泼溅以实现可证明安全的资源受限导航
发表机构 * Georgia Institute of Technology(佐治亚理工学院)
AI总结 提出PolyMerge,将大规模3D高斯泼溅模型转换为凸多面体覆盖,保证覆盖原模型所有障碍物,结合控制障碍函数实现实时安全路径规划,在Crazyflie无人机上验证。
Journal ref IEEE Robotics and Automation Letters, vol. 11, no. 7, pp. 8512-8519, July 2026
从令牌到区域:面向GPU内核生成的CUDA敏感指令微调
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; Biren Technology(壁仞科技)
AI总结 提出CuSeT方法,通过自适应令牌级掩码和区域感知样本重加权,在简单SFT框架内提升LLM生成CUDA内核的功能正确性。
通过主动和生成学习预测并行化学应用的运行时参数
发表机构 * Louisiana State University(路易斯安那州立大学) ; Pacific Northwest National Laboratory(太平洋西北国家实验室) ; University of Utah(犹他大学)
AI总结 提出基于主动学习和生成学习的机器学习方法,结合梯度提升回归树模型,预测并行化学计算的运行时参数,在CCSD计算中MAPE低至0.023,R²高达99.9%。
潜在思维流:大型语言模型中的高效潜在推理
发表机构 * Singapore Management University(新加坡管理大学) ; Ant Group(蚂蚁集团)
AI总结 提出Latent Thought Flow (LTF)方法,将推理建模为可变长度连续轨迹,通过连续GFlowNet训练采样器匹配奖励后验,在提升准确率9.5%的同时平均减少推理长度27.2%。
PACT: 多轮工具使用智能体的特权轨迹协同训练
发表机构 * Georgia Institute of Technology(佐治亚理工学院) ; Ohio State University(俄亥俄州立大学) ; University of Pennsylvania(宾夕法尼亚大学) ; Arizona State University(亚利桑那州立大学)
AI总结 提出PACT框架,通过特权轨迹(专家轨迹)在训练时提供密集监督信号,结合轨迹条件RL和组件感知SFT损失,避免推理时依赖轨迹,显著提升多轮工具使用智能体的性能。
Comments Project page: https://zhenbangdu.github.io/pact-project-page/
LUCID:基于确定性流匹配的学习型欠采样自适应一致性引导稀疏视角CT重建
发表机构 * School of Mathematical Sciences, Capital Normal University(首都师范大学数学科学学院) ; National Center for Applied Mathematics Beijing, Capital Normal University(首都师范大学北京国家应用数学中心) ; Academy for Multidisciplinary Studies, Capital Normal University(首都师范大学交叉科学研究院)
AI总结 提出LUCID框架,利用流匹配生成先验和稀疏度自适应策略,通过退化匹配初始状态和投影域一致性校正,实现不同采样密度下的稳定稀疏视角CT重建,减少伪影和幻觉结构。
编织多源证据进行生物医学推理:BioMedHop基准与BioWeave框架
发表机构 * University of New South Wales(新南威尔士大学) ; CSIRO(澳大利亚联邦科学与工业研究组织) ; University of Technology Sydney(悉尼科技大学)
AI总结 提出BioMedHop基准和BioWeave框架,用于评估和实现生物医学多源证据推理,BioWeave在基准上优于基线方法10.5%,并提升小模型性能。
基于场景相关观测商的传感器条件表示学习
发表机构 * Shenzhen Institute for Advanced Study, University of Electronic Science and Technology of China(电子科技大学深圳高等研究院) ; Department of Electrical and Computer Engineering, University of Waterloo(滑铁卢大学电气与计算机工程系) ; School of Computer Science and Engineering, Kyungpook National University(庆北国立大学计算机科学与工程学院)
AI总结 提出场景相关观测商作为表示目标,通过OQ-TSAE框架分解场景与干扰因子,在传感器条件下保持可区分性,优于重建、度量学习和对比学习基线。
ATHENA: 加速的多任务异构影响函数用于机器人数据筛选
发表机构 * Tongji University(同济大学) ; Shanghai Innovation Institute(上海创新研究院) ; Xi'an Jiaotong University(西安交通大学) ; Shanghai Jiao Tong University(上海交通大学)
AI总结 提出ATHENA框架,利用Kronecker梯度结构和秩r随机截断近似加速影响函数计算,实现多任务VLA模型数据筛选,在模拟和真实机器人任务中以更少数据达到或超越全数据微调性能。
衡量LLM导师是教学还是解题:教育影响的诊断方法
发表机构 * Washington University in St. Louis(圣路易斯华盛顿大学) ; Department of Operations Research and Engineering Management, Southern Methodist University(南卫理公会大学运筹学与工程管理系)
AI总结 针对LLM作为教育导师时解题能力不等于教学支持的问题,提出基于解题导向与教学导向基准性能差距的诊断方法,通过MathTutorBench分析表明两者仅部分对齐,建议分开报告评分并明确保护学生能动性的标准。
EgoPhys: 从第一人称视频学习可变形物体的通用物理模型
发表机构 * UC San Diego(加州大学圣地亚哥分校)
AI总结 提出EgoPhys框架,从第一人称RGB视频中通过可泛化先验构建可变形物体的物理数字孪生,无需测试时优化即可预测弹簧刚度场,在重建、未来预测和零样本泛化上优于基线。
Comments Project Page: https://hjhyunjinkim.github.io/EgoPhys
GRACE: 基于接地动作中心证据增强视频多模态大语言模型用于观众情感预测
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; Hangzhou Dianzi University(杭州电子科技大学) ; The 52nd Research Institute of China Electronics Technology Group Corporation(中国电子科技集团公司第五十二研究所) ; Hangzhou Bywin Technology Co., Ltd.(杭州百威科技有限公司) ; Zhejiang Dahua Technology Co., Ltd.(浙江大华技术股份有限公司) ; School of Information Science and Engineering, Shandong University(山东大学信息科学与工程学院) ; Haihe Laboratory of Information Technology Application Innovation(海河信息技术应用创新实验室)
AI总结 提出GRACE框架,通过提取时间有序的主谓宾三元组和视觉实体裁剪,增强视频MLLM对细粒度情感线索的提取与推理,在Pitts数据集上提升Qwen2.5-VL和Qwen3-VL性能。
Comments 13 pages, 5 figures