Towards Understanding Adam Convergence on Highly Degenerate Polynomials
理解Adam在高度退化多项式上的收敛性
AI总结 本文研究Adam优化器在高度退化多项式上的自动收敛性质,推导局部渐近稳定性条件,证明其线性收敛速度优于梯度下降和动量法,并刻画超参数相图。
Comments Accepted to ICML 2026
理解Adam在高度退化多项式上的收敛性
AI总结 本文研究Adam优化器在高度退化多项式上的自动收敛性质,推导局部渐近稳定性条件,证明其线性收敛速度优于梯度下降和动量法,并刻画超参数相图。
Comments Accepted to ICML 2026
混合量子神经网络用于多变量临床时间序列预测
AI总结 提出一种混合量子-经典架构,将变分量子电路集成到循环神经网络中,用于多变量生理时间序列的多步预测,在BIDMC数据集上表现出与基线相当的精度和更强的鲁棒性。
NEST: 面向分布式深度学习的网络与内存感知设备放置
AI总结 提出NEST框架,通过结构化动态规划统一模型并行、拓扑建模和内存可行性,在多种硬件和网络上实现高达2.43倍的吞吐量提升。
Comments Accepted to MLSys 2026
TimeSpot: 在真实世界场景中评估视觉语言模型的地理时间理解能力
AI总结 提出TimeSpot基准,通过1,455张全球图像评估视觉语言模型在时间属性(季节、月份、时段、日光相位)和地理属性(大洲、国家、气候带、环境类型、经纬度)上的推理能力,发现现有模型性能低下,尤其时间推理不足。
Comments Accepted to ICML 2026
少样本神经可微模拟器:真实到模拟的刚体接触建模
AI总结 提出一种结合解析公式物理一致性与图神经网络表示能力的少样本真实到模拟方法,通过少量真实数据校准解析模拟器生成大规模合成数据集,并引入基于网格的图神经网络隐式建模刚体前向动力学及碰撞检测的代理梯度,实现完全可微性,从而提升模拟保真度和策略学习效率。
Comments Accepted in ICRA 2026
特征相似性:迈向对Transformer中类比推理的理论理解
AI总结 本文通过最小化Transformer抽象模型,从理论上证明联合训练和特定课程顺序能使实体在表示空间中对齐,从而通过特征相似性实现属性转移,即类比推理。
Any2Any: 统一任意模态遥感翻译
AI总结 提出统一潜扩散框架Any2Any,通过共享潜空间和轻量残差适配器实现任意模态间的高效翻译,并在新数据集RST-1M上验证了其优于成对方法且具备零样本泛化能力。
Comments Accepted by ICML 2026
MultiPUFFIN:用于小分子性质预测的多模态领域约束基础模型
AI总结 提出多模态基础模型MultiPUFFIN,融合SMILES、2D图、3D构象及实验条件,通过条件感知精炼和热力学约束头,在小样本下优于ChemBERTa-2,预测小分子热物理性质。
从试错中学习:具身大语言模型的反思式测试时规划
AI总结 提出反思式测试时规划方法,通过行动中反思和行动后反思两种模式,结合回溯性反思,使具身智能体在测试时进行自我纠正和经验积累,显著提升长程任务性能。
多模态晶体流:面向统一晶体建模的任意模态生成
AI总结 提出多模态晶体流(MCFlow),一种统一的多模态流模型,通过原子类型和晶体结构的独立时间变量实现多种晶体生成任务,并在MP-20和MPTS-52基准上达到与任务特定基线竞争的性能。
PerSoMed:用于波斯社交媒体文本分类的大规模平衡数据集
AI总结 该研究构建了首个大规模平衡的波斯社交媒体文本分类数据集,包含9个类别共36,000条帖子,并基于BiLSTM、XLM-RoBERTa、TookaBERT等模型进行基准测试,其中TookaBERT-Large取得了最佳性能(F1分数0.9621)。
Comments 10 pages, including 1 figure
解码机器学习决策:面向大规模排序系统的智能体推理框架
AI总结 提出GEARS框架,通过智能体技能封装排序专家知识,将排序优化转化为自主发现过程,实现高层意图驱动的系统调控并保证生产可靠性。
Comments 12 pages, 5 figures
MARS:面向奖励建模的边界与语义感知数据增强
AI总结 提出MARS框架,通过优先增强低边界偏好对并利用语义距离细化,提升奖励模型质量和对齐性能。
所有泄漏都重要,有些泄漏更重要:LLM回测中可解释的时间污染检测与缓解
AI总结 提出基于Shapley值的声明级评估框架Shapley-DCLR和推理时架构TimeSPEC,用于检测和缓解LLM回测中的时间污染问题。
Comments 8 pages plus appendix
因子化潜在动作世界模型
AI总结 提出因子化潜在动作模型(FLAM),通过将场景分解为独立因子并学习各自的潜在动作,提升了无动作视频中多实体动态建模的准确性和视频生成质量。
CARL-CXR:基于连续适配器路由的任务未知胸部X光片分类
AI总结 提出CARL-CXR框架,通过固定高容量骨干网络、增量添加轻量级任务特定适配器和分类头,以及潜在任务选择器,解决任务未知推理下的胸部X光片增量分类问题,显著减少灾难性遗忘并提升路由准确性。
Comments 9 pages, 4 figures
STAPO:通过抑制稀有虚假标记稳定大语言模型的强化学习
AI总结 针对强化学习微调大语言模型时因稀有虚假标记导致训练不稳定和性能崩溃的问题,提出STAPO方法,通过抑制这些标记的梯度扰动,在多个数学推理基准上实现稳定训练和性能提升。
Krause同步变换器
AI总结 提出基于有界置信共识动力学的Krause注意力机制,通过局部化稀疏交互替代全局softmax归一化,缓解表示坍缩和注意力汇聚现象,实现线性复杂度并提升性能。
Comments ICML 2026, Project page: https://jingkun-liu.github.io/krause-sync-transformers/
多层级策略分类:通过晋升与降级动态激励改进
AI总结 本文提出一种多层级晋升-降级框架,通过设计分类器阈值和难度递进来激励代理人诚实努力,并证明在温和条件下代理人可通过真实改进达到任意高水平。
Comments 9 pages, 4 figures, Accepted at ICML 2026
上下文展开赌博机:面向可验证奖励的强化学习
AI总结 针对RLVR中展开使用无差别、短视导致的问题,提出上下文赌博机框架,自适应选择高价值展开,提升训练效率与性能。
Prism: 频谱感知的块稀疏注意力
AI总结 针对长上下文LLM预填充中块稀疏注意力的块选择效率瓶颈,提出无训练频谱感知方法Prism,通过高低频分支分解和能量温度校准恢复位置信号,实现纯块级重要性估计,在保持精度同时实现高达5.1倍加速。
Comments ICML 2026
E-VAds:面向多模态大语言模型的电商短视频理解基准
AI总结 提出电商短视频理解基准E-VAds,通过多模态信息密度评估框架量化领域复杂性,并构建多智能体生成的问答数据集,最后开发基于强化学习的推理模型E-VAds-R1,在商业意图推理上实现109.2%的性能提升。
Comments Accepted by ICML2026
F-GRPO: 别让你的策略学到显而易见的而忘记罕见的
AI总结 针对强化学习中有限采样组导致罕见正确轨迹被忽略的问题,提出基于Focal loss的难度感知缩放系数F-GRPO,在不增加组大小和计算成本下提升数学推理性能。
World-VLA-Loop: 视频世界模型与VLA策略的闭环学习
AI总结 提出World-VLA-Loop框架,通过状态感知视频世界模型联合预测未来帧和二元奖励,并采用协同进化范式迭代优化VLA策略,减少对真实环境交互的依赖。
Comments 16 pages, 9 figures
使用TensorGalerkin学习、求解和优化PDE:一种高效的高性能Galerkin组装算法
AI总结 提出基于Galerkin离散化的统一算法框架,通过张量化元素操作和稀疏矩阵乘法实现O(1)图规模的系统组装,高效求解、约束优化和物理信息学习变分PDE。
ECG-R1: 协议引导且模态无关的可靠心电图解读多模态大语言模型
AI总结 提出ECG-R1,通过协议引导数据生成、模态解耦架构和强化学习,实现可靠的心电图解读。
Comments Accepted to ICML 2026
通过扩散最后一层的生成式神经算子
AI总结 提出扩散最后一层(DLL)作为神经算子的概率输出头,通过Karhunen-Loéve展开和系数空间的条件扩散模型实现高效分布建模,在随机PDE基准和确定性长时滚动任务中提升了分布保真度和不确定性估计。
Comments ICML 2026, code is available at https://github.com/sungwpark/dll-no
面向边缘AI系统的可扩展可解释性即服务(XaaS)
AI总结 提出可解释性即服务(XaaS)分布式架构,通过解耦推理与解释生成、语义缓存、轻量验证和自适应引擎,在边缘设备上实现低延迟、高保真的可解释性,并在三个实际用例中降低38%延迟。
Comments 8 pages, 5 figures, 2 tables. This version updates metadata after publication in IEEE Xplore and publication by SoutheastCon 2026
CPMobius: 无数据强化学习的迭代式教练-玩家推理
AI总结 提出CPMobius协作式教练-玩家范式,通过无外部数据的合作优化循环提升数学推理能力,在Qwen2.5-Math-7B-Instruct上总体准确率提升4.9%,OOD准确率提升5.4%。
Comments Accepted to the ICML 2026
无奖励的冲突目标对齐
AI总结 提出RACO框架,通过冲突规避梯度下降的裁剪变体直接利用成对偏好数据解决多目标冲突,实现帕累托最优对齐。
Comments Accepted to ICML 2026 (Oral)