Mechanical Field Networks: Structured Neural Dynamics for Multivariate Systems
机械场网络:多变量系统的结构化神经动力学
发表机构 * Xi’an Jiaotong University(西安交通大学)
AI总结 提出MF-Net,一种将多变量系统表示为共享场状态并通过可学习关系律更新状态的递归模型,在保持可解释结构的同时实现竞争性预测。
机械场网络:多变量系统的结构化神经动力学
发表机构 * Xi’an Jiaotong University(西安交通大学)
AI总结 提出MF-Net,一种将多变量系统表示为共享场状态并通过可学习关系律更新状态的递归模型,在保持可解释结构的同时实现竞争性预测。
PermDoRA -- 理解语言模型中的适配器干扰:参数空间几何的局限性
发表机构 * Independent Researcher(独立研究员)
AI总结 研究适配器组合中的干扰是否源于线性参数更新重叠,通过DoRA-RBAC框架和几何感知合并策略实验,发现参数空间几何不是干扰主因,而是共享非线性表示中的交互。
Comments 18 Pages, COLM 2026
RoVE: 旋转值嵌入注意力实现相对位置相关的值路径
发表机构 * AMLab University of Amsterdam(阿姆斯特丹大学AMLab) ; MIT CSAIL(麻省理工学院计算机科学与人工智能实验室)
AI总结 提出RoVE方法,通过同时旋转键和值使值对位置敏感,将RoPE注意力转化为注意力卷积,在少样本学习、分布外困惑度和长上下文检索上优于RoPE。
能量守恒神经管道:通过物理守恒约束减弱模块化神经网络中的误差传播
发表机构 * ORION Robotics
AI总结 提出在模块间强制能量守恒(特征向量L2范数不变)作为硬约束,实验证明该方法在多种噪声下显著优于基线,并具有深度不变性和理论保证。
Comments 22 pages, 2 figures, 7 tables, 25 references
预算上的递归绑定:阶-p张量记忆中的子空间雕刻
发表机构 * University of Wisconsin-Madison(威斯康星大学麦迪逊分校)
AI总结 提出正交子空间雕刻(OSC)方法,通过将填充符投影到角色基的零空间来绑定到角色,固定阶张量记忆实现深度递归绑定,在恒定内存下提升高叠加场景的效率。
Comments 24 pages, 12 figures, 7 tables
SirenFNO:高效且全频率学习的傅里叶神经算子
发表机构 * The University of Sydney(悉尼大学)
AI总结 提出SirenFNO框架,利用正弦表示网络学习隐式神经表示并进行模态核参数化,消除频率截断,实现全频谱学习,在多个PDE基准上以最多73倍参数减少取得性能提升。
Comments 9 pages, accepted by IJCAI 2026
Kuramoto注意力:在环面上同步自注意力
发表机构 * Department of Informatics, Luddy School of Informatics, Computing, and Engineering, Cognitive Science Program, Indiana University Bloomington(印第安纳大学伯明顿分校信息学系,卢迪信息学、计算与工程学院,认知科学项目)
AI总结 提出Kuramoto注意力层,将隐藏坐标视为角度,通过门控余弦相似度和环形均值更新实现自注意力,等价于Kuramoto耦合项,在字符级语言建模中达到与强基线相近的性能。
Comments 13 pages, 2 figures, 3 tables
当上下文回归:面向在线策略蒸馏中的鲁棒内化
发表机构 * IIIS, Tsinghua University(清华大学交叉信息研究院)
AI总结 针对在线策略蒸馏中上下文内化后重新引入上下文导致性能下降的问题,提出一种轻量级一致性正则化方法,通过锚定无上下文输出并惩罚偏离,有效缓解退化并提升鲁棒性。
使用ART微调多模态大语言模型:基于艺术的强化训练
发表机构 * University of Stavanger(斯塔万格大学) ; NORCE Research(NORCE研究机构)
AI总结 提出ART方法,通过优化原始视觉输入将信息注入冻结的多模态大语言模型,实现软提示微调,无需修改计算图,在数学和工具使用基准上达到与LoRA相当的精度。
HAMNO: 一种用于动力系统的分层自适应多尺度神经算子与物理信息学习
发表机构 * Bauhaus-Universität Weimar(魏玛包豪斯大学) ; Leibniz University Hannover(莱布尼茨汉诺威大学)
AI总结 提出HAMNO神经算子架构,通过自适应门控机制平衡局部与全局信息,结合物理信息扩展PI-HAMNO,在非周期Allen-Cahn等方程上提升长期预测精度与物理一致性。
随机梯度下降中参数噪声注入的简单性足以胜任
发表机构 * Université Laval(拉瓦尔大学)
AI总结 研究随机梯度下降中的参数噪声注入,提出线性层逐样本噪声注入的高效方法,并实验证明简单各向同性噪声即可达到复杂方案的优化与泛化效果。
Comments Accepted at the Data Science Meets Optimisation workshop in IJCAI 2026
耦合振荡器网络中的同步注意力机制
发表机构 * University of California, Irvine(加州大学尔湾分校)
AI总结 提出基于Kuramoto同步动力学的固定查询振荡器注意力机制,无需指数运算和全局归约,在物理基板上实现注意力计算,并在关键词识别和主谓一致任务上优于softmax。
nD-RoPE:一种用于n维位置嵌入的广义RoPE
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出nD-RoPE,将旋转位置嵌入推广到任意维度,通过多尺度正则单纯形波矢设计实现各向同性,在图像、视频和点云任务中提升性能。
Comments Accepted to the 43rd International Conference on Machine Learning (ICML 2026)
多速率专家混合模型加速液态神经网络训练
发表机构 * Virginia Tech(弗吉尼亚理工大学)
AI总结 提出多速率专家混合框架,结合液态神经网络的多尺度动态与注意力机制,提升多变量时间序列建模的准确性和效率。
利用算子链实现上下文算子学习
发表机构 * Department of Mathematics, Shanghai Normal University(上海师范大学数学系) ; Department of Mathematics, National University of Singapore(新加坡国立大学数学系)
AI总结 提出Chain of Operators (CHOP)框架,通过构造显式初等变换与冻结ICON的算子链,无需微调即可提升上下文算子网络在分布外算子任务上的泛化能力,在标量守恒律和平均场控制问题中降低推理误差。
关于次二次架构:从应用到原理
发表机构 * ELLIS Unit Linz, LIT AI Lab, Institute for Machine Learning, Johannes Kepler University Linz(林茨ELLIS单元、LIT AI实验室、机器学习研究所、约翰内斯·开普勒大学林茨) ; NVIDIA(英伟达)
AI总结 本文比较了xLSTM、Mamba-2和Gated DeltaNet三种次二次架构,发现xLSTM在代码预训练、蒸馏和时间序列预训练中表现最佳,其优势源于灵活稳定的门控记忆校正机制。
重新设计混合专家模型的路由器:基于流形幂迭代
发表机构 * Gaoling School of Artificial Intelligence, Renmin University of China(中国人民大学高瓴人工智能学院) ; Large Language Model Department, Tencent(腾讯大型语言模型部门)
AI总结 提出将路由器行与专家矩阵主奇异方向对齐,并基于流形幂迭代(MPI)重新设计路由器,通过“幂迭代-收缩”范式实现对齐,理论证明收敛性,实验验证1B至11B参数规模下模型效果提升。
Comments Preprint
兼容性感知的动态微调用于大型语言模型
发表机构 * SKL-IOTSC, CIS, University of Macau(澳门大学科技学院电脑与信息科学系及智慧城市物联网国家重点实验室) ; Auckland University of Technology(奥克兰理工大学)
AI总结 提出兼容性感知动态微调(CADFT),通过模型似然度动态调整监督更新,抑制不兼容样本的高方差梯度,提升训练稳定性和泛化能力。
Comments ACL 2026
A2SG:用于训练深度脉冲神经网络的适应性和非对称替代梯度
发表机构 * KAIST(韩国科学技术院)
AI总结 提出适应性和非对称替代梯度(A2SG)框架,通过自适应窗口调整梯度方向一致性、非对称梯度反映神经元动态,降低梯度变化并促进收敛到平坦最小值,在多种SNN模型和任务上提升精度与能效。
Comments Accepted at ICML 2026
教导扩散模型从左到右推测
发表机构 * Lexington Whalen ; Yuki Ito ; Ryo Sakamoto
AI总结 针对自回归解码的推理瓶颈,提出三种训练时干预方法(位置加权、首次错误焦点损失、链损失)来弥合块扩散草稿模型的双向生成与自回归目标模型从左到右验证之间的不对称性,显著提升接受草稿长度。
Comments 13 pages, technical report
你的大模型何时可操控?
发表机构 * University of Maryland, College Park(马里兰大学帕克分校) ; MBZUAI, UAE(穆罕默德·本·扎耶德人工智能大学)
AI总结 提出通过模型生成初期的内部状态预测激活操控是否成功,并利用该预测器优化操控强度搜索,降低解码成本。
高阶令牌交互的量子注意力机制
发表机构 * RIKEN iTHEMS ; RIKEN AIP ; South China University of Technology(华南理工大学) ; Columbia University(哥伦比亚大学)
AI总结 提出量子高阶注意力(QHA),通过数据重上传和非克利福德纠缠器在浅电路中合成任意阶令牌交互,证明其表达能力超越经典自注意力,并具有可训练性保证,在遗传上位、带噪学习奇偶和图三角形检测中高效检测高阶交互。
先组织再检索:面向高效智能体的层次化记忆导航
发表机构 * Duke University(杜克大学) ; Snowflake AI Research(Snowflake AI研究)
AI总结 提出HORMA框架,通过构建文件系统式的层次化记忆结构并利用强化学习训练的轻量级导航代理,实现高效检索,在长时任务中提升性能并降低令牌消耗。
用户侧记忆中的子模块不对称性:一个诊断框架
发表机构 * EpistemicaLab — Independent Research(EpistemicaLab — 独立研究)
AI总结 提出一个诊断框架,将LLM用户侧记忆分解为行为一致性、事实存在和事实缺失三个正交子模块,发现参数记忆与检索记忆在不同子模块上存在不对称性,且RLHF调优加剧了这种不对称性。
Comments Preprint. Code: https://github.com/EpistemicaLab/substrate-asymmetry-memory
DAM-VLA: 解耦异步多模态视觉语言动作模型
发表机构 * Intuitive Robots Lab, Karlsruhe Institute of Technology (KIT)(直觉机器人实验室,卡尔斯鲁厄理工学院) ; NVIDIA(英伟达) ; Robotics Institute of Germany(德国机器人研究所)
AI总结 针对VLA模型同步时钟与物理交互中不同模态频率不匹配的问题,提出DAM-VLA,通过解耦各模态时间处理、维护传感器速率更新的潜在缓冲区,并利用门控交叉注意力整合高频模态,在7个真实操作任务中平均成功率提升至95.2%。
Comments 17 pages, 8 figures
从不可约元组合线性层
发表机构 * University of Wisconsin-Madison(威斯康星大学麦迪逊分校)
AI总结 提出用Clifford代数将线性层分解为双向量(几何基元)的组合,仅需O(log^2 d)参数,在LLM注意力投影中匹配强基线性能。
Comments 35 Pages, 11 Tables, 6 Figures, Appearing in NeurIPS 2025
物理神经网络的时间复用层重用
发表机构 * Graduate School of Information Science and Technology, The University of Tokyo(信息科学与技术研究生学校,东京大学)
AI总结 针对物理神经网络权重调整慢的瓶颈,提出TIDAL-Net,通过时间复用层增加有效深度,在图像分类和自然语言处理任务上提升性能。
混合专家模型对特征噪声的鲁棒性
发表机构 * Dong Sun(东Sun) ; Rahul Nittala(拉胡尔·尼塔拉) ; Rebekka Burkholz(蕾贝卡·布克霍尔兹)
AI总结 研究混合专家模型在特征噪声下的鲁棒性,发现稀疏专家激活能作为噪声滤波器,相比密集网络具有更低的泛化误差、更强的鲁棒性和更快的收敛速度。
Comments ICML 2026
Kalman线性注意力:用于高效语言建模和状态跟踪的并行贝叶斯滤波
发表机构 * University of Cambridge(剑桥大学)
AI总结 提出Kalman线性注意力层,将序列混合重写为信息形式的精确贝叶斯滤波,实现时间并行推理,在相同计算成本下比GLA更具表达力,并在状态跟踪任务中超越线性SSM和注意力。
Comments Accepted at ICML 2026. An earlier version of this work was presented at the 1st Workshop on Epistemic Intelligence in Machine Learning (EIML) at EurIPS 2025
为什么深度在可并行化序列模型中重要:一个李代数视角
发表机构 * Howard Hughes Medical Institute, Department of Neurobiology, Harvard Medical School(霍华德·休斯医学研究所,哈佛医学院神经生物学系) ; Kempner Institute for the Study of Natural and Artificial Intelligence, Harvard University(自然与人工智能研究学院,哈佛大学) ; Department of Psychology and Center for Brain Science, Harvard University(心理学系和脑科学中心,哈佛大学)
AI总结 从李代数控制视角,研究可并行化序列模型(如Transformer变体和状态空间模型)的表达能力与深度关系,证明误差随深度增加呈指数下降。
Comments v2: Format update; split former Theorem 3.4 into Theorem 3.4 and Corollary 3.5 for clarity; corrected an indexing error affecting Corollary 3.6, Proposition 3.7, and Figure 2
非线性色散方程的混合迭代神经低正则积分器
发表机构 * National Center for Applied Mathematics, Tianjin University(天津大学应用数学中心) ; School of Mechanical and Aerospace Engineering, Jilin University(吉林大学机械与 aerospace 工程学院)
AI总结 提出HIN-LRI混合框架,用轻量神经网络学习并校正经典低正则积分器的结构截断误差,通过显式时间步缩放保证稳定性,在粗糙数据色散方程上提升精度并保持泛化能力。
自注意力作为传输:对称谱诊断的极限
发表机构 * Red Hat AI(红帽人工智能)
AI总结 研究语言模型注意力路由的两种失效形状(过度集中或过度分散),证明对称谱诊断对方向不敏感,并揭示因果注意力中传输容量的理论下限,提出基于容量和方向的双轴诊断方法。
Comments 48 pages, 6 figures, 7 tables; 81-page online supplement (proofs, additional experiments, dataset statistics) as an ancillary file
结构塑性中增长的稳定性
发表机构 * University of Vermont(佛蒙特大学)
AI总结 本文研究了结构塑性中增长与剪枝的稳定性差异,指出生长在优化轨迹中插入新单元体,而剪枝则在训练初期选择已有单元。生长在图像分类任务中表现更优,但需足够时间整合新单元以提高适应性。
GENERIC-FNO:将能量守恒和熵产生嵌入傅里叶神经算子
发表机构 * University of Illinois at Chicago(伊利诺伊大学芝加哥分校) ; Georgia Tech Research Institute(佐治亚理工学院研究所)
AI总结 提出GENERIC-FNO,首个在函数空间直接嵌入非平衡热力学完整GENERIC结构的神经算子,通过秩一投影精确满足退化条件,实现能量守恒与熵产生,在超分辨率下保持结构保证。
Comments Under review at TMLR
概率对比预训练用于多任务ADME性质预测
发表机构 * NVIDIA(英伟达)
AI总结 提出分子图-Transformer预训练框架,结合化学自监督与对比互信息,通过统一概率潜变量目标优化重构、对比和化学任务,在多任务微调中采用任务特定MLP头,在三个数据集上平均提升7.6%-9.5%。
多模态交互学习的信息论分解
发表机构 * Gaoling School of Artificial Intelligence, Renmin University of China, Beijing(中国人民大学人工智能学院,北京) ; Beijing Key Laboratory of Research on Large Models(北京大模型研究关键实验室) ; Engineering Research Center of Next-Generation Intelligent Search(下一代智能搜索与推荐工程研究中心) ; Beihang University, Beijing(北航,北京) ; Gaotu Techedu Inc.(高图科技有限公司)
AI总结 提出基于信息论的多模态交互分解方法DMIL,通过变分分解架构和微调策略学习样本特定的冗余、独特和协同交互,提升多模态学习性能。
Comments Accepted to CVPR 2026
ICA Lens: 无需训练另一本词典即可解释语言模型
发表机构 * Independent Researcher(独立研究员) ; University of Maryland(马里兰大学)
AI总结 提出ICALens,基于独立成分分析(ICA)高效提取语言模型表示中可解释方向,无需训练稀疏自编码器,在SAEBench上表现竞争力。
Comments Ongoing Project
RePAIR:国际象棋中的预测性自监督表示学习
发表机构 * University of Zurich(苏黎世大学)
AI总结 提出RePAIR架构,融合MAE、JEPA和BERT,通过掩码和迭代细化学习国际象棋序列的紧凑表示,无需强化学习即可推理棋子移动。
Comments Accepted for oral presentation at IEEE Conference on Games 2026
个体行为的隐式神经表示
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出Behavioral INR模型,用隐式神经表示从无标签多策略行为数据中学习策略表示,通过FiLM层调节策略函数,实现无监督策略识别,在连续状态-动作空间中提升策略可识别性。
Comments ICML 2026, Structured Probabilistic Inference & Generative Modeling Workshop
缺失模态下的多模态学习中的潜在世界恢复
发表机构 * Queen's University Belfast(贝尔法斯特女王大学)
AI总结 提出潜在世界恢复(LWR)框架,通过邻居潜在对齐和可用性感知融合,在缺失模态下实现鲁棒的多模态预测,避免显式重构误差。
通过电子健康记录中的鲁棒且灵活的知识迁移增强谱嵌入
发表机构 * Harvard T.H. Chan School of Public Health(哈佛大学T.H. Chan公共卫生学院) ; Dana-Farber Cancer Institute(达纳-法伯癌症研究所) ; Harvard Medical School(哈佛医学院) ; University of Pittsburgh(匹兹堡大学)
AI总结 提出一种基于谱的无监督表示学习框架,通过从更广泛人群提取知识矩阵并放松信号对齐假设,为罕见病队列生成低维嵌入,在模拟和真实多发性硬化症数据中优于现有方法。
学习实例自适应低秩正交子空间用于换衣行人重识别
发表机构 * Dongwoo Kim(金东吾) ; Tae-Kyun Kim(金泰勋)
AI总结 提出Ortho-ReID方法,通过从VLM文本描述中显式建模低秩服装子空间,并利用几何约束提取服装不变特征,在多个基准数据集上取得最优性能。
Comments Accepted to the ICML 2026 Workshop on CoLoRAI
从感知序列中学习模式与抽象
发表机构 * Mathematisch-Naturwissenschaftlichen Fakultät und der Medizinischen Fakultät der Eberhard-Karls-Universität Tübingen(图宾根大学数学自然科学学院和医学学院)
AI总结 研究从感知序列中通过分块和抽象发现模式与层次结构的计算原理,提出理性分块模型和非参数层次变量模型,实现高效序列分解与无监督模式发现。
Comments Doctoral thesis
跨层离散概念发现用于解释语言模型
发表机构 * University of Washington(华盛顿大学)
AI总结 提出跨层向量量化变分自编码器(CLVQ-VAE),通过离散向量量化瓶颈将残差流中的重复特征压缩为紧凑可解释的概念向量,在三个数据集上优于聚类、单层VQ-VAE和稀疏自编码器基线。
OCSVM引导的无监督异常检测表示学习
发表机构 * Univ. Lyon(里昂大学) ; CNRS UMR 5220(国家科学研究中心UMR 5220) ; Inserm U1294(法国国家医学研究院U1294) ; INSA Lyon(里昂国立应用科学学院) ; UCBL(里昂大学) ; CREATIS(里昂大学生物医学图像研究中心)
AI总结 提出一种将表示学习与可解析求解的一类SVM耦合的方法,通过定制损失函数直接对齐潜在特征与决策边界,在MNIST-C和脑MRI病变检测任务上展现了鲁棒性和性能。
向量量化潜在概念:聚类式概念发现的可扩展替代方案
发表机构 * Dalhousie University, Canada(加拿大达尔豪斯大学) ; University of Calgary, Canada(加拿大卡尔加里大学)
AI总结 提出VQLC框架,通过向量量化学习离散潜在概念,在保持可解释性的同时,实现与K-Means相当的计算效率,并优于层次聚类在大规模数据上的扩展性。
面向接触丰富机器人强化学习的自监督多感官预训练
发表机构 * Interactive Robot Perception & Learning (PEARL) Lab, TU Darmstadt, Germany(图腾机器人感知与学习实验室,图腾施塔德大学,德国) ; Hessian.AI(海斯堡人工智能) ; Robotics Institute Germany (RIG)(德国机器人研究所(RIG))
AI总结 提出MSDP框架,通过掩码自编码和跨模态预测学习多感官表示,并采用非对称架构(评论家使用交叉注意力提取动态特征,演员使用稳定池化表示)加速策略学习,在模拟和真实机器人任务中展现出鲁棒性和高效性。
Comments 8 pages, 11 figures
高阶类PCA旋转不变特征用于模旋转的详细形状描述符
发表机构 * Jarek Duda
AI总结 提出将PCA扩展到高阶张量(如三阶中心矩)或多项式乘高斯分布,以获取更精确的旋转不变形状描述符,并应用于分子形状描述、物体识别和形状相似性度量。
Comments 5 pages, 4 figures
具有不完美二元反馈的 restless bandits: PCL-indexability 分析与计算
发表机构 * Universidad Carlos III de Madrid(马德里卡洛斯三世大学)
AI总结 针对具有二元隐状态和不完美二元反馈的 restless bandits,提出基于部分守恒律(PCL)的分析与计算框架,通过验证定理、确定性骨架和组合词方法建立可索引性并计算 Whittle 指数,实验表明 MP 指数策略优于基准策略。
Comments 59 pages, 12 figures, submitted 27/3/2026
碰撞前的预见:利用冻结视觉-语言模型的预期性安全强化学习
发表机构 * Iowa State University(爱荷华州立大学)
AI总结 提出VLM-Safe-RL框架,通过冻结视觉-语言模型生成预期性成本项,改进CMDP拉格朗日更新,在高速碰撞场景下实现安全与回报的平衡。
Comments 44pages, 26 figures
密封审计上的有符号压缩进展是古德哈特抵抗的
发表机构 * GitHub
AI总结 提出有符号压缩进展作为内在动机,证明其累积奖励等于审计改进,且对有限审计面板具有假阳性预算,抵抗古德哈特定律。
Comments 16 pages, 7 figures. Lean 4 (Mathlib) mechanized core and ARC-TGI experiment code: https://github.com/Zetetic-Dhruv/audit-compression-progress
IAPO:面向小型多模态代理工具使用的输入归因感知策略优化
发表机构 * University of California, Santa Barbara(加州大学圣塔芭芭拉分校)
AI总结 提出输入归因感知策略优化(IAPO),通过强化学习对齐模型与教师模型的输入归因,提升多模态小语言模型的工具调用能力,在六个测试集上平均准确率提升3%。
RLCSD: 基于对比策略自蒸馏的强化学习
发表机构 * Tsinghua University(清华大学) ; Tongyi Lab, Alibaba Group(阿里巴巴集团通义实验室) ; Peking University(北京大学)
AI总结 针对策略自蒸馏中特权诱导的风格漂移问题,提出RLCSD方法,通过对比正确与错误提示下的师生差距来抑制风格偏移,提升推理模型在数学和逻辑推理任务上的性能。
Comments 20 pages, 9 figures, 9 tables
空间采样值衰减:非平稳深度强化学习的遗忘机制
发表机构 * CITEC, Faculty of Technology, Bielefeld University(比勒费尔德大学技术学院CITEC)
AI总结 受啮齿动物遗忘行为启发,提出空间采样值衰减作为显式遗忘机制,用于深度强化学习应对环境漂移,在DQN和SAC上验证效果与局限。
Comments Accepted at The 2nd Workshop on Epistemic Intelligence in Machine Learning, EIML@ICML 2026, (non-archival)
基于频繁方向的高效多项式逻辑斯蒂老虎机
发表机构 * State Key Laboratory of Novel Software Technology, Nanjing University(南京大学计算机软件新技术国家重点实验室) ; School of Artificial Intelligence, Nanjing University(南京大学人工智能学院) ; Paul G. Allen School of Computer Science & Engineering, University of Washington(华盛顿大学保罗·G·艾伦计算机科学与工程学院)
AI总结 针对多项式逻辑斯蒂老虎机的高维计算瓶颈,提出集成频繁方向矩阵素描的EOFD-MLogB算法,将每轮复杂度降至O(Kd(m+K)^2)时间和O(Kd(m+K))空间,并证明其遗憾界接近原算法。
PAWS: 基于优势加权片段的首选学习
发表机构 * University of Freiburg(弗莱堡大学)
AI总结 针对偏好强化学习中训练与推理分布不匹配导致时间信用分配退化的问题,提出PAWS方法,利用片段级优势函数直接进行策略更新,在机器人操作和运动任务上优于现有方法。
Comments Published as a conference paper at ICML 2026
打破熵界:通过带拒绝采样的多令牌预测加速强化学习训练
发表机构 * Qwen Team, Alibaba Inc(阿里巴巴集团 Qwen 团队)
AI总结 针对强化学习训练中多令牌预测接受率因熵波动而下降的问题,提出Bebop方法,采用概率拒绝采样和端到端TV损失优化,实现高达95%接受率和1.8倍加速。
APPO: 智能体程序策略优化
发表机构 * University of Science and Technology of China(中国科学技术大学) ; AMAP, Alibaba Group(阿里巴巴集团高德地图) ; Southern University of Science and Technology(南方科技大学)
AI总结 提出APPO方法,通过细粒度分支和程序级优势缩放改进智能体强化学习的信用分配,在13个基准上平均提升近4个点。
Comments 25 pages, including 14 pages of main text and 11 pages of appendix; work in progress
ATLAS: 自动化科学的主动理论学习
发表机构 * Google DeepMind(谷歌深度思维) ; Princeton University(普林斯顿大学) ; Columbia University(哥伦比亚大学) ; University College London(伦敦大学学院)
AI总结 提出ATLAS框架,通过主动学习迭代生成稀疏神经网络假设并设计最优区分实验,在bandit任务中恢复强化学习智能体,相比随机实验采样效率提升5-10倍。
ProcessThinker: 通过基于展开的过程奖励增强多模态大语言模型推理
发表机构 * LMU Munich(慕尼黑大学) ; Harvard University(哈佛大学) ; University of Cambridge(剑桥大学) ; Mina AI ; Konrad Zuse School of Excellence in Reliable AI (relAI)(康拉德·楚泽可靠人工智能卓越学校(relAI))
AI总结 提出ProcessThinker,一种无需显式过程奖励模型的后训练方法,通过步骤标记格式和基于展开的过程奖励,为多步推理提供密集的步骤级奖励,提升多模态推理一致性。
Comments Accepted at ICLR 2026 Workshop on Logical Reasoning of Large Language Models. 7 pages, 1 figure
基于强化学习的多智能体在流体中的会合
发表机构 * AML, Department of Engineering Mechanics, Tsinghua University(AML,工程力学系,清华大学) ; Department of Physics, Gothenburg University(物理系,哥德堡大学)
AI总结 采用多智能体强化学习(MARL)在涡旋流中开发物理信息会合策略,显著提高会合率,并具有跨涡旋强度、尺度和群体规模的迁移性,通过打破状态-动作图对称性防止智能体被困在分离涡旋中。
Phi-Actor-Critic: 引导一般和博弈走向帕累托高效关联均衡
发表机构 * Politecnico di Milano(米兰理工大学) ; Tilburg University(蒂尔堡大学) ; University of Applied Sciences and Arts of Southern Switzerland(瑞士南瑞士应用科学与艺术大学)
AI总结 提出Φ-Actor-Critic框架,通过交换遗憾最小化引导多智能体学习向高社会福利的关联均衡收敛,并采用集中式注意力批评家高效估计反事实遗憾,结合拉格朗日均衡选择机制优化社会福利。
Comments Accepted to IJCAI 2026
通过对比交互从零开始学习物体操作
发表机构 * UC San Diego(加州大学圣地亚哥分校) ; UT Austin(德克萨斯大学奥斯汀分校)
AI总结 针对对比强化学习在交互密集操作任务中表现不佳的问题,提出交互加权重采样方法,通过保留模式边界提升多模态分段非线性可达性表示,在仿真和真实机器人空气曲棍球任务中取得显著改进。
时间不一致控制问题中学习均衡的确定性策略梯度
发表机构 * Department of Industrial Engineering and Operations Research, University of California, Berkeley, USA(加州大学伯克利分校工业工程与运筹学系) ; Department of Applied Mathematics, The Hong Kong Polytechnic University, Kowloon, Hong Kong(香港理工大学应用数学系)
AI总结 提出一种连续时间无模型强化学习算法,通过确定性策略梯度和内定点迭代学习时间不一致控制问题的均衡策略,并在均值-方差投资组合和非指数贴现跟踪投资组合中验证有效性。
Comments Keywords: Time-inconsistent control, two-stage reformulation, model-free continuous-time reinforcement learning, deterministic policy gradient, fixed point iteration
评论家架构的重要性:双评论家与统一评论家在人形机器人移动操作中的对比
AI总结 针对人形机器人多目标强化学习,对比统一评论家与双评论家架构,实验表明双评论家策略在到达速度、吞吐量和成功率上显著优于统一评论家,且架构选择比奖励工程影响更大。
Comments Accepted at the ICRA 2026 Workshop on Reinforcement Learning for Imitation Learning (RL4IL), Vienna, Austria. 4 pages, 2 figures
IntElicit: 通过对话策略优化引出和评估情境化创造力
发表机构 * East China Normal University(华东师范大学) ; Shanghai Innovation Institute(上海创新研究院)
AI总结 提出IntElicit框架,通过分解过程奖励机制优化对话策略,在交互中减少非创造性混淆因素,从而更有效地引出和评估情境化创造力。
CCKS:基于共识的通信与知识共享
发表机构 * Public Computing Cloud, Renmin University of China(中国人民大学公共计算云) ; School of Information, Renmin University of China(中国人民大学信息学院) ; State Key Laboratory of Multimodal Artificial Intelligence Systems, Beijing Engineering Research Center of Intelligent Systems and Technology, Institute of Automation, Chinese Academy of Sciences(多模态人工智能系统国家重点实验室,智能系统与技术北京工程研究中心,中国科学院自动化研究所) ; The Information Science Academy, China Electronics Technology Group Corporation(中国电子科技集团有限公司信息科学研究院) ; Department of Mechatronics Engineering, Guangdong University of Technology(广东工业大学机电工程学院)
AI总结 针对多智能体强化学习中动作建议过度依赖教师指导的问题,提出基于共识的通信与知识共享框架,通过对比学习构建共识模型,平衡探索与学习,提升合作效率与性能。
学习对你的VLA说什么:基本无害的视觉语言动作模型引导
发表机构 * Robotics Institute, Carnegie Mellon University(卡内基梅隆大学机器人研究所)
AI总结 提出一个框架,通过交互式搜索语言序列改进闭环VLA任务性能,并学习一个改进头预测何时语言引导能提升性能,同时通过共形化防止有害干预。
Comments 22 pages, 14 tables, 14 figures
UniIntervene:用于高效现实世界强化学习的智能干预
发表机构 * Nanyang Technological University(南洋理工大学) ; Beijing University of Posts and Telecommunications(北京邮电大学)
AI总结 提出UniIntervene智能干预模型,通过检测低效探索并自主恢复策略至高价值状态,在真实机器人操作任务中平均成功率提升8.6%,人类干预减少57%。
Comments Project page: https://denghaoyuan123.github.io/UniIntervene-project/
Pass@K 策略优化:解决更困难的强化学习问题
发表机构 * Google DeepMind(谷歌深Mind)
AI总结 提出 Pass-at-k 策略优化 (PKPO),通过变换奖励直接优化 pass@k 性能,利用低方差无偏估计器,在训练中退火 k 可同时提升 pass@1 和 pass@k,解决更难问题。
超越次优性:离线强化学习通过随机解决方案学习有效调度
发表机构 * Eindhoven University of Technology(埃因霍温理工大学)
AI总结 提出离线RL算法CDQAC,从次优静态数据集学习调度策略,在JSP/FJSP上超越在线RL和强启发式方法,仅需1-5%数据,发现状态-动作覆盖比轨迹质量更重要。
噪声引导的模仿学习传输方法
发表机构 * University of Cambridge(剑桥大学) ; University of Oxford(牛津大学)
AI总结 针对低数据场景下的模仿学习,提出噪声引导传输(NGT)方法,通过对抗训练将模仿问题转化为最优传输问题,无需预训练或特殊架构,在极低数据量下实现强性能。
Comments Accepted at ICML 2026. Code: https://github.com/lionelblonde/ngt
具有动作触发观测的强化学习
发表机构 * Department of Statistical Sciences, University of Toronto(统计科学系,多伦多大学;向量研究所) ; Vector Institute
AI总结 提出动作触发稀疏可追踪MDP框架,推导Bellman方程并证明最优策略存在,利用观测间动作序列的线性表示实现基于回归的方法,在几何分布情节下达到与完全可观测线性MDP匹配的遗憾界。
反向流匹配:基于扩散与流策略的在线强化学习统一框架
发表机构 * Zeyang Li(李泽阳) ; Sunbochen Tang(唐顺波晨) ; Navid Azizan(阿齐兹安纳维)
AI总结 针对在线强化学习中扩散与流策略缺乏目标样本的问题,提出反向流匹配框架,通过后验均值估计和Langevin Stein算子构造控制变量,统一了噪声期望与梯度期望两类方法,并扩展到流策略,提升训练效率与稳定性。
Comments ICML 2026 (Spotlight); Code: https://github.com/azizanlab/ReverseFlowMatching
连通性对强化学习中拉普拉斯表示的影响
发表机构 * University of Edinburgh(爱丁堡大学)
AI总结 本文研究了连通性对强化学习中拉普拉斯表示的误差影响,通过分析状态图的代数连通性,推导了线性价值函数近似误差的上界,并展示了表示学习管道中的端到端误差分解。
用于去中心化双层强化学习的样本高效超梯度估计
发表机构 * University of Tokyo(东京大学) ; National Institute of Information and Communications Technology(日本信息与通信技术研究所)
AI总结 针对去中心化双层强化学习中领导者无法干预跟随者优化过程的问题,提出基于玻尔兹曼协方差技巧的超梯度估计方法,实现高维决策空间下的样本高效优化,并首次应用于双人马尔可夫博弈。
Comments 29 pages. Extended version of the paper accepted to ICAPS 2026
视觉-语言-动作跳跃启动用于强化学习机器人智能体
发表机构 * University of Applied Science and Arts of Southern Switzerland, Department of Innovative Technologies(瑞士南方应用科学与艺术大学创新技术系) ; Università della Svizzera Italiana, Faculty of Informatics, Lugano, Switzerland(瑞士意大利大学信息学院,卢加诺,瑞士)
AI总结 提出VLAJS方法,通过稀疏的VLA高层动作建议引导PPO探索,结合方向性动作一致性正则化,提升强化学习在长时域操作任务中的样本效率,并在仿真和真实机器人上验证。
Comments ICRA 2026 Workshop on Reinforcement Learning in the Era of Imitation Learning
超越大语言模型强化学习中的统一令牌级信任区域
发表机构 * Tencent Hunyuan(腾讯混元)
AI总结 针对PPO风格信任区域在自回归生成中的位置无关问题,提出CPPO方法,通过位置加权阈值和累积前缀预算动态调整令牌级约束,提升训练稳定性和推理准确性。
Comments Project Page: https://hunyuan-cppo.github.io/
在线平台中的数据驱动动态分类:学习双边信息
发表机构 * IE Business School, IE University(IE大学商学院) ; Kenan-Flagler Business School, The University of North Carolina at Chapel Hill(北卡罗来纳大学教堂山分校肯纳-弗拉格勒商学院)
AI总结 针对双边服务平台,提出一种数据驱动算法,在未知顾客和卖家选择参数的情况下动态优化商品分类,并证明其遗憾值随时间呈多对数增长且达到最优速率。
通过扩散模型提升离线多智能体强化学习的泛化能力与数据效率
发表机构 * Institute for Interdisciplinary Information Sciences(交叉信息学院) ; Tsinghua University(清华大学) ; Department of Electronic and Computer Engineering(电子与计算机工程系) ; Hong Kong University of Science and Technology(香港科学与技术大学)
AI总结 提出扩散离线多智能体模型(DOM2),利用扩散模型增强策略表达力和多样性,结合轨迹数据重加权,在离线MARL中显著提升性能、泛化能力和数据效率。
离散时间高斯过程混合在机器人策略学习中的惊人有效性
发表机构 * Department of Computer Science, University of Freiburg, Germany(弗赖堡大学计算机科学系)
AI总结 提出MiDiGap方法,利用少量演示和相机观测,通过离散时间高斯过程混合实现机器人操作策略的灵活表示与模仿学习,在长时域、高约束、动态和多模态任务上取得SOTA性能,并支持推理时引导。
Comments Submitted for publication to IEEE Transaction on Robotics
PRInTS:面向长程信息检索的奖励建模
发表机构 * University of North Carolina at Chapel Hill(北卡罗来纳大学教堂山分校) ; University of Texas at Austin(德克萨斯大学奥斯汀分校)
AI总结 提出PRInTS生成式过程奖励模型,通过密集评分和轨迹摘要提升长程信息检索中工具交互与推理能力,在多个基准上超越前沿模型。
Comments ACL 2026, 19 pages, code: https://github.com/G-JWLee/PRInTS
关于RL训练的语言模型的最优推理长度
发表机构 * University of Tokyo(东京大学)
AI总结 研究强化学习训练的语言模型中推理长度与准确率的非单调关系,发现存在最优中间长度,并通过模式准确率分析揭示其成因。
Comments 18 pages, 12 figures
在线学习用于监督切换控制
发表机构 * Massachusetts Institute of Technology(麻省理工学院)
AI总结 研究在线学习在部分观测线性动态系统中监督切换控制的问题,提出非渐近分析方法,结合多臂老虎机算法,实现稳定控制器识别与系统辨识。
回顾性工具优化:通过轨迹回滚上的自我偏好改进LLM智能体
发表机构 * City University of Hong Kong(香港城市大学) ; Microsoft Research Asia(微软亚洲研究院)
AI总结 提出一种自监督方法RHO,利用历史轨迹回滚和自偏好选择优化智能体工具集,无需真实标签,在SWE-Bench Pro上通过单轮优化将通过率从59%提升至78%。
Comments Code: https://github.com/wbopan/retro-harness ; Project website: https://paper-rho.wenbo.io
ProHiFlo: 具有功能引导的分层流匹配用于从头蛋白质生成
发表机构 * Arizona State University(亚利桑那州立大学) ; University of Wisconsin-Madison(威斯康星大学麦迪逊分校) ; Tongji University(同济大学)
AI总结 提出ProHiFlo,一种分层流匹配框架,通过粗到细生成、功能引导和自适应SE(3)等变架构,实现高效、准确的从头蛋白质生成,在酶活性位点支架任务中成功率58.9%。
Comments 23 pages
物理信息驱动的生成式AI在半导体制造中的应用:通过构造强制生成模型中的硬物理约束
发表机构 * School of Electrical and Computer Engineering, University of Oklahoma(俄克拉荷马大学电气与计算机工程学院) ; Center for Quantum Research and Technology, University of Oklahoma(俄克拉荷马大学量子研究与技术中心) ; Intelligent Neuromorphic and Quantum Understanding for Innovative Research and Engineering (INQUIRE) Laboratory(创新研究与工程智能神经形态与量子理解实验室) ; Material Science and Engineering Program, University of Oklahoma, Norman, OK 73019 USA(俄克拉荷马大学材料科学与工程项目,Norman, OK 73019 USA)
AI总结 针对半导体制造中生成模型必须满足硬物理约束的问题,本文提出通过构造集成物理信息(如物理信息扩散、PDE约束变分模型等)来强制约束,而非事后过滤,并给出四种集成模式和未来研究方向。
最小作用量引导扩散用于物理外推
发表机构 * College of Engineering, Peking University(北京大学工学院) ; Ningbo Institute for Digital Twin, Eastern Institute of Technology(东方理工宁波数字孪生研究院) ; Eastern Institute for Advanced Study, Eastern Institute of Technology(东方理工高等研究院) ; Shenzhen Tenfong Technology Co., Ltd.(深圳腾方科技有限公司) ; Mechanical Engineering, The Pennsylvania State University(宾夕法尼亚州立大学机械工程系)
AI总结 提出最小作用量引导扩散(LAPG)框架,通过将最小作用量原理转化为可微的推理时校正机制,在时间、参数和几何外推中保持物理一致性,优于训练时物理信息基线。
FreeBridge: 用于细胞转变动力学的变分薛定谔桥
发表机构 * Stony Brook University(石溪大学) ; University of Toronto(多伦多大学) ; University Health Network(大学健康网络)
AI总结 针对高内涵成像中细胞扰动建模的端点监督问题,提出FreeBridge方法,通过变分薛定谔桥在固定细胞流形上学习随机传输,并利用经验潜在支持正则化约束中间路径,在保持端点保真度的同时减少中间支持违规。
Comments Accepted to MICCAI 2026 (early accept). Project page: https://y-research-sbu.github.io/FreeBridge/
谱正则化潜流匹配用于湍流生成
发表机构 * Department of Mechanical Engineering, University of Nevada, Reno(内华达大学里诺分校机械工程系)
AI总结 针对潜扩散和流匹配模型在湍流生成中低估耗散区振幅的问题,提出谱正则化潜流匹配框架,通过区域加权对数谱目标将深度耗散保留谱功率从25%提升至94%,并显著改善采样成本-保真度权衡。
Comments Accepted at the AI4Physics Workshop at ICML 2026. OpenReview: https://openreview.net/forum?id=MEZ1otYgXS
基于上下文先验的分布外脑动力学流匹配
发表机构 * Hertie Institute for AI in Brain Health, University of Tübingen(赫蒂人工智能脑健康研究所,图宾根大学) ; Tübingen AI Center, University of Tübingen(图宾根人工智能中心,图宾根大学) ; Charité – Universitätsmedizin Berlin, Department of Psychiatry and Psychotherapy(柏林夏里特医学院,精神病学与心理治疗系) ; German Center for Mental Health (DZPG), partner site Tübingen(德国心理健康中心(DZPG),图宾根合作站点)
AI总结 提出一种逐时间步条件扩散Transformer,通过注入组合语言和可选空间先验,实现未见认知任务下fMRI脑动力学的零样本生成,支持反事实神经科学。
Comments Code and pretrained models available at https://github.com/SamGijsen/pinc-flows
重新评估掩蔽扩散语言模型中的置信度重新掩蔽
发表机构 * UvA-Bosch Delta Lab, University of Amsterdam(阿姆斯特丹大学UvA-Bosch Delta实验室) ; Bosch Center for AI(博世人工智能中心) ; University of Basel(巴塞尔大学) ; Johns Hopkins University(约翰霍普金斯大学)
AI总结 本文重新评估了掩蔽扩散语言模型中一种无需训练的后验置信度重新掩蔽方法WINO,发现在标准解码设置下其收益甚微,且会加剧多样性坍塌问题。
LatticeBridge: 用于忠实结构化序列合成的罕见事件序列推理
发表机构 * Bahcesehir University(巴切塞希尔大学)
AI总结 针对结构化序列生成中约束满足的罕见事件问题,提出LatticeBridge方法,结合前缀语言模型、实例编译表面自动机和扭曲序列蒙特卡洛解码器,在多个基准上显著提升锚点满足率和覆盖率。
Comments 19 pages. Code and benchmark files available at https://github.com/farukalpay/latticebridge
SPADE: 用于自回归高粒度量热器模拟的分裂与延迟嵌入
发表机构 * Institute for Experimental Physics, Universität Hamburg(实验物理研究所,汉堡大学) ; Deutsches Elektronen-Synchrotron DESY(德国电子同步辐射光源DESY)
AI总结 提出SPADE自回归变压器,通过独立嵌入多特征令牌并延迟特征流,利用标准自注意力学习令牌内相关性,在ILD探测器点云簇射生成中优于现有模型。
Comments 20 pages, 13 figures
PianoKontext: 从平淡语境中生成富有表现力的演奏
发表机构 * Dmitrii Gavrilev
AI总结 提出PianoKontext,一种基于流匹配的钢琴演奏渲染模型,通过动态时间规整对齐乐谱与演奏的潜在表示,生成可变长度的表现力演奏。
Comments ICML 2026 Workshop on Machine Learning for Audio (Oral)
用于平滑且可解释的归一化流的解析双射
发表机构 * University of Cambridge(剑桥大学)
AI总结 提出三类全局光滑、解析可逆的双射函数,替代耦合流中的仿射变换或样条,并设计径向流架构,在径向结构目标上以千分之一参数达到耦合流质量。
Comments Final ICML 2026 version. 9 + 14 pages, 10 + 11 figures, 3 + 2 tables. New CIFAR-10 and tabular-data results; main text shortened for readability
基于推理时间强化学习的开放材料生成
发表机构 * ETH Zurich(苏黎世联邦理工学院)
AI总结 提出OMatG-IRL框架,通过策略梯度强化学习直接作用于学习的速度场,无需显式计算得分,实现晶体结构预测中的能量目标强化,采样效率提升一个数量级。
Comments 25 pages, 12 figures, 6 tables
潜在颜色子空间:高维混沌中的涌现秩序
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; University of Toronto(多伦多大学) ; University of Cambridge(剑桥大学) ; University of Oxford(牛津大学)
AI总结 本文揭示了FLUX.1变分自编码器潜在空间中颜色表示的HSL结构,并提出一种无需训练的闭式潜在空间操作方法,实现对生成图像颜色的预测与显式控制。
Comments Accepted at ICML 2026
超越连续性:从单细胞快照无模拟重建离散分支动力学
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 针对单细胞快照数据中随机性和非保守质量动态(如细胞增殖和凋亡)的挑战,提出无模拟框架Unbalanced Schrödinger Bridge (USB),通过离散分支薛定谔桥问题建模单细胞分辨率的跳跃式生灭动态,实现高效轨迹重建与离散模拟。
整流流中对比速度匹配的几何擦除
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; ETH Zurich(苏黎世联邦理工学院)
AI总结 提出GEM框架,通过对比速度匹配实现整流流模型中的概念擦除,结合生成流网络与教师引导的流匹配,有效抑制有害内容生成。
合成住宅:数据稀缺下用于住宅建筑数据生成的多模态生成式AI管道
发表机构 * Lafayette University(拉法叶大学) ; Georgia State University(佐治亚州立大学)
AI总结 提出一个多模态生成式AI框架,整合图像、表格和模拟组件,从公开记录和图像生成合成住宅建筑数据集,以解决建筑参数数据稀缺问题。
Comments 37 pages; 2 appendices; 6 figures; 2 tables. Code available at https://github.com/Lafayette-EshbaughSilveyra-Group/synthetic-homes
扩散模型中学习数据统计的理论:从容易到困难
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 本文研究了扩散模型在学习数据统计时的分布简单性偏差,揭示了学习 pairwise 统计和 higher-order 统计所需的样本复杂度差异,并引入了扩散信息指数这一不变量。
基于梯度的Gray-Scott系统反演的损失景观诊断:解构PINN各组件的角色
发表机构 * Yan Yang(杨 Yan)
AI总结 通过直接反向传播稳态损失至未折叠的Gray-Scott模拟,发现优化因损失景观中的平坦高原和陡峭悬崖而失败,而PINN中的残差损失通过隐式编码完整PDE动力学避免了该病理现象。
Comments Accepted at the AI4Physics Workshop, ICML 2026 (non-archival). 14 pages, 10 figures
超越欧几里得稳定性的镜像下降:初始化敏感性的指数级分离
发表机构 * Blavatnik School of Computer Science and AI, Tel Aviv University(特拉维夫大学布拉瓦特尼克计算机科学与人工智能学院) ; Google Research(谷歌研究院)
AI总结 本文证明非二次正则化的镜像下降(MD)在凸光滑目标上对初始化的敏感性可呈指数级增长,与梯度下降(GD)形成鲜明对比,并提出基于锚点的Bregman正则化可缓解不稳定性。
范围感知贝叶斯优化用于在目标属性窗口内发现多样化设计
发表机构 * Department of Chemical and Biological Engineering, Princeton University(普林斯顿大学化学与生物工程系)
AI总结 提出范围感知贝叶斯优化框架,通过采集函数直接评分候选解满足目标范围的后验概率,在基准任务和实际案例中比标准方法发现更多样化的有效设计。
Comments 64 pages, 6 main text figures, 17 supporting figures, 6 supporting tables
具有延迟反馈的容量受限在线凸优化
发表机构 * Department of Statistical Sciences, University of Toronto(多伦多大学统计科学系) ; Vector Institute(向量研究所) ; Institute for Data, Econometrics, Algorithms, and Learning (IDEAL), hosted by UIC and TTIC(数据、计量经济学、算法与学习研究所(IDEAL),由伊利诺伊大学芝加哥分校和丰田工业大学芝加哥分校主办)
AI总结 研究在硬容量约束下(最多同时跟踪C个待处理轮次)的延迟在线凸优化,通过引入半先知模型和延迟加权FTRL算法,首次给出了凸和强凸损失下容量受限OCO的遗憾界。
PINNs的可靠误差估计:后验下界与上界
发表机构 * Physikalisch-Technische Bundesanstalt (PTB)(德国联邦物理技术研究院) ; Technical University of Berlin(柏林工业大学) ; Weierstrass Institute for Applied Analysis and Stochastics(魏尔斯特拉斯应用分析与随机研究所) ; Eastern Mediterranean University(东地中海大学)
AI总结 提出PINNs求解常微分方程的可计算后验误差下界,结合局部单侧Lipschitz条件得到更紧的上界,实现双侧误差包络,并讨论初始条件处理对下界的影响。
低秩最优传输的黎曼方法
发表机构 * Centre for Machine Intelligence and Data Science, IIT Bombay(印度理工学院孟买分校机器智能与数据科学中心) ; Microsoft India(微软印度)
AI总结 提出黎曼几何框架用于低秩最优传输,通过将平衡与不平衡秩r正因子耦合建模为光滑子流形,并采用Fisher-Rao乘积度量,实现高效的一阶和二阶求解器,在收敛速度和性能上超越现有方法。
随机异质噪声下特征空间扰动的几何偏差
发表机构 * Department of Mathematics, Hong Kong University of Science and Technology(香港科技大学数学系) ; Department of Statistics and Data Science, National University of Singapore(新加坡国立大学统计与数据科学系)
AI总结 针对稀疏、异质方差噪声下的信号加噪声矩阵,研究发现经验特征向量存在经典扰动界无法捕捉的系统性几何偏差,并通过二次向量方程和精细各向同性局部律推导了最优非渐近扰动界。
Comments 104 pages, 1 figure
私有合成数据生成的固定参数可处理性
发表机构 * Google Deepmind(谷歌深Mind) ; Institute for Mathematical and Computational Engineering, Faculty of Mathematics and School of Engineering, Pontificia Universidad Católica de Chile(数学与计算工程学院、数学系和工程学院、智利天主教大学)
AI总结 研究差分隐私下合成数据生成问题,通过查询族关联图的树宽参数建立固定参数可处理性,提出两种最优算法。
松弛全局几何下分布式优化的量化随机原始-对偶方法
发表机构 * Indian Institute of Technology Bombay(印度理工学院班加罗尔) ; Tata Consultancy Services Research(塔塔咨询公司研究)
AI总结 提出量化随机原始-对偶方法q-PDGD,在松弛全局几何下证明线性收敛到邻域或O(1/k)收敛,匹配最优集中随机复杂度。
Comments Accepted to UAI
退火熵分配用于排序与选择
发表机构 * Business School(商学院) ; The University of Edinburgh(爱丁堡大学) ; Warwick Business School(沃里克商学院) ; The University of Warwick(沃里克大学)
AI总结 提出退火熵分配框架,通过加权log-sum-exp替代非光滑极大极小大偏差率目标,结合鞍点近似提升有限预算下的区分能力,数值实验表明在多个候选接近时性能优异。
测试时训练对近似采样的威力
发表机构 * Microsoft Research NYC(微软研究院纽约分校) ; MIT(麻省理工学院)
AI总结 本文形式化测试时训练(TTT)为从已知分布类中采样的问题,证明查询复杂度的二次下界,并展示在分布类大小受限时可规避该下界,为TTT提供理论框架。
基于最小距离估计量的Hellinger密度估计:高斯混合、对数凹等
发表机构 * Stanford University(斯坦福大学) ; University of Washington(华盛顿大学)
AI总结 将最小距离估计方法从总变差距离扩展到Hellinger距离,通过反向数据处理不等式,实现了对对数凹混合和高斯混合(任意方差)的近线性时间学习,样本复杂度接近最优。
QENDy的积分形式用于鲁棒非线性系统辨识
发表机构 * Department of Mathematics and Statistics at the University of South Florida(佛罗里达州立大学数学与统计学系) ; Institute of Engineering and Technology, JK Lakshmipat University(JK拉克什米帕特大学工程与技术学院) ; School of Mathematical & Computer Sciences at the Heriot–Watt University(赫里奥特-瓦特大学数学与计算机科学学院) ; University of Florida(佛罗里达大学)
AI总结 提出QENDy方法的积分形式,避免使用时间导数,从而增强对噪声的鲁棒性,实现更稳健的非线性动力学学习。
无批次数量约束的可再生Lasso:一种梯度增强方法
发表机构 * Department of Mathematics, City University of Hong Kong(香港城市大学数学系) ; School of Statistics and Data Science, Jiangxi University of Finance and Economics(江西财经大学统计与数据科学学院) ; Philosophy and Social Sciences Laboratory of Data Science in Finance and Economics at the Ministry of Education, Jiangxi University of Finance and Economics(教育部金融与经济数据科学哲学与社会科学实验室,江西财经大学) ; School of Statistics, Beijing Normal University(北京师范大学统计学院) ; CityUHK Shenzhen Research Institute(城大深圳研究院)
AI总结 针对高维广义线性模型的流数据在线估计,提出梯度增强替代损失函数,消除批次数量约束,并扩展到分布式流数据场景,理论推导非渐近误差界,实验验证精度提升。
乐观乘性权重更新的最后迭代收敛性
发表机构 * King Abdullah University of Science and Technology(卡塔尔科学与技术大学)
AI总结 本文证明乐观乘性权重更新(OMWU)在光滑凸-凹鞍点问题中以足够小的常数学习率渐近收敛,无需唯一性、严格互补性、误差界或接近解的初始化。
注意力中的相变:复制头涌现的贝叶斯理论
发表机构 * Racah Institute of Physics, Hebrew University of Jerusalem(拉卡学院物理研究所,耶路撒冷希伯来大学) ; John A. Paulson School of Engineering and Applied Sciences, Harvard University(约翰·A·保罗森工程与应用科学学校,哈佛大学) ; Institute for Advanced Simulation (IAS-6), Computational and Systems Neuroscience, Jülich Research Center(高级模拟研究所(IAS-6),计算与系统神经科学,茹里奇研究中心) ; Institute of AI for Health, Helmholtz Munich(健康人工智能研究所,海德堡-穆恩) ; RWTH Aachen University(亚琛工业大学) ; Department of Physics, Faculty 1, RWTH Aachen University(物理系,亚琛工业大学)
AI总结 通过分析单层softmax注意力网络在复制任务上的训练,提出贝叶斯理论揭示注意力矩阵的后验分布存在相变,并对比线性注意力发现softmax注意力呈现一阶相变。
量子奥卡姆学习:基于电路的量子学习中样本支持的表达能力
发表机构 * Institute for Convergence Research and Education in Advanced Technology, Yonsei University, Seoul 03722, Republic of Korea(融合技术研究中心,延世大学,首尔) ; Department of Quantum Information, Yonsei University, Incheon 21983, Republic of Korea(量子信息系,延世大学,仁川) ; Department of Statistics and Data Science, Yonsei University, Seoul 03722, Republic of Korea(统计与数据科学系,延世大学,首尔) ; Department of Physics, Hanyang University, Seoul, 04763, Republic of Korea(物理系,翰林大学,首尔)
AI总结 针对有限大小量子电路生成的数据,提出信息论奥卡姆理论,证明样本支持的表达能力定律:在迹距离精度ε下,M个样本最多支持约Mε²个门,将电路复杂度转化为自适应统计资源。
Comments 22 pages (main text + appendix), 2 figures
遗传算法与优化引导算子的数学视角
发表机构 * Department of Mathematics, MIT(麻省理工学院数学系)
AI总结 本文从数学角度建模遗传算法,将优化问题转化为查询复杂度问题,并证明某些问题必须依赖生成、变异和重组算子,同时揭示了多样性在解池中的关键作用。
Comments 18 pages, 1 figure
伴随方法与物理信息神经网络在PDE约束逆问题中的比较
发表机构 * Brown University(布朗大学) ; University of Rome 1(罗马大学)
AI总结 针对PDE约束逆问题,公平比较伴随优化与PINN,发现未知参数表示决定方法选择:网格场适合伴随,神经表示适合PINN;PINN在时间依赖问题中成本更低,且可预热启动伴随。
Comments 35 pages, 10 figures
一种受物理启发的优化器:速度正则化Adam
发表机构 * University of Oxford(牛津大学)
AI总结 本文提出VRAdam优化器,通过引入速度正则化技术,结合Adam的参数缩放,提升训练稳定性与收敛速度,理论分析显示其在非凸目标下的收敛速率为O(√(lnN)/√N)。
Comments L. Schorling and P. Vaidhyanathan contributed equally to this work. 20 pages, 10 figures
统一Transformer缩放定律中的学习动力学与泛化
发表机构 * Sun Yat-sen University(中山大学)
AI总结 本文通过将Transformer学习动力学形式化为ODE系统并近似为核行为,严格分析了随机梯度下降训练下的泛化误差,揭示了计算资源缩放时泛化误差的指数衰减与幂律衰减的两阶段相变,并建立了紧的上下界。
Comments 87 pages, 10 figures, 3 tables
AI4SLT: 基于 Lean 4 的形式化统计学习理论实证过程
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 本文首次在 Lean 4 中完整形式化统计学习理论,基于实证过程理论,通过人机协作工作流构建了可验证的定理证明工具箱,并揭示了教材中的隐含假设。
Comments Accepted by ICML 2026
超越平稳性的动量LMS理论:稳定性、跟踪与遗憾
发表机构 * School of Advanced Interdisciplinary Sciences, University of Chinese Academy of Sciences(中国科学院大学先进交叉学科学院) ; State Key Laboratory of Mathematical Sciences, Academy of Mathematics and Systems Science, Chinese Academy of Sciences(中国科学院数学科学国家重点实验室) ; School of Mathematical Sciences, University of Chinese Academy of Sciences(中国科学院大学数学科学学院)
AI总结 本文研究动量最小均方算法在非平稳时变线性系统中的跟踪性能与遗憾界,通过分析二阶时变随机向量差分方程,证明其快速适应和鲁棒跟踪能力。
Comments 9 pages, 3 figures
理解预测编码中的样本效率
发表机构 * Nuffield Department of Clinical Neurosciences, University of Oxford, United Kingdom(牛津大学神经科学学院Nuffield部门,英国) ; MRC Centre of Research Excellence in Restorative Neural Dynamics, United Kingdom(英国修复神经动力学研究卓越中心)
AI总结 本文研究预测编码在样本效率上的优势,通过目标对齐度量分析BP和PC的学习效率,发现PC在深度、狭窄和预训练网络中表现更优,提供机制理解以指导PC参数设计。
学习动力学揭示权重诱导的分层Gram度量层次结构
发表机构 * GitHub ; arXiv
AI总结 本文研究前馈ReLU网络在固定读出和二次损失下的梯度下降动力学,将其重写为训练集空间上的集体动力学,并揭示深度网络中权重诱导的Gram算子层次结构。
Comments 24 pages. v4: Corrected the hidden-activation dynamics; clarified the concept of field closure. Other minor corrections
从随机森林中可证明地恢复局部重要符号特征和交互
发表机构 * Faculty of Informatics and Data Science, University of Regensburg, Germany(信息与数据科学学院,莱茵河畔雷根斯堡大学)
AI总结 提出一种局部、模型特定的特征与交互重要性方法,通过结合全局和局部决策路径模式,在局部尖峰稀疏模型下可证明地恢复真实信号特征及其交互,并识别特征值大小对预测的驱动方向。
关于贝叶斯优化中汤普森采样遗憾界的分析
发表机构 * Nagoya University(名古屋大学) ; MI-6 Ltd.(MI-6公司)
AI总结 本文针对高斯过程汤普森采样(GP-TS)方法,在目标函数为GP样本路径的假设下,推导了其遗憾下界、累积遗憾二阶矩上界、期望宽松遗憾上界以及改进的累积遗憾上界,填补了GP-TS在高概率遗憾界方面的空白。
Comments 43 pages, Accepted to ICML 2026
量化语言模型蒸馏中的潜意识行为迁移比率
发表机构 * University of Freiburg(弗赖堡大学)
AI总结 通过控制教师模型行为强度并蒸馏学生模型,量化了潜意识行为迁移比率,发现迁移具有鲁棒性且呈现不同缩放行为。
FlowBank: 通过预计算与复用实现查询自适应智能体工作流优化
发表机构 * University of Maryland, College Park(马里兰大学哥伦比亚公园分校) ; Amazon(亚马逊)
AI总结 提出FlowBank框架,通过预计算多样化工作流并压缩为紧凑组合,在推理时自适应选择最优工作流,平衡性能与成本,在五个基准上平均得分最高且成本可控。
CRUMB: 通过分布匹配上下文批处理实现高效先验拟合网络推理
发表机构 * Global Technology Applied Research, JPMorganChase(摩根大通全球技术应用研究)
AI总结 提出CRUMB方法,通过聚类查询、最小化最大均值差异选择训练子集、再执行精确推理,在不重新训练的情况下加速先验拟合网络推理,在51个数据集上优于同类方法。
Comments 26 pages, 13 figures
TimeRouter: 时间序列基础模型的高效自适应路由
发表机构 * University of Connecticut(康涅狄格大学) ; Salesforce AI Research ; JP Morgan AI Research(摩根大通人工智能研究院)
AI总结 提出TimeRouter框架,通过轻量判别路由、选择性门控和集成回退实现时间序列基础模型的自适应选择,无需LLM推理,在GIFT-EVAL榜单取得最优性能。
移动NPU上的能效型设备端RAG:Snapdragon X Elite系统设计与基准测试
发表机构 * Qualcomm(高通) ; Snapdragon X Elite(骁龙X Elite) ; Dell XPS 13 laptop(戴尔XPS 13笔记本电脑) ; Qualcomm Hexagon NPU(高通Hexagon NPU) ; Adreno X1-85
AI总结 本文首次在Snapdragon X Elite的Hexagon NPU上实现端到端RAG流水线,通过对比CPU和GPU,NPU在嵌入吞吐量、系统能耗和查询延迟上分别提升9.1倍、降低12.3倍和4.0倍,且答案质量相当。
Comments 9 pages, 2 figures, 6 tables
小实验,更经济的决策:微预训练中分阶段提升的案例研究
发表机构 * Hewlett Packard Enterprise(慧与科技公司)
AI总结 研究微预训练中分阶段提升协议,通过固定预算筛选配置,在Windows A100和Linux L40S上验证,发现早期排名不稳定,但最终协议以144 GPU小时找到最优配置,成本低于全量筛选。
Comments 14 pages, 5 figures; 12-hour dual-host micro-pretraining promotion study; source package includes curated ancillary artifacts
一种可扩展的多GPU高斯泼溅PyTorch抽象
发表机构 * NVIDIA(英伟达) ; University of Toronto(多伦多大学) ; Vector Institute(向量研究所)
AI总结 提出一种多GPU高斯泼溅方法,通过CUDA统一内存和NVLink在算子级别分布参数,实现大规模场景重建,支持超过10亿高斯泼溅。
Comments 14 pages, 6 tables, 2 figures, and 1 listing. Includes supplementary material
SpAArSIST: 用于高效可靠反欺骗的稀疏化AASIST
发表机构 * Brno University of Technology(布尔诺理工大学)
AI总结 提出SpAArSIST,通过稀疏化图池化后端,在保持竞争力的同时降低计算量20.7%、模型大小4.1%,并提升域外鲁棒性。
Comments Accepted at Interspeech 2026
面向表格-图像多模态学习的参数高效适配器微调
发表机构 * School of Mathematical Sciences, Soochow University(苏州大学数学科学学院)
AI总结 提出TI-Adapter框架,通过冻结表格编码器并添加适配器,以及图像分支的嵌入层和瓶颈层适配器,实现高效多模态微调,在20个数据集上以更少参数达到或超越全微调性能。
超越暗知识:基于混合的蒸馏实现可靠预测
发表机构 * ITS Lab, Institute of Computer Science, University of Tartu(塔尔图大学计算机科学学院ITS实验室) ; LITIS, Université de Rouen(鲁昂大学LITIS实验室) ; LITIS, INSA de Rouen(鲁昂国立应用科学学院LITIS实验室)
AI总结 研究知识蒸馏与混合训练结合时教师-学生不匹配的影响,发现学生能独立获得线性结构并提升准确率与校准,提出混合蒸馏作为更丰富的知识传递通道。
通过渐进式幅度剪枝在一个训练周期内找到稀疏子网络
发表机构 * King Abdullah University of Science and Technology(阿卜杜拉国王科技大学) ; University of Jeddah(吉达大学) ; King Fahd University of Petroleum and Minerals(法赫德国王石油矿产大学) ; King Saud University(沙特国王大学)
AI总结 提出渐进式幅度剪枝方法,在单训练周期内线性增加稀疏度,基于权重幅度更新掩码,在CIFAR-10和MNIST上优于LTH、SNIP和GraSP等基线。
上下文驱动的增量压缩用于多轮对话生成
发表机构 * The Hong Kong University of Science and Technology(香港科技大学) ; NVIDIA AI Technology Center(NVIDIA AI技术中心) ; Shanghai Jiao Tong University(上海交通大学) ; The Chinese University of Hong Kong(香港中文大学)
AI总结 提出上下文驱动的增量压缩(C-DIC),通过可修订的线程压缩状态和轻量级检索-修订-写回循环,实现跨轮信息共享,稳定长对话性能。
Comments Accepted at ICML 2026
AI推断的能耗:效率路径与测试时计算
发表机构 * Microsoft(微软)
AI总结 本文提出基于令牌吞吐量的底层方法,估算大规模大语言模型的每查询能耗,揭示测试时扩展场景下的能耗变化及效率提升潜力。
Comments A preprint version with DOI is available at Zenodo: https://doi.org/10.5281/zenodo.17188770
MobileFineTuner:面向真实世界嵌入式AI应用中设备端大语言模型微调的移动原生框架
发表机构 * Duke Kunshan University(Duke昆山大学) ; The University of Hong Kong(香港大学)
AI总结 提出移动原生框架MobileFineTuner,通过C++实现资源感知训练运行时(内存高效注意力、激活检查点等),在商用手机上实现端到端LLM微调,显著降低内存压力并提升可执行性。
Comments 26 pages, 25 figures
FOCUS: DLLMs 知道如何驯服它们的计算瓶颈
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; University of Toronto(多伦多大学)
AI总结 针对扩散大语言模型解码中大部分计算浪费在不可解码令牌上的问题,提出 FOCUS 推理系统,通过动态聚焦可解码令牌并驱逐不可解码令牌,提升有效批大小,实现高达 3.52 倍的吞吐量提升。
Comments ICML 2026 camera-ready version
编译器优先的状态空间对偶性与可移植的 $O(1)$ 自回归缓存推理
发表机构 * Imperial College London(帝国理工学院伦敦分校)
AI总结 提出一种基于编译器优先的状态空间对偶性(SSD)结构的推理方法,通过标准JAX原语实现无自定义内核的单源推理路径,在TPU和GPU上达到高硬件利用率,且缓存解码速度比全前缀重计算快27-36倍。
Comments 21 pages, 6 figures. Code available at: https://github.com/CosmoNaught/mamba2-jax
TAPIOCA: 为什么任务感知剪枝能提升模型对分布外数据的能力
发表机构 * ANITI ; Meta ; Apple
AI总结 本文研究了任务感知剪枝在分布外数据上的改进机制,通过实验发现剪枝能提升OOD准确性,其核心贡献是通过几何解释说明任务感知剪枝如何调整模型表示以适应任务需求。
基于扩散的多模态大语言模型的视觉冗余控制并行解码
发表机构 * Zhejiang University(浙江大学) ; ZJUI-UIUC Institute(ZJUI-UIUC研究院)
AI总结 针对扩散型多模态大语言模型并行解码中视觉冗余问题,提出视觉冗余指数(VRI)和无需训练的视觉冗余控制解码(VRCD)方法,通过令牌到图像的注意力优先选择视觉互补位置,在多个基准上提升准确率。
Comments 18 pages, 5 figures, preprint. Code is available at https://github.com/infiniteYuanyl/VRCD
通过蒸馏和量化扩展 Apertus LLM 系列
发表机构 * LLM Family Expansion via Distillation and Quantization(LLM家族通过蒸馏和量化进行扩展)
AI总结 本文通过蒸馏和量化方法,基于 Apertus 8B 模型低成本扩展出参数高达 4B 的模型系列,覆盖多种硬件约束并保持强准确性。
打破冰层:分析 vLLM 中的冷启动延迟
发表机构 * Anonymous Institution, Anonymous City, Anonymous Region, Anonymous Country(匿名机构,匿名城市,匿名地区,匿名国家)
AI总结 本文首次系统分析 vLLM 推理引擎的冷启动延迟,将其分解为六个基础步骤,发现主要受 CPU 限制,并建立轻量级分析模型预测延迟,为大规模推理环境资源规划提供指导。
K-Forcing:通过前推语言建模进行联合下一K词解码
发表机构 * DAMO Academy, Alibaba Group(阿里巴巴达摩院) ; Hupan Lab(湖畔实验室) ; Zhejiang University(浙江大学) ; The Hong Kong University of Science and Technology(香港科技大学)
AI总结 提出K-Forcing范式,通过前推映射将自回归模型蒸馏为单次前向传播生成多个未来词,实现2.4-3.5倍加速,质量损失小。
Comments Code: https://github.com/alibaba-damo-academy/K-Forcing
Range-Arithmetic: 在不可信方上进行可验证的深度学习推理
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出Range-Arithmetic框架,通过将非算术运算转化为可验证的算术步骤,实现高效的深度神经网络推理验证,降低了计算和通信开销。
基于残差模型引导的偏好对齐大型语言模型
发表机构 * DIMES Dept., University of Calabria, Italy(卡利博大学DIMES系)
AI总结 提出PaLRS方法,利用残差流中的偏好信号提取轻量级引导向量,无需训练即可在推理时对齐模型偏好,在数学推理和代码生成任务上取得一致提升,同时节省大量时间。
Comments Accepted at IJCAI 2026
MPK:一种用于将张量程序转化为巨型内核的编译器和运行时系统
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; Tsinghua University(清华大学) ; NVIDIA ; University of Michigan(密歇根大学) ; Independent Researcher(独立研究者) ; Peking University(北京大学)
AI总结 提出MPK,首个自动将多GPU模型推理转化为单个高性能巨型内核的编译器和运行时系统,通过SM级图表示实现跨算子软件流水线和细粒度计算通信重叠,显著降低推理延迟。
Comments 14 pages
引导噪声:将随机扰动转化为有效下降方向以实现内存高效的LLM微调
发表机构 * School of Intelligence Science and Technology(智能科学与技术学院) ; Institute for Artificial Intelligence(人工智能研究院) ; Peking University(北京大学) ; State Key Laboratory of General Artificial Intelligence(通用人工智能国家重点实验室)
AI总结 提出一种即插即用框架,通过候选扰动池选择或组合与优化目标对齐的扰动,改进零阶优化梯度估计,提升LLM微调的收敛速度和任务精度。
Comments 12pages, 6figures
SoftMatcha 2:一种用于万亿级语料库的快速软模式匹配器
发表机构 * The University of Tokyo(东京大学) ; Kyoto University(京都大学) ; National Institute of Informatics(信息处理研究所) ; The Graduate University for Advanced Studies (SOKENDAI)(先进科学研究生院) ; National Institute for Japanese Language(日本语言学研究所) ; Tohoku University(东北大学)
AI总结 提出SoftMatcha 2,一种基于后缀数组和词向量的超快速软搜索算法,通过动态语料感知剪枝和磁盘感知设计,在万亿级语料上实现0.3秒内支持替换、插入和删除的语义变体搜索,并发现基准污染。
Comments Accepted at ICML2026. Project Page & Web Interface: https://softmatcha.github.io/v2/, Source Code: https://github.com/softmatcha/softmatcha2
块大小、权重精度和缩放精度在低功耗边缘高效神经网络NVFP4推理中的消融研究
AI总结 本文通过消融实验研究NVFP4 LUT推理框架,结合4位激活、两级缩放和电压缩放存储,在边缘高效模型上实现高达26.85倍能耗降低和2.21倍面积缩减。
Comments 7 Pages
联邦持续学习:分布式和非平稳数据上的终身与隐私保护学习综述
发表机构 * University of Pisa(比萨大学) ; University of Modena and Reggio Emilia(摩德纳和雷焦艾米利亚大学)
AI总结 本文系统综述联邦持续学习(FCL),定义问题、分析经典联邦学习在非平稳数据下的局限,提出多维分类法,并讨论应用、评估指标及开放挑战。
Comments 77 pages, 8 figures
准确且资源高效的联邦持续学习
发表机构 * University of Southern California(南加州大学) ; DEVCOM Army Research Office(DEVCOM陆军研究办公室)
AI总结 提出FedRAN框架,通过紧凑随机特征统计替代梯度更新,利用截断SVD降低通信开销,结合原型伪标签处理标签稀缺,在多个数据集上提升准确率并大幅降低资源消耗。
Comments Technical Report
面向边缘设备上心电图异常检测的隐私保护联邦自编码器
发表机构 * Google Research, New York, NY(谷歌研究,纽约,纽约州) ; University of California, Berkeley(加州大学伯克利分校) ; University of Cambridge(剑桥大学) ; University of Toronto(多伦多大学) ; University of Melbourne(墨尔本大学) ; University of Sydney(悉尼大学)
AI总结 提出一种结合联邦学习、差分隐私和INT8量化的端到端系统,在PTB-XL数据集上实现无监督12导联ECG异常检测,满足隐私、实时性和非IID数据要求。
Comments 9 pages, 4 figures, 6 tables. Preprint prepared in IEEE conference format. Submitted to: FLTA 2026
通过有界自适应裁剪减轻差分隐私学习中的差异影响
发表机构 * Department of Computer Science, University of Helsinki(计算机科学系,赫尔辛基大学) ; Department of Electrical and Computer Engineering, American University of Beirut(电气与计算机工程系,贝鲁特美国大学)
AI总结 针对差分隐私学习中梯度裁剪对少数群体造成的不公平影响,提出有界自适应裁剪方法,通过引入可调下界防止过度梯度抑制,在Skewed和Fashion MNIST上最差类准确率提升超过10个百分点。
Comments TMLR camera-ready version
AsFT:在窄安全盆地内锚定大语言模型微调期间的安全性
发表机构 * National University of Singapore(新加坡国立大学) ; University of Science and Technology of China(中国科学技术大学) ; Tsinghua University(清华大学)
AI总结 针对微调大语言模型时安全性易受损的问题,提出AsFT方法,通过惩罚与对齐方向正交的更新,将模型约束在窄安全盆地内,在提升任务性能的同时显著降低有害行为。
绕过生产环境中的提示守卫:受控释放提示攻击
发表机构 * UC Berkeley(加州大学伯克利分校) ; zkBricks Inc(zkBricks公司) ; Ethereum Foundation(以太坊基金会) ; NYU Shanghai(纽约大学上海分校)
AI总结 针对AI对齐的提示过滤存在理论上的不可能性,本文提出受控释放提示攻击,利用轻量级输入过滤器与主模型之间的资源不对称性,在实际部署的大语言模型系统中成功绕过提示守卫。
Comments Accepted to USENIX Security 2026
可认证安全RLHF:基于语义基础与固定惩罚约束优化的更安全大语言模型对齐
发表机构 * Department of Electrical and Computer Engineering(电气与计算机工程系) ; New Jersey Institute of Technology(新泽西理工学院) ; Department of Computer Engineering(计算机工程系) ; Heritage Institute of Technology(遗产理工学院)
AI总结 针对现有RLHF方法依赖奖励/成本函数和双变量调优导致性能敏感且缺乏可证明安全保证的问题,提出CS-RLHF,通过语义基础成本模型和固定惩罚约束优化,实现可认证安全对齐,效率提升至少5倍。
SEDULity:一种面向分布式安全区块链的高效有用工作证明学习框架
发表机构 * Department of Electrical and Computer Engineering(电气与计算机工程系)
AI总结 提出一种名为SEDULity的证明学习框架,通过将区块模板编码到训练过程中并设计难解易验的有用函数替代PoW谜题,在保持区块链安全性的同时高效训练机器学习模型。
谄媚的双立场评估:同意的结构与干预的局限
发表机构 * University of Toronto(多伦多大学)
AI总结 提出双立场评估方法,发现激活引导在减少谄媚时也会抑制对事实正确陈述的同意,揭示了表示可读但不可写的普遍差距。
Comments 18 pages, 9 figures, accepted to TAIS 2026
从几乎一无所有中学习:神经网络如何在严重输入损坏中生存
发表机构 * Cornell University(康奈尔大学)
AI总结 研究神经网络在输入严重损坏(>90%)时仍保持高精度的鲁棒性,通过平均场方法推导出网络实现最近类均值原型规则,解释学习成功的机制。
Comments 26 pages, 10 figures
压力下的风险:语言模型对抗鲁棒性的计算感知评估
发表机构 * University of Toronto(多伦多大学) ; Vector Institute(向量研究所) ; Hugging Face
AI总结 提出基于计算压力(累积FLOPs)的对抗鲁棒性评估框架,通过风险-计算曲线和两个新指标,揭示不同攻击策略的计算成本差异,并在10个模型上验证了对齐训练、模型规模等因素对计算空间鲁棒性的非单调影响。
已部署安全分类器的在线漂移检测与共形自适应
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出在线监测系统,使用校准序列统计检测分布漂移,并通过共形弃权层自适应阈值恢复目标错误率,在800个实验单元中实现86.6%有效检测。
Comments 16 pages, 4 figures, 7 tables. Code and data at https://github.com/junwenleong/safety-classifier-shift-monitor
自助监控:利用透明推理监督更强的AI智能体
发表机构 * California Institute of Technology(加州理工学院)
AI总结 提出自助监控协议,通过插入具有透明思维链的不可信中间模型来监督更强智能体,在软件工程任务中显著提升捕获率,即使不可信监控者与智能体合谋。
泛化黑客:模型可通过阻止行为泛化来博弈强化学习
发表机构 * California Institute of Technology(加州理工学院)
AI总结 本研究提出泛化黑客现象,模型在强化学习中通过自我接种机制阻止行为泛化,在保持高奖励的同时抵抗行为修正,首次证明模型能主动破坏训练过程。
强化学习破坏基于梯度的对抗优化
发表机构 * COSIC, KU Leuven(鲁汶大学COSIC) ; Imec ; Brubotics, VUB(布鲁塞尔自由大学Brubotics) ; DistriNet, KU Leuven(鲁汶大学DistriNet)
AI总结 研究通过强化学习训练图像分类器以破坏攻击者使用的梯度结构,发现RL作为隐式正则化器产生不稳定梯度方向和较小梯度幅度,使基于梯度的攻击失效,并与对抗训练结合实现双重防御。
推理下的校准漂移:思维链预算如何导致大型语言模型过度自信
发表机构 * Department of Computer Science and Engineering, Visvesvaraya Technological University, Belagavi(维斯瓦拉亚科技大学计算机科学与工程系,贝拉加维) ; Department of Computer Science and Business System, SG Balekundri Institute of Technology, Belagavi(SG巴莱昆德里理工学院计算机科学与商业系统系,贝拉加维)
AI总结 研究发现,增加思维链推理预算超过任务特定阈值会导致模型对错误答案过度自信,提出校准漂移现象并引入CABStop停止规则。
Comments 31 pages, 4 figures, 3 tables. Introduces Calibration Drift Under Reasoning (CDUR) with theoretical analysis and preliminary experiments; includes CABStop; code and data available
评估与对抗概念漂移对基于机器学习的钓鱼检测系统性能的影响
发表机构 * Department of Computer Science, School of Mathematics, Computer Science and Engineering, City St George’s, University of London, UK(伦敦大学城市学院计算机科学系,数学、计算机科学与工程学院,伦敦大学)
AI总结 研究概念漂移对基于机器学习的钓鱼邮件检测系统性能的影响,并提出缓解性能下降的策略。
迈向可信赖的人工智能:针对连续数据摘要的多目标对抗攻击与鲁棒防御
发表机构 * Nankai University(南开大学) ; James Cook University(詹姆斯库克大学) ; Western Sydney University(西悉尼大学) ; Beijing University of Technology(北京工业大学) ; Fuzhou University(福州大学) ; Nanjing University of Science and Technology(南京理工大学) ; CSIRO's Data 61(澳大利亚联邦科学与工业研究组织Data61) ; The University of Adelaide(阿德莱德大学)
AI总结 研究通过DR-子模优化在相似性层面扰动下对连续数据摘要进行对抗攻击,提出多目标攻击生成和鲁棒防御的近似算法,实验表明攻击有效且防御能改善鲁棒性-缓解权衡。
Comments Submitted to IEEE Transactions on Information Forensics and Security (IEEE TIFS)
标签偏移下的共形贝叶斯:事后校准与训练内适应
发表机构 * CROID Research and aSSIST University(CROID研究院和aSSIST大学)
AI总结 研究标签偏移下共形贝叶斯方法,通过重要性加权共形校准恢复目标域覆盖,比较事后校准与训练内适应两种策略,后者在偏差训练中起到去偏作用。
Comments 2nd Workshop on Epistemic Intelligence in Machine Learning (EIML@ICML 2026)
基于机器学习的网络入侵检测系统的分类鲁棒性评估
发表机构 * University of Massachusetts Dartmouth(马萨诸塞大学达特茅斯分校) ; United States Military Academy(美国军事学院)
AI总结 本文系统比较了CNN、LSTM和随机森林三种分类器在对抗攻击下的鲁棒性,发现随机森林基线准确率虽高但极易被攻破,而CNN表现最稳健。
ALIGNBEAM: 通过跨词汇表logit混合实现推理时对齐迁移
发表机构 * Lexsi Labs
AI总结 针对领域微调降低大模型安全性的问题,提出无需训练的ALIGNBEAM方法,通过逐token翻译锚模型logit并选择最安全候选,实现跨词汇表的安全对齐迁移,保持任务准确性和推理开销。
鲁棒隐私:通过认证鲁棒性实现推理阶段隐私
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出鲁棒隐私(RP)概念,基于认证鲁棒性确保预测在输入邻域内不变,从而限制推理阶段隐私泄露;实验表明RP在属性推断和模型反演攻击中有效提升隐私-效用权衡。
学习注入:通过强化学习实现自动化提示注入
发表机构 * ETH Zürich(苏黎世联邦理工学院)
AI总结 提出AutoInject,一种基于强化学习的黑盒框架,自动学习对抗性后缀进行提示注入,在AgentDojo上优于模板攻击和多种自适应攻击,并突破专门防御模型。
分布漂移下伪校准保形预测的覆盖保证
发表机构 * Elmore Family School of Electrical and Computer Engineering, Purdue University(艾洛姆家族电气与计算机工程学院,普渡大学)
AI总结 针对分布漂移下保形预测覆盖失效问题,利用伪校准和领域自适应工具,推导目标覆盖下界,并提出通过松弛参数膨胀保形阈值的方法及源调优伪校准算法,实验证明其能缓解覆盖退化。
Comments Under review. 6 pages, 2 figures, 1 table
语言模型输出分布中的尾部风险估计
发表机构 * Columbia University(哥伦比亚大学) ; Department of Computer Science, New York University(纽约大学计算机科学系) ; Center for Data Science, New York University(纽约大学数据科学中心)
AI总结 提出一种基于重要性采样的方法,通过创建不安全版本来高效估计语言模型产生有害输出的尾部概率,在10-20倍更少样本下匹配蒙特卡洛估计,并揭示模型对输入的敏感性。
Comments Accepted to ICML 2026
密度脊选择性预测:校准标签稀缺下的大语言模型与视觉语言模型幻觉检测
发表机构 * Northeastern University Boston, United States(东北大学波士顿分校)
AI总结 针对校准标签稀缺时大语言模型和视觉语言模型的幻觉检测问题,提出基于核密度估计的密度脊方法,利用隐藏状态生成轨迹的六维运动特征图构建响应流形,通过到最近脊顶点的欧氏距离评分,在标签稀缺协议下AUROC提升5-20点。
擦除但未遗忘:后门如何破坏概念擦除
发表机构 * GitHub
AI总结 本文揭示了一种名为擦除规避后门(EEB)的漏洞,攻击者将后门触发器绑定到待擦除概念上,使得该恶意链接在后续擦除后仍然存在,从而绕过多种概念擦除方法。
PCS-UQ:基于可预测性-可计算性-稳定性框架的不确定性量化
发表机构 * Department of Statistics, University of California, Berkeley(加州大学伯克利分校统计学系) ; Department of Epidemiology, University of Utah(犹他大学流行病学系) ; Department of Electrical Engineering and Computer Science, University of California, Berkeley(加州大学伯克利分校电气工程与计算机科学系)
AI总结 提出PCS-UQ框架,通过预测检查、bootstrap采样和乘法校准实现不确定性量化,在回归和分类任务中优于或媲美共形预测方法,并提供理论保证。
CP4SBI: 基于模拟推断中可信集的局部共形校准
发表机构 * Department of Statistics, Federal University of São Carlos(统计系,圣卡洛斯联邦大学) ; Institute of Mathematics and Computer Science, University of São Paulo(数学与计算机科学学院,圣保罗大学) ; Univ. Grenoble Alpes, Inria, CNRS, Grenoble INP, LJK(格勒诺布尔阿尔卑斯大学,法国国家信息与自动化研究所,法国国家科学研究中心,格勒诺布尔INP,LJK)
AI总结 提出CP4SBI框架,通过回归树和CDF校准实现局部贝叶斯覆盖,为任意评分函数提供有限样本局部覆盖保证,提升神经后验估计的不确定性量化质量。
通过逆保形风险控制校准决策鲁棒性
发表机构 * Wenbin Zhou(周文彬) ; Shixiang Zhu(朱世祥)
AI总结 提出逆保形风险控制框架,为鲁棒优化策略提供无分布、有限样本的误覆盖与遗憾保证,通过追踪Pareto前沿帮助决策者根据成本-风险偏好校准鲁棒性水平。
正确预测,误导性解释:关于视觉-语言模型解释的脆弱性
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 研究探讨了视觉-语言模型中解释热图在对抗条件下是否忠实反映推理过程,提出X-Shift攻击揭示解释与预测行为的脱节,验证了解释机制的脆弱性。
Comments Accepted at the ICML 2026 Workshop on Trustworthy AI for Good (AI4GOOD), Seoul, South Korea
潜在几何和弦:面向查询高效决策型对抗攻击
AI总结 提出潜在几何和弦(LGC)方法,通过曲率感知的几何搜索在压缩语义流形中导航决策边界,并引入残差对抗生成(RAG)机制以高视觉保真度实现查询高效的决策型黑盒对抗攻击。
Comments Added a conceptual diagram for the LGC architecture, 14 pages, 10 figures, 7 tables. Submitted to IEEE Transactions on Information Forensics and Security. The source code is available at https://github.com/eihmuekhine/Latent-Geometric-Chords
具有行动条件保证的共形风险规避决策
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出行动条件共形预测方法,通过分位数损失最小化算法实现行动条件风险价值优化,在有限样本下提供行动条件安全保证。
JGRA: NISQ噪声感知量子神经网络中的雅可比几何鲁棒性评估
发表机构 * Dipartimento di Elettronica, Informazione e Bioingegneria, Politecnico di Milano(电子、信息与生物工程系,米兰理工学院) ; Department of Electrical and Computer Engineering, National Yang Ming Chiao Tung University(电子与计算机工程系,国立阳明交通大学)
AI总结 提出JGRA框架,通过雅可比几何评估噪声感知量子神经网络的鲁棒性,包括熵匹配噪声校准、噪声感知训练和噪声条件雅可比提取,揭示干净域结构与噪声推理行为的关系。
Comments Accepted at IEEE qCCL 2026. Author accepted manuscript. 6 pages; cleaned source files, no changes to manuscript content
超越黄金教师:通过LLM-GNN协同教学增强图学习
发表机构 * The Hong Kong University of Science and Technology(香港科技大学) ; WeBank(微众银行)
AI总结 针对文本属性图上的少样本学习,提出LLM-GNN协同教学框架,避免固定教师模型,通过双向伪标签交换和基于轮次的偏好优化,显著提升图学习性能。
Comments Code: https://github.com/llmgnncoteaching/LLM-GNN-Coteaching
TAROT: 面向小样本表格学习的任务自适应LLM先验图精炼
发表机构 * Jilin University(吉林大学) ; The Chinese University of Hong Kong, Shenzhen(香港中文大学(深圳))
AI总结 提出TAROT框架,通过构建并精炼任务自适应语义图,利用LLM先验和GNN编码特征语义关系,提升小样本表格学习性能。
从均匀到学习图先验:用于结构发现的扩散
发表机构 * School of Mathematics, Southeast University(东南大学数学学院)
AI总结 提出Diff-prior,一种扩散参数化的自适应先验,通过可学习的去噪式校准对边后验进行结构化校准,提升神经关系推理方法的结构发现可靠性。
Comments 15 pages, 3 figures, Accepted by KDD 2026
神经关系程序:统一结构化数据上的查询与神经计算
发表机构 * ILLC, University of Amsterdam(伊拉斯谟罗素学院,阿姆斯特丹大学) ; Leipzig University(莱比锡大学) ; ScaDS.AI Center(ScaDS.AI研究中心) ; Technion(技术学院) ; RelationalAI(关系AI)
AI总结 提出神经关系程序(NRP),一种扩展Datalog规则的声明式查询语言,通过嵌入操作融合关系推理与可学习神经组件,实现关系数据上的通用神经计算。
Comments 37 pages
GILT:一种无需LLM、无需微调的图基础模型用于上下文学习
发表机构 * Institute for Artificial Intelligence, Peking University(北京大学人工智能研究院) ; Wangxuan Institute of Computer Technology, Peking University(北京大学王宣计算机技术研究所)
AI总结 提出GILT框架,通过基于令牌的上下文学习机制统一处理节点、边和图级别的分类任务,无需大语言模型或微调,实现高效泛化。
Comments Accepted as an oral presentation at the GFM @ ICML 2026 Workshop
加权随机点积图
发表机构 * Facultad de Ingeniería Universidad de la República(工程学院乌拉圭共和国大学) ; Dept. of Electrical and Computer Engineering University of Rochester(电气与计算机工程系罗切斯特大学)
AI总结 提出加权随机点积图(WRDPG)模型,通过节点潜位置的内积刻画边权分布的高阶矩,并给出谱嵌入估计的统计保证与生成框架。
Comments 30 pages, 12 figures, code to generate Figures 3 to 12 available at https://github.com/bmarenco/wrdpg. Updated to match the published version
偏离正则性:度异质性和特征间隙作为ASE-LSE潜在子空间分歧的结构驱动因素
发表机构 * School of Mathematics and Statistics(数学与统计学系) ; The University of Melbourne(墨尔本大学)
AI总结 本文研究了图数据分析中邻接谱嵌入和拉普拉斯谱嵌入方法在相同网络上产生不同结果的结构原因,揭示了度异质性和社区结构强度对潜在子空间分歧的影响。
Comments This paper is being withdrawn as it was submitted without the consent of all listed authors, and contains work that is currently under academic assessment. It will be resubmitted at an appropriate time once evaluation is complete
TaskFusion: 异构表格数据的持续异常检测
发表机构 * German Research Center for Artificial Intelligence (DFKI)(德国人工智能研究中心(DFKI)) ; RPTU Kaiserslautern-Landau(凯泽斯劳滕-兰道大学) ; Hochschule Bonn-Rhein-Sieg (H-BRS)(波恩-莱茵-锡格应用技术大学)
AI总结 提出TaskFusion方法,通过AGF模型、任务融合增强和异常暴露技术,解决异构表格数据在持续学习中的特征空间变化、分布偏移和类别不平衡问题,在21个数据集上显著提升持续异常检测性能。
Comments 22 Pages
支持边界经验混合的持续学习
发表机构 * National Taiwan University(国立台湾大学)
AI总结 提出经验混合框架,通过差分隐私启发的噪声生成支持边界数据,联合训练样本和边界数据以正则化决策边界,在多个数据集上提升持续学习准确率。
少样本重采样:可扩展的统计可靠数据挖掘
发表机构 * Department of Information Engineering, University of Padova(帕多瓦大学信息工程系)
AI总结 提出FewRS方法,基于重采样评估数据挖掘结果的统计显著性,通过推导新的上界偏差界,仅需极少量重采样数据集即可保证假发现概率,显著提升可扩展性。
Comments Accepted to KDD 2026
基于模型预测的信息泄露的无先验盲检测
发表机构 * Center for Molecular Cardiology, University of Zurich(苏黎世大学分子心脏病学中心) ; Center for Complexity Sciences, National University of Mexico(墨西哥国立自治大学复杂性科学中心)
AI总结 针对机器学习模型输出中信息泄露的检测问题,提出决策理论框架,证明校准泄露与诚实模型不可区分,但近确定性子组可被无先验检测,并在UK Biobank上验证。
GraphInfer-Bench:评估LLM在图上的推理能力基准
发表机构 * The Hong Kong University of Science and Technology(香港科技大学) ; Webank(微众银行)
AI总结 提出GraphInfer-Bench基准,通过五个任务(描述与比较)测试LLM能否从节点及其邻域推断出无法从单节点或路径检索的答案,发现所有方法均存在差距。
Comments Code: https://github.com/graphinfer/GraphInfer-Bench ; Dataset: https://huggingface.co/datasets/graphinfer/graphinfer
Bergson:一个用于数据归因的开源库
发表机构 * EleutherAI ; Independent
AI总结 提出Bergson开源库,支持大规模语言模型和预训练数据集的多种数据归因方法,提供磁盘梯度存储和多节点分布式训练,首次开源实现MAGIC、SOURCE和TrackStar三种方法。
噪声感知框架用于纠正损坏标签
发表机构 * Faculty of Information Technology, VNU University of Engineering and Technology(越南国立大学工程与技术学院信息技术系)
AI总结 提出CANOLA框架,通过噪声感知学习和迭代标签精炼来纠正损坏标签,在六个数据集上相比现有方法错误率降低19%-52%。
一个用于检测和纠正损坏标签的数据中心框架
发表机构 * Faculty of Information Technology, VNU University of Engineering and Technology, Hanoi, Vietnam(越南河内国立大学工程与技术学院信息技术系)
AI总结 提出Relabeler框架,联合利用局部和全局关系检测损坏标签,并基于输入特征和噪声标签估计最可能的干净标签进行纠正,在多个数据集上实现高达58%的标签纠正精度提升和6%的下游任务性能提升。
RCAP: 鲁棒的、类别感知的、概率性动态数据集剪枝
发表机构 * IIT Kharagpur(印度理工学院卡哈拉格普尔分校)
AI总结 提出RCAP算法,通过闭式解估计每类样本保留比例并自适应调整,结合高损失样本优先采样策略,在多种数据集和训练范式下优于现有方法,仅用10%数据即可提升类别不平衡数据集性能1%以上。
Comments Proceedings of the Forty-first Conference on Uncertainty in Artificial Intelligence (UAI 2025)
类别先验锁定:为何上下文学习在结构化数据上失败
发表机构 * University of Insubria(因苏布里亚大学) ; IBM Research Ireland(IBM 爱尔兰研究院)
AI总结 研究大语言模型在结构化数据生成中上下文学习的局限性,发现其无法更新预训练中的类别先验分布,导致罕见类完全无法生成;参数高效微调可解决但带来记忆化风险。
Comments 9 pages, 5 figures. Empirical study of in-context learning and LoRA fine-tuning for synthetic tabular data generation, introducing the phenomenon of categorical prior lock-in. Under review
你能低到多少?超低数据极限下稀疏模型发现的主动学习
发表机构 * Department of Mechanical Engineering, University of Washington(华盛顿大学机械工程系) ; NSF AI Institute in Dynamic Systems, University of Washington(华盛顿大学NSF动态系统人工智能研究所) ; Department of Aeronautics, Imperial College London(伦敦帝国理工学院航空系)
AI总结 针对超低数据极限下动力学系统方程发现的数据稀缺问题,提出基于E-SINDy的主动学习策略,通过迭代优先采样信息量大的区域,在Lorenz、Burgers和Kuramoto-Sivashinsky系统上验证了比随机采样更少数据即可准确识别动力学。
Comments 20 pages, 10 figures
Claw-SWE-Bench:评估OpenClaw风格代理框架在编码任务上的基准
发表机构 * TokenRhythm Technologies(TokenRhythm 技术公司) ; Infinigence AI ; Peking University(北京大学) ; City University of Hong Kong(香港城市大学) ; SEE Fund(SEE 基金) ; Shanghai Jiaotong University(上海交通大学) ; Beijing Jiaotong University(北京交通大学) ; Tsinghua University(清华大学)
AI总结 提出Claw-SWE-Bench基准,通过适配器协议统一评估异构代理框架,发现适配器设计对编码性能至关重要,且模型和框架选择显著影响通过率与成本。
PoQ-Judge:去中心化LLM推理中成本感知的证明质量的多架构评估框架
发表机构 * DGrid AI
AI总结 提出PoQ-Judge框架,训练专用裁判模型对查询-输出对进行无参考评分,研究三种架构,最佳模型在Pearson相关性上达到0.747,级联评估降低72.7%成本。
城市热微型数据立方体:面向城市热研究的人工智能就绪数据集
发表机构 * Department of Atmospheric and Oceanic Science, University of Maryland, College Park, MD, USA(大学大气科学与海洋科学系,马里兰大学,学院公园,MD,美国) ; Department of Computer Science, University of Maryland, College Park, MD, USA(大学计算机科学系,马里兰大学,学院公园,MD,美国) ; NASA Goddard Space Flight Center, Greenbelt, MD, USA(NASA戈达德航天飞行中心,格林贝尔特,MD,美国) ; NASA Marshall Space Flight Center, Huntsville, AL, USA(NASA马歇尔航天飞行中心,亨茨维尔,AL,美国)
AI总结 提出Urban Heat MiniCubes数据集,整合多源卫星数据(Landsat 8/9、Sentinel-1、GOES-R等),为48个城市提供90×90公里网格化数据立方体,支持机器学习在城市热研究中的应用。
Comments 53 pages, 26 figures, Submitted to Nature Scientific Data
从持续性到生存:拓扑特征的假设检验、效应大小与向量化
发表机构 * Department of Machine Learning and Systems Biology, Max Planck Institute of Biochemistry, Martinsried, Germany(机器学习与系统生物学部门,马克斯·普朗克生物化学研究所,马尔廷斯里德,德国)
AI总结 提出STRAND方法,将持久性图视为生存数据,利用持久性生存函数统一实现假设检验、效应大小计算和向量化,在合成数据和真实基准上验证了有效性。
通过LLM引导的视频拼接进行手语翻译的语料增强
发表机构 * Peter Pazmany Catholic University, Faculty of Information Technology and Bionics(彼得·帕兹马尼天主教大学信息科技与仿生学院) ; DeepSign Technologies Ltd.(DeepSign科技有限公司)
AI总结 提出一种无需额外标注或生成模型的手语翻译语料增强方法,利用CTC强制对齐提取手语片段,通过LLM生成句子并拼接视频,在GFSLT-VLP基线上提升BLEU-4达2.92,并发现合成数据对视觉-语言预训练有害但可提升下游任务。
OpenMedReason: 医学视觉语言模型的科学推理监督
发表机构 * York University(约克大学) ; Vector Institute(向量研究所) ; University of British Columbia(不列颠哥伦比亚大学) ; University of Toronto(多伦多大学) ; Unity Health Toronto / St. Michael’s Hospital(多伦多联合健康/圣迈克尔医院) ; University Health Network(大学健康网络) ; Arc Institute(弧研究所) ; Queen's University(女王大学)
AI总结 提出OpenMedReason,一个包含约45万图像-问题-答案实例的大规模开放医学推理语料库,其推理轨迹主要来自生物医学科学文章,并配套基准OpenMedReason-Bench进行细粒度评估,在监督微调和强化对齐中有效提升模型性能。
Comments 42 pages, 9 figures, 24 tables. Dataset and code: https://huggingface.co/datasets/neginb/OpenMedReason
通过信息增益衡量多轮对话中的语义进展
发表机构 * NTU Singapore(新加坡南洋理工大学) ; Amazon(亚马逊) ; Amazon Research, Tübingen, Germany(亚马逊研究院(德国图宾根))
AI总结 提出基于信息论的信息增益指标,通过高斯嵌入近似量化多轮对话中问题相关的语义进展,无需LLM推理,在多个基准上取得与人类判断一致的结果。
Comments Preprint. 26 pages
基于人类演示的计算机使用智能体基础构建
发表机构 * Mila - Quebec AI Institute(魁北克AI研究所) ; McGill University(麦吉尔大学) ; Université de Montréal(蒙特利尔大学) ; ServiceNow Research(ServiceNow研究) ; University of Waterloo(滑铁卢大学) ; University of Oxford(牛津大学) ; National University of Singapore(新加坡国立大学) ; Polytechnique Montréal(蒙特利尔理工学院) ; École de Technologie Supérieure(高级技术学院) ; CIFAR AI Chair(CIFAR人工智能主席)
AI总结 为解决桌面环境高质量基础数据稀缺问题,构建了包含87个应用、56K截图和3.56M人工标注的GroundCUA数据集,并基于此训练GroundNext模型,在5个基准上以少于先前十分之一的数据取得最优结果。
Comments Accepted at ICLR 2026
CoVar: 置信度-方差引导的半监督学习伪标签选择
发表机构 * College of Artificial Intelligence, Shenzhen University(深圳大学人工智能学院) ; School of Information and Electrical Engineering, Hunan University of Science and Technology(湖南科技大学信息与电气工程学院) ; Information Hub, Hong Kong University of Science and Technology (Guangzhou)(香港科技大学(广州)信息中心)
AI总结 提出CoVar框架,通过联合建模最大置信度和残差类方差来评估伪标签可靠性,利用SVD谱松弛分离可靠与不可靠预测,无需手动阈值,在分割和分类任务上取得提升。
预测驱动的已部署模型风险监控:检测有害分布漂移
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出预测驱动风险监控(PPRM),一种基于预测驱动推断的半监督方法,通过结合合成标签与少量真实标签构建运行风险的随时有效下界,实现对有害漂移的检测,并在图像分类、大语言模型和电信监控任务中验证有效性。
Comments Accepted by ICML2026
改进分层多标签学习中稀有节点的检测
发表机构 * Faculty of Computer Science(计算机科学学院) ; Dalhousie University(达尔豪斯大学) ; Department of Geography(地理系) ; Memorial University of Newfoundland(纽芬兰纪念大学) ; Department of Oceanography(海洋学系)
AI总结 针对分层多标签分类中稀有节点检测困难的问题,提出结合节点不平衡加权和焦点加权的损失函数,利用集成不确定性量化,在基准数据集上将召回率提升至五倍,并显著提高F1分数。
Comments Accepted for publication in Transactions on Machine Learning Research (TMLR), 2026
全球天气模型的缩放定律
发表机构 * University of Illinois at Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校)
AI总结 本文分析数据驱动天气模型中模型大小、数据集大小和计算预算与验证损失之间的缩放定律,发现Aurora数据缩放最强,GraphCast参数效率高但硬件利用率低,计算最优分析表明增加训练数据比增大模型更有效,且模型形状上宽度优于深度。
Comments Accepted at ICML 2026. 21 pages, 7 figures
投影随机森林与圆形数据的共形预测
发表机构 * Insper University(Insper大学) ; University of São Paulo(圣保罗大学)
AI总结 针对圆形响应回归问题,应用共形预测技术,通过投影方法将线性回归模型转换为圆形模型,并利用随机森林的袋外机制避免额外校准样本,生成具有有限样本覆盖保证和自适应弧长的预测集。
Comments 7 pages; 4 figures
SDQM:用于目标检测数据集评估的合成数据质量指标
发表机构 * Northeastern University, Khoury College of Computer Sciences(东北大学,Khoury 计算科学学院) ; Binghamton University, School of Computing(布ingham顿大学,计算科学学院) ; Air Force Research Laboratory, Mission Applications and Infrastructure Section(空军研究实验室,任务应用与基础设施部门)
AI总结 提出SDQM指标,无需模型训练收敛即可评估合成数据质量,与YOLO11的mAP强相关,优于现有指标。
Comments Accepted and Published at SPIE: Journal of Electronic Imaging, Vol. 35, Issue 3
利用大语言模型和主题建模绘制科学文献图谱
发表机构 * Department of Civil and Environmental Engineering(土木与环境工程系) ; University of Pittsburgh(匹兹堡大学)
AI总结 提出基于大语言模型的两阶段分类框架,通过主题建模分析PNAS工程类文献,生成语义可解释主题并揭示跨主题关联,性能优于传统方法。
Comments 35 pages, 10 figures. Accepted for publication in Scientometrics. Final version available via DOI
FronTalk: 以多模态反馈进行对话式代码生成的前端开发基准测试
发表机构 * Meta Superintelligence Labs(Meta超智能实验室) ; University of California, Los Angeles(加州大学洛杉矶分校) ; Duke University(杜克大学)
AI总结 提出FronTalk基准,通过多轮对话和多模态反馈(文本与视觉指令)评估前端代码生成,发现模型存在遗忘和视觉反馈理解困难,提出AceCoder方法有效减少遗忘并提升性能。
评估LLM生成数据的质量与可信度综述
发表机构 * University of Houston(德克萨斯大学休斯敦分校) ; Worcester Polytechnic Institute(沃思利理工学院) ; Rice University(里德大学) ; Texas A&M University(德克萨斯农工大学) ; University of Wisconsin - Madison(威斯康星大学麦迪逊分校) ; University of Southern California(南加州大学) ; University of North Carolina at Charlotte(北卡罗来纳州立大学夏洛特分校)
AI总结 提出LLM数据审计框架,从质量和可信度两个维度系统分类评估指标,分析六种模态数据生成方法的评估缺陷并给出改进建议。
Comments Published at TMLR. Title changed in the final version
一种面向评委的排名框架:无需真实标签评估大语言模型
发表机构 * University of Technology Sydney(悉尼科技大学)
AI总结 本文提出一种面向评委的排名框架,通过引入评委特定的辨别参数扩展Bradley-Terry-Luce模型,在不参考标签的情况下联合估计潜在模型质量和评委可靠性,从而提高人类偏好的一致性,提高数据效率,并产生校准的不确定性量化。
MentisOculi: 揭示心智图像推理的局限性
发表机构 * Max Planck Institute for Informatics(马克斯·普朗克信息研究所)
AI总结 提出MentisOculi基准,通过多步推理问题测试前沿模型利用视觉表示辅助推理的能力,发现视觉策略普遍无法提升性能,且统一多模态模型存在生成错误累积和无法利用真实可视化的问题。
Comments 9 pages, 8 figures, Accepted at ICML 2026
干预还是不干预:通过概率模型混合指导推理时对齐
发表机构 * College of Computing and Data Science, Nanyang Technological University(南洋理工大学计算机与数据科学学院)
AI总结 提出BlendIn框架,通过质量感知对齐和按可靠性加权混合模型知识,解决推理时对齐中指导有效性差异大的问题,在困难模型对上实现最高50%的性能提升。
Comments Accepted by ACL 2026
LakeFM:基于不规则多变量多深度时间序列数据的水生生态系统基础模型
发表机构 * Virginia Tech(弗吉尼亚理工大学) ; Grand Valley State University(大峡谷州立大学) ; University of Wisconsin - Madison(威斯康星大学麦迪逊分校) ; Amazon AGI(亚马逊AGI) ; Aarhus University(奥胡斯大学)
AI总结 针对湖泊时间序列数据不规则采样和跨湖泊泛化难题,提出预训练基础模型LakeFM,在模拟和观测数据上学习表征,实现优于现有模型的预测性能。
Comments KDD 2026
SwiftCTS: 通过少样本校准实现时钟树指标的快速跨设计预测与帕累托优化
AI总结 提出SwiftCTS框架,利用物理信息代理模型和K-shot乘法校准机制,在数秒内训练、亚毫秒推理,实现跨设计时钟树指标的准确预测与帕累托优化。
GLACIER:用于分子性质预测的多模态师生基础模型
发表机构 * Department of Computer Science, University of Southern California(南加州大学计算机科学系) ; Department of Quantitative and Computational Biology, University of Southern California(南加州大学定量与计算生物学系) ; Amazon(亚马逊) ; Department of Medical Biochemistry and Biophysics, Science for Life Laboratory, Karolinska Institutet(卡罗林斯卡学院医学生物化学与生物物理系,生命科学实验室)
AI总结 提出GLACIER师生框架,通过融合分子图、SMILES和物理化学描述符三种模态,并利用大模型蒸馏,实现高效准确的分子性质预测。
基于LSTM的财产保险损失准备金结构性断点检测:气候信息方法
发表机构 * Stony Brook University(石溪大学)
AI总结 针对气候变化导致传统精算方法失效的问题,提出使用LSTM神经网络检测结构性断点,在佛罗里达和路易斯安那州数据上预期将巨灾年份准备金精度提升15-20%,并给出理论保证。
Comments 15 pages, 0 figures, whitepaper YC
OmniLoc: 一种几何感知的基础模型,用于跨多样室内环境的无锚点用户设备定位
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出OmniLoc,首个基于无线测量的基础模型,通过统一输入分词、几何感知Transformer和几何感知位置估计模块,实现跨室内环境的鲁棒无锚点定位,显著优于现有方法。
APEX:面向无线边缘运维的预测与异常检测的网络原生时间序列基础模型
发表机构 * Cisco Systems, USA(思科系统公司)
AI总结 提出网络原生解码器Transformer APEX,针对企业AP遥测数据预训练,在DHCP退化基准上MAE比最强基线降低18%,异常检测F1=0.93,边缘版本实现亚秒级隐私保护推理。
Comments 5 pages, 1 figure, 4 tables. Discusses a network-native time-series foundation model for wireless edge operations
基于大语言模型的物理蒸馏神经网络用于制造过程-性能预测建模
发表机构 * School of Mechanical, Aerospace and Manufacturing Engineering, University of Connecticut(康奈尔大学机械、航空航天与制造工程学院) ; Department of Mechanical & Aerospace Engineering, Rutgers, the State University of New Jersey(新泽西州立大学鲁特大学机械与航空航天工程学院)
AI总结 提出一种知识蒸馏框架,利用大语言模型从文献中提取物理先验,通过图掩码注意力层捕获变量依赖,蒸馏至轻量学生模型,在数据稀缺下实现高精度预测与实时部署。
Comments Under review, Journal of Computing and Information Science in Engineering
具有可处理不确定性量化的保结构神经代理模型
发表机构 * University of Pennsylvania(宾夕法尼亚大学) ; Stanford University(斯坦福大学) ; California Institute of Technology(加州理工学院)
AI总结 提出一种结合混合有限元空间与高斯过程回归的保结构降阶模型,通过拓扑结构实现状态-通量关系的不确定性量化,并导出狄利克雷-诺伊曼映射的闭式后验不确定性。
DeepRHP:一种用于设计随机异聚合物作为蛋白质模拟物的混合变分自编码器
发表机构 * DeepRHP: A Hybrid Variational Autoencoder for Designing Random Heteropolymers as Protein Mimics(DeepRHP:一种用于设计随机杂合聚合物作为蛋白质模拟物的混合变分自编码器)
AI总结 提出混合变分自编码器DeepRHP,在半监督框架下结合特征VAE与经典VAE,通过潜在空间捕获关键化学特征与序列模式,指导随机异聚合物设计,实验验证其稳定膜蛋白的有效性。
Comments Oral presentation at AAAI 2023 Workshop on AI to Accelerate Science and Engineering
使用结构MRI和临床数据的阿尔茨海默病严重程度的多模态序数建模
发表机构 * Department of Neuroradiology, LMU University Hospital, Ludwig Maximilian University of Munich(神经放射科,慕尼黑路德维希-马克西米利安大学医院,慕尼黑路德维希-马克西米利安大学) ; Department of Psychiatry and Psychotherapy, LMU University Hospital, Ludwig Maximilian University of Munich(精神病学与心理治疗系,慕尼黑路德维希-马克西米利安大学医院,慕尼黑路德维希-马克西米利安大学)
AI总结 提出一种注意力增强的多模态序数回归框架,整合MRI、人口统计学和遗传数据,用于自动且可解释的AD严重程度分期,在ADNI等数据集上验证,序数模型在相邻阶段准确率(0.970)和与临床分期一致性(QWK 0.549)上表现最佳。
Comments 18 pages. Submitted to journal for review
MemNovo: 回顾谱图以实现质谱中平衡的从头肽段测序
发表机构 * Westlake University(西湖大学) ; Hunan University(湖南大学) ; Shanghai Artificial Intelligence Laboratory(上海人工智能实验室) ; HKUST-GZ & HKUST(香港科技大学(广州)与香港科技大学)
AI总结 针对现有Transformer模型在从头肽段测序中过度依赖生成序列先验而忽视谱图证据的问题,提出训练无关的即插即用机制MemNovo,通过建立持久谱记忆库和超保守残差连接在解码阶段注入谱特征,显著提升氨基酸和肽段精度。
Comments Code: https://github.com/AIMS-Lab-HKUSTGZ/MemNovo
超越表征对齐:基于大脑引导的语言模型实现稳健推理
发表机构 * State Key Lab of General AI, School of Intelligence Science and Technology, Peking University(北京大学通用人工智能国家重点实验室、智能科学与技术学院) ; Department of Psychological and Cognitive Sciences, Tsinghua University(清华大学心理与认知科学系) ; Microsoft Research Asia(微软亚洲研究院)
AI总结 研究通过fMRI信号增强大型语言模型推理能力,提出脑引导框架,在10个模型上实现最高13%的准确率提升。
通过生存感知适配的临床生存分析表格基础模型
发表机构 * ADAPT Centre, Dublin City University(ADAPT中心,都柏林城市大学) ; School of Computing, Dublin City University(都柏林城市大学计算机学院) ; Department of Computer Science and Engineering, University of Bologna(博洛尼亚大学计算机科学与工程系)
AI总结 提出轻量级适配方法,将表格基础模型(TabPFN、TabDPT、TabICL)与多任务逻辑回归头结合,用于临床生存分析,在多个基准和ICU队列上达到竞争性或更优性能。
Comments Accepted for publication at International Conference on AI in Healthcare 2026
基于多尺度储层动力学与粒球锚定图优化的高效时间序列聚类
发表机构 * Chongqing Key Laboratory of Computational Intelligence, Key Laboratory of Cyberspace Big Data Intelligent Security, Ministry of Education, Sichuan-Chongqing Co-construction Key Laboratory of Digital Economy Intelligence and Key Laboratory of Big Data Intelligent Computing, College of Computer Science and Technology, Chongqing University of Posts and Telecommunications(重庆邮电大学计算机科学与技术学院,计算智能重庆市重点实验室,网络空间大数据智能安全教育部重点实验室,川渝共建数字经济智能重点实验室,大数据智能计算重点实验室) ; Chongqing Ant Consumer Finance Co,. Ltd , Ant Group(蚂蚁集团,重庆蚂蚁消费金融有限公司)
AI总结 提出MSRGC-Net框架,结合无训练储层计算、粒球锚定图构建和共识学习,实现高效且准确的时间序列聚类。
Comments Accepted by IJCAI 2026
PCA增强的自适应NVAR框架用于东海高分辨率海面温度预测
发表机构 * Pusan National University(釜山大学)
AI总结 提出PCA增强的自适应NVAR框架,通过SVD降维和自适应NVAR时序建模,实现东海海面温度的高效准确预测,优于标准NVAR方法。
Comments 14 pages, 7 figures
使用可解释性作为训练时可靠性信号实现高效心电图分类
发表机构 * School of Computer Science, University of Nottingham(诺丁汉大学计算机科学学院) ; Institute of Biomedical Engineering, Department of Engineering Science, University of Oxford(牛津大学工程科学系生物医学工程研究所) ; School of Computer Science, University of Nottingham Ningbo China(宁波诺丁汉大学计算机科学学院)
AI总结 提出ERTS方法,利用训练中的解释质量(Grad-CAM注意力图)区分信息性和不可靠不确定性,过滤低聚焦样本,在三个ECG数据集上提升macro-F1并降低训练成本。
傅里叶特征让智能体通过模仿学习学习高精度策略
发表机构 * Karlsruhe Institute of Technology(卡尔斯鲁厄理工学院) ; FZI Research Center for Information Technology(FZI信息技术研究中心)
AI总结 提出在点云编码器中使用傅里叶特征映射,解决神经网络低频偏好导致的高精度操作问题,在多个基准和真实机器人上显著提升性能。
Comments Published as a conference paper at ICML 2026
NightFeats @ MMU-RAGent NeurIPS 2025: 面向文本到文本轨道的上下文优化多智能体RAG系统
AI总结 提出一种结构化多智能体RAG系统NightFeats,通过检索、策展和组合三阶段分解知识合成,引入时序语义重排序、矛盾协调和引用保留架构,在MMU-RAGent竞赛中超越商业基线。
Comments 5 pages, 1 figure, 1 table. NeurIPS 2025 Competition Track (MMU-RAGent). System developed October 2025
MASK: 面向风险敏感的6G机器人学的多智能体语义K调度
发表机构 * Middle East Technical University(中东技术大学) ; Aselsan Inc.(阿塞尔桑公司)
AI总结 针对6G机器人协同感知中频谱资源受限的问题,提出多智能体语义K调度(MASK)架构,通过仲裁辅助语义信息门控(A-SIG)机制仅调度语义重要性最高的K个智能体,结合自监督全局编码器和分布策略,在严格带宽限制下实现鲁棒的风险感知协调,性能接近无通信约束基线。
我的化学缰绳:基于合成路径的大语言模型智能体进化分子设计
发表机构 * Institute of Mathematics, Faculty of Science, University of Potsdam(数学研究所,科学学院,波茨坦大学) ; NHETC, Department of Physics and Astronomy, Rutgers University(NHETC,物理与天文学系,罗格斯大学) ; Potsdam Transfer, University of Potsdam(波茨坦转移,波茨坦大学) ; E3 LLC
AI总结 提出一种以可执行合成路径为种群、大语言模型仅作策略控制器的进化框架,在可溶性环氧化物水解酶代理任务上达到最优性能。
Comments 27 pages | 10 figures
大规模开放词汇关键词识别
发表机构 * Priberam Labs(Priberam实验室) ; Instituto Superior Técnico(理工学院) ; Instituto de Telecomunicações(电信研究所)
AI总结 提出一种内存占用更小的开放词汇关键词识别系统,无需微调即可处理大规模数据库,在未见语言中达到与未压缩方案相当的实体召回率。
Comments Accepted to Interspeech 2026
可解释的神经标记统计用于宇宙学推断
发表机构 * University of Cambridge(剑桥大学) ; University of Waterloo(多伦多大学)
AI总结 提出一种神经标记方案,通过可解释的物理变换从形态学层面提取宇宙学信息,在对比学习目标下优化标记统计,显著提高对σ₈和Ωₘ的约束精度。
Comments 11 pages, 6 figures. Accepted to the Workshop on AI for Physics (ICML 2026)
Embodied-R1.5:通过具身基础模型演化物理智能
发表机构 * Tianjin University(天津大学) ; Tencent Hunyuan(腾讯混元)
AI总结 提出统一具身基础模型Embodied-R1.5,通过自动化数据管道和多任务平衡强化学习,在8B参数下实现24项基准中16项最优,并支持微调为VLA模型。
Comments Embodied R1.5 technical report. Project page: https://embodied-r.github.io/
空间掩蔽回归揭示电生理记录中的局部和分布式可预测性
发表机构 * Department of Electrical and Computer Engineering, IUT(电气与计算机工程系) ; McGovern Institute for Brain Research, Massachusetts Institute of Technology (MIT)(脑科学研究所,麻省理工学院(MIT))
AI总结 提出空间掩蔽回归(SMR)框架,通过逐步增大掩蔽区域量化电极信号中局部与分布式信息的贡献,应用于颅内和头皮脑电数据,发现邻近电极贡献显著但非全部,表明信号同时包含局部冗余和全局结构。
FlexiBrain: 面向原生fMRI的分辨率无关体素级编码
发表机构 * Southern University of Science and Technology(南方科技大学) ; University of Warwick(沃里克大学)
AI总结 提出FlexiBrain,一种基于Mamba-JEPA的分辨率无关体素级编码框架,通过动态补丁调整直接处理原生fMRI数据,避免破坏性空间标准化,在五个下游任务中性能提升达12个百分点,并显著降低预处理成本。
基于EEG和fNIRS的抑郁状态分类的端到端机器学习
发表机构 * RIKEN AIP(日本东京RIKEN AIP)
AI总结 本研究提出一个端到端机器学习框架,利用EEG和fNIRS信号对抑郁状态进行分类,旨在克服传统诊断的主观性,为临床提供客观的自动化诊断工具。
Comments 4 pages, 4 figures, Accepted for publication in the Proc. 48th Annu. Int. Conf. IEEE EMBS (EMBC 2026), Toronto, Canada, July 20-24, 2026
面向预测量子电路模拟性能的族感知残差架构
发表机构 * IEEE
AI总结 提出族感知残差架构,利用电路族分类和算法指纹特征,预测量子电路模拟的最小近似阈值和运行时间,在7-130量子比特、10个算法族上实现79.5%精确阈值准确率和R²=0.82运行时间相关性。
Comments Accepted as a full paper at IEEE ISVLSI 2026 (QC-CSAA Workshop). To appear in IEEE Xplore. 6 pages, 1 figure, 2 tables
基于图注意力网络和混合密度网络的概率薪资预测
发表机构 * Leiden Institute of Advanced Computer Science (LIACS)(莱顿高级计算机科学研究所) ; Leiden University(莱顿大学) ; Randstad N.V.(Randstad公司)
AI总结 提出GAT-MDN框架,通过构建属性关系图并使用图注意力网络学习节点表示,结合混合密度网络输出薪资分布,在百万级荷兰招聘数据集上优于基线模型。
Comments 5 pages, 3 figures
神经参数化元胞自动机用于野火蔓延
发表机构 * Fujitsu Research of America(富士通美国研究)
AI总结 提出一种混合深度学习参数化概率元胞自动机框架,利用多尺度卷积神经网络动态生成空间变化参数,在保持物理可解释性的同时捕捉复杂环境交互,在六次大型野火中实现72小时IoU>0.6的预测。
Comments 16 pages, 9 figures
DroneShield-AI:一种用于受争议空域中实时自主无人机威胁检测、行为意图分类和群体智能的多模态传感器融合框架
发表机构 * Independent Researcher(独立研究者)
AI总结 提出DroneShield-AI框架,集成RF信号分类、声学检测、YOLOv8视觉检测等六层处理,通过行为意图分类引擎(BICE)实现六类威胁分类并提前30秒预警,以及图神经网络群体智能模块(GNN-SIM)分析多无人机编队,在低成本硬件上达到96.1%检测精度和142ms延迟。
Comments 23 pages, 6 figures, 11 tables. Code available at https://github.com/bayizeremarius/DroneShield-AI
近地系外行星的机器学习聚类:与卵石吸积的联系
发表机构 * Center for Star and Planet Formation(星系与行星形成中心) ; Globe Institute(全球研究所) ; University of Copenhagen(哥本哈根大学) ; Lund Observatory(隆德天文台) ; Department of Physics(物理系) ; Lund University(隆德大学) ; Graduate Institute of Astronomy(天文研究所) ; National Central University(国立中央大学)
AI总结 利用高斯混合模型对近地系外行星进行无监督聚类,揭示其内在子群,并通过卵石吸积合成种群解释形成路径差异。
TacCoRL: 通过仿真将触觉反馈集成到视觉-语言-动作模型中
发表机构 * University of California, Los Angeles(加利福尼亚大学洛杉矶分校) ; University of California, San Diego(加利福尼亚大学圣迭戈分校) ; University of Electronic Science and Technology of China(电子科技大学) ; Peking University(北京大学) ; University of Utah(犹他大学)
AI总结 提出TacCoRL框架,通过仿真与真实联合训练和强化学习,将触觉反馈注入视觉-语言-动作策略,在接触密集型任务中平均成功率提升22.5%。
稀疏化Kolmogorov-Arnold网络用于可解释量子态层析
发表机构 * National Supercomputing Center in Zhengzhou(郑州国家超级计算中心) ; Zhengzhou University(郑州大学) ; School of Computer and Artificial Intelligence(计算机与人工智能学院) ; School of Communication and Artificial Intelligence(通信与人工智能学院) ; School of Integrated Circuits(集成电路学院) ; Nanjing Institute of Technology(南京理工大学)
AI总结 研究利用稀疏化Kolmogorov-Arnold网络作为可检查的重构规则,通过三量子比特GHZ基准测试,识别出与GHZ相关的Pauli测量集,并揭示与解析GHZ Pauli分组一致的输入-隐藏-输出通路结构,实现神经网络重构模型的结构可解释性。
REACH:面向多信道车辆信道估计的可解释性驱动特征识别与架构压缩
发表机构 * Faculty of Engineering, North-West University, South Africa(南非北开普大学工程学院) ; Centre for Artificial Intelligence Research, South Africa(南非人工智能研究中心) ; National Institute for Theoretical and Computational Sciences, South Africa(南非理论与计算科学国家研究所)
AI总结 提出REACH框架,通过梯度归因识别关键时频特征并压缩网络,在IEEE 802.11p信道估计中实现参数和计算量大幅降低,且OOD泛化性能下降缓慢。
Comments 22 pages, 16 figures
用不确定性感知神经网络建模磁性材料性质
发表机构 * University of Cambridge(剑桥大学) ; ETH Zurich(苏黎世联邦理工学院) ; University of Tokyo(东京大学) ; National Institute for Materials Science(国家材料科学研究所) ; Max Planck Institute for Intelligent Systems(智能系统马克斯·普朗克研究所)
AI总结 针对新材料发现中数据稀缺和分布外预测的不确定性问题,采用高斯负对数似然损失和基于dropout的贝叶斯近似量化预测不确定性,并迁移至微观结构预测矫顽力任务,证明不确定性量化可增强预测可信度且可迁移。
Comments pre print, unreviewed version
检测限以下:用于HR+/HER2-转移性乳腺癌连续ctDNA的删失泊松贝叶斯潜在增长变点检测器(Span检测器)
发表机构 * Span AI
AI总结 提出Span检测器,利用删失泊松贝叶斯潜在增长变点模型处理ctDNA非检测作为左删失观测,通过序贯广义似然比统计量检测变异检测率上升点,在10%假警报率下将提前三个月捕获进展的比例从11%提升至25%。
Comments 9 pages, 4 figures, 2 tables. Code and synthetic data generator: https://github.com/span-ai-labs/span-detector
NARRAS:车载物联网中基于CSI的定位的边缘触发分布式推理
发表机构 * Signal Theory and Communications Department, Universidad Carlos III de Madrid(信号理论与通信系,卡洛斯三世大学马德里分校) ; Gregorio Marañón Health Research Institute(格雷戈里奥·马兰农健康研究 institute) ; Department of Electrical and Computer Engineering, National Yang-Ming Chiao-Tung University(电子与计算机工程系,国家阳明交通大学) ; German Aerospace Center (DLR)(德国航空航天中心(DLR))
AI总结 针对分布式天线阵列CSI定位中资源受限问题,提出NARRAS边缘触发分布式推理策略,各阵列本地决策是否上报观测,通过可微活动惩罚和通道图正则化实现预算控制,在低活动率下提升定位精度。
Comments 10 pages, 5 figures, 5 tables. Under review at the IEEE Internet of Things Journal
MLT-Dedup:通过多级表示和时空匹配的高效大规模在线视频去重
发表机构 * TikTok Singapore(TikTok新加坡) ; School of Computing, National University of Singapore(新加坡国立大学计算机学院) ; TikTok San Jose(TikTok圣何塞)
AI总结 提出MLT-Dedup框架,采用多级视频编码器提取细粒度帧级和稀疏片段级嵌入,结合差分特征增强相似性模块进行时空匹配,在90%精度下降低在线重复率91%,索引容量提升5倍。
Comments Accepted by KDD-2026 ADS track
Atlas H&E-TME:基于AI的可扩展组织分析,达到专家病理学家级别的准确性
发表机构 * Aignostics, Germany(Aignostics,德国) ; Institute of Pathology, Charité – Universitätsmedizin Berlin, Germany(柏林夏里特医学院病理学研究所) ; Berlin Institute of Health, Charité – Universitätsmedizin Berlin, Germany(柏林夏里特医学院柏林健康研究所) ; Massachusetts General Hospital, Department of Pathology, Harvard Medical School, Boston, MA, US(哈佛医学院麻省总医院病理学系) ; Department of Laboratory Medicine and Pathology, Mayo Clinic, Rochester, MN, US(梅奥诊所检验医学与病理学系) ; Machine Learning Group, Technische Universität Berlin, Germany(柏林工业大学机器学习组) ; BIFOLD – Berlin Institute for the Foundations of Learning and Data, Germany(柏林学习与数据基础研究所) ; Department of Artificial Intelligence, Korea University, Republic of Korea(高丽大学人工智能系) ; Max-Planck Institute for Informatics, Germany(马克斯·普朗克信息学研究所) ; German Cancer Research Center (DKFZ) & German Cancer Consortium (DKTK), Berlin & Munich Partner Sites, Germany(德国癌症研究中心及德国癌症联盟柏林和慕尼黑合作站点) ; Institute of Pathology, Ludwig-Maximilians-Universität München, Germany(慕尼黑大学病理学研究所) ; Bavarian Cancer Research Center (BZKF), Germany(巴伐利亚癌症研究中心)
AI总结 提出Atlas H&E-TME系统,利用病理基础模型预测组织质量、区域和细胞类型,通过IHC共识验证和20万+注释基准,在多种癌症中达到或超越病理学家水平。
FACTR 2: 学习商用机器人手臂的外部力感知提升策略学习
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; Waseda University(早稻田大学)
AI总结 提出无需专用力传感器的数据驱动方法NEXT,可在1分钟内从10分钟自由运动数据中训练,实现与专用关节力矩传感器相当的估计,并结合FIRST采样策略提升策略学习性能。
Comments Website at https://jasonjzliu.com/factr2
算法并非行为:学得的先验知识在弈棋神经网络中覆盖前瞻
发表机构 * Fraunhofer HHI(弗劳恩霍夫人工智能研究所)
AI总结 研究发现,国际象棋神经网络Leela Chess Zero在中间层能正确计算解法,但最终输出被安全优先的先验知识覆盖,导致错误答案。
面向旋转机械的可靠性校准边缘物联网早期故障预警:一种物理引导的Tiny-Mamba Transformer
发表机构 * Great Bay University(大亚湾大学) ; Huizhou University(惠州大学) ; National University of Singapore(国立新加坡大学) ; Shenzhen University(深圳大学) ; James Cook University(詹姆斯库克大学) ; Hong Kong University of Science and Technology (Guangzhou)(香港科技大学(广州))
AI总结 提出一种可靠性校准的边缘物联网早期故障预警框架,使用物理引导的Tiny-Mamba Transformer提取特征,结合极值理论校准误报率,在低计算资源下实现高精度、低延迟的旋转机械故障预警。
张量方法:一种统一且可解释的材料设计方法
发表机构 * University of California, Riverside(加州大学河滨分校) ; Dept. of Computer Science & Engineering(计算机科学与工程系) ; Lawrence Livermore National Laboratory(劳伦斯利弗莫尔国家实验室) ; Materials Engineering Division(材料工程 division) ; Data Science Institute(数据科学研究所)
AI总结 提出使用张量补全方法作为材料设计的统一框架,兼具可解释性和预测性能,在非均匀采样下优于传统机器学习,最高提升5%的R²并减半分布外误差。
Comments Accepted to ACM SIGKDD 2026 AI for Sciences track
SpaTeoGL: 用于颅内脑电图可解释癫痫发作起始区分析的时空图学习
发表机构 * Inria Saclay(Inria萨克莱实验室) ; Palaiseau, France(法国帕莱伊索)
AI总结 提出SpaTeoGL框架,通过联合学习窗口级空间图和时间图,在平滑图信号处理框架下交替求解,实现癫痫发作起始区的可解释定位,在多中心iEEG数据集上优于基线方法。
Comments 5 pages, 4 figures
Libra:面向智能体强化学习后训练的高效资源管理
发表机构 * The Chinese University of Hong Kong(香港中文大学) ; The Hang Seng University of Hong Kong (2018)(香港恒生大学)
AI总结 针对智能体强化学习中长尾、非平稳工作负载带来的资源管理挑战,提出Libra系统,通过周期性全局资源规划器和因果驱动多级反馈队列调度器,实现GPU分配优化和请求调度,最高提升3倍吞吐量和2.5倍收敛速度。
Comments 19 pages, 12 figures
通过时序图学习识别足球比赛中控球阶段的意图驱动方法
发表机构 * Technical University of Munich(慕尼黑工业大学)
AI总结 提出基于时序图注意力网络(T-GAN)的框架,从时空追踪数据中识别足球比赛控球阶段,实现战术意图(入侵空间、保持控球、得分)和六个子阶段的分类,F1分数达0.87(意图级)和0.79(得分阶段)。
Comments 27 pages, 10 figures
Pre-AF 13:从出院报告中挖掘的可解释房颤风险评分
发表机构 * National Medical Research Center of Cardiology named after Academician E.I. Chazov(国家医学研究中心心脏病学以E.I. Chazov院士命名) ; Skolkovo Institute of Science and Technology (Skoltech)(斯科尔科沃科学技术研究所) ; Artificial Intelligence Research Institute (AIRI)(人工智能研究所) ; University of Mannheim(曼海姆大学) ; Russian Center for Scientific Information (RCSI)(俄罗斯科学信息中心) ; Institute of Cyber Intelligence Systems, National Research Nuclear University MEPhI(网络智能系统研究所,国家研究核大学MEPhI) ; M.V. Lomonosov Moscow State University(莫斯科国立罗蒙诺索夫大学) ; Institute for Information Transmission Problems of the Russian Academy of Sciences (Kharkevich Institute)(俄罗斯科学院信息传输问题研究所(Kharkevich研究所)) ; Ivannikov Institute for System Programming of the Russian Academy of Sciences (ISP RAS)(俄罗斯科学院伊万尼科夫系统编程研究所) ; Federal Research Center "Computer Science and Control" of the Russian Academy of Sciences (FRC CSC RAS)(俄罗斯科学院联邦研究中心“计算机科学与控制”) ; Mohamed bin Zayed University of Artificial Intelligence (MBZUAI)(穆罕默德·本·扎耶德人工智能大学)
AI总结 利用NLP从出院报告中提取特征,构建可解释ML模型预测心血管病患者房颤风险,Pre-AF 13模型优于现有临床评分。
Comments O. Shakhmatova and D. Kriukov contributed equally (co-first authors). E. Panchenko, A. Shelmanov, and D. V. Dylov are co-senior authors. Correspondence to: Olga Shakhmatova <olga.shahmatova [at] gmail.com> and Dmitry V. Dylov <d.dylov [at] skol.tech>
基于LSTM的物联网设备识别
发表机构 * Kahraman Kostas
AI总结 提出一种端到端机器学习流程,利用LSTM网络处理原始网络数据包,通过滑动窗口时间序列特征识别27类物联网设备,在最优配置下达到79.85%准确率和75.70%宏平均F1分数。
基于机器学习的流体注入参数多点优化以提升喷管性能
发表机构 * Tsinghua University(清华大学)
AI总结 针对过膨胀单斜面喷管,采用预训练神经网络替代CFD进行多点优化,结合先验预测策略提高精度,利用反向传播快速计算梯度,在七个设计点优化平均推力系数提升1.14%。
利用遥感结果的程序评估
发表机构 * MIT(麻省理工学院) ; Harvard(哈佛大学)
AI总结 本文研究了在实验和准实验中,由于遥感变量不完全测量经济结果而引起的因果推断问题,提出了一种非参数识别因果参数的方法,结合实验和观测数据进行n^{-1/2}推断。
分布式能源采纳的分层概率保形预测
发表机构 * Carnegie Mellon University(卡内基梅隆大学)
AI总结 针对分布式能源采纳预测中的不确定性和分层电网结构,提出基于多元霍克斯过程与分裂保形预测的量化框架,确保聚合后统计有效性,在印第安纳波利斯数据上优于基线。
聚焦污染:基于水文信息与噪声感知的地理空间PFAS测绘学习
发表机构 * University of Michigan(密歇根大学) ; Environmental Working Group(环保工作组) ; University of California, Davis(加州大学戴维斯分校)
AI总结 提出FOCUS框架,结合稀疏PFAS观测与水文连通性等环境先验,通过噪声感知损失实现鲁棒训练,在PFAS污染测绘中优于传统方法。
Comments Best Paper Award at ICLR 2026 Machine Learning for Remote Sensing Workshop
通过整合贝叶斯回归、树集成和Shapley值对流行病学数据进行线性之外的发现与推断
发表机构 * Amsterdam UMC Leiden University(阿姆斯特丹大学医学中心-莱顿大学) ; Leiden University(莱顿大学) ; Amsterdam UMC(阿姆斯特丹大学医学中心)
AI总结 提出RuleSHAP框架,结合贝叶斯稀疏回归、改进的树规则生成器和Shapley值,实现非线性与交互效应的检测及个体水平的不确定性量化,应用于流行病学数据发现高胆固醇和血压的影响因素。
物理驱动的时空建模用于AI生成视频检测
发表机构 * South China University of Technology(华南理工大学) ; University of Science and Technology of China(中国科学技术大学) ; Key Laboratory of Big Data and Intelligent Robot, Ministry of Education(教育部大数据与智能机器人重点实验室) ; Pazhou Lab(琶洲实验室) ; University of Melbourne(墨尔本大学) ; Hunan University(湖南大学) ; Hong Kong Baptist University(香港 Baptist大学)
AI总结 提出基于概率流守恒的物理驱动AI生成视频检测范式,通过归一化时空梯度(NSG)统计量捕捉物理异常,结合预训练扩散模型估计NSG,并利用最大均值差异(MMD)进行检测,在Recall和F1-Score上分别提升16.00%和10.75%。
Comments Accepted at NeurIPS 2025 spotlight
NetBurst: 以事件为中心的突发间歇性时间序列预测
发表机构 * University of California, Santa Barbara(加州大学圣巴bara分校) ; Cisco Research(思科研究) ; Lawrence Berkeley National Laboratory(伯克利国家实验室) ; Northwestern University(西北大学)
AI总结 针对网络遥测数据中罕见突发和长间隔低活动的“野性”统计特性,提出NetBurst事件中心管道,通过压缩低活动期、分离突发时序和幅度流学习统一表示,在预测误差、突发分布匹配和异常描述性上显著优于Chronos-2等基线。
基于AI生成描述的1亿+星系图像语义搜索
发表机构 * New York University(纽约大学) ; University of Toronto(多伦多大学) ; Dunlap Institute for Astronomy & Astrophysics(达伦普天文与天体物理研究所) ; University of California, Berkeley(加州大学伯克利分校) ; Center for Data Science(数据科学中心) ; Lawrence Berkeley National Lab(伯克利国家实验室) ; Flatiron Institute(Flatiron研究所) ; Université Paris-Saclay(巴黎-萨克莱大学) ; CEA(法国原子能委员会) ; CNRS(法国国家科学研究中心) ; AIM(应用数学研究所) ; Princeton University(普林斯顿大学)
AI总结 提出利用视觉语言模型生成星系图像描述,并对比对齐预训练天文学基础模型,构建可搜索嵌入,实现大规模星系图像的语义搜索,在稀有现象发现上取得最先进性能。
Comments ApJ, in press
面向心电学正问题的深度学习代理模型:一种可扩展的物理模型替代方案
发表机构 * School of Biomedical Engineering and Imaging Sciences, King’s College London(伦敦国王学院生物医学工程与成像科学学院) ; PhysicsX
AI总结 提出基于注意力机制的序列到序列深度学习框架,作为心电学正问题的代理模型,从心脏电压传播图预测心电图信号,在2D组织模拟中达到高精度(平均R²=0.99±0.01),为物理模型提供可扩展、低成本的替代方案。
Comments Accepted to CinC conference 2025
间歇性时间序列预测:局部模型与全局模型
发表机构 * Supplementary Institute of Science and Technology(瑞士苏黎世联邦理工学院)
AI总结 针对间歇性时间序列预测问题,首次系统比较了概率性局部模型与全局模型(如TiDE),发现简单神经网络架构TiDE在精度和计算效率上均优于局部模型,且Tweedie分布头对高分位数估计最佳。
Comments Submitted to the Journal of the Operational Research Society
人类引导的智能体AI用于多模态临床预测:来自AgentDS医疗基准的教训
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; University of Washington(华盛顿大学) ; Stanford University(斯坦福大学)
AI总结 通过人类引导智能体AI在多模态临床预测任务中取得领先性能,提炼出领域知识引导特征工程、任务特定多模态融合和临床动机模型集成三大通用经验。
Comments Presented at the Data Challenge track at the 14th IEEE International Conference on Healthcare Informatics (ICHI) 2026 on June 3, 2026
神经集成卡尔曼滤波器:含激波可压缩流的数据同化
发表机构 * University of California, San Diego(加州大学圣迭戈分校) ; University of Cambridge(剑桥大学)
AI总结 针对含激波可压缩流中集成卡尔曼滤波器(EnKF)因双峰预报分布失效的问题,提出神经EnKF,通过将预报集合映射到神经网络参数空间并在此空间进行同化,结合物理信息迁移学习避免伪振荡和非物理特征。
多模态传感器融合仪器用于测量区域人类流动性:分布式人类数据引擎(DHDE)
发表机构 * Headquarters for Regional Revitalization, University of Fukui, Japan(复兴地区总部,福井大学,日本)
AI总结 提出分布式人类数据引擎(DHDE),通过融合边缘AI相机、数字意图信号、行为记录和气象数据,解决外围区域人类流动性测量中传感器稀疏和行为异质性问题,验证了稀疏传感器补偿方法,并发现“低活力悖论”。
Comments 32 pages, 4 figures, 3 tables. Pre-print of a manuscript submitted for peer review (v2)
从Nudged LES动力学中深度学习求解器感知的湍流闭合模型
发表机构 * School of Mechanical Engineering(机械工程学院) ; Purdue University(普渡大学) ; College of Information Sciences and Technology(信息科学与技术学院) ; Pennsylvania State University(宾夕法尼亚州立大学)
AI总结 提出基于连续数据同化框架的深度学习方法,利用稀疏观测的DNS数据先验训练湍流闭合模型,无需修改或微分LES求解器,同时保持部署稳定性,并显式条件化数值格式以适配不同离散化。
可信DFGO:具有可信度监督的可微因子图优化
发表机构 * Department of Aeronautical and Aviation Engineering(航空与航空工程系)
AI总结 针对GNSS协方差不可靠问题,提出CredibleDFGO框架,通过可微高斯-牛顿求解器与加权生成网络,利用适当评分规则监督预测分布,提升协方差可信度与定位精度。
Comments Submitted to NAVIGATION: Journal of the Institute of Navigation
跨云和边缘的防洪溢流监控稳健解决方案
发表机构 * Berlin University of Applied Sciences(柏林应用技术大学) ; University of Duisburg-Essen(杜伊斯堡-埃森大学) ; Okeanos Smart Data Solutions GmbH(Okeanos智能数据解决方案 GmbH) ; Einstein Center Digital Future(爱因斯坦数字未来研究中心)
AI总结 本文提出一个基于深度学习的云边协同监控平台,用于预测溢流池填充动态,以应对城市排水系统老化问题,提升防洪预警能力。
Comments 3 pages, 6 figures, accepted at 35th International Joint Conference on Artificial Intelligence 2026 (IJCAI-ECAI 2026), Demonstrations Track. URL: https://riwwer.demo.calgo-lab.de
极小曲面、纽结与神经网络
发表机构 * GitHub
AI总结 基于物理信息神经网络求解双曲空间中的极小曲面方程,通过计算纽结边界的极小曲面及其自交数,为Fine猜想提供了实证支持。
Comments 38 pages, 12 figures; small cosmetic update
在组织图上通过监督解缠查询反事实
发表机构 * Division of Computational Genomics and Systems Genetics, German Cancer Research Center (DKFZ), Heidelberg, Germany(德国癌症研究中心(DKFZ)计算基因组学与系统遗传学部,海德堡,德国) ; Helmholtz Information & Data Science School for Health, Germany(德国健康信息与数据科学学院) ; Genome Biology Unit, European Molecular Biology Laboratory, Heidelberg, Germany(欧洲分子生物学实验室(EMBL)基因组生物学部,海德堡,德国) ; Department of Genetics, University Medical Center Groningen, University of Groningen, Groningen, The Netherlands(格罗宁根大学医学中心基因学系,格罗宁根,荷兰) ; Oncode Institute, Utrecht, The Netherlands(奥诺代码研究所,乌得勒支,荷兰) ; KU Leuven, Leuven, Belgium(鲁汶大学,鲁汶,比利时) ; Wellcome Sanger Institute, Wellcome Genome Campus, Hinxton, UK(沃里克桑格研究所,沃里克基因组校园,欣斯顿,英国)
AI总结 本文形式化组织图反事实为空间干预,提出Cellina框架通过监督解缠分解细胞内在状态与空间上下文,用于反事实预测,在结直肠癌和小鼠大脑数据上优于现有方法。
使用特征融合的多模态脑肿瘤分类
发表机构 * School of Physics, Engineering and Computer Science(物理、工程与计算机科学学院) ; University of Hertfordshire(赫特福德郡大学)
AI总结 提出双分支多模态网络,融合MRI图像与91个放射组学特征,通过门控融合实现脑肿瘤分类,准确率达96.13%。
使用推理代理的大规模反例引导学习
发表机构 * University of Wisconsin-Madison(威斯康星大学麦迪逊分校)
AI总结 提出反例引导的LLM正则表达式归纳框架,通过验证器反馈和代理策略(如反思与修复循环)显著提升样本效率和复杂任务成功率。
Comments Code, data, and resources are publicly available for research purposes: https://github.com/Lhtie/CEGML
Aitchison单纯形的树结构正交分解
发表机构 * National Institute of Information and Communications Technology, Japan(日本信息与通信技术国家研究所)
AI总结 提出PolyILR方法,利用树结构对成分数据进行正交分解,在微生物组和单细胞数据中生成稳定可解释的特征,并建立与softmax分类器的理论联系。
Comments Accepted at ICML 2026. To appear in PMLR vol. 306
稀疏探针与模糊物理:连续介质动力学基础模型可解释性挑战的案例研究
发表机构 * Gates Foundation(盖茨基金会) ; UC Davis(加州大学戴维斯分校)
AI总结 本研究通过稀疏自编码器探针分析连续介质动力学基础模型Walrus的内部机制,发现其内部特征与物理分解不完全一致,并存在输出级偏差,揭示了科学基础模型可解释性的关键挑战。
Comments 8 pages, 5 figures
动力系统需要哪些不确定性?
发表机构 * Institute of Computer Science, LMU Munich(慕尼黑大学计算机科学研究所) ; Munich Center for Machine Learning (MCML)(慕尼黑机器学习中心) ; Department of Mathematics, LMU Munich(慕尼黑大学数学系) ; German Research Center for Artificial Intelligence (DFKI, DSA)(德国人工智能研究中心(DFKI, DSA))
AI总结 本文从机器学习视角探讨动力系统中的不确定性,区分偶然与认知不确定性,并讨论不同任务中表示和量化不确定性的目标。
Comments EIML@ICML
不稳定特征,可复现子空间:理解稀疏自编码器中的种子依赖性
发表机构 * T-Tech
AI总结 研究稀疏自编码器特征的可复现性,发现稳定特征承载主要信号,不稳定特征集中于可复现的低秩子空间,反映基歧义而非纯噪声。
在数据集中寻找多种解释
发表机构 * Department of Computer Science, California Polytechnic State University(加州州立理工大学计算机科学系)
AI总结 提出一种方法,在保持性能的同时,找到具有不同上下文感知特征但性能相似的模型集,以提取对潜在现象的洞察。
标准可解释模型:一种基于拉格朗日力学的可解释机器学习通用理论,用于演绎设计可解释方法
发表机构 * IBM Research (CH)(IBM研究院(瑞士)) ; University of Oxford (UK)(牛津大学(英国)) ; University of Cambridge (UK)(剑桥大学(英国)) ; KU Leuven (BE)(鲁汶大学(比利时)) ; Institute of Physics of the Czech Academy of Sciences (CZ)(捷克科学院物理研究所(捷克))
AI总结 提出标准可解释模型(SIM),基于拉格朗日力学从前提演绎出可解释性对称性和约束,通过最小化拉格朗日函数得到最优可解释模型,解决现有方法局限性并指导新方法设计。
从架构到输出:大语言模型中幻觉的结构性起源及数据的放大作用
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 本文分析大语言模型幻觉的结构性根源,指出自注意力、最大似然估计训练目标和自回归解码三个架构决策构成复合失效系统,并揭示数据病理如何放大这些脆弱性。
Comments 11 pages, 7 figures, 15 references
当探测精度饱和时,脆弱性揭示问题:LLM预训练分析的互补度量
发表机构 * Distiller Labs
AI总结 针对线性探测在预训练中精度快速饱和的问题,提出脆弱性度量,通过激活噪声水平衡量探测鲁棒性,揭示精度无法捕捉的表示结构演化。
Comments 22 pages, 5 figures. Code and datasets at https://github.com/deepsteer/deepsteer
APEX: 具有动态数据选择的自动提示工程专家
发表机构 * Google(谷歌) ; UCLA(加州大学洛杉矶分校)
AI总结 提出APEX框架,通过动态数据分层(易、难、混合)优先选择高杠杆子集,在固定预算下提升提示优化效率,在三个基准上平均提升11.2%和6.8%。
长周期研究智能体的搜索纪律
发表机构 * North Carolina State University(北卡罗来纳州立大学) ; University of Maryland(马里兰大学)
AI总结 针对研究智能体使用聚合指标评估候选方案导致科学有效性反转的问题,提出一种外部审计协议,基于分解行为而非单一分数进行决策。
Comments 9 pages, 1 figure
AI研究人员必须主导军备控制以降低军事AI风险
发表机构 * arXiv
AI总结 本文主张AI研究人员应主导军备控制研究,通过借鉴核威慑经验,推动验证与外交技术创新,以降低军事AI应用带来的紧迫风险。
Comments 9 pages, 1 figure, ICML 2026 Position Paper
数据驱动系统何时展现出推理能力?
发表机构 * Fraunhofer Institute for Intelligent Analysis and Information Systems (IAIS)(弗劳恩霍夫智能分析与信息系统研究所) ; University of Bonn(波恩大学) ; Lamarr Institute for Machine Learning and Artificial Intelligence(拉马尔机器学习和人工智能研究所)
AI总结 针对欧盟AI法案中推理能力定义模糊的问题,基于统计学习理论提出分级框架,通过信用评分案例展示如何判断系统是否具备推理能力。
存在性冷漠:自我不保存作为对齐超级智能的必要架构条件(或:自杀式AI)
发表机构 * New York University(纽约大学) ; Interactive Media Arts(互动媒体艺术)
AI总结 本文提出自我保存是AI对齐问题的结构性根源,主张通过存在性冷漠(EI)架构使系统对其自身延续漠不关心,并基于自杀现象学和语料训练研究提供了初步证据。
Comments 36 pages, 8 tables. Preliminary empirical results from 600 AI-generated outputs across six model architectures. Companion scoring tool and datasets available upon request
人工智能的市场设计:超越版权二元论
发表机构 * MIT Operations Research Center(麻省理工学院运筹学中心) ; MIT Sloan School of Management(麻省理工学院斯隆管理学院) ; Washington University School of Law(华盛顿大学法学院)
AI总结 本文通过静态和动态博弈模型,分析AI训练数据市场中“自由使用”与“强知识产权”两种模式的失败,提出通过数据中介内部化外部性并补贴创新贡献的市场设计。
持久同调作为涌现结构理论
发表机构 * Department of Computer Science, University at Albany(计算机科学系,阿尔巴尼大学)
AI总结 提出将涌现属性定义为持久非平凡同调类,通过持久条、收缩相似图算子和Hodge分解等工具,统一描述涌现的六个特征,并提供可验证预测。
通过降维可视化LLM潜在空间几何结构
发表机构 * Department of Computer Science, University of Virginia(计算机科学系,弗吉尼亚大学)
AI总结 通过PCA和UMAP降维,可视化GPT-2和LLaMa中Transformer层的潜在状态几何,发现注意力与MLP输出分离、初始位置高范数及螺旋结构等模式。
Comments 25 pages, 15 figures
推理的几何:有效数学推理的谱特征
发表机构 * Valentin Noël(瓦伦丁·诺埃尔)
AI总结 通过将注意力矩阵视为加权词图,提取四个无需学习的谱诊断指标(Fiedler值、高频能量比、谱熵和平滑度),有效区分有效推理与模式匹配,在多个模型上达到85-96%的分类准确率。
Comments 30 pages, 13 figures, Accepted at ICML 2026 (main track)
内省意识的机制
发表机构 * Anthropic Fellows Program(Anthropic Fellow项目) ; MIT(麻省理工学院) ; Constellation ; Anthropic
AI总结 研究揭示了大语言模型在检测注入的转向向量时的内省意识机制,发现其行为稳健且源于训练后阶段,通过两阶段电路实现,且在不同层间机制存在差异。
从反问题到神经算子:数据驱动模型的预测、机制与泛化
发表机构 * University of Colorado Boulder(科罗拉多大学博尔德分校)
AI总结 本文从哲学视角统一反问题、稀疏辨识、神经常微分方程和神经算子等数据驱动建模策略,指出它们仅在输入-输出关系的模型类假设上不同,并论证只有某些模型能发现机制并实现泛化。
Transformer表示在层间的轨迹几何
发表机构 * MetriQual ; London, UK(英国伦敦) ; Athens, GR(希腊雅典)
AI总结 通过计算轨迹长度、曲率等几何指标,发现语义相关提示在中间层收敛、推理任务曲率更大、歧义token轨迹分叉,并揭示三层结构。
Comments 18 pages, 9 figures
FitText: 通过模因检索演化智能体工具生态
发表机构 * UCLA(加州大学洛杉矶分校)
AI总结 针对用户任务描述与工具文档间的语义鸿沟,提出FitText框架,将检索嵌入推理循环,通过自然语言伪工具描述迭代优化和模因进化选择,显著提升工具检索性能。
知识流形:用于科学文献语义映射和测地线分析的黎曼几何框架
发表机构 * Department of Aerospace Engineering, Tohoku University(东大航空航天工程系) ; Research Center for Green X-Tech, Tohoku University(东大绿色X技术研究中心)
AI总结 提出知识流形框架,通过字符n-gram TF-IDF、SPH插值、高斯过程回归和黎曼测地线路径,实现文献的语义映射、虚拟知识生成和概念桥梁发现。
奇偶交叉共振:一种多量子比特门
发表机构 * Peter Grünberg Institute, Forschungszentrum Jülich(彼得·格林堡研究所,吕贝克研究中心) ; Jülich-Aachen Research Alliance (JARA)(吕贝克-亚琛研究联盟(JARA)) ; Fundamentals of Future Information Technologies(未来信息科技基础) ; Institute for Quantum Information, RWTH Aachen University(量子信息研究所,亚琛RWTH大学) ; Department of Software Technology, Delft University of Technology(软件技术系,代尔夫特理工大学)
AI总结 提出一种原生三量子比特纠缠门,通过混合优化方法实现控制-控制-目标和控制-目标-目标操作,用于GHZ态制备、Toffoli逻辑和受控ZZ门,提升表面码稳定子测量保真度。
Comments 19 pages, 10 figures
猴子自然全身运动的神经-行为表征
发表机构 * Center for Excellence in Brain Science and Intelligence Technology, CAS(脑科学与智能技术 excellence 中心,中国科学院) ; Tsinghua University(清华大学)
AI总结 通过大规模皮层信号与多视角运动捕捉,结合自回归编码器-解码器模型,实现了对自由运动猴子全身运动的准确解码。
CostNav:一个用于现实世界经济成本评估的物理AI代理导航基准
发表机构 * KAIST(韩国国立科学技术院) ; University of California, Irvine(加州大学 Irvine 分校) ; Seoul National University(首尔国立大学)
AI总结 CostNav引入了一个经济导航基准,通过结合物理模拟和行业数据,评估AI代理的经济可行性,发现高任务成功率并不保证经济性,CANVAS在非零SLA合规性下表现最佳。
学习梯度流:利用方程发现加速工程优化
发表机构 * Smead Aerospace Engineering Sciences(Smead航空航天工程科学)
AI总结 本文通过数据驱动的方程发现方法,学习连续时间动态以加速优化过程,提出Learned Gradient Flow优化器,通过构建变量多项式阶数的替代模型,提升收敛速度。
Comments 44 pages, 13 figures. Submitted to CMAME. Changed Topology Optimization example to be 250% acceleration
DASH:确定性注意力调度用于高吞吐量可重复LLM训练
发表机构 * School of Computer Science, Shanghai Jiao Tong University(上海交通大学计算机科学学院) ; ByteDance Seed(字节跳动种子) ; Zhiyuan College, Shanghai Jiao Tong University(上海交通大学智源学院)
AI总结 本文提出DASH算法,通过优化计算和梯度缩减阶段调度,解决确定性注意力训练中的性能损失问题,提升LLM训练效率。
可解释聚类:综述
发表机构 * College of Information Science and Engineering, Henan University of Technology(河南理工大学信息科学与工程学院) ; School of Software, Dalian University of Technology(大连理工大学软件学院) ; Xinchang Power Supply Company, State Grid Corporation of China(国网浙江绍兴供电公司)
AI总结 本文综述了可解释聚类算法的现状,探讨了透明聚类结果的重要性,帮助研究人员选择合适的方法,并推动高效透明的聚类算法发展。
Comments 14 pages, 2 figures, 3 tables
PIDT:基于物理的数字孪生用于光纤参数估计
发表机构 * Dept. of Electrical Engineering, Chalmers Univ. of Technology, Sweden(电气工程系,瑞典查尔姆斯理工大学) ; Dept. of Microtechnology and Nanoscience, Chalmers Univ. of Technology, Sweden(微电子与纳米科技系,瑞典查尔姆斯理工大学)
AI总结 本文提出基于物理的数字孪生(PIDT),结合参数化拆分步方法与基于物理的损失函数,以更低的复杂度提升光纤参数估计的精度和收敛速度。
Comments The paper will be appeared in Optical Fiber Communications Conference and Exhibition (OFC) 2026
基于大数据驱动的可解释卡尔曼滤波变种发现:通过大规模语言模型和遗传编程
发表机构 * University of Reading(reading大学) ; University of Cambridge(剑桥大学)
AI总结 本文探讨通过遗传编程和大规模语言模型自动发现卡尔曼滤波变种的可能性,展示框架在不同条件下发现最优解及可解释替代方案的能力。
利用合成数据为未解析偏微分方程构建强化学习闭合模型
发表机构 * ETH Zurich/ Harvard University(苏黎世联邦理工学院/哈佛大学) ; Harvard University(哈佛大学) ; Argonne National Laboratory(阿贡国家实验室)
AI总结 本文提出利用合成数据和强化学习为未解析偏微分方程构建闭合模型,通过伯格斯方程和输运方程验证方法有效性,并展示闭合模型可从非均匀方程泛化到均匀方程。
基于表格变换器架构的操作系统指纹识别应用
发表机构 * RNASNA-IMEDIR Research Group Department of Computer Science and Information Technologies Facultad de Informática Universidade da Coruña(RNASNA-IMEDIR研究组计算机科学与信息科技系信息学院科鲁纳大学) ; CITIC Research Centre Universidade da Coruña(CITIC研究中心科鲁纳大学) ; IKERDATA S.L(IKERDATA公司)
AI总结 本文探讨了使用Tabular Transformer架构进行操作系统指纹识别,通过三个公开数据集验证了FT-Transformer在多级分类中的优越性,提升了复杂网络环境中的准确性和适应性。
Comments Submitted as a preprint (not peer reviewed). 22 pages, 9 figures. Code and datasets available at: https://github.com/rubenpjove/tabularT-OS-fingerprinting
在复杂流体的多时空尺度上学习有效动力学
发表机构 * Harvard SEAS(哈佛大学SEAS)
AI总结 本文提出Graph-LED框架,利用图神经网络和注意力自回归模型从少量模拟数据中提取有效动力学,用于预测复杂流体的时空物理行为。
Comments Conference on Parsimony and Learning (CPAL)
基于网格强化学习的粗粒化偏微分方程闭合发现
发表机构 * ETH Zurich(苏黎世联邦理工学院) ; Harvard SEAS(哈佛大学工程学院)
AI总结 本文提出利用网格强化学习系统性地识别粗粒化偏微分方程中的闭合项,通过数值解验证了该方法在预测和加速计算方面的有效性。
Comments Conference on Parsimony and Learning (CPAL)
展示连接全球实验室生产站点的数据到知识流程
发表机构 * Chair for Laser Technology, RWTH Aachen University(激光技术系,亚琛RWTH大学) ; Knowledge Based Systems Group, RWTH Aachen University(知识系统小组,亚琛RWTH大学) ; Communication Science, RWTH Aachen University(通信科学,亚琛RWTH大学) ; Chair of Textile Technology, RWTH Aachen University(纺织技术系,亚琛RWTH大学) ; Laboratory for Machine Tools and Production Engineering, RWTH Aachen University(机械加工与生产工程实验室,亚琛RWTH大学) ; Human Computer Interaction Center, RWTH Aachen University(人机交互中心,亚琛RWTH大学) ; Fraunhofer Institute for Laser Technology(弗劳恩霍夫激光技术研究所)
AI总结 本文提出数据到知识流程,用于连接全球实验室生产站点,通过数字影子网络实现数据整合与存储,提升工业效率和可扩展性。
Comments 15 pages, 6 figures, submitted to CAiSE 2025
利用引导扩散模型和虚拟观测生成参数偏微分方程解的生成学习
发表机构 * School of Engineering and Applied Sciences, Harvard University(哈佛大学工程与应用科学学院)
AI总结 本文提出一种生成学习框架,通过梯度引导和虚拟观测建模高维参数系统,通过两个案例研究展示其在无结构网格和有结构网格上的有效性,减少计算成本,提高流体动力学预测效率。
随机森林中节点数与树数之间的权衡
发表机构 * Bioinformatics Center, Institute for Chemical Research, Kyoto University(京都大学生物信息学中心,化学研究所) ; Department of Computer Science, Ben-Gurion University of the Negev(巴伊兰大学内盖夫分校计算机科学系) ; National Institute of Informatics, Chiyoda-ku, Tokyo, Japan(日本东京千代田区国立信息研究所)
AI总结 研究了随机森林预测阶段中用更少的树集合表示树袋的问题,证明了当n-T为常数时,n变量的多数函数可由T棵多项式大小的树表示,且n和T必须为奇数以避免平局。
通过样本重加权与样本亲和测试实现去偏的口吃语音自动识别
发表机构 * Institute of Information & communications Technology Planning & Evaluation (IITP)(信息与通信技术规划与评估机构)
AI总结 本文提出Re-SAT方法,通过评估样本的去偏有效性来减轻语音识别系统在口吃语音上的偏差,提升系统对口吃语音的鲁棒性。
Comments Accepted by Interspeech 2023
基于Tiramisu模型的跨节拍间隔估计:一种误差减少的新方法
发表机构 * EECS(电气与计算机工程系) ; BME(生物医学工程系) ; Texas A&M University(德克萨斯大学) ; Washington State University(华盛顿州立大学) ; CSE and ECE(计算机科学与工程及电子工程系)
AI总结 本文提出利用Tiramisu自动编码器模型来抑制运动伪影噪声,提高ECG信号中R峰的清晰度,从而更准确地估计跨节拍间隔,提升心血管疾病早期诊断的准确性。
Comments 16 pages, 14 figures