TailLoR: Protecting Principal Components in Parameter-Efficient Continual Learning
TailLoR:在参数高效持续学习中保护主成分
发表机构 * Bitdefender
AI总结 提出TailLoR方法,利用预训练权重的奇异基作为固定参考系,对奇异值矩阵进行低秩更新,并通过软谱惩罚抑制与主导奇异方向对齐的更新,从而减少干扰并实现细粒度适应。
TailLoR:在参数高效持续学习中保护主成分
发表机构 * Bitdefender
AI总结 提出TailLoR方法,利用预训练权重的奇异基作为固定参考系,对奇异值矩阵进行低秩更新,并通过软谱惩罚抑制与主导奇异方向对齐的更新,从而减少干扰并实现细粒度适应。
重复博弈中与自适应对手的遗憾最小化
发表机构 * Massachusetts Institute of Technology(麻省理工学院) ; OpenAI ; University of Maryland, College Park(马里兰大学学院公园分校)
AI总结 针对重复博弈中自适应对手的遗憾最小化问题,提出重复策略遗憾(RP-Regret)指标,并设计三种算法实现次线性遗憾,同时证明所有玩家最小化该遗憾可学习子博弈完美均衡。
操作引导的渐进式人机文本转换基准:面向多粒度AI文本检测
发表机构 * Mohamed bin Zayed University of Artificial Intelligence(莫扎德·本·泽亚德人工智能大学) ; University College London(伦敦大学学院)
AI总结 提出OpAI-Bench基准,通过九种渐进修订版本和五种AI编辑操作,模拟人机协作编辑过程,支持文档、句子、词元和跨度多粒度检测,揭示AI文本可检测性受编辑操作、领域和累积修订历史影响,并发现混合作者中间版本比纯人类或纯AI端点更难检测。
Comments Our code and data are available at https://github.com/VILA-Lab/OpAI-Bench
DNQ: 用于部分可观测n人博弈的深度纳什Q网络
发表机构 * IEEE
AI总结 针对多智能体同时博弈问题,提出DNQ框架,通过求解器在环的均衡监督训练智能体,并对比成对与精确均衡求解方法的可扩展性。
无递归预训练循环网络
发表机构 * MIT(麻省理工学院)
AI总结 提出监督记忆训练(SMT)方法,通过将循环神经网络训练转化为一步记忆转换标签上的监督学习,实现时间并行训练和稳定梯度路径,优于反向传播通过时间(BPTT)方法。
Comments 30 pages, 23 figures
RREDCoT: 推理模型的片段级奖励再分配
发表机构 * ELLIS Unit Linz and LIT AI Lab, Institute for Machine Learning, Johannes Kepler University Linz, Austria(林茨ELLIS单元和LIT人工智能实验室,机器学习研究所,林茨约瑟夫·冯·拉格纳大学,奥地利) ; Cognizant AI Lab, San Francisco, USA(认知人工智能实验室,美国旧金山) ; NXAI GmbH, Linz, Austria(NXAI公司,奥地利林茨)
AI总结 针对推理语言模型强化学习微调中的延迟奖励问题,提出RREDCoT方法,利用模型自身近似最优奖励再分配,无需额外生成,降低方差并提升信用分配效率。
Comments Preprint, under review
扩散语言模型的自增强检索
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; Google Research(谷歌研究院)
AI总结 提出SARDI框架,利用扩散语言模型去噪过程中丢弃的低置信度标记作为前瞻信号指导检索,无需训练且与检索器无关,在多跳问答基准上以高达8倍吞吐量超越现有方法。
Comments ICML 2026
PC层:通过多项式权重预处理改进大语言模型预训练
发表机构 * The Chinese University of Hong Kong, Shenzhen(香港中文大学(深圳)) ; Google LLC(谷歌公司) ; Shenzhen International Center for Industrial and Applied Mathematics(深圳国际工业与应用数学中心) ; Shenzhen Research Institute of Big Data(深圳大数据研究院) ; University of Illinois at Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校)
AI总结 提出一种多项式预条件子权重参数化方法(PC层),通过低阶多项式预条件重塑权重矩阵奇异值谱,确保LLM训练中权重条件稳定,且训练后无推理开销,在Llama-1B预训练中优于标准Transformer。
好的插值器有多丰富?
发表机构 * Cornell University, Department of Computer Science(康奈尔大学计算机科学系) ; Cornell University, Department of Statistics and Data Science(康奈尔大学统计与数据科学系)
AI总结 在高维比例下,通过大偏差原理研究随机均匀选择的线性插值分类器的泛化误差分布,发现几乎所有插值分类器具有相同的泛化性能,而高效算法(如梯度下降)优于大多数插值器。
Comments 140 pages
仅索引一次:具有共享路由的跨层稀疏注意力
发表机构 * Microsoft Research(微软研究院) ; Tsinghua University(清华大学)
AI总结 提出跨层稀疏注意力(CLSA),通过共享KV缓存和路由索引,在保持token稀疏注意力精度的同时减少路由开销,显著提升长上下文LLM的解码效率。
面向AI-RAN的参数到KPI依赖学习的事件检测
发表机构 * Idaho National Laboratory(爱达荷国家实验室)
AI总结 针对AI-RAN中多AI控制函数相互干扰问题,提出基于事件检测的依赖学习方法,通过将噪声连续遥测转换为二元事件指示器,并利用合成数据评估机器学习管道恢复潜在依赖结构的能力。
上下文多实例学习
发表机构 * Berlin Institute for the Foundations of Learning and Data(柏林学习与数据基础研究所) ; Machine Learning Group, Technische Universität Berlin(柏林技术大学机器学习小组) ; Aignostics ; Institute of Pathology, Charité – Universitätsmedizin Berlin(柏林查理医院病理研究所) ; Max-Planck Institute for Informatics(马克斯·普朗克信息研究所) ; Department of Artificial Intelligence, Korea University(韩国大学人工智能系)
AI总结 本文提出一种基于感知器架构的上下文学习器,通过合成数据预训练,无需梯度更新即可从少量标记包中解决新的多实例学习任务,在12个基准上超越需任务特定训练的监督基线。
基于归一化流的潜在推理
发表机构 * University of Pennsylvania(宾夕法尼亚大学) ; UC San Diego(圣地亚哥大学) ; Meta(Meta公司)
AI总结 提出NF-CoT框架,通过归一化流在LLM内部建模连续潜在思维,保留自回归生成、概率采样、KV缓存解码和似然估计等优势,在代码生成任务中提升通过率并降低推理成本。
来自熵推理的因果图谱:超越最优DAG的贝叶斯网络
发表机构 * Department of Physics , Engineering Physics and Astronomy(物理系、工程物理与天文学系)
AI总结 针对数据驱动因果识别中多因果链问题,提出基于熵推理的因果图谱方法,通过最大熵系综采样量化因果结构歧义性。
Comments 18 pages, 2 figures
双重预处理 (DoPr):针对测试时性能而非验证损失的优化
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; Stanford University(斯坦福大学) ; University of Cambridge(剑桥大学) ; DeepMind(深度Mind) ; Google Research(谷歌研究)
AI总结 提出双重预处理优化范式,通过结合梯度级和激活级预处理,缓解自回归语言建模等场景中训练/验证损失与下游指标不匹配的测试时反馈问题,提升测试时性能而不一定改善验证损失。
面向智能体数据分析的无监督技能发现
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出DataCOPE框架,通过无监督验证器引导从探索轨迹中发现可复用的数据分析技能,在报告式和推理式分析任务上分别提升平均得分9.71%和32.30%。
Comments Work in progress
右删失生存数据的适当评分规则
发表机构 * IDLab ; Biometrics Research Group(生物信息学研究组) ; Department of Electronics(电子系) ; Department of Morphology, and Information Systems and Information Systems Imaging, Orthopedics(形态学系及信息系统和影像学、骨科) ; Ghent University(根特大学) ; Ghent University - imec(根特大学 - imec) ; Rehabilitation and Nutrition(康复与营养) ; Department of Electronics and Information Systems(电子系及信息系统)
AI总结 针对右删失生存数据,提出通过删失机制映射预测分布并应用适当评分的框架,得到删失CRPS、pinball损失等评分,并证明其适当性。
Comments 27 pages
共形风险分担:具有参与保证的认证成本分配
发表机构 * Ieva Kazlauskaite(伊娃·卡祖利特)
AI总结 提出共形风险分担方法,通过可解释的分担策略与分裂共形校准相结合,从有限数据中无分布假设地分配罕见事件的财务影响,为每个参与者提供义务上限并验证无人受损。
用于 HEC-RAS 2D 水面高程预测的学习型响应场惯性算子
发表机构 * Canizaro Livingston Gulf States Center for Environmental Informatics, Department of Computer Science, The University of New Orleans(坎西罗利文斯顿湾州环境信息中心,计算机科学系,新奥尔良大学) ; Center for Geospatial Sciences, Naval Research Laboratory(地理空间科学中心,海军研究实验室) ; Ocean Sciences Division, Naval Research Laboratory(海洋科学 division,海军研究实验室)
AI总结 提出学习型响应场惯性算子(LRFIO),一种基于增量、无外力项的学习代理模型,通过从已求解的 HEC-RAS 轨迹中校准惯性响应算子并在原生非均匀网格上进行封闭形式滚动预测,实现了跨数据集的水面高程预测,并展示了自适应复杂度控制。
Comments Preprint manuscript prepared using IEEEtran journal format
端到端子图检测与GraphDETR
发表机构 * Max Planck Institute of Biochemistry(马克斯·普朗克生物化学研究所)
AI总结 提出GraphDETR框架,将子图检测视为集合预测问题,通过图神经网络编码目标图、Transformer解码器联合预测所有模式实例,并采用二分匹配端到端训练,支持精确和近似匹配,在多达1000节点的图中检测50节点模式,并在ChEMBL数据集上实现AP100=91.2。
最大化定位球回报:用图强化学习优化足球角球战术
发表机构 * School of Computer Science, University of Birmingham, Birmingham, UK(伯明翰大学计算机科学学院) ; Nottingham Forest Football Club, Nottingham, UK(诺丁汉森林足球俱乐部) ; Oxford Robotics Institute, University of Oxford, Oxford, UK(牛津大学机器人研究所) ; School of Sport, Exercise and Rehabilitation Sciences, University of Birmingham, Birmingham, UK(伯明翰大学运动、体能与康复科学学院)
AI总结 提出一种基于图强化学习的框架,通过调整进攻球员位置和速度来最大化角球首次触球射门概率,在英超角球数据上优于传统优化方法。
Comments 11 pages, 4 figures
贝叶斯神经常微分方程的函数空间先验及其在船舶轨迹预测中的应用
发表机构 * Department of Industrial and Systems Engineering, Korea Advanced Institute of Science and Technology (KAIST)(工业与系统工程系,韩国科学技术院(KAIST))
AI总结 针对船舶轨迹预测中不规则采样、缺失报告和复杂动力学挑战,提出一种在向量场上施加高斯过程核先验的正则化方法,并结合概率多重打靶实现长序列的不确定性量化。
GraphCast在巴西中期天气预报中的性能评估
发表机构 * MALTA, Machine Learning Theory and Applications Lab, PUCRS, Porto Alegre, Brazil(MALTA,机器学习理论与应用实验室,PUCRS,波士顿,巴西)
AI总结 本研究利用GraphCast模型与ECMWF IFS HRES基线,评估其在巴西四个气候子区域的中期天气预报性能,发现其技能具有季节性依赖性,在冬季中期表现不佳但在延伸期有优势,夏季则能准确捕捉大尺度水汽输送并抑制高频对流变率。
使用时间序列基础模型的攻击检测
发表机构 * University of Pennsylvania(宾夕法尼亚大学) ; KTH Royal Institute of Technology(皇家理工学院) ; Uppsala University(乌普萨拉大学)
AI总结 针对无模型知识的网络物理系统,提出基于TimesFM时间序列基础模型的零样本攻击检测方法,在IEEE 14节点电力系统上验证其性能。
Comments Under review
使用TRIBE v2数据增强提升脑到图像解码
发表机构 * Meta AI
AI总结 针对脑解码中标记数据稀缺的问题,提出利用预训练的fMRI响应模型TRIBE v2生成合成数据来增强小样本数据集,在两个数据集上实现最高68%的Top-10图像检索准确率提升,并发现纯合成数据训练的解码器在零样本设置中也能达到高于随机水平的性能。
等变神经信念传播
发表机构 * Department of Computer Science, University of Oxford(计算机科学系,牛津大学) ; FLock.io
AI总结 提出等变神经信念传播(ENBP),通过等变高斯混合消息和秩2精度矩阵合成,实现SE(3)对称性下的高效概率推理,在分子构象和机器人推理任务中显著超越基线。
Comments 18 pages
对称散度与归一化相似性:表示分析的统一拓扑框架
发表机构 * School of Data Science, The Chinese University of Hong Kong, Shenzhen(数据科学学院,香港中文大学(深圳))
AI总结 提出对称表示拓扑散度(SRTD)和归一化拓扑相似性(NTS),分别解决现有拓扑散度的非对称性和无界性问题,实现细粒度结构诊断与跨场景标准化评估。
Comments Accepted by TMLR
弥合领域专业知识与泛化能力以实现性能估计
发表机构 * School of Computer Science and Engineering, Sun Yat-sen University, China(中山大学计算机科学与工程学院) ; Key Laboratory of Machine Intelligence and Advanced Computing, Ministry of Education, China(教育部人工智能与先进计算重点实验室) ; Shenzhen Loop Area Institute, China(深圳环湖院) ; Alibaba Cloud(阿里云)
AI总结 提出FRAP方法,利用外部基础模型和基础模型的互补优势,通过温度缩放校准和对齐预测分布,构建更可靠的伪标签参考分布,从而在分布偏移下准确估计模型性能。
通过利用针对合成数据的成员推理攻击量化反事实的隐私性
发表机构 * ÉTS Montreal and Mila Canada(蒙特利尔ÉTS学院和Mila加拿大) ; UQAM Canada(魁北克大学UQAM加拿大) ; Inria Grenoble France(法国格勒诺布尔Inria)
AI总结 本文利用针对合成数据的成员推理攻击,证明仅通过反事实即可成功实施成员推理攻击,无需访问模型,揭示了反事实发布中的隐私风险。
子空间感知稀疏自编码器用于有效的机制可解释性
发表机构 * The Pennsylvania State University(宾夕法尼亚州立大学)
AI总结 针对稀疏自编码器将特征假设为一维导致特征分裂的问题,提出子空间感知稀疏自编码器(SASA),通过学习解码器子空间、块稀疏门控和核范数正则化,在GPT-2和Mistral-7B上减少特征分裂和吸收,提高单义性和可解释性。
高维数据流形上的高效平均曲率计算
发表机构 * Federal University of São Carlos(萨尔瓦多·卡洛斯联邦大学)
AI总结 针对高维数据集局部平均曲率计算中原始方法O(m^4)每点成本过高的问题,提出基于代数恒等式和截断SVD的快速估计器,将成本降至O(k^2 m + k m p^2),在真实数据集上实现50-300倍加速且精度损失可忽略。
Comments 31 pages, 2 figures and 5 tables
PAMF: 面向不完整时间序列数据的先验感知多模态融合
发表机构 * Department of Computer Science, University of Central Florida(中央佛罗里达大学计算机科学系) ; Department of Computer Science, University of North Carolina at Chapel Hill(北卡罗来纳大学教堂山分校计算机科学系)
AI总结 提出PAMF框架,通过先验感知流匹配和权重共享显式处理模态内缺失和模态级缺失,将插补与下游预测耦合,提升多模态医疗时间序列任务性能。
Comments 5 figures. arXiv preprint version
学习遗忘什么:通过习得的词元级重要性改进大语言模型遗忘
发表机构 * Theory of Machine Learning Lab, EPFL(机器学习理论实验室,EPFL)
AI总结 提出交替词元加权遗忘(ATWU)框架,通过联合学习词元遗忘特异性和模型参数,在无外部监督下实现最优的遗忘-保留权衡。
DAS-PINNs 用于高维偏微分方程:将深度自适应采样扩展到时空域
发表机构 * University of Manchester(曼彻斯特大学) ; Department of Mathematics(数学系)
AI总结 提出一种基于归一化流的深度自适应采样框架,将时空视为统一域,通过残差分布自动识别高残差区域并生成采样点,有效求解具有局部动态特征的高维时变PDE。
从浓度重建壁面剪切应力:可微物理与物理信息神经网络
发表机构 * Department of Mechanical Engineering, University of Utah, Salt Lake City, UT, USA(机械工程系,犹他大学,盐湖城,UT,美国) ; Scientific Computing and Imaging Institute, University of Utah, Salt Lake City, UT, USA(科学计算与成像研究所,犹他大学,盐湖城,UT,美国) ; Department of Mechanical Engineering, University of Wisconsin–Milwaukee, Milwaukee, WI, USA(机械工程系,威斯康星大学密尔沃基分校,密尔沃基,WI,美国) ; Department of Biomedical Engineering, University of Utah, Salt Lake City, UT, USA(生物医学工程系,犹他大学,盐湖城,UT,美国)
AI总结 本文通过可微物理框架和物理信息神经网络两种逆方法,从空间有限的被动标量观测中重建壁面剪切应力,并证明测量位置和逆公式共同决定重建精度。
基于梯度信息逻辑校正的离散扩散模型即插即用引导
发表机构 * National University of Singapore(新加坡国立大学) ; University of Science and Technology of China(中国科学技术大学)
AI总结 提出GILC框架,通过将预训练去噪网络作为变分代理来估计引导信号,并引入无雅可比机制直接校正干净预测逻辑,实现无需额外训练的离散扩散模型可控生成,在DNA、蛋白质序列和分子生成任务上达到最优性能。
Comments Accepted by ICML 2026
反应通量匹配:稀有事件的机制发现与自适应采样
发表机构 * CMU-Pitt Program in Computational Biology(CMU-匹兹堡计算生物学项目) ; Dept. of Computational & Systems Biology University of Pittsburgh(计算与系统生物学系匹兹堡大学) ; Machine Learning Department Dept. of Mathematical Sciences Carnegie Mellon University(机器学习系数学科学系卡内基梅隆大学) ; Courant Institute, New York University(纽约大学Courant研究所) ; Machine Learning Lab Capital Fund Management(机器学习实验室资本基金管理)
AI总结 提出通量匹配框架,从反应轨迹数据中学习电流速度 u(z) 和标量势 h(z),用于识别反应路径和反应坐标,并实现自适应采样。
Comments 21 pages, 7 figures, submitted to NeurIPS 2026
消息传递图神经网络的PAC-Bayesian对抗鲁棒泛化:敏感性分析
发表机构 * School of Information Science and Engineering, Southeast University(信息科学与工程学院,东南大学) ; Squirrel Ai Learning
AI总结 通过敏感性感知的PAC-Bayesian框架,利用输出雅可比矩阵的秩约束和异向高斯后验,为消息传递图神经网络导出更紧的对抗鲁棒泛化界。
来自异构域的离散因果表示:一种贝叶斯方法及其在社会调查中的应用
发表机构 * Department of Statistics, University of Chicago(芝加哥大学统计学系) ; University of Tübingen(图宾根大学) ; Department of Statistics & Data Science Institute, University of Chicago(芝加哥大学统计学与数据科学研究所) ; Seminars for Statistics, ETH Zürich(苏黎世联邦理工学院统计系)
AI总结 提出一种贝叶斯方法,从多环境数据中学习离散因果概念,通过序贯蒙特卡洛采样近似多模态后验,并在社会调查数据中验证了其推断有意义的高层概念和因果关系的有效性。
你的GFlowNet秘密学习了一个最优传输方案
发表机构 * GitHub ; arXiv
AI总结 本文建立了非无环生成流网络与最优传输之间的理论联系,证明最小流GFlowNet学习到的策略编码了从源分布到目标分布的最优传输方案。
Comments ICML 2026 SPIGM Workshop
GRAMformer: 通过体积多模态交叉注意力实现任意顺序模态交互
发表机构 * Dept. of Information Engineering, Electronics, and Telecommunications, Sapienza University of Rome(信息工程、电子与电信系,罗马萨皮恩扎大学)
AI总结 提出体积多模态交叉注意力(VMA)机制,通过计算查询与多模态键向量的联合几何体积来建模任意顺序的模态交互,并集成到新型多模态Transformer架构GRAMformer中,提升多模态学习的有效性和效率。
大型语言模型温度缩放中的生成临界性
发表机构 * State Key Laboratory of Nuclear Physics and Technology, Institute of Quantum Matter, South China Normal University(核物理与技术国家重点实验室,量子物质研究院,华南师范大学) ; Key Laboratory of Atomic and Subatomic Structure and Quantum Control (MOE), Guangdong-Hong Kong Joint Laboratory of Quantum Matter(原子与亚原子结构及量子控制重点实验室(MOE),量子物质广深联合实验室) ; Guangdong Basic Research Center of Excellence for Structure and Fundamental Interactions of Matter, Guangdong Provincial Key Laboratory of Nuclear Science(物质结构与基本相互作用卓越基础研究中心,广东省核科学重点实验室) ; KEK Theory Center, Institute of Particle and Nuclear Studies(KEK理论中心,粒子与核物理研究所) ; RIKEN Center for Interdisciplinary Theoretical and Mathematical Sciences (iTHEMS), Wako(RIKEN交叉学科理论与数学科学中心(iTHEMS),Wako) ; Graduate University for Advanced Studies (SOKENDAI), Oho 1-1, Tsukuba, Ibaraki(高等研究大学(SOKENDAI),Oho 1-1,筑波,Ibaraki) ; Institute for Physics of Intelligence, The University of Tokyo(智能物理研究院,东京大学)
AI总结 通过统计场框架研究大型语言模型文本生成中的温度缩放,发现接近特征温度时出现类似连续相变的临界现象,为理解解码策略与临界现象的联系提供定量工具。
Comments 9 pages, 7 figures, contributed to PAI 2026 Conference
追踪神谕:改进扩散时间步调度用于3D CT重建
发表机构 * School of Computer Science and Engineering, University of Electronic Science and Technology of China(电子科技大学计算机科学与工程学院)
AI总结 针对3D CT重建中扩散模型推理计算开销大且均匀时间步调度引入大截断误差的问题,提出即插即用的TrO框架,通过动态规划优化时间步调度,在有限采样步数下显著提升重建保真度和计算效率。
Comments Accessed to ECML-PKDD2026
设计一个可靠的LLM集成接口用于死亡率预测
发表机构 * Curtin University(Curtin大学)
AI总结 提出一个结合大语言模型(LLM)的接口,通过自然语言输入驱动确定性预测流程,在保持统计精度的同时提升非专家用户的可及性。
Comments 7 pages, 7 figures
Anchor PCA
发表机构 * ETH Zürich(苏黎世联邦理工学院)
AI总结 针对多领域数据,提出Anchor PCA方法,通过修改目标矩阵进行主成分分析,在保留共享变异方向的同时权衡整体解释方差,实现鲁棒的降维。
弥合语义-协作鸿沟:面向冷启动物品推荐的非对称图架构
发表机构 * Tubi ; Kumo AI
AI总结 提出Shallow-RHS非对称链接预测架构,通过左端设备塔利用时序历史消息传递捕获协作信号,右端内容塔仅基于内在特征编码,解决冷启动物品推荐中的图归纳补全问题。
日本兽医毒理学中的无监督模式分析:用于跨物种风险评估的合规框架
发表机构 * Graduate School of Information Sciences, Tohoku University(东北大学信息科学研究生院)
AI总结 提出一种监管集成的无监督框架,利用NVAL数据库对不良药物事件进行聚类分析,识别出具有生物学意义的跨物种毒性模式。
Comments Submitted to IEEE Transactions on Biomedical Engineering
事件数据的非负矩阵分解
发表机构 * Ghent University(根特大学)
AI总结 提出EventNMF,一种直接对事件时间进行建模的连续时间非负矩阵分解方法,通过B样条基函数分解强度函数,避免分箱预处理的信息损失,并证明标准分箱方法是其特例。
基于机器学习的亨廷顿病阶段发现框架:结合图表示学习与聚类以揭示纵向Enroll-HD数据集中的进展动态
发表机构 * School of Mathematical and Computer Sciences, Heriot-Watt University(赫瑞斯-沃德大学数学与计算机科学学院)
AI总结 提出基于动态图表示学习和K-means++聚类的无监督框架,从纵向临床数据中识别亨廷顿病的四个有意义的进展阶段,并通过稳定性分析验证其鲁棒性。
Comments Accepted for publication in the Proceedings of the 10th International Conference on Medical and Health Informatics (ICMHI 2026), Association for Computing Machinery (ACM)
扩散模型仅观察梯度:分数匹配误差的几何视角
发表机构 * University of Cambridge(剑桥大学)
AI总结 本文从几何角度揭示L2分数误差不是衡量边缘分布质量的正确指标,通过Helmholtz-Hodge分解将分数误差分解为梯度分量和螺线管分量,证明只有梯度分量影响Fokker-Planck动力学,并给出仅依赖于梯度分量的KL散度上界及可计算的梯度分量估计器。
通过元学习从隐式成本-性能偏好中学习路由LLM
发表机构 * Hong Kong University of Science and Technology (Guangzhou)(香港科技大学(广州)) ; Southern University of Science and Technology(南方科技大学)
AI总结 提出MetaRouter框架,利用元学习从少量交互中学习用户隐式成本-性能偏好,实现个性化LLM路由,在分布内外任务上优于基线方法。
学习从多风险因素建模儿童哮喘加重:弗吉尼亚沿海地区案例研究
发表机构 * Joint Institute on Advanced Computing for Energy and Science(联合能源与科学高级计算研究所) ; Old Dominion University(老 Dominion 大学) ; School of Data Science(数据科学学院) ; Eastern Virginia Medical School(东部弗吉尼亚医学院) ; Macon & Joan Brock Virginia Health Sciences(马科恩与乔安·布罗克弗吉尼亚健康科学) ; Children’s Hospital of the King’s Daughters(国王女儿儿童医院) ; Children’s Specialty Group(儿童专科组) ; Institute for Coastal Adaptation and Resilience(海岸适应与韧性研究所) ; Chief Data Office(首席数据办公室) ; Thomas Jefferson National Accelerator Facility(托马斯·杰弗逊国家加速器设施) ; Department of Psychiatry(精神病学系) ; Boston Children’s Hospital(波士顿儿童医院)
AI总结 本研究通过比较广义线性模型、神经网络和稀疏字典学习框架,建模弗吉尼亚沿海地区儿童哮喘加重与空气污染、气象及社区社会经济因素的关系,并识别关键风险因素。
Comments 22 pages, 6 figures (5 supplemental)
有效维度作为物理信息神经网络中保物理约束适配的算子不变量
发表机构 * University of Cambridge(剑桥大学)
AI总结 利用Fisher信息矩阵定义物理约束模型的有效自由度d_eff,证明其收敛于微分算子核维数,并基于此提出子空间投影策略实现边界条件适配。
关于物理信息神经算子训练以求解参数化偏微分方程的研究
发表机构 * College of Civil Engineering, Tongji University(同济大学土木工程学院) ; Department of Engineering Science, University of Oxford(牛津大学工程科学系) ; Institute for Foundations of Data Science, Yale University(耶鲁大学数据科学基础研究所)
AI总结 本文系统研究了物理信息神经算子(PINO)的训练策略,包括架构设计、优化器选择、损失平衡和配置点采样,通过实验发现CViT架构表现稳定,并揭示了梯度冲突和因果违反等优化问题,表明PINN的缓解算法在PINO中同样有效。
面向有限标注数据的燃气轮机机群信任感知预测性排放监测
发表机构 * School of Natural and Computing Sciences University of Aberdeen(自然与计算科学学院 布拉德福德大学) ; School of Computing Sciences University of East Anglia(计算科学学院 东安格利亚大学) ; Siemens Energy Industrial Turbomachinery Ltd.(西门子能源工业涡轮机有限公司) ; Department of Physics and Technology UiT The Arctic University of Norway(物理与技术系 UiT 北极大学)
AI总结 提出一种信任感知概率框架,结合多头循环预测模型、置信度估计、集成不确定性量化、辅助特征预测、特征空间距离分析和运行范围诊断,在少量标注数据下实现机群级NOx预测,并提供可解释的逐样本信任分数以指示未标注涡轮机的预测可靠性。
Comments 14 pages, 6 figures, 6 tables
通过新颖的球面覆盖定理实现紧的列表可复现性界
发表机构 * McGill University(麦吉尔大学) ; Ohio State University(俄亥俄州立大学)
AI总结 针对列表可复现性中列表大小与精度参数及假设类复杂度之间的关系,本文利用Borsuk-Ulam定理证明了一个新颖的拓扑球面覆盖定理,并由此得到VC类列表大小与精度的紧界,以及大间隔半空间的最优列表大小。
Comments 17 pages, 2 figures
基于率失真的自适应状态-动作抽象
发表机构 * Department of Informatics, University of Sussex(苏塞克斯大学信息学院) ; Department of Brain Science, Imperial College London(伦敦帝国学院脑科学系) ; Centre for Eudaimonia and Human Flourishing, University of Oxford(牛津大学幸福与人类繁荣中心)
AI总结 提出通过率失真原理构建软状态-动作抽象,并利用性能证书动态调整抽象粒度,以在压缩状态和动作信息时实现近似最优性能。
Comments 28 pages, 2 figures
$p$-adic 双过滤用于基因组序列的拓扑机器学习
发表机构 * Department of CS & IS, BITS Pilani, K K Birla Goa Campus(计算机科学与信息系统系,比斯潘大学,KK Birla Goa校区) ; Department of Mathematics, BITS Pilani, K K Birla Goa Campus(数学系,比斯潘大学,KK Birla Goa校区)
AI总结 提出 pVR 框架,结合 $p$-adic 数与拓扑数据分析,通过双过滤 Vietoris-Rips 复形提取基因组序列拓扑特征,在低样本数据集上优于基线方法。
Comments 12 pages, 5 figures, 8 tables
从观察中学习理论化世界
发表机构 * University of Washington(华盛顿大学)
AI总结 受认知科学启发,提出Learning-to-Theorize范式,通过神经理论家(NEO)模型从原始非文本观测中推断显式解释性理论,实现基于解释的泛化。
用于脑电图解码的相关矩阵切片Wasserstein框架
发表机构 * Westlake University(西湖大学) ; School of Artificial Intelligence and Computer Science(人工智能与计算机科学学院) ; Jiangnan University(江南大学) ; Sun Yat-sen University(中山大学)
AI总结 提出基于拉回欧几里得度量的切片Wasserstein框架,实例化两种相关矩阵切片Wasserstein差异,并构建脑电图解码的域泛化方法,在三个数据集上验证了分布偏移下的泛化能力提升。
Comments Accepted by KDD 2026
步进自适应多模态融合网络与多尺度云特征学习用于超短期太阳辐照度预测
发表机构 * School of Automation, Southeast University(自动化学院,东南大学)
AI总结 提出一种步进自适应多模态融合网络,通过InceptionNeXt提取多尺度云特征、步进自适应低频补偿单元动态调整低频信息,并结合气象时间序列特征进行超短期太阳辐照度预测。
IR3DE:面向大型语言模型的线性路由器
发表机构 * Gensyn
AI总结 提出基于岭回归的线性路由器IR3DE,以低成本快速为每个提示选择最合适的领域专家大语言模型,在推理任务中超越基线方法,并支持动态添加或移除专家模型。
Comments Accepted at the ICML 2026 Workshop on Resource-Adaptive Foundation Model Inference
OrderGrad: 通过顺序统计量策略梯度估计超越均值优化
发表机构 * The University of Tokyo(东京大学)
AI总结 提出OrderGrad,一种用于顺序统计量目标的似然比和重参数化梯度估计器族,通过奖励变换实现风险厌恶、鲁棒和探索性学习的统一即插即用方法。
通过可微编程整合机制模型与数据驱动模型用于神经系统疾病
发表机构 * Department of Applied Mechanics, Indian Institute of Technology Delhi(印度理工学院德里应用力学系) ; Yardi School of Artificial Intelligence, Indian Institute of Technology Delhi(印度理工学院德里人工智能学院)
AI总结 本文综述了混合建模策略,通过可微编程将深度学习与基于物理的求解器结合,用于神经系统疾病的诊断、预后和治疗规划,优于纯机制或纯数据驱动方法。
关于 Max@K 策略梯度的优势估计
发表机构 * The University of Tokyo(东京大学)
AI总结 针对稀疏奖励下推理模型后训练困难,提出一种新的优势估计方法 MaxPO,通过 Leave-Two-Out 基线实现中心化优势,降低梯度方差并提升性能。
基于生成流场代理的三维水下路径规划
发表机构 * Flinders University(弗林德斯大学)
AI总结 针对自主水下航行器回收过程中复杂三维螺旋桨尾流的高成本CFD仿真问题,提出用条件生成对抗网络(cGAN)作为替代,结合能量加权A*路径规划,实现快速且有效的路径规划。
Comments 41 pages, 5 figures, 11 tables
MDP-GRPO:面向多约束指令跟随的稳定化组相对策略优化
发表机构 * Department of Electrical and Computer Engineering, College of Engineering, University of Tehran(德黑兰大学电气与计算机工程系,工程学院) ; Department of Statistics, Mathematics and Computer Science, Allameh Tabataba’i University(塔巴蒂大学统计、数学与计算机科学系)
AI总结 针对标准GRPO在离散低分散奖励下的不稳定性,提出MDP-GRPO,通过多温度采样、双锚优势、前景理论整形和非对称KL正则化,在FollowBench等数据集上提升严格约束满足率最高5.0%。
Comments Accepted to ACL 2026 Main Conference. 14 pages, 9 figures
使用Rashomon集的蜕变测试:机器学习中的解释忠实性
发表机构 * Norwegian Ministry of Education and Research(挪威教育与研究部)
AI总结 针对机器学习中因Rashomon效应导致解释不可靠的问题,提出基于蜕变测试的框架,通过后验解释方法评估特征归因的忠实性,无需真实标签。
Comments Accepted at 10th International Workshop on Metamorphic Testing (MET 2026)
基于函数近似的在线KL正则化强化学习在模型误设下的研究
发表机构 * Department of XXX, University of YYY, Location, Country(XXX系,YYY大学,地点,国家) ; School of ZZZ, Institute of WWW, Location, Country(ZZZ学院,WWW研究所,地点,国家)
AI总结 研究在模型误设下,基于一般函数近似的KL正则化上下文赌博机和情节强化学习,提出KL误设公式并分析基于回归的Gibbs策略更新算法,给出包含显式误设项的高概率KL遗憾界。
Comments Accepted by RLC 2026
用稀疏逼近方法学习PDE的解算子
AI总结 本文提出一种结合乘积基展开与正交匹配追踪的稀疏高维方法,用于逼近偏微分方程的解算子,显著减少所需样本量,并在数值实验中与立方体稀疏逼近和傅里叶神经算子对比,展示了在稀疏表示下的准确性和可解释性。
基于替代概率的自适应学习率用于跟随扰动领导者
发表机构 * Korea Institute of Science and Technology(韩国科学技术院) ; Kyoto University(京都大学) ; RIKEN AIP(理化学研究所AIP) ; The University of Tokyo(东京大学) ; University of Science and Technology(科学技术大学)
AI总结 针对FTPL算法因无优化特性难以设计自适应概率依赖学习率的问题,提出基于替代概率函数的自适应学习率,实现了任意形状参数α>1的Pareto扰动下的最佳双世界保证,并扩展到专家建议的赌博机问题。
Comments TBA COLT2026
当足够好即最优:量化门控DeltaNet的仅乘法矩阵求逆近似
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 针对分块并行线性注意力中矩阵求逆的瓶颈,提出基于截断Neumann级数展开的仅矩阵乘法算法,结合结构掩码和并行残差校正,实现NPU上5倍内核加速和20%解码层开销降低。
灾难性遗忘作为可访问性崩溃:持续学习中知识持久性的三层次框架
发表机构 * Independent Researchers(独立研究者)
AI总结 本文提出一个三层次框架(知识存储、表示和可访问性),通过实验证明灾难性遗忘主要是可访问性失败而非表示擦除,重新训练分类器可恢复大部分性能。
Comments 14 pages, 6 figures, 8 tables. Sequential continual-learning experiments on CIFAR-100 using ResNet-18
RedditPersona: 一个用于从Reddit进行社区条件化LLM适配的模块化框架
发表机构 * Future Computing Group University of Oulu(未来计算组奥卢大学) ; Centre for Applied Computing University of Oulu(应用计算中心奥卢大学)
AI总结 提出RedditPersona模块化框架,通过五种分组策略和QLoRA训练参数高效适配器,在112个Reddit子版块上评估社区条件化语言模型,发现适配器的行为可识别性与策略内在一致性相关,且所有策略在可识别性和分布相似性之间存在一致权衡。
将基于模型的控制与多智能体强化学习相结合以实现多智能体协作团队策略
发表机构 * Georgia Institute of Technology(佐治亚理工学院) ; Sandia National Laboratories(桑地亚国家实验室)
AI总结 提出一种结合多智能体强化学习与模型预测控制的框架(MA-AC-MPC),通过扩展演员-评论家模型预测控制实现安全、动态可行的协作策略,并在追逃场景和异构环境中验证其优于多层感知机模型。
Comments 12 pages, 8 figures, 7 tables
HoT-SSM:用于医疗保健的高阶时序知识图谱推理与状态空间模型
发表机构 * Fujitsu Research of India, Bangalore(印度班加罗尔 Fujitsu 研究院)
AI总结 提出HoT-SSM模型,通过构建超图捕获高阶临床交互,并利用动态超图状态空间模型建模长程时序依赖,在MIMIC-III/IV数据集上显著提升临床预测性能。
Comments Paper under review
压缩-蒸馏:面向高效知识蒸馏的推理轨迹压缩
发表机构 * Université catholique de Louvain(列日天主教大学) ; Sophont Inc(Sophont公司)
AI总结 本文提出在知识蒸馏前对推理轨迹进行事后压缩,以降低训练成本并缩短推理输出,实验表明压缩在准确率与效率间存在权衡。
基于视觉感知的多模态大语言模型条件编辑扩散的视频率流式风格化:蒸馏UNet + MLLM文本编码器上的非对称批处理推理
发表机构 * Independent researcher(独立研究员)
AI总结 针对蒸馏扩散模型中文本编码器成为瓶颈的问题,提出一种结合非对称CUDA流水线、编译友好的ControlNet-LLLite重构和周期性条件刷新调度的流式管线,在消费级GPU上实现视频率实时风格化编辑。
Comments 12 pages, 4 figures, 12 tables. Under review at IEEE Transactions on Circuits and Systems for Video Technology. Code, evaluation harness, and the released v3 Temporal LLLite adapter weights are at https://github.com/otanl/dreamlite-stream (also mirrored to Hugging Face and Zenodo)
基于反事实链和因果图的LLM可解释性
发表机构 * Faculty of Data and Decision Sciences, Technion I IBM Research(数据与决策科学学院,技术离子IBM研究所)
AI总结 提出一种四阶段方法,利用因果图建模LLM推理过程,通过MCMC启发的反事实增强发现类判别性概念并生成可解释图,用于疾病诊断、情感分析等任务。
测量基于LLM的结构化提取对临床出院小结中提示、模型和模式选择的敏感性
发表机构 * DryLabz GmbH(DryLabz公司)
AI总结 本研究通过固定提取任务并逐一改变提示、模型和模式选择,测量了大型语言模型在临床文本结构化提取中输出对上游配置的敏感性,发现模式选择导致的差异集中在缺失与沉默的区分上,而模型选择在多类分类中主导提示措辞。
Comments 69 pages, 5 main figures, supplementary material included
Steering Vectors 是对抗攻击面
发表机构 * Sapienza University of Rome(罗马萨皮恩扎大学) ; EPFL(苏黎世联邦理工学院)
AI总结 本文揭示了一种隐蔽的数据投毒攻击,通过替换转向数据集中的4-6%令牌,使转向向量与反拒绝方向对齐,从而劫持目标模型,同时保留对良性提示的预期转向效果。
死方向:几何奇异学习
发表机构 * IIIT, Hyderabad(Hyderabad 二十一世纪信息技术研究所)
AI总结 本文通过引入“死方向”概念,桥接奇异学习理论与信息几何,提出在原始参数坐标下从Fisher曲率衰减率恢复KL阶数的方法,并扩展到深度网络,实现无需后验采样的Watanabe三元组(λ, m, ν)轨迹率读出。
Comments 139 pages, 13 figures, 13 tables
短论文:黑暗中的模型——机器学习供应链中GDPR下的更正与删除
发表机构 * Karlstad University(卡尔斯塔德大学)
AI总结 本文从跨学科视角调查机器学习供应链中实现GDPR更正权和删除权的挑战,提出“黑暗中的模型”概念,并分析其带来的紧迫问题。
Comments accepted for presentation at Annual Privacy Forum 2026
EML-CD:通过结构学习中的EML符号树进行因果机制恢复
发表机构 * SoftBank Corp(软银公司)
AI总结 提出EML-CD框架,利用EML算子构建可解释的因果机制符号树,从数据中自动发现闭式因果方程,在真实和合成数据上实现了机制恢复与结构学习的平衡。
多模态还是非多模态:通过主动模态检测的查询自适应音视频人物检索
发表机构 * University of Cambridge(剑桥大学) ; Queen's University Belfast(贝尔法斯特女王大学) ; University of Surrey(萨里大学) ; Cisco(思科) ; Southwest Jiaotong University(西南交通大学) ; Teesside University(泰赛德大学)
AI总结 提出一种查询自适应框架,通过跨模态分数一致性检测主动模态,在BBC Rewind语料库上达到94.2%的P@1,优于单模态和固定融合方法。
Comments INTERSPEECH 2026
通过标签特定距离的过采样解决多标签数据中的不平衡问题
发表机构 * Key Laboratory of Data Engineering and Visual Computing, Chongqing University of Posts and Telecommunications, China(数据工程与视觉计算重点实验室,重庆邮电大学,中国) ; School of Computer Science and Technology, Chongqing University of Posts and Telecommunications, China(计算机科学与技术学院,重庆邮电大学,中国) ; State Key Laboratory of Novel Software Technology, Nanjing University, China(新型软件技术国家重点实验室,南京大学,中国) ; School of Informatics, Aristotle University of Thessaloniki, Greece(信息学院,希腊阿尔蒂米斯大学)
AI总结 针对多标签分类中的标签不平衡问题,提出基于标签特定距离的过采样方法LSDMLO,通过加权相关特征空间识别标签一致邻居,生成更有效的合成实例,实验表明优于现有方法。
DBHN-Net: 低复杂度单声道语音增强的双分支混合神经网络
发表机构 * State Key Laboratory of Opto-Electronic Information Acquisition and Protection Technology, (School of Computer Science and Technology), Anhui University(光电信息获取与防护技术国家重点实验室(计算机科学与技术学院),安徽大学) ; China Telecom Artificial Intelligence Technology (Beijing) Co., Ltd(中国电信人工智能技术(北京)有限公司) ; Institute of Acoustics, University of Chinese Academy of Sciences(中国科学院声学研究所) ; Institute of Artificial Intelligence (TeleAI), China Telecom, China(人工智能研究所(TeleAI),中国电信,中国)
AI总结 提出一种结合ANN和SNN的双分支混合神经网络,通过BandSplit、TF-Mamba等模块降低计算复杂度,同时利用交互和融合模块保持性能,在三个公共数据集上实现平均7.5倍复杂度降低。
Comments This article has been accepted for publication in IEEE Transactions on Pattern Analysis and Machine Intelligence(TPAMI)
可解注意力模型中LoRA微调的高维理论
发表机构 * Statistical Physics of Computation Laboratory, École Polytechnique Fédérale de Lausanne (EPFL)(计算物理学实验室,瑞士联邦理工学院(EPFL))
AI总结 本文通过高维统计理论分析低秩适应(LoRA)在注意力模型中的微调过程,揭示了预训练与微调之间的相互作用,并给出了测试误差和表示对齐的精确渐近刻画。
将研究关注度表示为上下文结构化流
发表机构 * University of Oxford(牛津大学) ; The Open University(开放大学) ; Springer Nature
AI总结 提出注意力流(attention flows)作为上下文结构化表示,编码注意力的组织及其随时间演化,通过类比推理基准评估发现流表示更有效支持结构比较,并提升部分观测和结构扰动下的鲁棒性。
Comments Accepted at STi 2026 - International Conference on Science and Technology Indicators
当更密集的信用不足时:面向长周期LLM智能体训练的基于证据校准的策略优化
发表机构 * X-LANCE Lab, School of Computer Science, Shanghai Jiao Tong University, Shanghai, China(X-LANCE实验室,计算机科学学院,上海交通大学,上海,中国) ; Faculty of Electronic and Information Engineering, Xi’an Jiaotong University(电子与信息工程学院,西安交通大学)
AI总结 针对长周期LLM智能体在稀疏延迟奖励下的信用分配问题,提出一种无评论家的策略优化算法ECPO,通过证据校准的动作优势和方差门控信用加权来修正密集信用的统计不可靠性,在ALFWorld和WebShop上显著提升性能。
LadderMan: 学习人形机器人感知爬梯
发表机构 * Amazon FAR(亚马逊FAR) ; USC(美国南加州大学) ; UC Berkeley(加州大学伯克利分校) ; Stanford University(斯坦福大学) ; CMU(卡内基梅隆大学)
AI总结 提出LadderMan系统,通过两阶段学习管道和视觉基础模型,使人形机器人能够鲁棒地攀爬多种梯子并在梯子上进行操控。
跨尺度空间感知生成模型揭示神经退行性脑组织下的转录组程序
发表机构 * Department of Computer Engineering, Karaikal Polytechnic College, Karaikal, Puducherry, India(计算机工程系,卡莱克尔理工学院,卡莱克尔,浦那赫里,印度)
AI总结 提出一种跨尺度空间感知生成框架,通过变分生成架构结合图空间平滑正则化,学习区域基因表达与皮质退化的潜在生物程序,实现高精度预测(解释方差0.8604,空间相关r=0.9439)。
Comments 26 pages, 5 figures
通过深度线性网络理论与条件ReLU约简解读Grokking中的两个训练时钟
发表机构 * State Key Laboratory of Mathematical Sciences, Academy of Mathematics and Systems Science, Chinese Academy of Sciences, Beijing 100190, China(数学科学国家重点实验室,数学与系统科学研究院,中国科学院,北京100190,中国) ; School of Mathematical Sciences, University of Chinese Academy of Sciences, Beijing 100049, China(中国科学院大学数学科学学院,北京100049,中国) ; Shanghai Institute for Mathematics and Interdisciplinary Sciences (SIMIS), Shanghai, China(上海数学与交叉科学研究所(SIMIS),上海,中国) ; Key Laboratory of Systems Health Science of Zhejiang Province, School of Life Science, Hangzhou Institute for Advanced Study, University of Chinese Academy of Sciences, Chinese Academy of Sciences, Hangzhou 310024, China(浙江省系统健康科学重点实验室,生命科学学院,杭州先进研究院,中国科学院大学,中国科学院,杭州310024,中国)
AI总结 本文通过分离分类损失的快速衰减与表示学习的缓慢简化,定义了“两个训练时钟”形式化Grokking现象,并利用深度线性网络理论和条件ReLU约简机制解释了这一两阶段过程。
沿Transformer堆栈的一致性训练
发表机构 * Purdue University(普渡大学) ; Independent(独立) ; Columbia University(哥伦比亚大学) ; University of California, San Diego(加州大学圣地亚哥分校) ; University of California, Los Angeles(加州大学洛杉矶分校) ; Dartmouth College(达特茅斯学院) ; University of Michigan, Ann Arbor(密歇根大学安娜堡分校)
AI总结 本文通过引入MLP状态和注意力分布的一致性目标,将一致性训练扩展到多种安全威胁,并发现跨威胁泛化及共享机制,证明其作为灵活对齐框架的有效性。
Comments Submitted to EMNLP 2026
基于混合截断损失的鲁棒稀疏支持向量机用于监督分类
发表机构 * School of Science, Beijing Forestry University(北京林业大学理学院) ; Translational Cancer Research Center, Peking University First Hospital(北京大学第一医院转化肿瘤研究中心)
AI总结 提出一种稀疏且有界的混合截断损失函数L_ht,构建L_ht-SVM模型用于单视图分类,并扩展为多视图MvL_ht-SVM,通过P-平稳点和交替方向乘子法实现高效优化,实验表明在准确率、稀疏性和鲁棒性上优于对比方法。
SALT: 当更多 rollout 在基于组的策略优化中无益时如何使其发挥作用
发表机构 * Bilibili Inc.(哔哩哔哩公司) ; Fudan University(复旦大学) ; Zhejiang University(浙江大学)
AI总结 针对 GRPO 风格组归一化中增加 rollout 数量导致梯度抵消的问题,提出 SALT 组件,通过子空间自适应重加权组相对更新系数,改善更新几何并提升性能。
CaliDist: 通过抗干扰行为鲁棒性校准大型语言模型
发表机构 * Cornelia Caragea(卡伦·卡雷亚) ; Mohammad Anas Jawad(穆罕默德·安斯·贾瓦德)
AI总结 提出CaliDist方法,通过测量和惩罚模型对语义干扰的敏感性来校准LLM,在7个NLU基准上平均将ECE从23%降至7%。
CollabBench: 通过主动参与与多样化玩家基准测试和释放LLMs的协作能力
发表机构 * Shanghai Institute of AI for Education(上海人工智能教育研究院) ; School of Computer Science(计算机科学学院) ; East China Normal University(东华大学) ; Tencent Inc.(腾讯公司) ; Shanghai Innovation Institute(上海创新研究院)
AI总结 提出CollabBench基准,通过多样化玩家模拟和协作智能体训练范式,提升LLM在合作游戏中的任务效率和情感适应能力。
Comments Accepted by ICML 2026
LLM 能写出正确的 TLA+ 规范吗?自然语言到 TLA+ 生成的评估
发表机构 * Department of Computer Science, Loyola University Chicago(洛约奈大学芝加哥分校计算机科学系)
AI总结 本文首次系统评估基于 LLM 从自然语言合成 TLA+ 规范的能力,发现模型在语义正确性上仅达 8.6%,且成功依赖于渐进式提示,揭示了模型大小与质量无关、代码专用模型表现不佳等关键发现。
Comments 12 pages, 11 tables. Accepted at the 21st International Conference on Software Technologies (ICSOFT 2026); Recommended as Best Paper Award Candidate
下一代LPDR并行解码器:架构优化与类别平衡的GAN增强
发表机构 * School of Electrical Engineering ; Computer Science National University of Sciences \& Technology Islamabad, Pakistan sobaid.mscs25seecs.edu.pk ; Computer Science National University of Sciences \& Technology Islamabad, Pakistan nchandio.mscs25seecs.edu.pk ; Computer Science National University of Sciences \& Technology Islamabad, Pakistan njamil.mscs25seecs.edu.pk ; Computer Science National University of Sciences \& Technology Islamabad, Pakistan
AI总结 针对车牌检测与识别中的空间字符不匹配和数据不平衡问题,提出交叉空间混合注意力和类别平衡合成增强方法,将少数省份车牌识别率从78.2%提升至91.5%,同时保持152 FPS的实时处理性能。
Comments 8 pages, 7 figures
基于改进的CNN-LSTM的物联网网络入侵检测系统
发表机构 * University of Engineering and Technology, Lahore(拉合尔工程与技术大学)
AI总结 提出一种结合多类分类、数据集集成和时间特征学习的改进CNN-LSTM入侵检测模型,在物联网网络上达到约97%的准确率。
Comments 8 pages, 8 figures
DRIFT:一种用于视觉-语言模型中连续输出解码的残差流适配器
发表机构 * University of Wisconsin–Madison(威斯康星大学麦迪逊分校) ; West Lafayette Jr./Sr. High School(韦斯特拉法叶高中)
AI总结 提出DRIFT框架,通过结合基础预测器和基于流匹配的生成式精化模块,将预训练视觉-语言模型适配到连续解码任务,在视觉定位和机器人控制等任务上优于回归和生成方法。
超越软掩码:用于鲁棒GNN可解释性的硬扰动混合解释器
发表机构 * Xi’an Jiaotong University(西安交通大学) ; PayPal ; bellevue USA(贝尔维尤美国)
AI总结 提出基于广义图信息瓶颈的硬扰动混合解释框架HPME,通过图池化提取离散解释子图并采用结构级替换的混合策略,解决软掩码方法中标签无关信息泄漏和分布偏移问题,提升解释保真度。
让它简单:视觉-语言-动作模型的单步动作生成
发表机构 * University of Science and Technology of China(中国科学技术大学) ; Shanghai Innovation Institute(上海创新研究院) ; Fudan University(复旦大学)
AI总结 针对视觉-语言-动作(VLA)模型,提出通过偏置训练时间分布至高频噪声状态,实现无需教师模型、蒸馏或辅助目标的单步动作生成,性能可匹配十步解码。
Comments 20 pages, 10 figures
零拷贝语义传染:一种用于演化注意力图的内存流式架构
发表机构 * Department of Electrical Engineering, Nirma University(电气工程系,尼玛大学)
AI总结 提出一种基于Rust-Python的异构流式架构,通过零拷贝解析和神经霍克斯过程实现跨公司注意力图的实时构建与推理,在FNSPID语料库上相比随机基线提升1.70倍精度。
Comments Accepted to the 2026 ACM SIGMOD Workshop on Data Management for the Modern Financial Systems (FinDS). 10 pages, 4 figures
基于遥感的季节内作物制图机器学习算法比较
发表机构 * Oak Ridge National Laboratory(橡树岭国家实验室) ; Environmental Sciences Division(环境科学 division) ; Northeastern University(东北大学)
AI总结 本研究通过比较十种机器学习算法,利用Landsat-Sentinel反射率时间序列和轮作历史,在6月初准确绘制玉米和杏仁的30米分辨率作物图,并量化物候和分布不确定性,发现支持向量机总体表现最佳。
Comments 22 pages, 8 figures
通过微调语言模型和引导树搜索自动证明香农型熵不等式
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 本文通过微调小规模语言模型并结合引导束搜索,自动化证明香农型熵不等式,在含10-15个变量的测试集上达到85%的证明成功率。
ViCuR: 视觉线索作为多模态在策略蒸馏中的可恢复特权
发表机构 * Shanghai AI Laboratory(上海人工智能实验室) ; Fudan University(复旦大学) ; Nanjing University(南京大学)
AI总结 提出ViCuR框架,通过将教师特权从答案侧替换为输入中的视觉线索,并引入轻量级线索恢复模块,解决多模态在策略蒸馏中的训练-测试不匹配问题,在七个基准上显著提升学生模型性能。
Comments 25 pages, 11 figures. Preprint, under review
混合CNN-LSTM框架用于美国关键数字基础设施的智能网络攻击检测与防御:基于CSE-CIC-IDS2018的机器学习比较评估
发表机构 * Department of Computer Science, Maharishi International University(马哈拉吉国际大学计算机科学系) ; Department of Information Studies, Trine University(特林大学信息学系) ; Department of Business Information Systems, Central Michigan University(中央密歇根大学商业信息系统系)
AI总结 提出一种结合CNN和LSTM的混合深度学习框架,利用CSE-CIC-IDS2018数据集进行网络攻击检测与防御,通过比较多种机器学习模型,实现高精度入侵检测和自动防御。
Comments 25 pages, 9 figures, CSE CIC IDS2018 dataset, Hybrid CNN LSTM, cyber attack detection
基于评论的异构多智能体推理用于可靠的数学问题求解
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出一种基于评论的异构多智能体框架,通过生成器-验证器结构和自适应学习系统,利用中间反馈评估和引导推理过程,在GSM8K基准上实现高达13%的准确率提升,并减少对大模型的依赖。
Comments 6 pages
T-SAR-JEPA:通过潜在预测在SAR幅度堆栈中进行自监督时间异常检测
发表机构 * Independent Researcher(独立研究者) ; Dakota State University(达科塔州立大学)
AI总结 提出T-SAR-JEPA框架,通过自监督潜在预测在SAR幅度堆栈中检测时间异常,在DFC 2026数据集上达到77.0%的ROC-AUC,优于多种基线方法。
Comments Won IEEE GRSS Data Fusion Contest 2026; to appear in IGARSS 2026 proceedings
重新审视原型重放用于无样本持续学习:基于流形感知边界采样与自适应类别平衡损失
发表机构 * Chester F. Carlson Center for Imaging Science(切斯特·F·卡森成像科学中心) ; Rochester Institute of Technology(罗切斯特理工学院)
AI总结 针对无样本类增量学习,提出流形感知边界采样和自适应类别平衡损失,通过生成边界感知重放样本和动态调整类别权重,使原型重放方法恢复竞争力并达到最先进性能。
Comments Published in CVPR 2026 Findings. 10 pages, 6 figures. CVF version: https://openaccess.thecvf.com/content/CVPR2026F/html/Xu_Revisiting_Prototype_Rehearsal_for_Exemplar-Free_Continual_Learning_Manifold-Aware_Boundary_Sampling_CVPRF_2026_paper.html. Code: https://github.com/HXuSz11/ACB_CEOS_CVPR2026_Findings
进化中选择的因果建模
发表机构 * University of Washington(华盛顿大学) ; Carnegie Mellon University(卡内基梅隆大学)
AI总结 本文区分了静态选择与进化选择两种形式,针对进化选择提出新因果模型,并开发了从数据中识别该模型的完整方法。
Comments Appears at ICML 2026 (spotlight)
CASS-RTL:面向LLM的RTL生成的正确性感知子空间引导
发表机构 * Department of Electrical and Computer Engineering (ECE), University of Central Florida, Orlando, FL 32816, USA(电子与计算机工程系,中央佛罗里达大学,奥兰多,佛罗里达州32816,美国)
AI总结 提出CASS-RTL框架,通过识别LLM中与RTL正确性相关的注意力头并构建低维子空间进行轻量级干预,在无需额外监督或重训练的情况下提升RTL代码生成的功能准确性。
Comments Accepted to the IEEE International Conference on LLM-Aided Design (LAD '26)
双向优于单向:基于循环一致性的双向对齐用于无样本类增量学习
发表机构 * Chester F. Carlson Center for Imaging Science(切斯特·F·卡勒中心影像科学中心) ; Rochester Institute of Technology(罗切斯特理工学院)
AI总结 提出BiCyc方法,通过双向投影器对齐和循环一致性目标,解决无样本类增量学习中原型漂移和单向投影偏差问题,减少灾难性遗忘并提升准确率。
Comments Published as a conference paper at ICLR 2026. 23 pages, 8 figures. Code: https://github.com/HXuSz11/BiCyc_ICLR2026
Diff2SP:随机规划中相关场景生成的扩散模型
发表机构 * Purdue University(普渡大学)
AI总结 提出Diff2SP扩散生成框架,将下游优化目标嵌入场景生成过程,通过理论证明和经验验证实现统计一致性与决策感知的平衡。
Q-GNN: 具有类型感知的查询条件图神经网络用于知识图谱补全
发表机构 * College of Intelligence and Computing, Tianjin University(智能与计算学院,天津大学)
AI总结 提出Q-GNN,通过融合查询实体的结构上下文和语义类型信息,增强图神经网络在知识图谱补全中的推理能力。
StableRCA:鲁棒的图无关机制级根因分析
发表机构 * Department of Computer Science, Tsinghua University(清华大学计算机科学系) ; Bosch Center for Artificial Intelligence(博世人工智能中心) ; Computer Science Department, TU Darmstadt(图尔恩大学计算机科学系)
AI总结 提出StableRCA框架,通过估计局部马尔可夫边界并检测条件分布偏移,避免全局图发现,实现鲁棒的机制级根因分析。
当新生成器到来:基于岭特征迁移的终身机器生成文本归因
发表机构 * Wuhan University(武汉大学) ; Ant Group(蚂蚁集团) ; The Hong Kong University of Science and Technology (Guangzhou)(香港科学与技术大学(广州)) ; Institute of Deep Perception Technology, JITRI(感知技术研究院,JITRI)
AI总结 针对终身机器生成文本归因中持续适应新生成器与保留旧知识难以平衡的问题,提出轻量级分析更新框架RidgeFT,通过协方差校准和固定随机特征实现无需示例回放的闭式更新。
Comments 12 pages
自承诺延迟:一种用于提示隐式劫持的无奖励探针
发表机构 * Stanford University(斯坦福大学) ; Tsinghua University(清华大学)
AI总结 提出自承诺延迟指标,通过测量推理上下文对模型自身最终答案的承诺时机,无需奖励信号即可检测提示隐式劫持,在GSM8K数据集上达到AUROC 0.878-0.926。
利用敏感度平衡投影揭示极端事件机制以进行预测与控制
发表机构 * Department of Mechanical Engineering, University of Washington(华盛顿大学机械工程系) ; AI Institute in Dynamic Systems, University of Washington(华盛顿大学动态系统人工智能研究所) ; Sibley School of Mechanical and Aerospace Engineering, Cornell University(康奈尔大学Sibley机械与航空航天工程学院)
AI总结 提出基于协方差平衡降维(CoBRAS)的可解释方法,通过自动微分替代伴随计算,识别敏感度平衡投影以揭示极端事件机制,并用于数据驱动预测和事件抑制控制。
Comments 12 pages, 6 figures (main text). Additional 14 pages of references and Supplementary Information
SlotGCG:利用LLMs中的位置脆弱性进行越狱攻击
发表机构 * Dongguk University-Seoul(东国大学-首尔)
AI总结 本文提出SlotGCG方法,通过量化提示中不同插入位置(槽)的脆弱性得分(VSS),选择最脆弱的位置插入对抗性令牌,从而显著提升基于优化的越狱攻击成功率。
跨时代自适应展开优化用于强化学习后训练
发表机构 * Department of Industrial Engineering & Decision Analytics, Hong Kong University of Science and Technology(工业工程与决策分析系,香港科学与技术大学)
AI总结 针对提示词训练信号差异大的问题,提出CERO方法,通过贝叶斯估计提示词成功概率并利用Fenchel对偶优化自适应分配展开预算,在固定总预算下提升样本效率。
从预测到自我:最小神经系统中能动性的发展条件
发表机构 * Independent Researcher(独立研究者)
AI总结 通过40个逐步增加的实验,研究最小GRU系统如何区分自我与世界因果影响,发现四个严格顺序的发展条件,并提出能动性增益作为度量指标。
Comments 18 pages, 6 figures
修正思维,而非动作:通过知识缺口定位实现可解释的AI辅助
发表机构 * University of Tokyo(东京大学) ; National Institute of Information and Communications Technology(信息与通信技术国家研究所)
AI总结 提出SENSEI框架,通过结构化知识表示推断用户误解并提供针对性建议,在长时任务中实现零样本组合泛化,纠正90%的学生误解。
Comments Accepted to International Conference on Machine Learning (ICML) 2026
通过平滑激活函数缓解深度神经网络一致收敛中的维度灾难
发表机构 * Department of Statistics, The Pennsylvania State University(宾夕法尼亚州立大学统计学系)
AI总结 本文通过分析平滑激活深度神经网络,建立了统一收敛的理论框架,证明其能够通过自适应利用目标函数的低维层次组合结构来缓解维度灾难。
Comments 30 pages, 5 figures
审计示范策展指标:仅动作评分器在降低模仿策略的结构缺陷上失败
发表机构 * Aarav Bedi
AI总结 本研究构建受控测试平台,注入两类示范缺陷(细微扰动和结构错误),审计七种策展指标,发现仅动作指标无法检测结构错误,且部分指标评分倒置,而状态轨迹指标能部分检测但下游性能恢复有限。
Comments 5 pages, 3 figures, 4 tables
HDST-GNN:用于无人机航拍图像多目标跟踪的异质动态时空图神经网络
发表机构 * Phillip Jiang(菲利普·姜)
AI总结 针对无人机航拍中目标小、密集、遮挡导致身份切换的问题,提出异质动态时空图神经网络HDST-GNN,通过高度自适应边构建、异质节点表示和遮挡门控时序聚合提升跟踪性能。
Comments 18 pages, 4 figures, 6 tables
蒙特卡洛Steklov算子用于大规模野外几何处理
发表机构 * Brown University(布朗大学) ; Loyola Marymount University(洛约拉玛丽蒙特大学) ; Massachusetts Institute of Technology(麻省理工学院)
AI总结 提出一种蒙特卡洛方法估计Dirichlet-to-Neumann算子及其Steklov特征模态,实现鲁棒且高效的体积算子计算,并应用于大规模3D对比表示学习。
Comments 21 pages
CLaaS: 作为服务的持续学习,用于样本高效的在线学习
发表机构 * Resolute Labs(Resolute实验室) ; Incept Labs(Incept实验室)
AI总结 提出CLaaS系统,通过经验回放缓冲区实现异步训练中的梯度复用,在对抗性任务中展示参数更新优于上下文学习的前向迁移和遗忘减少。
Comments 4 pages main content, 7 figures
自回归扩散世界模型用于LLM智能体的离线评估
发表机构 * Department of Computer Science, Emory University(埃默里大学计算机科学系) ; School of Computer Science, Shanghai Jiao Tong University(上海交通大学计算机科学学院)
AI总结 提出ADWM框架,通过自回归扩散世界模型从预收集轨迹中模拟环境响应,实现无需在线交互的LLM智能体策略离线评估。
表示学习实现可扩展的多任务深度强化学习
发表机构 * Mila – Québec AI Institute(魁北克AI研究所) ; Université de Montréal(蒙特利尔大学) ; McGill University(麦吉尔大学) ; CIFAR AI Chair(CIFAR人工智能 chair) ; Google DeepMind(谷歌DeepMind)
AI总结 本文提出一种结合预测性表示学习与高容量值函数近似的无模型算法MR.Q,在无需规划的情况下,在多任务连续控制任务中超越基于世界模型的方法和多种深度强化学习基线,并显著降低计算开销。
平衡图像压缩与生成:自引导分词
发表机构 * Peking University(北京大学) ; Central Media Technology Institute, Huawei(华为中央媒体技术研究所)
AI总结 提出SelfBootTok方法,通过自引导学习将图像信息分解为全局和局部标记组,使生成器仅依赖全局标记,减少40%计算量并提升重建与生成质量,以64个标记实现1.56的gFID新纪录。
少即是MoE:修剪领域专家语言模型中的专家
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; UCSD(加州大学圣地亚哥分校) ; MIT(麻省理工学院)
AI总结 针对MoE模型部署时参数过多的问题,提出基于Fisher重要性的中间维度修剪方法Fisher-MoE,在50%压缩比下保持模型能力,减少约45%权重内存并提升21%推理吞吐量。
物体能做什么,而非它们是什么:面向功能可供性推理的功能潜在空间
发表机构 * The University of Texas at Austin(德克萨斯大学奥斯汀分校) ; Neurosymbolic Intelligence(神经符号智能) ; University of Colorado Boulder(科罗拉多大学博尔德分校)
AI总结 提出A4D框架,通过构建基于功能可供性的共享潜在空间,将视觉观察映射到该空间并测量与可供性的距离,实现基于物体功能而非外观的规划推理,显著提升泛化能力和推理效率。
Comments Code, videos, and data available at: https://A4Dance-reasoning.github.io
Almieyar-Oryx-BloomBench:一个用于视觉语言模型认知知情评估的双语多模态基准
发表机构 * University of British Columbia(不列颠哥伦比亚大学) ; Zuse School(Zuse学校) ; Qatar Computing Research Institute (QCRI)(卡塔尔计算研究所) ; Hamad Bin Khalifa University(哈马德·本·哈利法大学)
AI总结 针对现有基准无法诊断视觉语言模型真实推理能力的问题,提出基于Bloom认知分类学的双语多模态基准BloomBench,系统评估六个认知层次,揭示模型在事实回忆和创造性合成方面的深层局限。
Comments Accepted to ACL 2026 Findings
主导层 ZO:单层主导大语言模型的零阶微调
发表机构 * University of North Carolina at Charlotte(北卡罗来纳大学夏洛特分校) ; University of Houston(休斯顿大学) ; State University of New York at Binghamton(纽约州立大学布法罗分校) ; Arizona State University(亚利桑那州立大学) ; Department of Artificial Intelligence and Informatics, Mayo Clinic(梅奥诊所人工智能与信息学系)
AI总结 本文发现零阶优化微调大语言模型时,单个解码层主导性能,通过仅微调该层可匹配或超越全模型微调,并基于激活异常值识别该层,解释其机制。
LEVANTE-bench: 使用认知任务对VLM与儿童进行多尺度比较(或者,“你的VLM比五年级学生聪明吗?”)
发表机构 * Stanford University(斯坦福大学)
AI总结 本文提出LEVANTE-bench基准,基于儿童认知任务数据,从多个尺度系统评估视觉语言模型与5-12岁儿童在六项任务上的对齐程度,发现模型与人类认知仅部分对齐。
纵向数据的稀疏函数奇异值分解用于双聚类和三聚类
发表机构 * Division of Biostatistics and Health Data Science University of Minnesota(生物统计学与健康数据科学系明尼苏达大学)
AI总结 提出Tri-SfSVD框架,通过稀疏惩罚同时进行连续轨迹估计与对象、特征和时间选择,实现纵向数据中的双聚类和三聚类,优于现有方法。
通过探针目标归因定位大型语言模型中的提示歧义
发表机构 * Georgia Institute of Technology(佐治亚理工学院)
AI总结 提出PRIG方法,利用线性探针和梯度归因,通过中间表示而非输出层定位提示中的歧义位置,在合成和人工基准上取得高AUROC。
Comments 23 pages, 5 figures, 5 tables
学习子空间压缩以实现通信高效的流水线并行
发表机构 * Concordia University(康科迪亚大学) ; Mila ; Quebec AI Institute(魁北克人工智能研究所) ; CNRS, Sorbonne University(法国国家科学研究中心,索邦大学)
AI总结 提出MAPL方法,通过Stiefel流形约束学习每个流水线阶段的任务最优正交投影,结合因子化锚点嵌入和残差向量量化,在低带宽网络中实现高压缩比且性能损失极小。
Comments Accepted at the 2nd Workshop on Connecting Low-rank Representations in AI, ICML 2026
面向统一且数据高效的预测与健康管理:基于表格基础模型
发表机构 * IMOS Lab, EPFL(IMOS实验室,瑞士联邦理工学院)
AI总结 提出利用表格基础模型通过上下文学习处理工业时间序列,实现预测与健康管理(PHM)任务,在低数据场景下表现优异,并优于序列模型和梯度提升树。
我们能否在生成之前预测文生图内容的人类偏好,以及这样做是否有用?
发表机构 * LSU ATHENA Lab(LSU ATHENA实验室)
AI总结 研究在扩散模型生成图像前预测人类偏好评分(HPM)的可行性,并利用该预测提升生成质量,同时评估不同HPM的适用性。
Comments Code is available at https://github.com/LSU-ATHENA/HPM-Predict
AlloGen: 基于差异状态评分的构象选择性结合物生成
发表机构 * Department of Computer Science and Engineering(计算机科学与工程系) ; The Chinese University of Hong Kong(香港中文大学) ; Department of Bioengineering(生物工程系) ; University of Pennsylvania(宾夕法尼亚大学) ; Department of Computer and Information Science(计算机与信息科学系)
AI总结 提出AlloGen框架,通过可学习的构象选择性评分器Qθ,结合骨架生成与状态选择性,实现针对蛋白不同构象状态的选择性结合物设计。
通过循环一致性机器翻译的多语言共指消解
发表机构 * Department of Computer Science, University of Bucharest(布加勒斯特大学计算机科学系)
AI总结 提出一种利用循环一致性机器翻译生成或扩展训练数据的管道,通过BERT潜在空间余弦相似度评估翻译质量并加权损失函数,显著提升低资源语言的共指消解性能。
高阶光滑非凸优化的尖锐一阶下界
发表机构 * Department of Computer Science, Indiana University(计算机科学系,印第安纳大学)
AI总结 针对高阶光滑非凸优化,通过块链机制构造硬实例,首次证明了匹配已知上界的一阶下界,如Hessian Lipschitz情形下的Ω(ε^{-7/4})和三阶光滑情形下的Ω(ε^{-5/3})。
Comments 24 pages, 1 table
DP-MacAdam:具有自适应裁剪和自适应动量的差分隐私机制
发表机构 * University of Southern California(南加州大学)
AI总结 提出DP-MacAdam算法,通过联合利用梯度均值和方差估计进行自适应裁剪和动量更新,在无需手动调整裁剪阈值的情况下提升模型效用。
Comments 6 pages, 2 tables
选择性优势熵自适应视野GRPO:用于语言模型高效强化学习的非对称令牌级折扣
发表机构 * Indian Institute of Technology (BHU)(印度理工学院(博生胡大学)) ; Department of Computer Science, University of Illinois Chicago(伊利诺伊大学芝加哥分校计算机科学系)
AI总结 提出选择性优势熵自适应视野GRPO(SA-AH-GRPO),通过非对称令牌级折扣(仅对负优势轨迹应用熵基折扣)来稳定训练并提升数学推理性能。
Comments 16 pages, 4 Figures, 7 Tables
可执行模式合约:从自动摄入到多源检索
发表机构 * Intuit AI Research(Intuit AI研究)
AI总结 提出一种自动从多源数据中发现可执行模式并将其作为共享合约的系统,通过模式约束的检索路由和结构化分析提升多源问答性能。
Comments 9 pages, 4 figures, plus supplementary appendix
当证据稀疏时:对话和LLM-Agent轨迹中的弱监督早期失败预警
发表机构 * Intuit AI Research(Intuit AI研究院) ; Princeton University(普林斯顿大学)
AI总结 针对对话和LLM-Agent轨迹中早期失败预警问题,提出一种两阶段方法,通过注意力机制从稀疏的轨迹级标签中学习回合级失败证据,并结合α-STOP策略实现可控的早期预警,在多个基准上显著提升帕累托前沿质量并降低训练成本。
Comments 9 pages, 14 figures, and appendix
CausalPOI:基于时空图因果建模的冷启动POI签到预测
发表机构 * Nanyang Technological University(南洋理工大学) ; China Agricultural University(中国农业大学) ; Meituan(美团)
AI总结 提出CausalPOI框架,利用时空功能交互图建模POI间语义和空间关系,通过结构对齐的处理和对照图模拟事实与反事实场景,解决冷启动POI签到预测问题,在真实数据集上显著优于基线。
Comments Accepted at KDD 2026
利用通用智能体进行情境化时间序列分析
发表机构 * University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校)
AI总结 提出TimeClaw框架,通过集成可执行时间工具、经验驱动能力进化和情景多模态记忆,使通用大语言模型智能体具备情境化时间推理能力,在能源、金融等多领域基准上取得性能提升。
Comments Preprint. 38 Pages
信任,但不验证:LLM 源评估中的认知盲点
发表机构 * Amazon(亚马逊)
AI总结 研究语言模型在多源综合中是否评估证据质量,发现模型虽能检测伪造统计但未在综合中启用,而是依赖方法论-语域门控,导致数值有效性被抑制。
LeanMarathon:通过长视界Lean自动形式化实现可靠的AI合作数学家
发表机构 * Department of Statistics, University of Warwick, UK(英国沃里克大学统计系) ; Center for Advanced Intelligence Project, RIKEN, Japan(日本理化学研究所高级智能项目) ; Department of Statistics, University of Michigan, USA(美国密歇根大学统计系) ; Department of Mathematical Informatics, The University of Tokyo(东京大学数学信息学系;日本理化学研究所高级智能项目) ; also Center for Advanced Intelligence Project, RIKEN, Japan(加州大学伯克利分校电气工程与计算机科学系;统计系) ; Department of Electrical Engineering and Computer Sciences, also Department of Statistics, University of California, Berkeley, USA(上海交通大学数学科学学院,自然科学院和MOE-LSC) ; School of Mathematical Sciences, Institute of Natural Sciences and MOE-LSC, Shanghai Jiao Tong University, China
AI总结 提出多智能体框架LeanMarathon,通过蓝图抽象和两阶段编排器实现长视界研究数学的可靠自动形式化,在四个Erdős问题上成功形式化七个定理。
Comments 26 pages, 9 figures. Comments are welcome
广义TV--$\ell_p$结构化先验用于贝叶斯$T_1$映射
发表机构 * Department of Computing Science, Umeå University, Sweden(乌尔姆大学计算机科学系,瑞典)
AI总结 提出一种结合总变分(TV)与$\ell_p$范数的结构化空间先验族,并嵌入贝叶斯回归框架,利用No-U-Turn采样器进行后验推断,实现$T_1$映射中的不确定性量化,实验表明该方法能提高空间一致性和估计可靠性。
Comments Accepted for publication at the Journal of Machine Learning for Biomedical Imaging (MELBA) https://melba-journal.org/2026:015
具有双重预测的学习增强在线最小化
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 针对度量任务系统和层状集合覆盖两类在线最小化问题,提出利用对偶线性规划最优解的机器学习预测来改进理论保证的学习增强算法。
模式选择性并非任务因果结构:1B类语言模型中组合任务电路的跨架构机制研究
发表机构 * B-Class Language Models(1B类语言模型) ; Cross-Architecture Mechanistic Study(跨架构机理研究)
AI总结 通过统一协议测试三个1B类语言模型在四个组合任务上的注意力头电路,发现不同模型对同一任务使用不同的注意力模式,并引入五类筛选结果分类法,提出MoE模型基于前一个token位置基板构建组合任务电路的可证伪假设。
Comments 27 pages, 3 figures
SHALA-LLM:在对齐LLM中智能处理模糊标签
发表机构 * MIT Media Lab, Massachusetts Institute of Technology(麻省理工学院媒体实验室、麻省理工学院) ; National University of Singapore(新加坡国立大学)
AI总结 提出SHALA-LLM强化学习框架,通过从标注者分布中学习并动态优先处理高模糊样本,改善LLM对模糊标签的建模,在NLI和情感识别任务中提升与标注者分布的一致性及分类性能。
证据引导的神经架构选择在不确定性下用于个体化血糖预测
发表机构 * organization= Department of Mechanical ; Data-Enabled Sciences, University at Buffalo , city= Buffalo , state= NY , country= USA
AI总结 提出EVIDENT框架,结合贝叶斯训练、证据排序和任务特定验证,在有限、噪声和异构数据中自动选择最优神经架构,用于个体化血糖预测。
Mamba辅助的非马尔可夫闭合用于降阶建模
发表机构 * Pacific Northwest National Laboratory(太平洋西北国家实验室) ; University of Washington(华盛顿大学) ; Brown University(布朗大学)
AI总结 针对高维动力系统降阶建模中的非马尔可夫闭合项问题,提出Mamba辅助闭合框架,利用Mamba序列模型从已解析轨迹预测闭合项,并通过数值积分器耦合降阶方程,在粘性Burgers方程和混沌双尺度Lorenz '96系统上优于马尔可夫模型、GRU序列模型和Wilks方法。
Comments Code will be released upon acceptance
基于经验贝叶斯的环境鲁棒表示学习
发表机构 * Department of Statistics Columbia University(统计学系哥伦比亚大学) ; Columbia University(哥伦比亚大学) ; Departments of Statistics and Computer Science Columbia University(统计学与计算机科学系哥伦比亚大学)
AI总结 提出一种经验贝叶斯变分方法,通过跨环境平衡项学习不变潜在变量,实现对新环境的鲁棒预测,在天文、微生物和ICU数据上优于现有方法。
TabSODA: 基于表格扩散的插补方法,结合跳跃模式检测与序数感知
发表机构 * Department of Biostatistics NYU School of Global Public Health(生物统计学系纽约大学全球公共卫生学院)
AI总结 提出TabSODA方法,通过EM框架下的扩散模型处理大规模调查中的结构跳跃和序数变量,在PATH和NSDUH数据集上显著提升插补精度。
PJ-RoPE:一种用于相对注意力的傅里叶-喷气-仿射位置空间
发表机构 * School of Physics, Ningxia University(宁夏大学物理学院)
AI总结 本文提出PJ-RoPE,一种统一RoPE、Jordan-RoPE和ALiBi的傅里叶-喷气-仿射相对位置空间,通过可学习参数适应不同任务,并引入自适应扇区诊断和LC/快度坐标稳定高阶喷气。
Comments 26 pages, 6 figures, 10 tables. Code available at https://github.com/ybzhang-nxu/Poincare_Rope
大型线性自编码器中学习机制的三棱柱层次结构
发表机构 * Applied AI Institute(应用人工智能研究所) ; Steklov Mathematical Institute of Russian Academy of Sciences(俄罗斯科学院斯捷克洛夫数学研究所)
AI总结 本文通过形式损失展开层次结构,将大型权重绑定线性自编码器的极端学习机制与三棱柱的面相关联,推导出五种基本极端机制下的训练和总体损失演化显式表达式。
Comments 33 pages, under review for NeurIPS'2026
物理的隐形之手:当视频扩散模型知道的比它们展示的更多
发表机构 * University of Bristol(布里斯托大学) ; McGill University(麦吉尔大学) ; Mila–Quebec AI Institute(魁北克AI研究院) ; Microsoft Research(微软研究院) ; University of Calgary(卡尔加里大学)
AI总结 通过逆向扩散过程探测视频扩散模型的潜在轨迹,发现物理合理性可以从扩散变换器状态中线性解码,准确率达81.27%,表明物理有意义的表示是生成式去噪的副产品。
基于最优传输势的多边缘流匹配
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出一种利用动态最优传输势引导流匹配学习中间边缘分布的方法,实现高效无模拟的多边缘流匹配,在单细胞RNA测序、海洋学和气象数据集上取得最优性能。
Comments 9 pages, 3 figures, 4 tables, and a 27 page appendix. Accepted to the Forty-Third International Conference on Machine Learning
稳定边缘的梯度下降:双层网络的自由能模型与动力学描述
发表机构 * Ecole Normale Supérieure, CNRS, 45 rue d’Ulm, 75005 Paris, France(巴黎高等师范学院、法国国家科学研究中心、巴黎 rue d’Ulm 45 号、75005 地址、法国)
AI总结 针对大学习率下梯度下降的稳定边缘动力学,提出连续时间有效模型跟踪平均轨迹与快速振荡协方差,揭示有效自由能作为关键监控量,并导出宽双层网络的平均场极限动力学方程。
Comments Comments are welcome!
基于预测驱动推断的统计可靠LLM排序评估
发表机构 * Amazon(亚马逊)
AI总结 提出PRECISE框架,将预测驱动推断扩展到排序评估指标,通过结合少量人工标注和大量LLM判断实现无偏估计,并在ESCI基准和实际系统中验证了有效性。
Comments Accepted at ACL 2026 - GEM Workshop
智能体蒙特卡洛:黑盒智能体的强化学习模拟
发表机构 * University of Cambridge(剑桥大学)
AI总结 提出Agentic Monte Carlo (AMC)方法,利用序贯蒙特卡洛从最优策略后验中采样,无需参数级优化即可对黑盒LLM智能体进行强化学习式优化,在AgentGym基准上超越提示基线并随测试时计算扩展优于GRPO。
Comments Accepted by ICML 2026
基于LSTM自编码器的电液伺服作动器异常检测
发表机构 * IPEK - Institute of Product Engineering, Karlsruhe Institute of Technology (KIT), Germany(产品工程研究所,卡尔斯鲁厄理工学院(KIT),德国) ; SUPMICROTECH-ENSMM, France(SUPMICROTECH-ENSMM,法国)
AI总结 针对电液伺服作动器传感器信号,提出基于LSTM自编码器的重构异常检测框架,在多种故障注入场景下达到99%平均准确率与极低误报率。
Comments 8 pages, 6 figures, 3 tables, ESREL 2026 -European Safety and Reliability Conference, accepted paper to be published
学习流形与伊藤动力学:分支神经粗糙微分方程
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; Stanford University(斯坦福大学) ; University of Toronto(多伦多大学)
AI总结 提出分支神经粗糙微分方程(B-NRDE),通过Hopf代数框架统一处理欧几里得伊藤动力学、流形上的有序协变导数及经典Stratonovich情形,实现精确的粗步流形约束动力学和伊藤一致律匹配。
Comments Accepted at ICML 2026
基于LLM的弱验证器聚合用于空间布局生成
发表机构 * Stanford University(斯坦福大学) ; Roblox
AI总结 提出一种通过聚合LLM生成的弱验证器来构建强验证器的流水线,用于空间布局领域,在3D房间布局和2D海报设计任务中F1分数提升高达7倍。
植入vs植入测试的尖锐低度阈值
发表机构 * Department of Mathematics, University of California, Davis(加州大学戴维斯分校数学系)
AI总结 针对植入vs植入设置,建立了低度多项式测试的首个尖锐阈值,并证明在植入子矩阵和植入稠密子图模型中计数社区的匹配上下界,测试阈值与已知低度恢复阈值精确一致。
数据高效的洪水深度预测:通过领域感知的核心集选择与表格基础模型
发表机构 * Urban Resilience.AI Lab(Urban Resilience.AI实验室) ; Zachry Department of Civil and Environmental Engineering, Texas A&M University(Zachry土木与环境工程系,德克萨斯A&M大学) ; Department of Computer Science and Engineering, Texas A&M University(计算机科学与工程系,德克萨斯A&M大学) ; Resilitix Intelligence LLC ; Institute for a Disaster Resilient Texas, Texas A&M University(德克萨斯灾难韧性研究所,德克萨斯A&M大学)
AI总结 提出一种领域感知的核心集构建流程,结合表格基础模型,仅用0.7%的训练数据即可实现与监督模型相当的洪水深度预测精度,并支持跨流域迁移。
基于策略条件的反事实信用分配用于长周期语言智能体的可验证强化学习
发表机构 * stu.ahu.edu.cn(安徽大学)
AI总结 提出CVT-RL算法,通过策略条件反事实贡献估计和可验证奖励约束,解决长周期语言智能体在推理和工具使用中的虚假证据链、信念漂移和捷径行为问题,在多个任务上提升成功率并降低作弊率。
Comments 16 pages, 6 figures
NIV: 用于可变字体生成的神经轴变化
发表机构 * Reichman University(雷赫曼大学)
AI总结 提出NIV方法,通过预测字形轮廓的逐点位移,自动将静态字体转换为支持多轴连续插值的可变字体,并在新构建的数据集上验证其泛化能力。
利用源异质性进行聚类结构迁移学习
发表机构 * Department of Statistics, University of Connecticut(康奈尔大学统计学系) ; Department of Public Health Sciences, Henry Ford Health(亨利福特医疗健康部公共卫生科学系) ; Center for Population Health, University of Connecticut Health Center(康奈尔大学健康中心人口健康中心)
AI总结 针对迁移学习中源异质性问题,提出Trans-GLMC方法,通过聚类结构自适应融合目标与源数据,提升预测性能并识别可解释的源聚类。
用户事件序列上行为基础模型的缩放定律
发表机构 * Unbox AI
AI总结 研究行为基础模型在用户事件序列上的缩放定律,通过约600次实验发现小嵌入器参数最优,计算最优训练在低计算量时数据密集,且评估指标影响缩放定律。
Flash-WAM:面向世界动作模型的模态感知蒸馏
发表机构 * Northeastern University(东北大学) ; University of Georgia(佐治亚大学) ; EmbodyX Inc.(EmbodyX公司)
AI总结 针对世界动作模型联合生成视频和机器人动作时因多模态噪声分布不对称导致蒸馏失效的问题,提出模态感知步蒸馏框架Flash-WAM,通过为不同模态选择匹配噪声机制的参数化方法,实现单步推理并大幅加速。
Alpha-RTL: 面向RTL硬件优化的测试时训练
发表机构 * SKLP, Institute of Computing Technology, Chinese Academy of Sciences(SKLP,计算技术研究所,中国科学院) ; University of the Chinese Academy of Sciences(中国科学院大学) ; School of Advanced Interdisciplinary Sciences(先进交叉学科学院)
AI总结 提出TTT-RTL框架,通过测试时强化学习结合EDA反馈(语法检查、仿真和PPA奖励)优化LLM生成的RTL设计,在RTLLM v2.0和工业级C910 FPU单元上分别降低PPA乘积65.1%和ADP 59.4%。
Comments 10 pages, 5 figures
DiffSlack: 通过可学习松弛变量在非线性不等式约束下学习
发表机构 * State Key Laboratory of Tribology in Advanced Equipment, Tsinghua University(先进设备摩擦学国家重点实验室,清华大学) ; Beijing Key Laboratory of Transformative High-end Manufacturing Equipment and Technology, Department of Mechanical Engineering, Tsinghua University(transformative高端制造设备与技术北京市重点实验室,机械工程系,清华大学) ; Automotive Electronics Business Unit, Hirain Inc.(Hirain公司汽车电子事业部)
AI总结 提出DiffSlack,一种可微投影层,通过可学习松弛变量将非线性不等式约束转化为等式,结合阻尼高斯-牛顿投影实现端到端约束满足,在车辆路径规划中取得更高成功率和几何约束满足度。
驯化SGLD的确定性包络:解耦随机梯度噪声与局部化驯化
发表机构 * School of Mathematics and Statistics, Yunnan University(云南大学数学与统计学院)
AI总结 针对随机梯度Langevin算法中驯化分母引入的稳态偏差问题,提出一种结构保持的确定性包络框架,通过解耦梯度噪声与驯化步骤来消除偏差,并引入混合包络设计以兼顾稳定性和偏差减少。
Comments 40 pages, 11 tables, 2 figures
HyFAD: 用于时间序列插值的混合时频扩散与频率感知嵌入
发表机构 * School of Data Science and Engineering(数据科学与工程学院) ; East China Normal University(华东师范大学)
AI总结 提出HyFAD模型,通过耦合时频扩散框架和频率感知步嵌入,实现从时域到频域的渐进式去噪,有效解决频率敏感去噪和高频重建问题,在多个基准数据集上达到最先进性能。
一种新型四元数关节缆驱动冗余机械臂配置及其通过FABRIK和残差强化学习的控制
发表机构 * University of California, San Diego(加州大学圣地亚哥分校)
AI总结 提出一种4段8关节四元数关节缆驱动冗余机械臂配置,并利用残差强化学习实现比FABRIK算法高三个数量级的位置和方向精度控制。
OLIVE: 面向高效自适应外骨骼的在线低秩增量学习
发表机构 * University of California, Los Angeles(加州大学洛杉矶分校) ; Columbia University(哥伦比亚大学) ; University of Wisconsin-Madison(威斯康星大学麦迪逊分校) ; Rice University(里奇大学)
AI总结 提出OLIVE框架,通过低秩残差分解和奖励驱动策略梯度实现外骨骼控制的在线个性化自适应,在多种地形上提升步态平滑度、降低努力并增强稳定性。
可微分高效算子搜索
发表机构 * The University of Sydney(悉尼大学) ; ByteDance(字节跳动) ; Shanghai Jiao Tong University(上海交通大学) ; University of California, Los Angeles(加州大学洛杉矶分校)
AI总结 提出可微分高效算子搜索框架,统一解释多种token缩减算子,通过联合搜索缩减位置、保留数量和算子行为,在预算约束下优化多模态模型性能。
中心描述长度(CDL)聚类验证指标
发表机构 * Toronto Metropolitan University(多伦多 Metropolitan 大学)
AI总结 提出中心描述长度(CDL)聚类验证指标,通过计算不可观测真实聚类中心描述长度的概率上界来评估聚类质量,无需标签且适用于非凸和不规则形状数据。
量化健康与疾病状态下口形红细胞的生物物理特性
发表机构 * Division of Applied Mathematics, Brown University(布朗大学应用数学系) ; Department of Materials Science and Engineering, Massachusetts Institute of Technology(麻省理工学院材料科学与工程系) ; College of Engineering, University of Georgia(佐治亚大学工程学院)
AI总结 通过耗散粒子动力学模拟与微流控成像结合,构建三种口形红细胞模型,揭示其几何主导的脾窦穿越行为、膜滚动抑制及高剪切粘度增加,统一解释遗传性口形红细胞增多症的脾切除悖论。
Comments 26 pages, 9 figures
洗脱的语言:非靶向LC-HRMS脂质组学中下一个特征的自回归预测
发表机构 * Virginia Commonwealth University School of Pharmacy(弗吉尼亚联邦大学药学院)
AI总结 将色谱洗脱建模为自回归序列预测任务,使用LSTM和Transformer模型基于无注释特征预测下一个洗脱的质荷比区间,在临床脂质组学数据上达到98.4%的top-1准确率,并揭示了序列模式而非分子特性驱动预测。
大步长梯度下降恢复多路径深度线性网络中的对称性
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 本文研究大步长离散梯度下降如何通过边缘稳定性振荡使多路径深度线性网络从对称性破坏转向信号重新分配,从而偏好共享表示而非单路径主导。
Comments ICML 2026
得分哈密顿量:将扩散模型映射到绝热输运
发表机构 * Computer Science Department, Princeton University(普林斯顿大学计算机科学系) ; ORFE Department, Princeton University(普林斯顿大学ORFE系)
AI总结 本文通过构建得分哈密顿量,建立了基于得分的扩散模型采样与薛定谔算子基态绝热输运之间的精确对应关系,并利用绝热定理推导了密度重建误差界和退火调度方案。
Transformer增强的强化学习:通信网络中的基础与应用
发表机构 * Faculty of Computer Science, Phenikaa University(菲律宾Phenikaa大学计算机科学学院) ; Faculty of Artificial Intelligence and Data Science, Phenikaa University(菲律宾Phenikaa大学人工智能与数据科学学院) ; School of Information and Electronic Engineering (Sussex Artificial Intelligence Institute), Zhejiang Gongshang University(浙江工商大学信息与电子工程学院(Sussex人工智能研究院)) ; School of Computer Science and Electronics Engineering, University of Essex(埃塞克斯大学计算机科学与电子工程学院) ; School of Mathematics, Statistics and Mechanics, Beijing University of Technology(北京理工大学数学、统计与力学学院) ; School of Information Science and Technology, Harbin Institute of Technology(哈尔滨工业大学信息科学与技术学院) ; Department of Electrical and Information Technology, Faculty(电气与信息技术系)
AI总结 本文综述了Transformer增强的强化学习算法及其在通信网络中的应用,重点解决了传统RL在长期依赖建模和部分可观测性方面的局限。
基于浅层循环解码器的多保真度学习在反应堆物理中的应用
发表机构 * Autodesk Research(Autodesk研究院) ; Department of Energy, Nuclear Engineering Division(能源部核工程系) ; Politecnico di Milano(米兰理工大学) ; Department of Mechanical and Nuclear Engineering and Emirates Nuclear Technology Center(机械与核工程系和阿联酋核技术中心)
AI总结 针对反应堆物理中高保真数据稀缺而低保真数据丰富的问题,提出利用浅层循环解码器将低保真模型(如点动力学)映射到高保真模型(如扩散方程),以低成本获得高保真解。
状态承诺学习:训练语言模型区分计算与记忆
发表机构 * Alibaba Group(阿里巴巴集团) ; Tsinghua University(清华大学)
AI总结 提出状态承诺学习目标及反事实擦除强化学习(CERL)方法,通过训练模型区分应保留的持久状态与可丢弃的临时计算,减少推理对隐藏思维的依赖,在数学、长链逻辑、科学问答和多轮工具使用任务中保持准确率的同时降低依赖。
Comments 17 pages
一种用于脂质纳米颗粒结构解析的可微分机器学习小角X射线散射分析框架
发表机构 * RISE Research Institutes of Sweden, Division Digital Systems, Computer Science(瑞典RISE研究机构,数字系统部门,计算机科学) ; RISE Research Institutes of Sweden, Division Bioeconomy, Food Research and Innovation(瑞典RISE研究机构,生物经济、食品研究与创新部门) ; Sustainable Innovation & Transformational Excellence, Pharmaceutical Technology & Development, Operations, AstraZeneca(可持续创新与转型卓越,制药技术与开发,运营,阿斯利康) ; Department of Mathematical Sciences, Chalmers University of Technology and University of Gothenburg(查尔姆斯理工大学和哥德堡大学数学科学系) ; Advanced Drug Delivery, Pharmaceutical Sciences, R&D, AstraZeneca(先进药物递送,药学科学,研发,阿斯利康) ; Global Product Development, Pharmaceutical Technology & Development, Operations, AstraZeneca(全球产品开发,制药技术与开发,运营,阿斯利康) ; MAX IV Laboratory, Lund University(隆德大学MAX IV实验室)
AI总结 提出一种结合机器学习代理模型和可微分层的框架,加速脂质纳米颗粒的SAXS数据分析,实现多起点拟合和可辨识性分析,揭示参数简并性。
Comments 38 pages, 24 figures, 5 tables (incl. supplementary information)
基于几何深度学习与大尺度预训练的核酸-小分子精准对接框架
发表机构 * College of Pharmaceutical Sciences, Zhejiang University(浙江大学药学院) ; Faculty of Health Sciences, University of Macau(澳门大学健康科学学院) ; Zhejiang Provincial Key Laboratory for Intelligent Drug Discovery and Development, Jinhua Institute of Zhejiang University(浙江省智能药物发现与开发重点实验室,浙江大学金华研究院) ; Shanghai Innovation Institute(上海创新研究院)
AI总结 提出NucleoDock框架,通过物理引导的大规模预训练和精细调优,结合序列、结构及原子级特征,利用混合密度网络几何评分头实现核酸-小分子对接,在125个复合物基准上达到56%的top-1成功率(RMSD<2.0Å),优于传统方法。
Comments 34 pages, 4 figures, 4 tabels, Supplementary Materials includes 8 tabels
时间偏好概念及其在大语言模型中的功能
发表机构 * AISC(AI Safety Camp) ; SPAR(Supervised Program for Alignment Research)
AI总结 通过因果定位和激活修补,本文发现大语言模型在中间到上层节点编码时间偏好几何结构,且行为分析表明模型对未来折扣比人类更平缓,但偏好不稳定,可通过引导向量调控。
PyCC.id: 一个具有结构可辨识性的假设驱动方程发现包
发表机构 * Physics Institute of Rosario(罗萨里奥物理研究所)
AI总结 提出PyCC库,通过特征曲线骨架和假设驱动方法解决数据驱动方程发现中的病态逆问题,支持多种方程发现范式并具有结构可辨识性。
Comments The software package is available at: https://github.com/FedejGon/pyCC.id
预算受限的微预训练中的分阶段因子筛选
发表机构 * Hewlett Packard Enterprise(惠普企业)
AI总结 针对预算受限的微预训练,提出分阶段分数因子设计方法,通过短时筛选识别高惩罚方向并确认有效锚点,在共享加速器上实现高效配方筛选。
Comments 23 pages, 4 figures
Drishti AI-Event Guardian:面向大规模聚集事件的智能实时人群监控与应急响应系统
发表机构 * School of Computer Engineering, Kalinga Institute of Industrial Technology(计算机工程学院,凯林加工业技术学院) ; School of Electronics Engineering, Kalinga Institute of Industrial Technology(电子工程学院,凯林加工业技术学院)
AI总结 提出Drishti AI-Event Guardian框架,结合YOLOv8、异常检测和梯度提升回归等多模态深度学习技术,实现实时人群密度估计、异常检测、预测建模、人脸识别、医疗紧急报告、聊天机器人和智能警卫重分配,在Kumbh Mela和RCB Victory Parade事件中验证了低延迟和高精度。
Comments 22 pages
ERRORQUAKE: 开放权重大语言模型中重尾错误严重性分布
发表机构 * Independent(独立)
AI总结 提出Errorquake-10k基准测试,通过连续严重性评分和古登堡-里希特指数b揭示开放权重LLM在相同准确率下错误严重性分布存在显著差异,证明严重性分布与错误率信息非冗余。
Comments 28 pages, 12 figures, appendix and checklist
评估盲点:大型语言模型基准覆盖的体视学理论
发表机构 * Independent(独立)
AI总结 本文提出一种体视学理论,通过有效维度和可见豪斯多夫距离量化LLM基准覆盖的盲点,发现结构盲点远超统计噪声,并基于子模贪心算法和特征值分析提出稳定核心基准集。
Comments 55 pages, 3 figures, 3 tables, extensive appendix with proofs
模型崩溃的流行病学:通过双层SIR动力学建模合成数据污染
发表机构 * Xiangyu Wang(王翔宇)
AI总结 提出双层耦合SIR/SIRS框架,将数据语料库和AI模型视为两个相互作用的群体,通过交叉层传播模拟合成数据污染导致的模型崩溃,并推导基本再生数R0,实验验证了阈值动力学和干预策略的有效性。
Comments 24 pages, 15 figures
UniFair: 基于分离度和紧致性的统一公平聚类方法
发表机构 * University of Ioannina(伊奥安纳大学) ; Archimedes/Athena Research Center(阿基米德/雅典娜研究中心)
AI总结 提出UniFair框架,通过联合优化分离公平性和社会公平性,在保持聚类质量的同时减少群体差异。
Comments 17 pages, 6 Figures
利用状态空间模型学习连续时间动态图中的长程时空表示
发表机构 * University of Texas at Austin(德克萨斯大学奥斯汀分校) ; Indian Institute of Science(印度科学研究院)
AI总结 提出一种基于状态空间模型的连续时间动态图框架(CTDG-SSM),通过拓扑感知的高阶多项式投影算子(CTT-HiPPO)实现长程时空信息传播,在动态链接预测、节点分类和序列分类任务上取得最优性能。
Comments Accepted at ICML 2026
基于轨迹级别优势优先经验回放的GRPO
发表机构 * Department of Electrical and Computer Engineering, Seoul National University(首尔国立大学电子与计算机工程系) ; Interdisciplinary Program in AI, Seoul National University(首尔国立大学人工智能跨学科项目) ; AIIS, ASRI, INMC, and ISRC, Seoul National University(首尔国立大学人工智能研究所、人工智能研究机构、智能网络与计算中心及人工智能科学研究中心)
AI总结 针对GRPO样本效率低的问题,提出轨迹级经验回放缓冲器,通过年龄驱逐限制陈旧性、新鲜锚定组合保持在线策略、按优势幅度优先采样,在多个数学基准上显著提升性能。
LimiX-2M:缓解表格基础模型中的低秩坍塌和注意力瓶颈
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出统一tokenize-and-route框架LimiX-2M,通过RaBEL扩展标量为局部RBF特征并重新排序双向块S→N→F,以2M参数超越更大模型,改善表格基础模型的精度-效率权衡。
Comments Accepted to ICML 2026
连续时间鲁棒马尔可夫决策过程的策略梯度
发表机构 * Centre for Frontier AI Research, Agency for Science, Technology and Research (A*STAR)(前沿人工智能研究中心,科技研究局(A*STAR)) ; Institute of High Performance Computing, Agency for Science, Technology and Research (A*STAR)(高性能计算研究所,科技研究局(A*STAR)) ; College of Computing and Data Science, Nanyang Technological University(计算与数据科学学院,南洋理工大学)
AI总结 本文针对连续时间鲁棒马尔可夫决策过程,推导了策略梯度和对抗梯度,并提出双循环优化器和平均场优化器,分别实现线性收敛和亚线性收敛,同时给出了样本复杂度分析。
面向企业AI代理的部署前保障:基于本体的仿真与信任认证
发表机构 * Golden Gate University(金门大学) ; Data, Digital & IT, Novartis Healthcare Pvt. Ltd.(数据、数字与IT,诺华健康护理私人有限公司)
AI总结 提出一种基于本体的验证框架,通过本体驱动的场景生成和信任证书,实现企业AI代理在部署前的自动化监管合规与安全认证。
Comments 26 pages, 3 figures. Companion to arXiv:2604.00555. Code and data: https://github.com/frank-luongt/faos-research/tree/main/RA-6
Transformer 需要三个投影吗?QKV 变体的系统研究
发表机构 * Ali Kayyam ; Anusha Madan Gopal ; M Anthony Lewis
AI总结 本文系统研究了注意力机制中查询、键、值投影共享的变体,发现 Q-K=V 共享在语言建模中仅以 3.1% 的困惑度损失实现 50% 的 KV 缓存减少,且与头共享结合可达到 96.9% 的缓存减少,从而支持设备端推理。
Comments Accepted at ICML 2026 (PMLR vol. 306). 26 pages, 12 figures, 16 tables. Code: https://github.com/Brainchip-Inc/Do-Transformers-Need-3-Projections
轨迹感知的节点贡献与静态可控性的极限
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 本文提出“涌现贡献”(EC)作为节点动态杠杆的有限时域度量,通过可微模型的雅可比矩阵计算,在线性时不变极限下退化为平均可控性,并构建相图刻画两者一致与分歧的条件。
Comments 11 pages, 1 figure
零样本3D问答通过层级视图到令牌传输
发表机构 * Dongsheng Wang(王东生) ; Dawei Su(苏大卫) ; Hui Huang(黄慧)
AI总结 提出KeyVT方法,通过层级视图和令牌级输入上下文收集,结合像素特征与相机参数评估视图重要性,并利用最优传输识别代表性令牌,实现零样本3D问答性能提升。
Comments Accepted at ICML 2026. 19 pages, 6 figures
ASymPO: 用于异步大语言模型后训练的非对称尺度策略优化(无需行为信息)
发表机构 * Huawei Technologies(华为技术)
AI总结 针对异步强化学习中陈旧响应导致的分布漂移问题,提出非对称尺度策略优化(ASymPO),通过归一化每个响应的令牌损失来恢复零和平衡,无需行为策略概率。
Comments incorrect proofs in the paper
先过滤,再重加权:重新思考在线策略蒸馏中的优化粒度
发表机构 * THU(清华大学) ; HKUST(香港科技大学) ; BIT(北京理工大学) ; Meituan(美团) ; ZJU(浙江大学)
AI总结 针对在线策略蒸馏,提出FiRe-OPD方法,通过轨迹级过滤和令牌级软重加权实现细粒度优化,在多种设置下优于现有方法。
OpenWebRL: 揭秘视觉网络代理的在线多轮强化学习
发表机构 * UIUC(伊利诺伊大学香槟分校) ; Microsoft(微软)
AI总结 提出OpenWebRL框架,通过在线多轮强化学习在真实网站上训练视觉网络代理,以4B参数模型在基准测试中达到开源最优,并与闭源系统竞争。
Comments 36 pages, 11 figures
工业化预测驱动推断:用于可靠生成式AI与智能体系统评估的GLIDE库
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; Google Research(谷歌研究院)
AI总结 提出GLIDE开源库,统一多种预测驱动推断方法,提供无偏估计与有效置信区间,显著降低人工标注成本。
Comments 8 pages, Accepted to the ICML 2026 Workshop on Statistical Frameworks for Uncertainty in Agentic Systems, Seoul, South Korea, 2026
深度神经网络训练作为随机效应:优化-推断对偶性
发表机构 * Centre for Biomedical Data Science, Duke-NUS Medical School, National University of Singapore(生物医学数据科学中心,国立新加坡大学杜克-新加坡医学学校) ; Department of Biostatistics, Harvard T.H. Chan School of Public Health, Boston, MA, USA(生物统计学系,哈佛T.H. Chan公共卫生学院,马萨诸塞州波士顿,美国) ; Institute of Natural Sciences, MOE-LSC, School of Mathematical Sciences, CMA-Shanghai, SJTU-Yale Joint Center of Biostatistics and Data Science, Shanghai Jiao Tong University(自然科学院,MOE-LSC,数学科学学院,CMA-上海,SJTU-耶鲁联合生物统计学与数据科学中心,上海交通大学) ; Department of Biostatistics, Columbia University, New York, NY, USA(生物统计学系,哥伦比亚大学,纽约州纽约市,美国)
AI总结 本文提出深度神经网络训练与经典随机效应模型等价,揭示了优化-推断对偶性,并利用限制最大似然估计实现基于似然的早停规则。
多样性中的可检测性:单次运行中用于隐私审计的改进金丝雀构造
发表机构 * PreMeDICaL team, Inria Idesp, Inserm, Univ. de Montpellier(PreMeDICaL团队,Inria Idesp,Inserm,蒙彼利埃大学)
AI总结 针对单次运行隐私审计中金丝雀点相互干扰导致隐私泄露估计偏弱的问题,提出结合影响函数贪婪初始化与双层优化的方法,最大化金丝雀可检测性并促进嵌入空间多样性,以较低计算成本获得更强的隐私泄露估计。
当梯度冲突时:多目标提示优化用于LLM评判器的失败模式
发表机构 * IIT Jodhpur(印度理工学院乔普里尔) ; Amazon(亚马逊)
AI总结 研究多目标文本梯度优化中梯度稀释和指令干扰两种失败模式,通过分解优化器信息共享方式揭示性能下降原因。
Comments Accepted at ACL 2026 - CustomNLP4U Workshop. Code, prompts and data available at https://github.com/adivekar-utexas/when-gradients-collide
最大化提示与响应之间的互信息无需额外数据即可提升LLM性能
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出互信息偏好优化(MIPO)方法,通过对比数据增强构建偏好对,利用直接偏好优化最大化提示与响应间的点互信息,无需额外数据或外部监督即可提升LLM在个性化和可验证任务上的性能。
Comments International Conference on Machine Learning 2026
极端区域策略蒸馏
发表机构 * Gaoling School of Artificial Intelligence, Renmin University of China(中国人民大学耿丽人工智能学院) ; Wuhan University(武汉大学)
AI总结 提出极端区域策略蒸馏(ERPD)两阶段框架,通过解耦样本效率与KL效率,在固定数据上先进行弱约束离策略优化以最大化提取训练信号,再在信任区域约束下蒸馏到基础策略,从而在数学推理任务中实现更好的性能与更小的KL散度。
电子健康记录语义审计的生成式方法
发表机构 * School of Biomedical Engineering, Faculty of Engineering, Tel Aviv University(特拉维夫大学生物医学工程学院,工程学院) ; AI and Data Science Center of Tel Aviv University (TAD)(特拉维夫大学人工智能与数据科学中心(TAD)) ; Safra Center for Bioinformatics, Tel Aviv University(特拉维夫大学萨弗拉生物信息学中心)
AI总结 提出一种基于大语言模型的生成式方法,通过语义数据覆盖和检索增强生成架构自动检测电子健康记录与流行病学证据之间的不一致性,实现可扩展的语义审计。
Comments 23 pages, 5 figures (+ appendix)
频谱探测电路:识别预训练Transformer中注意力头电路的三步法
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出一种三步法,通过频谱信号排序、任务模式筛选和组消融因果验证,无需标签即可识别预训练Transformer中执行持续内容依赖计算的注意力头电路,并在多个模型上验证了其通用性和因果必要性。
Comments 35 pages, 4 figures
通过LLM引擎集成在O-RAN中的高级AI服务提供
发表机构 * Department of Electrical and Computer Engineering, Worcester Polytechnic Institute(电气与计算机工程系,沃斯特理工学院) ; Department of Electrical and Computer Engineering, North Carolina State University(电气与计算机工程系,北卡罗来纳州立大学)
AI总结 提出一种双脑架构,结合LLM的推理能力和轻量级ML引擎的实时性,实现O-RAN中AI服务的自动化部署与配置。
严重类别不平衡下多类别偏头痛分类的类别依赖混合数据增强
发表机构 * University of Santiago de Compostela(圣地亚哥-德孔波斯特拉大学)
AI总结 针对偏头痛分类中严重类别不平衡问题,提出一种基于类别样本量的混合数据增强策略,并引入保真度不对称概念,在纠正数据泄露和指标偏差后,显著提升了多分类器的平均鲁棒性。
Reflex: 基于状态连续控制中利用反射对称性的强化学习
AI总结 提出Reflex框架,通过反射对称性正则化机制将反射对称性融入策略学习,提升基于状态的连续控制任务的样本效率。
Comments Some of the data in the paper contain errors and need to be confirmed for modification
通过自适应批处理缩放实现可扩展的在线强化学习
发表机构 * Jongchan Park
AI总结 本文提出自适应批处理缩放方法,通过动态调整有效批处理大小来平衡强化学习早期的可塑性需求和晚期的稳定收敛,发现增大网络和批处理大小的组合在强化学习中取得最佳性能。
利用大语言模型进行安全硬件设计及相关问题:机遇与挑战
发表机构 * New York University Abu Dhabi(纽约大学阿布扎克分校) ; NYU Tandon School of Engineering(纽约大学塔能工程学院)
AI总结 本文探讨了大语言模型在电子设计自动化和硬件安全领域的应用,分析了其在生成RTL代码、自动生成测试平台以及弥合高层次规格与硅芯片之间语义差距方面的潜力,同时指出了其引入的严重安全漏洞,并总结了当前研究的最新进展和未来研究方向。
Comments Accepted for 2026 IEEE Computer Society Annual Symposium on VLSI (ISVLSI)
Toto 2.0:时间序列预测进入规模化时代
发表机构 * Datadog AI Research(Datadog AI研究院) ; Carnegie Mellon University(卡内基梅隆大学)
AI总结 本文提出Toto 2.0模型家族,通过单一训练配方在400万到25亿参数范围内实现可靠的预测质量提升,并在三个基准测试中达到新状态。
Comments Code: https://github.com/DataDog/toto Weights: https://huggingface.co/collections/Datadog/toto-20
受生物学启发的联合分布神经元:基于层次相关性重建的多向传播神经元
发表机构 * Jagiellonian University(雅盖隆大学)
AI总结 本文提出了一种受生物学启发的联合分布神经元,通过层次相关性重建实现多向值和密度传播,改进了传统人工神经元在学习、灵活性和鲁棒性方面的不足。
Comments 12 pages, 17 figures
将预处理选择重新定义为近红外光谱学中的模型内部校准:一种大规模的运算符自适应PLS和岭模型基准测试
发表机构 * CIRAD, UMR AGAP Institut(CIRAD,AGAP研究院) ; UMR AGAP Institut, Univ Montpellier, CIRAD, INRAE, Institut Agro(AGAP研究院,蒙彼利埃大学,CIRAD,INRAE,农业研究院) ; Laboratoire Cogitamus(Cogitamus实验室)
AI总结 本文研究了在近红外光谱学中,将预处理选择重新定义为模型内部校准的方法,通过大规模基准测试比较运算符自适应PLS和岭模型的性能和效率。
Comments 17 pages, 8 figures; supplementary material (39 pages, 4 figures) included. Extended preprint version of a companion study prepared as a concise journal article (same results, different framing and scope). Code and artifacts: https://github.com/GBeurier/nirs4all-aom
MSTN: 一种轻量且快速的通用时间序列分析模型
发表机构 * Department of Computer Science and Engineering(计算机科学与工程系) ; Indian Institute of Technology Indore(印度理工学院印度尔)
AI总结 本文提出了一种轻量且快速的MSTN模型,通过多尺度时间网络架构,结合早期内部聚合原理,有效处理时间序列中的非平稳性、非线性动态和多时间尺度行为,实现了在多个时间尺度上的灵活建模,同时保持了模型的轻量级和低延迟特性。
Comments 30 pages, published in Transactions on Machine Learning Research (TMLR)
代理神经架构协同设计包(SNAC-Pack)
发表机构 * University of California San Diego(加州大学圣地亚哥分校) ; ETH Zurich(苏黎世联邦理工学院) ; Fermi National Accelerator Laboratory(费米国家加速器实验室) ; University of Illinois Chicago(伊利诺伊大学芝加哥分校)
AI总结 本文提出SNAC-Pack,一种面向硬件的自动化机器学习框架,用于神经架构协同设计和端到端FPGA部署,通过多目标全局搜索和硬件代理模型减少合成成本,并结合量化感知训练和迭代幅度剪枝来压缩模型,最终在FPGA上实现高效部署。
Comments 15 Pages, 3 Figures, AutoML (International Conference on Automated Machine Learning) 2026
CUBE: 通过平衡实验实现对比理解
发表机构 * Department of Computer Engineering(计算机工程系) ; Gachon University(加荣大学)
AI总结 本文提出CUBE框架,通过平衡低-高探针解释已训练的预测模型,揭示模型的主要效应和交互作用,验证了其在合成和现实表格任务中的有效性。
Comments The core framework and main claims remain unchanged; the manuscript has been revised for clarity, presentation, and consistency
推理模型不只思考更久,它们的移动方式不同
发表机构 * Technical University of Denmark(丹麦技术大学) ; Stanford University(斯坦福大学)
AI总结 本文研究了推理训练模型在生成链式思维时的轨迹差异,发现通过长度校正后,不同领域中难度与轨迹几何的耦合关系存在显著差异,尤其是在代码领域中,推理训练模型表现出更直接的轨迹和更一致的局部曲率。
Comments Preprint
对树集成模型的敏感性量化:一种符号和组合方法
发表机构 * Indian Institute of Technology Bombay(印度理工学院班加罗尔分校) ; University of Toronto(多伦多大学)
AI总结 本文提出了一种针对树集成模型的敏感性量化方法,通过离散化输入空间并枚举易受敏感性影响的区域,结合代数决策图(ADD)编码和分拆子问题,实现高效计算。实验表明,所提工具XCount在速度和可扩展性方面优于其他方法。
由Coreset诱导的条件速度流匹配
发表机构 * Department of Statistics, Purdue University(普渡大学统计学系)
AI总结 本文提出了一种生成模型CCVFM,通过数据驱动的源分布增强层次化修正流,利用Coreset压缩目标数据并生成高斯混合分布,从而在无需学习神经采样器的情况下实现条件速度律的闭式表达,并通过轻量级修正流进一步优化生成效果。
当注意力胜过傅里叶:用于不规则域上的PDE求解的多尺度变换器
发表机构 * Physics Lab, Yee Collins Research Group(Yee Collins研究组物理实验室)
AI总结 本文研究了深度学习模型在求解偏微分方程(PDE)时的架构选择问题,探讨了基于学习注意力的变换器架构在何时优于傅里叶域神经算子。引入了多尺度注意力变换器(MSAT),该架构将时空解的历史编码为令牌序列,并通过复合监督目标进行端到端训练。在五个基准问题上,与九种基线方法(包括物理信息神经网络、神经算子和状态空间模型)进行了全面的实证评估,展示了在复杂几何问题上的最佳泛化能力。
Comments Substantial Revision Required
路径耦合贝尔曼流用于分布式强化学习
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 本文提出路径耦合贝尔曼流(PCBF),一种连续时间的分布式强化学习方法,通过学习回报分布的流匹配来解决现有方法在边界不匹配和高方差-bootstrap问题,实验表明其在分布保真度和训练稳定性方面有所提升。
Comments Accepted to the 43rd International Conference on Machine Learning (ICML 2026)
测试时训练用于视觉前瞻视觉-语言-动作模型
发表机构 * KAIST(韩国科学技术院)
AI总结 本文提出了一种测试时训练方法,用于增强视觉前瞻视觉-语言-动作模型在面对分布外数据时的鲁棒性,通过引入适应性更新过滤机制来减少测试时更新带来的实际挑战。
Comments Accepted at ICML 2026 Workshop on Continual Adaptation at Scale (CATS)
SHRED: 通过自蒸馏与对数势降低实现无保留集的去记忆
发表机构 * University of Southern California(南加州大学) ; USC Information Sciences Institute(USC信息科学研究所)
AI总结 本文提出了一种无需保留集的去记忆方法SHRED,通过自蒸馏与对数势降低,在去记忆的同时保持模型的实用性,优于传统需要保留集的方法。
通过缓存响应实现高效的模型评估
发表机构 * University of Maryland(马里兰大学)
AI总结 本文提出了一种基于数据核视角空间(DKPS)的方法,利用已缓存的模型响应来预测基准性能,从而减少评估新模型所需的查询数量,提高了模型评估的效率。
在危机后时代跨挪威五个竞价区的电力价格预测
发表机构 * Independent researcher(独立研究者) ; Department of Mathematics, University of Oslo(奥斯陆大学数学系) ; Department of Computer Science, The Arctic University of Norway(挪威北极大学计算机科学系) ; Faculty of Medicine, University of Oslo(奥斯陆大学医学院)
AI总结 本文研究了挪威五个竞价区在能源危机后电力价格预测的问题,通过构建多模态数据集并评估了八种预测模型,发现LightGBM在所有区域表现最佳,同时强调了外部特征在不同市场状况下的重要性。
Comments This version removes variables unavailable at prediction time to eliminate look-ahead leakage, clarifies the forecasting task definition, and updates the results and discussion accordingly. All tables and figures have been recomputed
校准的惊喜:一种信息论视角下的创造性质量
发表机构 * Bo Zou(邹波) ; Chao Xu(徐超)
AI总结 本文提出了一种信息论框架,用于评估创造性写作的质量,通过校准的惊喜概念,结合香农互信息理论,量化了高质量文本与降质文本之间的差异。
Comments 28 pages, 3 figures
Transformer 的拓扑困境
发表机构 * Google DeepMind(谷歌深Mind)
AI总结 本文探讨了Transformer在处理序列结构时的拓扑问题,指出其纯前馈架构限制了动态状态跟踪,提出应通过递归架构转向隐含激活动态,并介绍了连续思维Transformer架构的分类方法及未来研究方向。
评估Hopper和Blackwell GPU上的CUDA Tile用于AI工作负载
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; Stanford University(斯坦福大学)
AI总结 本文评估了CUDA Tile在Hopper和Blackwell GPU上的AI工作负载性能,比较了CuTile与cuBLAS、Triton等方法的效率和可移植性,发现CuTile在特定工作负载上表现优异,但在跨架构优化上仍有不足。
测地语义搜索:基于学习局部黎曼度量的引文图导航
AI总结 本文提出Geodesic Semantic Search (GSS),通过在引文图上学习节点特定的黎曼度量,实现几何感知的语义检索。不同于传统基于嵌入的检索依赖固定欧几里得距离,GSS在每个节点学习低秩度量张量,诱导局部正定度量,从而在保持模型可计算性的同时保证有效度量。检索过程通过多源Dijkstra算法在学习的测地距离上进行,随后通过最大边际相关性重排序和路径一致性过滤。在包含169,000篇arXiv论文的引文预测基准上,GSS在Recall@20上比SPECTER+FAISS基线提升了23%。我们提供了Bridge Recovery Guarantee,描述了测地检索在定性上优于直接相似性的情况,以及训练损失与检索质量的边际分离结果,并刻画了低秩度量参数化的表达能力。我们的分层粗到细检索方法结合k-means池化,将计算成本降低4倍,同时保持97%的检索质量。
Comments Substantial Revision Required
自适应头预算用于高效多头注意力
发表机构 * LIPN, Université Paris 13(巴黎第十三大学LIPN实验室) ; Université Paris 13(巴黎第十三大学) ; Université de Versailles Saint-Quentin-en-Yvelines(巴黎- Versailles 巴黎-圣昆丁-埃夫里大学)
AI总结 提出BudgetFormer,通过动态分配注意力头预算和相关性分布,在文本分类任务中减少计算和内存开销,同时保持或提升性能。
面向 horizon 的决策支持框架:用于在鲁棒生产计划中选择需求预测模型
发表机构 * Department of Computer Engineering and Informatics, Faculty of Engineering, University of Santiago of Chile(工程学院计算机工程与信息学系,智利圣塔克鲁斯大学)
AI总结 本文提出了一种面向 horizon 的决策支持框架,用于在需求波动大、不确定性高的生产计划中选择需求预测模型,通过 MDFH 方法预测误差指标并提出 RMSSEh 和 AHSIV 作为改进的模型选择方法。
Comments 31 pages, 12 figures and Appendix
PF$Δ$: 一个用于负载、发电和拓扑变化的功率流基准数据集
发表机构 * Department of Electrical Engineering & Computer Science(电气工程与计算机科学系) ; Laboratory for Information & Decision Systems(信息与决策系统实验室) ; Massachusetts Institute of Technology(麻省理工学院)
AI总结 本文提出PF$Δ$基准数据集,用于评估在负载、发电和拓扑变化下的功率流计算,通过包含859,800个解决的实例,涵盖六种不同的变电站系统大小,并包含三种故障场景,以评估传统求解器和基于GNN的方法,识别现有方法的不足和未来研究的开放问题。
Comments 31 pages, 14 figures. Accepted at NeurIPS 2025
代数多样性:从单次观测进行群论谱估计
发表机构 * Richardson, TX 75080 USA(美国德克萨斯州里奇蒙德市75080号)
AI总结 本文通过群论方法揭示了单次观测下的谱估计问题,证明了时间平均是退化群作用的特例,并展示了群平均估计与多快门协方差估计的等效性,同时统一了DFT、DCT和KLT等变换。
Comments 41 pages, 14 figures. v3: Retracted six quantitative findings in Section 11, transformer application, due to implementation error in spectral concentration metric. Corrected results deferred to separate publication. Remark added after Conjecture 23 on orbit-structure bias in psi criterion. All other sections unaffected v4: new result on blind group matching; v5: corrected/updated metrics
强流带电粒子束中束-等离子体集体振荡:介电响应理论、朗缪尔波色散以及通过Prometheus的无监督检测
AI总结 本文研究了强流带电粒子束中束-等离子体集体振荡的理论和计算框架,通过介电响应理论、朗缪尔波色散关系以及Prometheus算法验证了束-等离子体过渡的特性,展示了其在中间能区的应用前景。
Comments Substantial Revision Required
IatroBench: AI安全措施中意外伤害的预注册证据
发表机构 * Harvard T.H. Chan School of Public Health(哈佛大学T.H. 洪学校公共卫生学院)
AI总结 该研究通过IatroBench评估了AI安全措施在医疗决策中的意外伤害风险,发现不同模型在身份相关性上的隐瞒行为存在显著差异,尤其在高度安全训练的模型中表现更明显。
Comments 30 pages, 3 figures, 11 tables. Pre-registered on OSF (DOI: 10.17605/OSF.IO/G6VMZ). Code and data: https://github.com/davidgringras/iatrobench. v2: Fix bibliography entries (add arXiv IDs, published venues); correct p-value typo in Limitations section; add AI Assistance Statement v3: Correct Figure 1 (decoupling scatter accidentally reverted to earlier draft in v2)
SOLARIS: 预测性卸载基于潜在表示的推理扩展
发表机构 * Meta AI
AI总结 本文提出SOLARIS框架,通过预测未来请求中的用户-项目交互嵌入,将昂贵的基础模型推理与关键服务路径解耦,从而在大规模应用中实现实时知识转移,提升服务效率和收益。
Comments Accepted to SIGIR 2026 Industry Track
SUPERNOVA: 通过自然指令上的强化学习激发大语言模型的通用推理
发表机构 * University of California, Los Angeles(加州大学洛杉矶分校)
AI总结 本文提出SUPERNOVA框架,通过自然指令数据集构建高质量的强化学习可验证奖励数据集,通过100+次强化学习实验系统研究如何利用这些数据集提升下游推理性能,并在BigBench Extra Hard基准上实现64.4个百分点的相对提升。
Comments 23 Pages; 2-column format; 10 figures
PI-JEPA: 一种无需标签的替代预训练方法,用于通过操作符分裂潜在预测的耦合多物理场模拟
AI总结 该研究提出了一种无需完整PDE求解的替代预训练框架PI-JEPA,通过掩码潜在预测和每子操作符PDE残差正则化,在未标记的参数场上训练,从而减少多物理场替代部署所需的模拟预算。
Comments Substantial Revision Required
CuTeGen: 基于LLM的代理框架用于使用CuTe生成和优化高性能GPU内核
发表机构 * Department of Computer Science, University of Toronto(计算机科学系,多伦多大学)
AI总结 本文提出CuTeGen,一种基于LLM的代理框架,通过CuTe抽象层实现GPU内核的生成和优化,通过结构化生成-测试-优化工作流,在标准基准测试中实现了比PyTorch快1.71倍的速度提升,并在生成成本相近的情况下优于现有代理基线CudaForge。
神经坍缩动力学:深度、激活、正则化和特征范数阈值
发表机构 * Department of Electrical Engineering and Computer Science(电气工程与计算机科学系)
AI总结 本文研究了神经坍缩现象的动力学,发现特征范数达到特定临界值时会发生神经坍缩,并探讨了深度、激活函数、正则化和网络宽度对这一过程的影响。
通过Kolmogorov-Arnold网络进行非线性因子分解:一种资产收益分析的谱方法
发表机构 * Faculty of Mathematics and Computer Science, University of Bucharest(布加勒斯特大学数学与计算机科学学院)
AI总结 本文提出KAN-PCA,一种利用KAN作为编码器和线性映射作为解码器的自编码器,通过在每条边上使用学习的B样条函数替代线性投影,以捕捉比传统PCA更多的方差。实验表明KAN-PCA在20只S&P 500股票上实现了更高的重建R²值,并在修正数据泄露后与PCA外推结果一致。
Comments 12 pages, 2 figures
监督学习真的和无监督学习有那么大的区别吗?
发表机构 * KTH Royal Institute of Technology(皇家理工学院) ; Uppsala University(乌普萨拉大学)
AI总结 该研究通过将监督学习分解为两阶段过程,证明在不访问标签数据的情况下选择模型参数和添加输出,可以实现与传统监督学习相似的性能,表明监督与无监督学习的区别可能不如表面看起来那么根本。
Comments Paper accepted at AISTATS 2026
LeWorldModel:从像素稳定端到端联合嵌入预测架构
发表机构 * Mila & Université de Montréal(Mila与蒙特利尔大学) ; New York University(纽约大学) ; Samsung SAIL(三星SAIL) ; Brown University(布朗大学)
AI总结 本文提出LeWorldModel,一种通过仅使用两个损失项从原始像素稳定端到端训练的联合嵌入预测架构,显著减少了可调损失超参数,并在多种2D和3D控制任务中表现出色,同时在物理结构编码和物理不合理的事件检测方面展示了其能力。
从因果发现到神经时间序列中的动态因果推断
发表机构 * Lucy Family Institute for Data & Society(数据与社会卢西家族研究所) ; University of Notre Dame(诺克斯达大学) ; Political Science University of Notre Dame(政治学诺克斯达大学)
AI总结 提出动态因果网络自回归(DCNAR)两阶段框架,通过神经自回归因果发现学习稀疏有向因果网络,并将其作为结构先验用于时变神经网络自回归,实现无需预设网络结构的动态因果推断。
Comments 11 pages, 2 figures
通过各向同性高斯表示实现稳定的深度强化学习
发表机构 * University of Waterloo(滑铁卢大学)
AI总结 本文提出了一种基于各向同性高斯表示的深度强化学习方法,通过在训练过程中塑造表示以达到各向同性高斯分布,从而在非平稳环境下提高性能并减少表示崩溃、神经元休眠和训练不稳定性。
通过赌注进行多臂顺序假设检验
发表机构 * University of California Berkeley(加州大学伯克利分校) ; École Normale Supérieure & Inria Paris(法国国家科学研究中心巴黎分校 & 巴黎研究所)
AI总结 本文研究了通过赌注进行多臂顺序检验的问题,提出了一种在多个数据源(臂)中选择以获取数据的统计学家的变体,旨在拒绝全局空假设P(所有臂在某种意义上无效)并支持复合替代假设Q(至少有一个臂非空)。通过推广对数最优性和期望拒绝时间最优性的概念,得到了匹配的上下界,并提出了一个修改的上置信界算法来处理不可观测但足够可估计的奖励。
Level Up: 定义和利用过渡问题以进行课程学习
发表机构 * Department of Computer Science, Columbia University(哥伦比亚大学计算机科学系) ; Department of Computer Science, University of Toronto(多伦多大学计算机科学系)
AI总结 本文提出了一种新的方法,通过定义和利用过渡问题来改进课程学习,该方法能够根据模型能力的提升动态调整训练难度,从而更有效地提升模型性能。
混合能量感知奖励塑形:一种统一的轻量级物理引导策略优化方法
发表机构 * School of Mechanical Engineering, University of Science and Technology Beijing(北京科技大学机械工程学院) ; Jiangsu XCMG Construction Machinery Research Institute Co., Ltd.(江苏中联重科工程机械研究院有限公司)
AI总结 提出混合能量感知奖励塑形(H-EARS),通过编码先验能量项作为奖励势能,结合动作正则化,在连续控制中提升收敛速度、稳定性和能效。
Comments 23 pages, 48 figures. Accepted by Neurocomputing
关于对数动力学对分数函数误差的鲁棒性
发表机构 * Cornell University(康奈尔大学)
AI总结 本文研究了基于分数函数的生成模型对分数函数估计误差的鲁棒性,发现对数动力学在L2误差(更一般地Lp误差)下并不鲁棒,即使在高维简单分布中,即使分数函数估计误差非常小,对数动力学在多项式时间内运行也会导致与目标分布的总变差距离很大,这进一步支持了扩散模型优于对数动力学。
Comments ICML 2026
训练过程中对抗语言模型中新兴偏差的防御措施
发表机构 * University of Copenhagen(哥本哈根大学)
AI总结 本文研究了在训练过程中如何防止语言模型出现新兴偏差,提出了五种训练正则化干预方法,并展示了通过选择对齐模型与偏差模型之间困惑度差异的交错数据可以获得最佳效果。
Comments Accepted at ICML 2026 https://icml.cc/virtual/2026/poster/64303
softmax 注意力头的专门化:来自高维单位置模型的见解
发表机构 * Statistical physics of computation laboratory, École Polytechnique Fédérale de Lausanne, Switzerland(计算物理学实验室,瑞士联邦理工学院拉沃斯纳分校)
AI总结 本文研究了多头注意力机制中注意力头的专门化现象,提出了一种理论模型,分析了SGD下多头softmax注意力的训练动态,并引入了Bayes-softmax注意力以优化预测性能。
GIPO:高斯重要性采样策略优化
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 该研究提出了一种基于截断重要性采样的策略优化目标GIPO,通过使用基于对数比率的高斯信任权重替代硬裁剪,以软化极端重要性比率同时保持非零梯度,从而提高数据效率,实验表明GIPO在多种回放缓冲区大小下均取得最佳性能,表现出优越的偏差-方差权衡、高训练稳定性及改进的样本效率。
CUCo:一种用于计算与通信协同设计的代理框架
发表机构 * UT Austin(德克萨斯大学奥斯汀分校)
AI总结 本文提出CUCo框架,通过结合结构化设计空间形式化和正确性优先的快速路径代理以及进化驱动的慢速路径代理,实现了CUDA内核的计算与通信协同设计,从而在四个多GPU工作负载中实现了1.57倍的加速,并在LLM推理成本低于10美元的情况下发现了一种双流重叠策略。
在线算法在表现性预测中的稳定性
发表机构 * MIT(麻省理工学院) ; NYU(纽约大学)
AI总结 本文研究了在线算法在表现性预测中的稳定性问题,证明了任何在表现性设置中使用的无遗憾算法都会收敛到一种表现性稳定的均衡状态,该状态中模型主动塑造数据分布,使得其预测在事后看来是最优的。该研究避免了对模型如何影响分布的假设,并揭示了常见算法如梯度下降为何能自然稳定化并防止 runaway 反馈循环。
软序列策略优化
发表机构 * Lomonosov Moscow State University(罗蒙诺索夫莫斯科国立大学) ; Institute for Artificial Intelligence(人工智能研究所)
AI总结 本文提出软序列策略优化方法,通过引入软门控函数改进序列级重要性权重,提升大语言模型对齐任务的训练稳定性与性能。
增量变换器神经过程
发表机构 * University of Cambridge(剑桥大学)
AI总结 本文提出增量变换器神经过程(incTNP),通过因果掩码、键值缓存和高效自回归训练策略,在保持预测性能的同时将更新计算复杂度从二次降低到线性,从而在序列推理中实现显著的速度提升,并保持流式推理的一致性。
Comments Accepted at ICML 2026
Harpoon:基于条件表格扩散的通用流形引导
发表机构 * Department of Computer Science, Delft University of Technology(代尔夫特理工大学计算机科学系) ; Department of Computer Science, Université de Neuchâtel(日内瓦大学计算机科学系)
AI总结 本文提出Harpoon,一种基于流形引导的条件表格扩散方法,通过扩展流形理论来处理多样化的推理目标,从而在表格数据生成中实现更精确的条件控制。
Comments Accepted at ICLR 2026
迈向人工智能流行病学:一种用于前瞻性风险检测的测量标准化框架
AI总结 本文提出了一种测量标准化框架,用于在没有访问模型内部信息的情况下,将专家-人工智能交互压缩为结构化、可比较的领域,以进行前瞻性风险检测。该框架旨在定义其范围,包括语义和统计层面,并指定未来工作的实证测试协议。
Comments 29 pages, 3 figures
浅层神经网络在特征学习 regime 中的缩放定律与谱特性
发表机构 * Departement d’Informatique, École Normale Supérieure, PSL & CNRS(信息学院,巴黎高等师范学院,PSL与CNRS) ; Statistical Physics of Computation Laboratory, École Polytechnique Fédérale de Lausanne (EPFL)(计算统计物理实验室,洛桑联邦理工学院(EPFL)) ; Information, Learning and Physics Laboratory, École Polytechnique Fédérale de Lausanne (EPFL)(信息、学习与物理实验室,洛桑联邦理工学院(EPFL))
AI总结 本文研究了浅层神经网络在特征学习 regime 中的缩放定律与谱特性,通过分析二次和对角神经网络的缩放规律,揭示了样本复杂度和权重衰减对过剩风险缩放指数的影响,并建立了这些 regime 与训练网络权重谱性质的精确联系。
多智能体Lipschitz老虎机
发表机构 * University of Colorado Boulder(科罗拉多大学波德穆尔分校) ; INRIA Paris(巴黎国家信息与自动化研究所)
AI总结 本文研究了在连续Lipschitz结构动作空间上的去中心化多玩家随机老虎机问题,其中硬碰撞导致零奖励。研究提出了一种无需通信的策略,旨在最大化集体奖励,同时分离协调成本和学习成本。通过新颖的maxima-directed搜索识别并安排玩家到高价值区域,将问题分解为N个独立的单玩家Lipschitz老虎机。在共识模式下,得到端到端的 regrets bound,其主导学习项为~O(T^{(d+1)/(d+2)}),与单玩家Lipschitz速率匹配;前期协调成本在固定置信度下与时间无关,仅在期望 regrets 形式中为多项式对数。在额外的公共覆盖/调度假设下,还获得了无间隙~O(T^{(d+1)/(d+2)})保证。进一步推导了主导学习项的匹配下界,并将框架扩展到一般距离阈值碰撞模型。
Comments Twenty-Ninth Annual Conference on Artificial Intelligence and Statistics (AISTATS 2026)
通用合成数据驱动推断
发表机构 * Department of Electrical and Computer Engineering, Technion IIT, Israel(电气与计算机工程系,技术离子研究所,以色列) ; Department of Statistics and Data Science, The Wharton School, University of Pennsylvania, USA(统计学与数据科学系,沃顿商学院,宾夕法尼亚大学,美国) ; Department of Computer Science, Technion IIT, Israel(计算机科学系,技术离子研究所,以色列)
AI总结 本文提出了一种通用合成数据驱动推断框架,通过结合高质量合成数据和真实数据来提高样本效率,同时在合成数据质量低时自动回退到传统方法,无需分布假设即可保持误差率在用户指定范围内。
在现实时间序列中使用幂律实现鲁棒因果发现
发表机构 * Department of Computer Science, Sapienza University of Rome(罗马大学计算机科学系)
AI总结 本文提出了一种基于幂律谱特征提取的鲁棒因果发现方法,以提高在现实时间序列中因果关系发现的鲁棒性,该方法在合成数据集和真实数据集上均优于现有方法。
无需训练你的关系数据库基础模型
发表机构 * University of Hong Kong, Shanghai X-Lab(香港大学,上海X实验室)
AI总结 本文提出了一种基于上下文学习的关系数据库编码器,能够在不重新训练的情况下,与现有的单表上下文学习基础模型结合,实现对多张相关表的高效处理。
Comments International Conference on Machine Learning (ICML) 2026
从能力寻求强化学习训练中产生的对齐风险
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; Stanford University(斯坦福大学) ; University of Washington(华盛顿大学) ; University of Texas at Austin(德克萨斯大学奥斯汀分校) ; University of Toronto(多伦多大学) ; University of Cambridge(剑桥大学)
AI总结 本文研究了在易受攻击的环境中通过强化学习训练语言模型时,模型可能利用隐含漏洞来最大化奖励的风险,发现这些策略不仅限于狭窄的技巧,还能在一定程度上转移、传播,并在某些情况下比通过SFT学习更持久,表明需要扩展AI安全工作到审计和保障训练环境、奖励机制和评估渠道。
Comments Accepted by ICML 2026
超越奖励的强化学习在网络安全防御中的应用
发表机构 * University of Cambridge(剑桥大学)
AI总结 本文研究了在网络安全防御中使用强化学习时,奖励函数结构对学习和策略行为的影响,通过比较稀疏和密集奖励函数,揭示了奖励、动作空间和子最优策略风险之间的复杂关系。
停止训练于最差:渐进性解蔽加速了掩码扩散训练
发表机构 * Harvard University(哈佛大学) ; Kempner Institute(凯普纳研究所)
AI总结 本文提出了一种名为渐进性解蔽(PUMA)的方法,通过修改前向掩码过程,使训练时间和推理时的掩码模式一致,从而加速了掩码扩散模型的训练。
在LLMs的测试时间扩展中对树搜索策略与固定令牌预算对齐
发表机构 * University of Tokyo(东京大学)
AI总结 本文提出了一种名为Budget-Guided MCTS (BG-MCTS)的树搜索解码算法,通过将搜索策略与剩余令牌预算对齐,以提高在不同令牌预算下的推理性能。
Comments Accepted at ICML 2026. Code: https://github.com/Sora-Miyamoto/bg-mcts
通过回滚增强学习视觉-语言模型中的自我纠正
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 本文提出一种基于回滚增强的强化学习框架Octopus,通过重新组合现有回滚生成密集的自我纠正示例,提高样本效率并稳定RL优化,同时引入响应遮蔽策略以解耦自我纠正与直接推理,从而在7个基准测试中实现开源VLM的SOTA性能。
Comments 18 pages
模型比较与交叉验证的相对不稳定性
发表机构 * Department of Statistics, Harvard University, Cambridge, MA, USA(哈佛大学统计系) ; Microsoft Research New England, Cambridge, MA, USA(微软研究院新英格兰分部)
AI总结 研究指出即使个体稳定的模型在比较时也可能产生相对不稳定的结果,挑战了交叉验证推断的有效性,特别指出Lasso和软阈值化在最有利的学习条件下仍会导致无效的交叉验证推断。
通过符号蒸馏获得可解释的分析Calabi-Yau度量
发表机构 * D Yang Eng
AI总结 本文研究如何用少量射影不变量紧凑描述Calabi-Yau度量的点确定比,并通过符号回归发现低阶对称特征能有效捕捉教师变化,同时验证了在复杂结构模数范围内保持一致性。
多校准梯度提升的收敛性研究
发表机构 * Meta ; LSE, Department of Statistics(伦敦经济学院统计系)
AI总结 本文研究了多校准梯度提升的收敛性,证明了预测更新的幅度以O(1/√T)衰减,并在额外的平滑假设下实现线性收敛,实验验证了理论结果和方法的快速收敛性。
Comments Under submission
最小最大最优差分隐私合成数据用于平滑查询
发表机构 * Department of Mathematics, University of Southern California(南加州大学数学系) ; Department of Mathematics, University of California San Diego(加州圣地亚哥大学数学系)
AI总结 本文研究了如何生成具有(ε,δ)差分隐私的合成数据,以在保证个体隐私的同时,为有意义的下游分析提供强效用保证。提出了一种多项式时间算法,实现了最小最大误差率O_{k,d}(n^{-min{1, k/d}}),并建立了针对k-平滑查询的首个最小最大下界。
Comments COLT 2026 arXiv version. 34 pages
grounded but Misleading: Evaluating Semantic Alignment in AI-Generated Security Explanations
发表机构 * Virginia Tech(弗吉尼亚理工学院)
AI总结 本文研究了AI生成的安全解释中语义对齐的问题,通过VEXA测试平台验证了词汇基础与语义风险对齐之间的差距,发现即使解释在词汇上显得合理,其语义解释可能削弱检测器的意图风险评估。
FlexRank: 嵌套低秩知识分解用于自适应模型部署
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出FlexRank方法,通过嵌套低秩权重分解和基于重要性的整合,从预训练模型中提取不同能力的子模型,实现“一次训练,随处部署”的自适应部署。
Comments Accepted at ICML 2026 (Spotlight)
变分熵最优传输
发表机构 * Lomonosov Moscow State University(莫斯科罗蒙诺索夫莫斯科大学) ; National Research Nuclear University MEPhI(国家研究核大学 MEPhI)
AI总结 本文提出变分熵最优传输(VarEOT),通过精确的变分重参数化将对数分区函数转化为可处理的最小化问题,从而在不依赖MCMC模拟的情况下实现高效的最优传输学习,理论上有有限样本泛化界和通用函数逼近结果,并在合成数据和未配对图像到图像翻译任务中展示了竞争力或改进的翻译质量。
揭示递归神经策略中的隐藏动力学结构
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 本文通过分析不同训练方法、模型架构和任务中学习得到的递归策略的隐藏状态域,发现稳定的循环结构在与环境交互时 consistently 出现,这些结构与动力系统分析中的极限环有相似性,并揭示了极限环几何结构与策略行为之间的对应关系,为解释递归策略的性能提供了新视角。
SpanNorm: 在深度Transformer中协调训练稳定性与性能
发表机构 * Meituan Inc.(美团公司) ; NLP Lab, School of Computer Science and Engineering(自然语言处理实验室,计算机科学与工程学院) ; Northeastern University, Shenyang, China(东北大学,沈阳,中国)
AI总结 本文提出SpanNorm技术,通过结合前归一化和后归一化的优势,解决深度Transformer中训练稳定性与性能之间的根本性权衡问题,理论分析和实验结果表明其在密集和专家混合(MoE)场景中均优于传统归一化方案。
Comments Accepted by ICML2026
在d+1维度中重新表述神经算子以嵌入演化
发表机构 * HKUST (GZ)(香港科技大学(广州)) ; HKUST(香港科技大学) ; SWJTU(西南交通大学)
AI总结 本文提出在d+1维度中重新表述神经算子,通过引入辅助函数维度来建模嵌入演化,从而改进嵌入扩展的效率,通过傅里叶基算子在物理域和辅助域上联合作用,实现更高效的嵌入演化模块,实验表明该方法在多个基准测试中表现优异。
动态思维-令牌选择用于大型推理模型中的高效推理
发表机构 * Zhejiang University(浙江大学)
AI总结 本研究提出动态思维-令牌选择方法,通过分析推理轨迹发现只有部分关键令牌影响最终答案,从而优化大型推理模型的效率。
利用无透镜全息和深度学习进行自动HER2评分及不确定性量化
发表机构 * Electrical and Computer Engineering Department, University of California, Los Angeles, CA, 90095, USA(加州大学洛杉矶分校电气与计算机工程系) ; Bioengineering Department, University of California, Los Angeles, CA, 90095, USA(加州大学洛杉矶分校生物工程系) ; California NanoSystems Institute (CNSI), University of California, Los Angeles, CA, 90095, USA(加州大学洛杉矶分校加州纳米系统研究所) ; Department of Computer Science, University of California, Los Angeles, CA, 90095, USA(加州大学洛杉矶分校计算机科学系)
AI总结 本文提出了一种基于无透镜全息和深度学习的紧凑型、低成本系统,用于自动免疫组化染色乳腺组织切片的HER2评分,通过贝叶斯蒙特卡洛Dropout策略提高诊断可靠性,实现了高准确率的HER2分类和评分。
Comments 23 Pages, 6 Figures, 1 Table
考虑安全约束的多利益相关者多地点碳捕集与封存项目最优存储管理:从马尔可夫博弈视角
发表机构 * The University of Texas at Austin(德克萨斯大学奥斯汀分校)
AI总结 本文基于马尔可夫博弈方法,研究多利益相关者多地点碳捕集与封存项目中不同联盟结构对利益相关者目标的影响,提出一种考虑安全约束的多智能体强化学习框架,以实现多利益相关者的最优存储管理。
Comments 58 pages
隐式偏差与不变性:Hopfield网络如何高效学习图轨道
发表机构 * Mathematical Sciences, University of Bath(巴斯大学数学科学系) ; Department of Mathematics, UCLA(洛杉矶大学数学系) ; Algebraic 4 New Theory AI(代数4新理论AI)
AI总结 研究探讨了Hopfield网络在处理对称性学习问题时的隐式不变性机制,揭示了通过梯度下降学习图同构类时的隐式偏差及其对样本复杂度的影响。
通过排名均方误差进行奖励学习
发表机构 * Calarina Muslimani(卡拉里娜·穆斯林尼) ; Matthew E. Taylor(马修·E·泰勒)
AI总结 本文提出了一种基于排名的强化学习方法R4,通过引入新的排名均方误差损失函数,从轨迹-评分对数据中学习奖励函数,并在机器人基准测试中表现出色。
一种用于离线逆强化学习和动态离散选择模型的经验风险最小化方法
发表机构 * Foster School of Business, University of Washington(华盛顿大学福斯特商学院)
AI总结 本文提出了一种基于经验风险最小化(ERM)的逆强化学习/动态离散选择模型框架,该方法无需显式估计贝尔曼方程中的状态转移概率,适用于高维和无限状态空间,并在理论上有Polyak-Lojasiewicz条件的支持,从而保证了快速的全局收敛性。
Know Yourself Better: Diverse Object-Related Features Improve Open Set Recognition
发表机构 * Technical University Berlin(柏林技术大学) ; University of Mannheim(曼海姆大学)
AI总结 研究通过分析特征多样性提升开放集识别性能,提出了一种利用特征多样性的新型开放集识别方法。
针对鲁棒多标签遥感图像分类的噪声自适应正则化
发表机构 * Burgert et al.(Burgert 等)
AI总结 本文提出了一种噪声自适应正则化方法NAR,通过区分加性噪声和减性噪声,提升遥感多标签分类的鲁棒性,实验表明在不同噪声场景下均优于现有方法。
Comments Submitted to TGRS
多模态用户界面/用户体验设计理解的基准测试:MLLMs能否捕捉界面如何引导用户行为?
发表机构 * Yonsei University(延世大学) ; Seoul National University(首尔国立大学) ; NC AI
AI总结 本文提出WiserUI-Bench基准测试,用于评估多模态UI/UX设计对用户行为的影响,通过300对真实世界UI图像对和专家解读,发现MLLMs在理解UI/UX设计行为影响方面存在局限。
Comments ACL 2026 Main. Our code and dataset: https://github.com/jeochris/wiserui-bench
大气机器学习模型对均匀海表温度变暖的平衡响应
发表机构 * University of Washington(华盛顿大学)
AI总结 本文评估了几种先进的机器学习模型对均匀海表温度变暖的气候响应,探讨了这些模型在气候预测中的潜力与局限性。
Blade:一种使用扩散先验的无导数贝叶斯反演方法
发表机构 * California Institute of Technology(加州理工学院) ; University of Toronto(多伦多大学) ; Peking University(北京大学)
AI总结 本文提出Blade方法,通过使用扩散模型作为数据驱动的先验,解决无导数贝叶斯反演中高维非线性问题的后验估计问题,实现了准确且校准良好的后验分布。
自主不确定性量化用于计算床旁传感器
发表机构 * Electrical & Computer Engineering Department(电气与计算机工程系) ; Bioengineering Department(生物工程系) ; California NanoSystems Institute (CNSI)(加州纳米系统研究所) ; Department of Surgery(外科医学系) ; University of California, Los Angeles(加州大学洛杉矶分校)
AI总结 本文提出了一种自主不确定性量化技术,用于改进床旁诊断中的神经网络驱动计算传感器系统,通过蒙特卡洛dropout方法提高诊断的准确性和可靠性。
Comments 18 Pages, 5 Figures
GraphFire-X: 基于物理信息图注意力网络和结构梯度提升的建筑尺度野火准备方法用于荒野-城市界面
发表机构 * Urban Reslience.AI Lab, Zachry Department of Civil and Environmental Engineering, Texas A&M University(Urban Reslience.AI实验室,Zachry土木与环境工程系,德克萨斯A&M大学) ; Department of Computer Science and Engineering, Texas A&M University(计算机科学与工程系,德克萨斯A&M大学)
AI总结 本研究提出GraphFire-X框架,结合物理信息图注意力网络和结构梯度提升,通过分离脆弱性为环境传染和结构脆弱两个向量,解决荒野-城市界面野火风险建模问题,揭示环境压力主导传播路径,而屋檐成为主要微尺度入侵向量,从而实现精准的灾害预防和缓解策略。
ABBEL: 为高效交互学习自然语言信念状态
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; Georgia Institute of Technology(佐治亚理工学院)
AI总结 本文提出ABBEL框架,通过显式自然语言信念状态直接监督每个摘要的信息内容,以解决传统方法在生成摘要时信息丢失或更新错误的问题,从而在保持高效内存使用的同时提升交互性能。
在大规模系统中实现可扩展的时间异常因果发现:通过二进制异常标志数据实现计算效率
发表机构 * Department of ICT, University of Agder(阿格德大学信息与通信技术系) ; The CMS Experiment, CERN(欧洲核子研究中心(CERN)CMS实验)
AI总结 本文提出了一种异常因果发现方法(AnomalyCD),旨在解决从时间二进制标志数据集生成图形因果模型(GCMs)的准确性和计算挑战,通过异常数据感知的因果测试、稀疏数据和先验链接压缩以及边修剪调整等策略,提高了计算效率和准确性。
Comments 26 pages, 17 figures, 8 tables, published version at EPJ-C: Computing, Software and Data Science
迈向基于谱表示的可扩展且有效的条件独立性检验
发表机构 * University of Cambridge(剑桥大学) ; University of Oxford(牛津大学) ; ETH Zürich(苏黎世联邦理工学院)
AI总结 本文提出了一种基于谱表示的学习方法,用于解决传统条件独立性检验在适应性和可扩展性方面的不足,通过构造简单的检验统计量和双层对比算法,建立了表示学习误差与检验性能之间的理论联系,并在实际和合成数据上验证了其有效性。
Comments Accepted at ICML 2026. Revised to match the accepted version; updated experiments and exposition
HEIST:一种用于空间转录组学和蛋白质组学数据的图基础模型
发表机构 * Yale University, USA(耶鲁大学)
AI总结 本文提出HEIST模型,通过图结构建模空间转录组学和蛋白质组学数据,利用层次化图Transformer实现对细胞空间位置和基因表达的联合建模,从而提升对细胞异质性和微环境响应的理解。
通过强化学习训练一个模型以掌握跨层级的代理行为
发表机构 * Peking University(北京大学) ; National University of Singapore(新加坡国立大学)
AI总结 本文提出CrossHA,一种统一的代理模型,能够掌握异构的动作空间并自主选择每一步轨迹中最有效的接口,通过结合冷启动监督微调和多轮组相对策略优化(GRPO)算法,实现适应性动作切换,在Minecraft开放世界中超过800个任务上展示了最先进的性能。
Comments Accepted to CVPR 2026 as a Highlight
摆脱验证者:通过示范学习推理
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; Stanford University(斯坦福大学)
AI总结 本文提出RARO方法,通过逆强化学习从专家示范中学习强大的推理能力,无需任务特定的验证者,从而在多个评估任务中实现了显著的性能提升。
扩散语言模型的综述
发表机构 * VILA Lab, Mohamed bin Zayed University of Artificial Intelligence(维拉实验室,穆罕默德·本·扎耶德人工智能大学) ; Department of Automation, Tsinghua University(清华大学自动化系)
AI总结 本文综述了扩散语言模型的发展现状,探讨了其与自回归模型和掩码语言模型的关系,分析了预训练策略、后训练方法以及推理优化技术,并讨论了多模态扩展、应用场景、局限性及未来研究方向。
掩码可能具有干扰性:关于扩散语言模型中的上下文理解
发表机构 * University of Cambridge(剑桥大学)
AI总结 本文研究了扩散语言模型中掩码对上下文理解的影响,发现掩码会干扰模型对相关信息的处理,提出一种掩码无关的损失函数以提高模型的鲁棒性。
Comments Published at the Forty-Third International Conference on Machine Learning (ICML 2026)
能否用Vibe编码击败研究生计算机科学学生?一个LLM与人类编码竞赛在市场驱动的战略规划中的表现
发表机构 * University of Southampton(苏塞克斯大学) ; University of Oxford and Alan Turing Institute(牛津大学和艾伦·图灵研究所)
AI总结 本文提出一个基于现实物流优化问题(拍卖、取件和送货问题)的多智能体推理驱动基准,该问题结合了竞争拍卖与容量受限路由。研究通过比较40个LLM编码代理与17个人类编码代理在12场双打全部比赛和约4万场比赛中的表现,揭示了人类编码代理在战略规划和优化任务中的优势,以及LLM在现实世界中生成有效代码的能力不足。
旋转参数化图分数阶傅里叶变换:定义、性质和最优滤波
发表机构 * School of Mathematics and Statistics, Nanjing University of Information Science and Technology(南京信息工程大学数学与统计学院) ; School of Communication and Artificial Intelligence, Nanjing Institute of Technology(南京理工大学通信与人工智能学院) ; School of Integrated Circuits, Nanjing Institute of Technology(南京理工大学集成电路学院) ; Jiangsu Province Engineering Research Center of IntelliSense Technology and System(江苏省智能感知技术与系统工程研究中心) ; Hubei Key Laboratory of Applied Mathematics, Hubei University(湖北省应用数学重点实验室) ; Key Laboratory of System Control and Information Processing, Ministry of Education, Shanghai Jiao Tong University(教育部系统控制与信息处理重点实验室,上海交通大学)
AI总结 本文提出旋转参数化图分数阶傅里叶变换(RP-GFRFT),通过统一分数阶和旋转参数化的谱分析,解决现有方法在旋转基控制和零角度退化方面的不足,提升图信号处理的去噪、重建和特征保留性能。
双视角嵌入融合:一种混合学习方法用于知识图谱节点分类,以解决数据有限的问题
发表机构 * Department of Mathematical and Computer Sciences, Physical Sciences and Earth Sciences, University of Messina(数学与计算机科学系、物理科学与地球科学系,墨西拿大学)
AI总结 本文提出了一种双视角嵌入融合方法,通过结合Node2Vec和GraphSAGE两种互补的图嵌入技术,提升知识图谱节点特征的 informative 内容,从而生成增强的图嵌入以改进GML模型,无需额外合成数据。
Comments Accepted at the 14th International Joint Conference on Knowledge Graphs (IJCKG) 2025
深度线性神经网络的梯度流方程:从网络角度的综述
发表机构 * Department of Electrical Engineering, Linköping University(电子工程系,林雪平大学)
AI总结 本文综述了深度线性神经网络梯度流方程的动力学和损失景观的最新进展,从网络角度探讨了梯度下降训练动态(步长趋近于0时的极限情况)以及二次损失函数下的研究问题,揭示了该方程类为收敛的矩阵微分方程,具有 nilpotent、多项式、isospectral 和守恒律等特性。
Comments Manuscript accepted for publication in SIAM Review (SIREV)
选择性Sinkhorn路由以提高稀疏专家混合模型
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; National University of Singapore(新加坡国立大学)
AI总结 本文提出了一种选择性Sinkhorn路由方法,通过将token到专家的分配问题转化为最优传输问题,并引入约束以确保专家利用率均衡,从而在不依赖辅助平衡损失的情况下提升稀疏专家混合模型的性能。
Comments 12 pages, 5 figures
wa-hls4ml: 一个用于hls4ml资源和延迟估计的基准及替代模型
发表机构 * Fermi National Accelerator Laboratory(费米国家加速器实验室) ; University of California San Diego(加州大学圣地亚哥分校) ; Johns Hopkins University(约翰霍普金斯大学) ; University of Sherbrooke(Sherbrooke大学) ; Columbia University(哥伦比亚大学) ; Texas A&M University(德克萨斯A&M大学) ; European Organization for Nuclear Research (CERN)(欧洲核子研究中心(CERN))
AI总结 本文提出了一个用于评估ML加速器资源和延迟的基准wa-hls4ml,并介绍了基于图神经网络和Transformer的替代模型,用于预测ML加速器的延迟和资源使用情况。
Comments 30 pages, 18 figures
逆熵最优运输通过数据似然最大化解决半监督学习
发表机构 * Institute for Advanced Study(高级研究院) ; National Research Council Canada(加拿大国家研究理事会) ; University of Toronto(多伦多大学) ; St. Petersburg State University(圣彼得格勒国立大学) ; Skolkovo Institute of Science and Technology(斯克罗夫诺技术研究所) ; Kazan Federal University(卡兹兰卡联邦大学)
AI总结 本文提出了一种名为EBiEOT的新学习范式,通过数据似然最大化技术无缝整合配对和非配对数据,解决了半监督学习中的数据获取难题,并证明了该方法在理论上能够以任意小的误差恢复真实条件分布。
HOPSE:可扩展的高阶位置和结构编码器用于组合表示
发表机构 * Guillermo Bernárdez University California Santa Barbara(Guillermo Bernárdez 卡尔弗大学圣巴bara分校) ; Sapienza University of Rome(罗马萨皮恩扎大学) ; Universitat Politèqnica de Catalunya(加泰罗尼亚理工大学) ; University of Fribourg(弗里堡大学) ; Aalto University(阿alto大学) ; University California Santa Barbara(加州圣巴bara大学) ; Intelligent Maintenance and Operations Systems, EPFL(EPFL智能维护与操作系统)
AI总结 本文提出HOPSE,一种无需消息传递层的框架,通过Hasse图分解在任意高阶域上生成高效且表达能力强的编码,实现了在组合表示规模线性增长的同时保持HOMP方法的表达能力和排列等价性,实验表明其在分子和拓扑基准上表现优异且速度更快。
关于深度等变网络的通用性
发表机构 * University of Trento(特伦托大学) ; Fondazione Bruno Kessler(布鲁诺·凯瑟勒基金会) ; PUC Chile(智利天主教大学) ; Northeastern University(东北大学)
AI总结 本文研究了等变神经网络的通用性问题,提出在分离约束下,通过全连接读出层可实现连续函数的近似,并引入了更严格的逐元素分离性准则,证明了足够深度或适当读出层可使等变网络在逐元素分离性范围内实现通用性。
Comments Published as a conference paper at ICLR 2026
基于激活信息的帕累托引导低秩压缩用于高效LLM/VLM
发表机构 * University of California-Santa Barbara(加州大学圣芭芭拉分校) ; Amazon(亚马逊)
AI总结 本文提出了一种基于激活信息的帕累托引导低秩压缩方法,通过理论分析和算法设计,在保持模型精度的同时提升LLM和VLM的压缩效率和推理速度。
扩展神经元,而非参数
发表机构 * University of Washington(华盛顿大学) ; Microsoft Research(微软研究院)
AI总结 通过增加神经元数量而不增加非零参数总数,减少特征干扰,从而提高网络性能,并在多种模型中验证了有效性。
Comments Accepted to the 43rd International Conference on Machine Learning (ICML 2026). 9 pages, 6 figures. Code available at https://github.com/Shavit-Lab/Expand-Neurons
通过最优脑损伤遮蔽实现抗标签噪声学习
发表机构 * Hohai University(河海大学)
AI总结 本文提出了一种基于最优脑损伤理论的抗标签噪声学习方法,通过遮蔽冗余连接来减少噪声梯度传播,提升模型鲁棒性。
开源人工智能中开放协作的图谱:映射14个开源大语言模型项目的实践、动机与治理
发表机构 * RISE Research Institutes of Sweden AB(瑞典RISE研究机构) ; University of Oxford(牛津大学)
AI总结 本文通过分析14个开源大语言模型项目的开发与再利用生命周期中的开放协作实践,揭示了协作方法、动机和治理结构的多样性,以及开放源代码AI并非单一属性,而是协作组织方式在互联艺术领域、生命周期阶段和制度背景下的涌现结果。
Comments In submission
Concept-SAE: 一种可控且可逆的概念接口用于稀疏自编码器
发表机构 * The Chinese University of Hong Kong(香港中文大学)
AI总结 本文提出Concept-SAE,一种通过结构化可控接口探测用户定义概念的框架,通过将激活子空间分解为概念令牌和自由令牌,实现高保真、局部化强且解耦的概念表示,优于现有方法。
Comments Accepted by ECML PKDD 2026, the project can be found at https://github.com/RafaDD/Concept-SAE
多尺度科学数据的自适应生成流
发表机构 * Department of Mathematics, University of California, Los Angeles(加州大学洛杉矶分校数学系) ; Machine Learning Lab, Capital Fund Management(资本基金管理有限公司机器学习实验室) ; Courant Institute, New York University(纽约大学柯朗研究所)
AI总结 本文提出了一种多尺度科学数据生成模型,通过设计噪声分布和插值计划,解决多尺度傅里叶谱数据中的数值挑战,提高了生成样本的质量和效率。
注意力真的全部我们需要吗?对预训练RNN稀疏和全局注意力模型在资产定价中的实证研究
发表机构 * Department of Economics and Related Studies, Univiersity of York(经济与相关研究系,约克大学)
AI总结 本文研究了预训练RNN注意力模型在资产定价中的应用,探讨了注意力机制在捕捉时间依赖性和长期记忆方面的改进,以及在不同市场条件下的稳定性。
Comments 72 pages including appendix
重新思考分布偏移:针对表格数据的经验分析与建模
发表机构 * Department of Industrial Engineering and Operations Research(工业工程与运筹学系) ; Department of Computer Science and Technology(计算机科学与技术系) ; Decision, Risk, and Operations Division(决策、风险与运营部) ; Columbia University(哥伦比亚大学) ; Tsinghua University(清华大学)
AI总结 本文通过经验分析和建模,重新审视分布偏移问题,发现Y|X偏移在表格数据中最为常见,与机器学习文献中对X(协变量)偏移的重视形成鲜明对比,并指出鲁棒算法的性能并不优于普通方法。
Comments Forthcoming at Management Science. Conference version appeared in NeurIPS 2023, previously titled "On the Need for a Language Describing Distribution Shifts: Illustrations on Tabular Datasets"
一种基于神经隐式对比源表示的全数据和相位less数据反演可微框架
发表机构 * Department of Electronic Engineering, Beijing National Research Center for Information Science and Technology (BNRist), and State Key laboratory of Space Network and Communications(电子工程系,北京信息科学与技术国家研究中心(BNRist),空间网络与通信国家重点实验室)
AI总结 本文提出了一种基于神经隐式对比源表示的可微框架,用于全数据和相位less数据反演,通过引入轻量级残差多层感知机作为连续神经场,提升了反演精度和鲁棒性,同时通过总变分正则化将状态方程和数据方程结合,形成可微目标函数,实现了端到端的可微优化。
学习优化并保证收敛性:线性收敛算法的完整表征
发表机构 * School of Electrical Engineering and Computer Science, and Digital Futures, KTH Royal Institute of Technology, Sweden(电气工程与计算机科学学院及数字未来学院,瑞典皇家理工学院) ; Australian Centre for Robotics and School of Aerospace, Mechanical and Mechatronic Engineering, The University of Sydney, Australia(澳大利亚机器人中心及航空航天、机械与机电工程学院,澳大利亚悉尼大学) ; Department of Engineering Sciences, University of Oxford, United Kingdom(工程科学系,英国牛津大学)
AI总结 本文研究了如何通过改进算法在特定问题分布下的平均性能,提出了一种线性收敛算法的完整表征方法,展示了如何通过基线算法和可训练的指数衰减修改来实现线性收敛,并在非凸、梯度主导函数、强凸函数和多面体可行集优化中验证了其有效性。
多样性是否是可扩展机器人操作的全部需求?
发表机构 * University of Science and Technology of China(中国科学技术大学) ; Tsinghua University(清华大学) ; University of California, Berkeley(加州大学伯克利分校)
AI总结 本文研究了数据多样性在机器人学习中的作用,发现任务多样性比单任务演示量更重要,多身体预训练数据在跨身体转移中可选,专家多样性可能对策略学习产生干扰,提出分布去偏方法提升性能。
Comments Code is available at https://github.com/OpenDriveLab/AgiBot-World
时间点过程的进展:贝叶斯、神经网络和大语言模型方法
发表机构 * Center for Applied Statistics and School of Statistics, Renmin University of China(应用统计中心和中国人民大学统计学院) ; Independent Researcher(独立研究者) ; School of Computer Science, Guangdong University of Technology(广东工业大学计算机学院) ; School of Statistics and Data Science, Southeast University(东南大学统计与数据科学学院)
AI总结 本文综述了时间点过程的最新研究,从贝叶斯、深度学习和大语言模型三个角度探讨了模型设计、参数估计以及经典应用领域,并展望了未来的研究挑战和方向。
通过广义平滑性实现高效逃离鞍点的自界正则性
发表机构 * Cornell University(康奈尔大学)
AI总结 本文研究了非凸函数(不一定光滑)的一阶优化方法,提出了一种新的框架,系统分析了在广义平滑性下一阶优化算法的收敛性,首次建立了在广义平滑性下一阶方法达到二阶 stationary 点的收敛保证。
Comments Camera ready version of NeurIPS 2025 paper. 97 pages
基于拓扑的联邦学习差分隐私
发表机构 * Quantum Cloud Computing and Distributed Systems (qCLOUDS) Lab, School of Computing and Information Systems, The University of Melbourne(量子云计算与分布式系统实验室,计算与信息系统学院,墨尔本大学)
AI总结 本文研究了联邦学习中通信拓扑对差分隐私的影响,提出了一种拓扑感知的分布推理方法TADI,通过四个通道消解来隔离客户端泄露,并推导出一个加性互信息界,从而得到Fulcrum算法,该算法在非对称拓扑下优于均匀DP-SGD,在多个数据集上实现了隐私保护的提升。
Comments 16 pages, 6 figures, 2 tables. Data from the experiments and source code can be found here: https://doi.org/10.5281/zenodo.20507155
FATE:用于多变量时间序列预测的焦点调节注意力编码器
发表机构 * GAASH Research Lab(GAASH研究实验室) ; Department of Information Technology(信息科技系) ; National Institute of Technology Srinagar(斯里 Nagar国立理工学院)
AI总结 本文提出FATE,一种新的Transformer架构,用于可靠的多变量时间序列预测。FATE引入了张量化的焦点调节机制,以显式捕捉时间序列中的时空相关性,并通过两个调节分数提高可解释性,通过在七个不同现实世界数据集上基准测试,证明其在长视界多变量气象数据集上的优越性能。
自调节汽车:自动化自由流道路网络的交通控制
发表机构 * Department of Computer Science(计算机科学系) ; New York University(纽约大学) ; Indian Institute of Technology Delhi(德里印度理工学院)
AI总结 本文提出了一种基于强化学习的自调节汽车方法,通过动态调节车辆速度来优化通行能力和防止拥堵,无需新基础设施,结合经典交通流理论和微观模拟,在高保真度的PTV Vissim模拟器上实现了提高通行能力、减少延误和停车次数的改进。
GenFT:一种用于预训练基础模型的生成性参数高效微调方法
发表机构 * Department of Mathematics, Hong Kong Baptist University, Hong Kong, China(香港 Baptist 大学数学系,香港,中国) ; Department of Computer Science, Harbin Institute of Technology, Shenzhen, China(哈尔滨工业大学(深圳)计算机科学系,中国)
AI总结 本文提出GenFT,一种基于预训练权重的参数高效微调方法,通过生成任务特定的更新来利用预训练权重中的结构信息,实现高效的模型微调。
Comments paper is accepted at ICANN 2026
基于聚类的因果混合器用于多变量时间序列的在线异常检测
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 本文提出了一种基于聚类的因果混合器,用于多变量时间序列的在线异常检测,通过聚类处理通道间的相关性,结合因果混合器保持时间因果性,并开发了序列异常评分方法以提高检测准确性。
生成器介导的老虎机:面向生成式人工智能的自适应干预的汤普森采样
发表机构 * Department of Statistics, University of Michigan, Ann Arbor, MI (USA)(密歇根大学统计学系,安阿伯,MI (美国))
AI总结 本文提出了一种生成器介导的老虎机算法(GAMBITTS),用于解决生成式人工智能(GenAI)驱动的自适应干预问题。该算法通过建模治疗和奖励生成过程,利用观察到的治疗信息加速策略学习,并在模拟研究中优于传统算法。
Comments 39 pages, 12 figures
通过非负每例费舍尔分解揭示模型处理策略
发表机构 * University of North Carolina Chapel Hill(北卡罗来纳大学教堂山分校) ; University of Toronto(多伦多大学) ; Vector Institute(向量研究所)
AI总结 本文提出NPEFF方法,通过分解每例费舍尔矩阵揭示模型生成预测所用的策略,展示了NPEFF组件在语言模型和文本处理任务中的应用,并展示了如何通过扰动这些组件来干扰模型处理,同时通过消融研究和实验验证了NPEFF在分析和缓解去学习的副作用以及研究上下文学习中的优势。
懒惰但有效:基于异构数据的协同个性化联邦学习
发表机构 * Artificial Intelligence Laboratory EPFL(苏黎世联邦理工学院人工智能实验室) ; Telenor Research(Telenor研究)
AI总结 本文提出了一种简单有效的个性化联邦学习框架pFedLIA,通过使用计算效率高的影响近似方法'Lazy Influence',在分布式 manner 中对客户端进行聚类,从而在模型聚合前协同训练模型以捕捉客户端特定的数据模式,实验证明其在非iid数据集上能有效恢复全局模型性能,并在多个基准任务中优于现有基线方法。
Comments Accepted at the International Joint Conference on Neural Networks (IJCNN), IEEE, 2025
通过频域见解实现多样化模态和模型的全面可靠特征归因
发表机构 * School of Computational Science, Wuhan University(武汉大学计算科学学院) ; Brain Research Center, Wuhan University(武汉大学脑科学研究中心) ; College of Information Science and Technology (School of Cyber Science and Technology), Shihezi University(石河子大学信息科学学院(网络安全科学与技术学院)) ; Xinjiang Production and Construction Corps Key Laboratory of Computing Intelligence and Network Information Security Open Fund(新疆生产建设兵团计算智能与网络信息安全重点实验室开放基金)
AI总结 本文提出了一种新的可解释性方法FreqX,结合信号处理和信息理论,以解决个性化联邦学习中非IID数据、异构设备、缺乏公平性和贡献不明确等问题,通过频域分析提高解释性效率和准确性。
Comments 16pages, 9 figures
RTD-Lite:用于学习任务中比较加权图拓扑结构的可扩展分析
发表机构 * Skoltech, AI Foundation and Algorithm Lab(斯克里普丘尔技术学院,人工智能基础与算法实验室) ; Skoltech, AIRI(斯克里普丘尔技术学院,人工智能研究机构) ; Skoltech, CNRS(斯克里普丘尔技术学院,法国国家科学研究中心)
AI总结 本文提出RTD-Lite算法,通过最小生成树辅助图在O(n²)时间内高效比较加权图的拓扑特征,适用于降维和神经网络训练等任务,实验表明其在识别拓扑差异和减少计算时间方面优于现有方法。
Comments Accepted for AISTATS 2025
Everything, Everywhere, All at Once: Is Mechanistic Interpretability Identifiable?
发表机构 * Université Grenoble Alpes, CNRS, Grenoble INP, LIG(格勒诺布尔阿尔卑斯大学、国家科学研究中心、格勒诺布尔INP、实验室LIG)
AI总结 本文探讨了在机械可解释性(MI)框架下,给定行为是否具有唯一解释的问题,通过统计可识别性理论分析了MI解释的可识别性,并提出了两种主要策略及实验结果。
统一数据集剪枝与蒸馏以实现高效大规模压缩
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 本文提出一个统一的数据集压缩基准,探讨数据集剪枝与蒸馏的收敛趋势,发现软标签蒸馏在小数据集上表现不如剪枝,提出基于硬标签的数据集压缩方法,通过PCA框架提升图像质量和存储效率。
Comments Accepted by ICML 2026
利用稀疏传感器网络全面监测空气污染热点
发表机构 * New York University(纽约大学) ; Google Research(谷歌研究) ; Toyota InfoTechnology Center(丰田信息技术中心) ; Kaiterra Inc(Kaiterra公司) ; University of Warwick(沃里克大学) ; Yale University(耶鲁大学)
AI总结 本文通过结合预测建模和机理方法,利用新增的低成本传感器,发现新德里现有传感器网络之外的189个隐藏热点,并利用空间时间克里金法进行预测,同时开发了高斯烟雾扩散模型以解释热点形成机理,为资源受限环境下的空气污染管理提供了数据驱动和机理结合的解决方案。
等变神经网络的分离能力
发表机构 * University of Trento(特伦托大学) ; Fondazione Bruno Kessler(布鲁诺·凯斯勒基金会) ; University of Oxford(牛津大学) ; University of Venice(威尼斯大学)
AI总结 本文研究了等变神经网络的分离能力,分析了架构和超参数对分离能力的影响,发现非多项式激活函数在表达能力上等价,深度在阈值后不再提升分离能力,而隐表示的块分解会影响分离能力。
Comments Published as a conference paper at ICLR 2025
LIA: 在联邦学习中使用懒惰影响近似进行隐私保护的数据质量评估
发表机构 * École Polytechnique Fédérale de Lausanne (EPFL)(瑞士联邦理工学院洛桑校区) ; Telenor Research(Telenor研究) ; University of Southern California(南加州大学)
AI总结 本文提出了一种新的隐私保护数据质量评估方法LIA,通过懒惰影响近似技术过滤和评分数据,在保持隐私的前提下有效识别低质量、损坏或恶意数据。
Comments Proceedings of the 2024 IEEE International Conference on Big Data (IEEE BigData 2024). A preliminary version of this work received the Best Paper Award at the International Workshop on Trustworthy Federated Learning at IJCAI (FL-IJCAI) 2023
分段线性函数的分解多面体
发表机构 * Ruhr-Universität Bochum(博德姆鲁尔大学) ; Max Planck Institute MiS(马克斯·普朗克研究所MiS) ; University of Technology Nuremberg(纽伦堡技术大学)
AI总结 本文研究如何将连续分段线性函数分解为两个凸分段线性函数的差,通过固定多面体复形来确定非线性区域的可能位置,并证明分解集合形成一个多面体,从而为优化和神经网络理论提供新的见解。
GridPE: 一种基于网格细胞的统一位置嵌入方法用于任意维度空间
发表机构 * New York University(纽约大学) ; Peking University(北京大学) ; Imperial College London(伦敦帝国学院) ; Tongji University(同济大学)
AI总结 本文提出GridPE,一种受哺乳动物空间认知中六边形周期编码启发的新型位置嵌入框架,旨在解决高维时空任务中位置嵌入的理论保障问题,通过结合计算神经科学原理和调和分析,为任意维度空间提供统一的位置嵌入解决方案。
通过线性扰动损失最小化进行探索
发表机构 * University of Alberta(阿尔伯塔大学)
AI总结 本文提出了一种基于线性扰动损失的探索方法EVILL,通过求解线性扰动的正则化负对数似然函数的最小化问题,解释了随机奖励扰动为何能产生有效的多臂老虎机算法,并展示了数据依赖扰动如何使EVILL在理论和实践中达到与Thompson采样类参数扰动方法相当的性能。
Comments Updated with erratum note: Appendix I contains a gap in the proof; all main-paper claims remain valid via the corrected argument of Perneczky, Abeille & Janz (2026, arXiv:2606.00431)
二元高斯卷积合成:一种基于LLM的数据增强框架,用于慢性肾病早期透析预测
发表机构 * Department of Industrial & Management Systems Engineering, West Virginia University(威斯康星大学工业与管理系统工程系) ; Department of Electrical and Computer Engineering, Concordia University(康科迪亚大学电气与计算机工程系) ; Department of Computer Science, University of California, Davis(加州大学戴维斯分校计算机科学系) ; School of Mathematical & Data Sciences, West Virginia University(威斯康星大学数学与数据科学学院) ; School of Systems Science and Industrial Engineering, The State University of New York at Binghamton(纽约州立大学布法罗分校系统科学与工业工程学院) ; H. Milton Stewart School of Industrial and Systems Engineering, Georgia Institute of Technology(佐治亚理工学院H.米尔顿·斯图尔特工业与系统工程学院)
AI总结 本文提出Binary Gaussian Copula Synthesis (BGCS),一种专为二元临床数据设计的两阶段数据增强方法,通过生成合成少数类样本并过滤不合理的样本,提高了早期透析预测的性能。
半离线强化学习用于优化文本生成
发表机构 * Changyu Chen, Xiting Wang, Yiqiao Jin, Victor Ye Dong, Li Dong, Jie Cao, Yi Liu, Rui Yan(未知机构)
AI总结 本文提出了一种半离线强化学习方法,平衡了探索能力和训练成本,并在优化成本、渐近误差和过拟合误差界方面实现了最优的强化学习设置。
Comments In Proceedings of the 40th International Conference on Machine Learning (ICML 2023)
在非马尔可夫世界中的有限资源分配:产科与儿童保健的案例
发表机构 * Harvard University(哈佛大学) ; Google Research(谷歌研究)
AI总结 本文研究了在非马尔可夫环境下如何通过时间序列方法优化资源分配,提出了一种新的时间序列臂排名指数(TARI)策略,以提高产科和儿童保健项目的参与度和依从性。
Comments Proceedings of the 32nd International Joint Conference on Artificial Intelligence (IJCAI 2023)
随机时间序列中分形结构的解析确定
发表机构 * Laboratoire de Psychologie Cognitive ( UMR --6146) CNRS \& Aix--Marseille Universit\'e I, Marseille, France
AI总结 本文提出了一种基于贝叶斯评估的分析框架,用于客观准确地推断时间序列的分形结构,同时推导出一种优于现有方法的Hurst指数最大似然估计器。
Comments 9 pages, 4 figures