Equilibrium Reasoners: Learning Attractors Enables Scalable Reasoning
平衡推理器:学习吸引子使推理可扩展
发表机构 * CMU(卡内基梅隆大学)
AI总结 本文提出平衡推理器(EqR),通过学习任务条件的吸引子来实现可扩展推理,该方法在测试时无需外部验证器或任务特定先验,通过增加深度和广度实现推理能力的提升,从而在Sudoku-Extreme上将准确率从2.6%提升至超过99%。
Comments ICML 2026
平衡推理器:学习吸引子使推理可扩展
发表机构 * CMU(卡内基梅隆大学)
AI总结 本文提出平衡推理器(EqR),通过学习任务条件的吸引子来实现可扩展推理,该方法在测试时无需外部验证器或任务特定先验,通过增加深度和广度实现推理能力的提升,从而在Sudoku-Extreme上将准确率从2.6%提升至超过99%。
Comments ICML 2026
量化超参数迁移与嵌入层学习率的重要性
发表机构 * Department of Physics, University of Maryland, College Park(马里兰大学物理系) ; Department of Computer Science, University of Maryland, College Park(马里兰大学计算机科学系) ; Joint Quantum Institute, University of Maryland, College Park(马里兰大学联合量子研究所) ; Meta Superintelligence Labs, Fundamental AI Research(Meta超智能实验室,基础人工智能研究)
AI总结 本文研究了超参数迁移的量化方法,通过三种指标评估超参数迁移的质量,发现Maximal Update(μP)参数化在训练中通过最大化嵌入层学习率提升了超参数迁移质量,而权重衰减虽改善了缩放定律拟合,但会降低外推鲁棒性。
Comments 10+28 pages, 5+17 figures
EvoStruct: 通过蛋白质语言模型适应桥接进化和结构先验以进行抗体CDR设计
发表机构 * Georgia State University, Atlanta, USA(佐治亚州立大学,亚特兰大,美国) ; Georgia Institute of Technology, Atlanta, USA(佐治亚理工学院,亚特兰大,美国)
AI总结 本文提出EvoStruct方法,通过蛋白质语言模型适应桥接进化和结构先验,解决抗体CDR设计中的词汇崩溃问题,提升了氨基酸恢复率和降低困惑度。
Velocityformer: 用于宇宙学速度重建的破缺对称性匹配等价图变换器
发表机构 * ETH Zürich(苏黎世联邦理工学院)
AI总结 该研究提出Velocityformer,一种等价图变换器架构,通过匹配观测数据的破缺对称性来提高宇宙学速度重建的精度,其在速度相关系数r上比标准线性理论基线提高了35%。
AiraXiv:一个面向人类和AI科学家的AI驱动的开放获取平台
发表机构 * Westlake University(西湖大学) ; Zhejiang University(浙江大学) ; Shanghai Innovation Institution(上海创新研究院) ; Zhongguancun Academy(中关村学院)
AI总结 本文提出AiraXiv平台,通过AI驱动的开放预印本、AI增强的分析与评审以及读者反馈,解决传统学术出版系统在AI时代面临的研究产出增长和可扩展性挑战。
关系预测任务是否需要固定模式图?关系深度学习中的全分辨率图结构学习
发表机构 * SKLCCSE, School of Computer Science and Engineering, Beihang University, Beijing, China(信息与电子学院,北京航空航天大学,北京,中国) ; Key Lab of Education Blockchain and Intelligent Technology, Ministry of Education, Guangxi Normal University, Guilin, China(教育区块链与智能技术重点实验室,教育部,广西师范大学,桂林,中国)
AI总结 本文提出了一种全分辨率且可优化的图结构学习框架FROG,用于关系深度学习,将关系结构学习建模为可学习的表角色建模问题,允许表作为节点和边在信息传递中发挥作用,并设计了基于角色的信息传递机制,以捕捉关系语义,同时通过功能依赖约束确保语义一致性,实验表明该方法在多个下游任务中优于现有方法。
Comments Accepted by the Forty-third International Conference on Machine Learning (ICML2026)
你只需要最小的RLVR训练:通过秩-1轨迹来扩展LLMs
发表机构 * University of Virginia(弗吉尼亚大学) ; Washington University in St. Louis(华盛顿大学圣路易斯分校)
AI总结 本文研究了通过秩-1轨迹扩展LLMs的方法,发现RLVR参数轨迹具有极低的秩和高度可预测性,并提出RELEX方法,通过简单的线性回归在无需训练模型的情况下实现高效的超量扩展。
Comments preprint. Code: https://github.com/weizhepei/RELEX
DelTA: 一种用于可验证奖励强化学习的判别性token信用分配
发表机构 * Gaoling School of Artificial Intelligence, Renmin University of China(中国人民大学人工智能学院 Gallagher 学院) ; Ant International(蚂蚁国际)
AI总结 本文提出DelTA方法,通过估计token系数来增强特定侧的token梯度方向,从而改进可验证奖励强化学习中的token概率更新,提升了模型在数学基准测试中的性能。
一种基于激活函数的加权最小二乘GNSS定位机器学习框架
发表机构 * Department of Electrical and Computer Engineering, McGill University(麦吉尔大学电气与计算机工程系)
AI总结 本文提出了一种基于激活函数的加权最小二乘GNSS定位机器学习框架,通过使用信号质量指标作为训练特征,利用集成学习算法识别低质量信号,并通过激活函数将机器学习预测的分数转换为适当的权重以提高定位精度。
注意仿真到现实的差距并像科学家一样思考
发表机构 * Amazon SCOT(亚马逊SCOT团队) ; Yale University(耶鲁大学) ; Duke University(杜克大学)
AI总结 本文研究了在仿真和现实之间如何补充实验以减少价值差距,提出了Fisher-SEP方法,并通过两个案例研究展示了其应用。
通过可解释的评分标准嵌入缓解标签偏差
发表机构 * Harvard Kennedy School(哈佛肯尼迪学校) ; Harvard University(哈佛大学)
AI总结 本文提出通过可解释的评分标准嵌入来缓解标签偏差问题,通过理论和实验证明该方法在合理条件下能减少标签偏差并提升群体质量评估。
神经网络的近似理论:旧与新
AI总结 本文综述了神经网络近似理论的发展,包括传统单隐层网络的密度结果、量化误差界限以及深度-宽度权衡,还探讨了Kolmogorov-Arnold网络等新架构的理论性质。
Comments 31 pages, 4 figures
torchtune: 一种基于PyTorch的后训练库
发表机构 * PyTorch ; Meta ; Stanford(斯坦福) ; Meta-FAIR
AI总结 本文介绍了torchtune,一种基于PyTorch的后训练库,旨在简化大语言模型的后训练生命周期,提供高效的微调、实验和部署流程,通过模块化和可扩展性提升性能和灵活性。
Comments 14 pages
基于神经网络的负二项回归用于每周地震预测:每个单元的分散估计和尾部风险评估
AI总结 本文提出了一种基于神经网络的地震预测方法,通过每个单元的分散参数估计和尾部风险评估,改进了传统泊松分布的假设,提高了极端事件预测的准确性。
Comments 28 pages, 9 figures. Source code available at https://github.com/Al1mkaYandere/seismic-probabilistic-modeling
高斯sheaf神经网络
发表机构 * Getulio Vargas Foundation(盖图利奥·瓦格斯基金会) ; MBZUAI(穆斯林人工智能研究所)
AI总结 本文提出高斯sheaf神经网络(GSNNs),通过将高斯分布的均值和协方差矩阵作为节点特征,解决传统GNN在处理概率分布特征时的不足,提出新的拉普拉斯算子并进行实验验证。
roto 2.0:机器人触觉奥林匹克
发表机构 * University of Edinburgh(爱丁堡大学)
AI总结 本文提出roto 2.0,一个基于触觉的强化学习基准,旨在通过四种不同的机器人形态(16-DOF到24-DOF)标准化触觉强化学习,专注于端到端的'盲'操作,仅使用本体感觉和触觉传感,不使用状态信息或蒸馏。研究展示了显著的性能提升,盲控代理在10秒内完成13次保定球旋转,比当前最先进的速度快了一个数量级。通过开源环境和经过充分调优的基线,降低了进入门槛,使研究人员能够优先考虑基本算法挑战而非繁琐的强化学习调优。
Comments Accepted to 7th ViTac Workshop, ICRA 2026
多项式时间鲁棒多类线性分类下的高斯边缘分布
发表机构 * University of Wisconsin-Madison(威斯康星大学麦迪逊分校)
AI总结 研究在高斯分布下多类线性分类器的无偏学习任务,提出了一种多项式时间鲁棒学习算法,解决了多类分类中误差保证的问题,特别是在k≥3的情况下。
自适应信号复苏:用于稀疏视觉网络的通道级后剪枝修复
发表机构 * Department of Mathematical and Statistical Sciences, Marquette University(马歇尔大学数学与统计科学系) ; The University of Texas at Austin(德克萨斯大学奥斯汀分校) ; Cornell Ann S. Bowers College of Computing and Information Science, Cornell University(康奈尔大学安·S·博尔斯计算与信息科学学院)
AI总结 本文提出了一种无需训练的通道级修复方法ASR,用于解决高稀疏度下因后剪枝修复粒度不匹配导致的精度下降问题,通过估计每个输出通道的方差匹配修正并结合数据驱动的收缩规则,提升稀疏视觉网络的性能。
HiRes: 反应条件推荐的可检查先例记忆
发表机构 * Mstack AI
AI总结 HiRes通过结合图编码器、变换感知交叉注意力、多流反应融合和k-NN检索层,实现了反应条件推荐的高准确率和可解释性,其在催化剂、溶剂和试剂的Top-1准确率分别达到0.929、0.534和0.530,优于现有方法。
FedCritic: 一种基于联邦批评学习的多小区OFDMA资源分配方法用于6G
发表机构 * School of Electrical Engineering and Computer Science, University of Ottawa(奥克塔维亚大学电气工程与计算机科学学院)
AI总结 本文研究了6G超密集网络中因频率重用加剧的小区间干扰问题,提出FedCritic框架,通过轻量级基于干扰图的参数平均实现去中心化执行,从而在不依赖中央协调器的情况下稳定估计价值函数,提升信号干扰噪声比(SINR)和小区边缘速率,提高网络总和速率和公平性。
Comments Submitted to IEEE for possible publication
十二篇LLM代理基准测试论文披露了什么:一项初步审计和开放评分方案
发表机构 * Research Division, BrightMind AI(BrightMind AI研究部) ; Texas Tech University(德克萨斯理工大学) ; University of Texas at Arlington(德克萨斯大学阿灵顿分校)
AI总结 本文通过分析十二篇知名LLM代理基准测试论文,揭示了这些论文在评估方法披露方面的不足,设计了一种开放评分方案以提高透明度和可重复性。
Comments Pilot audit of 12 LLM agent benchmark papers; schema, codebook, and per-paper scoring sheet released. Submission to IEEE Big Data 2026
记忆、收敛与泛化在生成模型中的表现
发表机构 * INRIA Paris & DI ENS, PSL University, Paris, France(巴黎国家信息与自动化研究所(INRIA)及巴黎高等师范学院(ENS)与巴黎大学(PSL University)) ; International School of Advanced Studies (SISSA), Trieste, Italy(意大利国际高级研究学院(SISSA))
AI总结 本文研究了生成模型中记忆、收敛和泛化的区别,通过线性生成模型的分析,发现当样本数与输入维度成线性关系时,模型会从记忆过渡到泛化,并揭示了泛化包含两个不同目标:匹配数据分布的主体和恢复数据的主潜在因素。
迈向稳健和自主的网络:AI原生6G的BlueSky愿景
发表机构 * Nokia(诺基亚)
AI总结 本文提出了一种AI原生6G的BlueSky愿景,旨在将人工智能原生整合到6G中,从'为AI的网络'转向'为网络的AI',通过基础模型和协作多智能体系统,将网络管理转化为统一的多模态多任务优化问题,推动6G向智能自维持通信基础设施发展。
Comments Accepted at KDD 2026
关于PDE诱导度量的一步Wasserstein引导生成模型的正则性和泛化性
发表机构 * Department of Mathematics, The University of Hong Kong(香港大学数学系) ; Division of Mathematical Sciences, School of Physical and Mathematical Sciences, Nanyang Technological University(南洋理工大学数学科学系) ; Department of Mathematics, University of California at Irvine(加州大学 Irvine 分校数学系)
AI总结 本文研究了一步Wasserstein引导生成模型在处理PDE诱导概率度量时的正则性和泛化性,通过理论框架证明了运输映射的正则性和生成模型的泛化性质,并通过实验验证了理论结果。
解耦生成与回归在可控图像恢复中的随机插值
发表机构 * Tongji University(同济大学) ; Fudan University(复旦大学)
AI总结 本文提出DiSI框架,通过解耦随机插值过程中的生成与回归组件,实现从纯回归到全生成的连续可控过渡,提升图像恢复任务的效率和精度。
Comments 44 pages, 16 figures, 16 tables
闭环动态驾驶数据混合用于真实-合成协同训练
发表机构 * Li Auto(力汽车) ; HKUST(香港科技大学) ; HKUST (GZ)(香港科技大学(广州))
AI总结 本文提出了一种闭环动态数据混合方法,通过动态优化过程调整训练数据混合比例,以提升模型性能,解决了在有限预算下优化数据混合的关键问题。
基于切换电压的单相和混合局部放电分类的AWA-CNN框架
AI总结 本文提出了一种基于AWA模式表示的CNN框架,用于在切换电压激励下对局部放电源进行分类,通过分析脉冲幅度、宽度和面积生成可视化模式,实现对六种不同放电源的高准确率分类。
通过物理引导的主动学习实现数据高效的神经算子训练
发表机构 * University College London(伦敦大学学院) ; Atomic Energy Authority(原子能局)
AI总结 本文提出了一种基于物理的主动学习方法,用于提高神经算子训练的数据效率,通过利用偏微分方程残差来指导数据选择,在1D Burgers方程和2D可压缩纳维-斯托克斯方程的数值实验中验证了该方法在数据效率上的优越性。
Comments Presented at the ICLR 2026 Workshop on Artificial Intelligence and Partial Differential Equations
半参数高效双层梯度估计
发表机构 * Université Grenoble Alpes, Inria, CNRS, Grenoble INP, LJK(格勒诺布尔阿尔卑斯大学、法国国家科学研究中心、格勒诺布尔INP、LJK实验室) ; Gatsby Computational Neuroscience Unit, University College London(伦敦大学学院(UCL)的Gatsby计算神经科学单位) ; Cornell University(康奈尔大学) ; Netflix Research(Netflix研究)
AI总结 本文提出一种半参数去偏理论,用于消除双层梯度估计中的一阶偏差,通过交叉拟合的正交超梯度估计器实现了渐近正态性,并在二次损失下简化为基于条件均值 nuisances 的双重鲁棒分数。
快速且稳定的三角矩阵求逆用于Delta规则线性变换器
发表机构 * Computing Systems Lab(计算系统实验室) ; Huawei Technologies Switzerland(华为技术瑞士)
AI总结 本文研究了Delta规则线性变换器中快速且稳定的三角矩阵求逆方法,通过分析直接和迭代算法,探讨了矩阵乘法丰富的算法在现代硬件上的高效利用,实验验证了不同方法在低精度浮点表示下的性能和稳定性,实现了三角矩阵求逆的4.3倍加速,从而提升整个层级性能并保持端到端模型精度。
Comments Preprint
刺激对称性可能混淆表征相似性分析
发表机构 * Center for Brain Science(脑科学中心) ; Society of Fellows(fellows 社会) ; Harvard University(哈佛大学)
AI总结 研究探讨了网络输入对称性如何影响表征相似性矩阵(RSMs)的分析,指出不同配置可能导致不同的RSMs,并展示了随机梯度下降或能量正则化如何生成稀疏漂移代码,从而导致漂移RSMs。
Comments 40 pages
优化的联邦知识蒸馏与分布式神经架构搜索
发表机构 * Interdisciplinary Centre for Security, Reliability and Trust (SnT), University of Luxembourg(安全、可靠与信任跨学科研究中心(SnT),卢森堡大学) ; Blekinge Institute of Technology(布莱金厄理工大学) ; ADSLabs, Umea University(ADSLabs,乌梅亚大学)
AI总结 本文提出FedKDNAS框架,结合客户端侧神经架构选择与服务器协调的知识蒸馏,以解决联邦学习中数据异质性、系统异质性和通信效率问题,通过提升准确率和效率的帕累托效率。
TextReg: 通过正则化的文本空间优化缓解提示分布过拟合
发表机构 * Georgia Institute of Technology(佐治亚理工学院) ; University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校)
AI总结 本文研究了提示分布过拟合问题,提出TextReg框架通过正则化的文本梯度实现软惩罚目标,结合双证据梯度净化、语义编辑正则化和正则化引导的提示更新,提升模型在分布外(OOD)任务上的泛化能力。
Comments Code: https://github.com/luchengfu6/TextReg
CRAFT: 用于联邦训练的冲突解决聚合
发表机构 * Department of Mathematics, Friedrich-Alexander-Universität Erlangen-Nürnberg(埃朗根-纽伦堡费里德里希-亚历山大大学数学系) ; School of Computation, Information and Technology, Technical University of Munich(慕尼黑技术大学计算、信息与技术学院) ; Munich Center for Machine Learning(慕尼黑机器学习中心)
AI总结 本文提出CRAFT框架,通过将全局更新视为几何校正问题,解决联邦学习中冲突客户端更新的聚合问题,提升全局模型准确率并减少客户端间性能差异。
分析深度神经网络分布鲁棒性的新框架
发表机构 * Microsoft(微软) ; Ashoka University(阿什oka大学)
AI总结 本文提出了一种新框架,通过研究层权重与激活之间的相互作用来分析和量化深度神经网络的分布鲁棒性,展示了该框架在CIFAR-10和ImageNet上模型的实用性,并表明所提指标能区分记忆训练数据和未记忆的网络。
Comments 9 pages, 6 figures, 3 tables
DeCoR:基于强化学习的城市街道设计与控制联合优化
发表机构 * University of Tennessee, Knoxville, TN, USA(田纳西大学,诺克斯维尔分校) ; University of North Carolina at Charlotte, Charlotte, NC, USA(北卡罗来纳大学夏洛特分校) ; University of California, Riverside, CA, USA(加州大学河滨分校)
AI总结 本文提出DeCoR框架,通过强化学习联合优化城市街道的过街横道布局和网络级信号控制,减少了行人到达最近过街横道的时间,并显著降低了行人和车辆等待时间。
Comments 22 pages, 8 figures
从电路证据到机制理论:一种归纳逻辑方法
发表机构 * Department of Computer Science, University of Manchester(曼彻斯特大学计算机科学系) ; Idiap Research Institute(Idiap研究机构) ; CRUK National Biomarker Centre, University of Manchester(曼彻斯特大学癌症研究联盟国家生物标志物中心)
AI总结 本文提出了一种基于归纳逻辑的方法,通过将电路解释视为归纳理论构建,为累积的机制科学提供形式化基础设施。该方法通过因果功能签名和建筑签名,明确机制主张,并在不同模型规模之间实现可移植性。
Comments 27 pages, 10 Figures, 14 Tables
通过与健康对照组对比自动发现疾病亚组
发表机构 * NeuroSpin(神经旋) ; Université Paris-Saclay(巴黎-萨克勒大学) ; CEA(法国原子能委员会) ; LTCI ; Institut Polytechnique de Paris(巴黎高等理工学院)
AI总结 本文提出了一种通过对比患者与健康对照组来发现可解释且同质的疾病亚组的方法,该方法在医学影像数据集上展示了改进的亚组估计质量。
Comments Accepted to Data Mining and Knowledge Discovery, ECML-PKDD 2026 Journal Track
TimeSRL: 通过语义RL调优的LLM实现通用的时间序列行为建模 -- 一项心理健康应用的案例研究
发表机构 * Columbia University(哥伦比亚大学) ; University of North Carolina at Chapel Hill(北卡罗来纳大学教堂山分校) ; Yale University(耶鲁大学) ; University of California, Los Angeles(加州大学洛杉矶分校) ; Google(谷歌) ; University of Virginia(弗吉尼亚大学)
AI总结 本文提出TimeSRL,一种两阶段LLM框架,通过显式的语义瓶颈路由预测,将原始信号抽象为高级自然语言,从而预测行为结果,该方法在心理健康预测中实现了最先进的跨群体泛化性能。
双因子线性变换器模型的大步训练动态
发表机构 * Department of Statistics, University of California, Davis(加州大学戴维斯分校统计学系)
AI总结 本文研究了双因子线性变换器模型在大学习率下的训练动态,通过分析发现大步长学习率可以改变变换器的训练吸引子,而非仅仅加速收敛,可能在稳定性阈值之外导致训练进入循环、有界混沌或发散。
表格基础模型的机理研究
发表机构 * Morgan Stanley(摩根大通)
AI总结 本文研究了不同架构的表格基础模型在分类和回归任务中的准确性收敛问题,揭示了模型内部算法、对称性来源以及扰动鲁棒性的机理,发现先前指出的表示崩溃并非实际问题。
在线强化学习需要多少?用于RLVR中离线偏好优化的信息性回放
发表机构 * TCS Research Department of CSE(TCS计算机科学系研究部) ; IIT Madras(印度理工学院马德拉斯分校) ; Department of Data Science & AI(数据科学与人工智能系) ; Wadhwani School of Data Science & AI(Wadhwani数据科学与人工智能学院)
AI总结 本文提出G2D方法,通过短时GRPO预热、构建静态偏好数据集和离线DPO微调,以较低的计算成本实现优于GRPO的性能,强调偏好数据信息性而非数量的重要性。
网络上的Llamas:基于WebGPU的内存高效、性能可移植和多精度LLM推理
发表机构 * Microsoft Research(微软研究院) ; UC Santa Cruz(加州大学圣克鲁兹分校)
AI总结 本文提出LlamaWeb,一种基于WebGPU的LLM推理框架,通过静态内存规划和高效模型加载减少内存开销,支持多种模型权重格式,实现了内存高效、性能可移植的LLM推理。
Comments 19 pages, 11 figures, 5 tables
CODA:将Transformer块重写为GEMM-epilogue程序
发表机构 * Massachusetts Institute of Technology(麻省理工学院) ; Princeton University(普林斯顿大学) ; Together AI ; Meta
AI总结 本文提出CODA,一种将Transformer中的非注意力计算重写为GEMM-epilogue程序的GPU内核抽象,以提高训练效率和硬件利用效率。
MeMo:记忆作为模型
发表机构 * Institute of Data Science, National University of Singapore(数据科学研究院,新加坡国立大学) ; Integrative Sciences and Engineering Programme, NUSGS(整合科学与工程计划,NUSGS) ; Agency for Science, Technology, Research (A*STAR)(科技研究局(A*STAR)) ; Department of Computer Science, National University of Singapore(计算机科学系,新加坡国立大学) ; University of Tokyo(东京大学) ; Liquid AI ; CSAIL, Massachusetts Institute of Technology(CSAIL,麻省理工学院) ; AI Singapore ; Singapore-MIT Alliance for Research and Technology Centre, Singapore(新加坡-麻省理工学院研究与技术中心,新加坡)
AI总结 本文提出MeMo框架,通过在不改变LLM参数的情况下将新知识编码到专用记忆模型中,解决了大型语言模型在需要及时领域特定信息的应用中的问题,同时具备处理复杂跨文档关系、抗检索噪声、避免灾难性遗忘、无需访问LLM权重或输出logits以及检索成本与语料库大小无关等优势。
Comments MeMo augments any LLM with up-to-date or domain-specific knowledge via a trained memory model, avoiding costly retraining, mitigating catastrophic forgetting, and remaining robust to retrieval noise
扩散模型中的临界减慢现象
发表机构 * Laboratoire de Physique Statistique, École normale supérieure, PSL Research University(统计物理实验室,巴黎高等师范大学,PSL研究大学) ; Department of Physics, Duke University(杜克大学物理系) ; Department of Chemistry, Duke University(杜克大学化学系)
AI总结 本文研究了扩散模型在统计场理论O(n)模型中的应用,揭示了训练过程中参数学习的临界减慢现象,并通过引入局部得分近似方法,展示了通过适当架构设计可以克服这一现象,为统计物理中的采样方法提供了可控的改进框架。
Comments 17 pages, 8 figures
DECO:稀疏专家混合模型在端侧设备上实现密集级性能
发表机构 * Dept. of Comp. Sci. & Tech., Institute for AI, Tsinghua University, Beijing, China(计算机科学与技术系,人工智能研究院,清华大学,北京,中国)
AI总结 本文提出DECO,一种稀疏的专家混合模型,能够在相同的总参数预算和训练token数量下,实现与密集Transformer相当的性能,并在端侧设备上实现高效部署。
Comments 15 pages, 10 figures, 12 tables
神经网络过参数化极限下牛顿方法的收敛性分析
发表机构 * Mathematical Institute(数学研究所) ; University of Oxford(牛津大学) ; Department of Mathematics & Statistics(数学与统计学系) ; Boston University(波士顿大学)
AI总结 本文研究了在过参数化极限下,正则化牛顿方法训练神经网络的收敛性问题,通过分析牛顿神经切线核(NNTK)的特性,证明了在无限宽极限下,神经网络以指数速度收敛到目标数据,并解决了频谱偏置问题。
自适应正则化用于Bregman-based优化器中的稀疏性控制
发表机构 * Department of Data Science, FAU Erlangen-Nürnberg(FAU厄林根-纽伦堡数据科学系) ; International Audiolabs, FAU Erlangen-Nürnberg(FAU厄林根-纽伦堡国际声学实验室) ; School of Computation, Information and Technology, Technical University of Munich(慕尼黑技术大学计算、信息与技术学院) ; Munich Center for Machine Learning (MCML)(慕尼黑机器学习中心)
AI总结 本文提出了一种自适应正则化方法,用于在Bregman-based优化器中更精确地控制稀疏性,通过动态调整正则化参数λ,从而提高稀疏性控制的效率和准确性。
Comments 21 pages, 15 figures
切片正则化最优传输
发表机构 * The University of Texas at Austin(德克萨斯大学奥斯汀分校)
AI总结 本文提出了一种新的正则化最优传输(OT)方法,称为切片正则化最优传输(SROT)。与熵正则化最优传输(EOT)不同,SROT将正则化方向指向平滑的切片最优传输(SOT)计划。我们提供了SROT的正式定义,推导了其对偶形式,并提供了SROT的后贝叶斯解释。然后,我们开发了一种类似Sinkhorn的算法,以高效计算,保留与EOT相同的可扩展性优势。通过将可扩展的SOT计划作为先验,SROT在相同正则化水平下比EOT更准确地近似了精确的OT计划。此外,所得到的传输计划优于参考的SOT计划本身。我们还引入了由SROT引起的相应的OT分歧度,称为SROT分歧度,并分析了其拓扑和计算性质。最后,我们通过合成数据集和颜色传输任务的实验验证了我们的方法,证明SROT在近似精确OT方面优于EOT和SOT。额外的梯度流实验进一步突显了SROT分歧度的优势。
Comments 22 pages, 8 figures, 1 table
可持续性并非线性:在设备智能中量化性能、能耗和隐私的权衡
发表机构 * University of Naples Federico II(那不勒斯费德里科二世大学) ; Vrije Universiteit Amsterdam(阿姆斯特丹自由大学)
AI总结 本文研究了将大语言模型从云集群迁移到边缘设备过程中性能、能耗和隐私之间的权衡,通过实验证明模型架构对电池寿命的影响大于量化方案,并发现中等大小模型在响应质量和可持续能耗之间达到最佳平衡。
Comments Under review at Empirical Software Engineering (EMSE)
为什么自蒸馏(有时)会降低大语言模型的推理能力?
发表机构 * Microsoft Research(微软研究院) ; KAIST(韩国成均馆大学) ; Seoul National University(首尔国立大学)
AI总结 本文研究了自蒸馏在数学推理中降低大语言模型推理能力的原因,发现其通过抑制模型在推理过程中的不确定性表达,导致在未见过的问题上表现下降,强调了适当表达不确定性对鲁棒推理的重要性。
Comments Code is available at https://github.com/beanie00/self-distillation-analysis
tutor-student 强化学习:一种动态课程以实现鲁棒的深度伪造检测
发表机构 * School of Computer Science, Wuhan University(武汉大学计算机学院) ; School of Integrated Circuits, Peking University(北京大学集成电路学院) ; School of Information, Huazhong Agricultural University(华中农业大学信息学院) ; Cyberspace Institute of Advanced Technology, Guangzhou University(广州大学先进技术网络研究院)
AI总结 本文提出了一种 tutor-student 强化学习框架,通过动态优化训练课程来提高深度伪造检测的鲁棒性和泛化能力。
Comments Accepted to CVPR 2026
基于类重加权和解剖引导时间解码的ResNet-50在消化系统视频分析中的应用
发表机构 * Department of Computer Science and Biomedical Informatics, University of Thessaly(塞萨洛尼基大学计算机科学与生物医学信息学系)
AI总结 本文提出了一种多标签消化系统视频分析管道,结合ResNet-50帧分类器和解剖引导的时间事件解码,通过类重加权和解剖引导的解码方法提高稀有病理类别的识别性能,最终在挑战测试集上将时间mAP从0.3801提升到0.4303。
Comments ICPR 2026 RARE-VISION Competition
基于图注意力的跨客户端可解释性非线性时序动态联邦学习
发表机构 * Georgia Institute of Technology(佐治亚理工学院)
AI总结 本文提出了一种联邦学习框架,用于在分布式非线性系统中学习跨客户端的时序依赖关系。该框架通过非线性状态空间模型将本地高维观测映射到低维潜在状态,并利用图注意力网络在通信的潜在状态上学习图结构的神经状态转移模型,通过将学习的服务器侧转移模型的雅可比矩阵与注意力系数相关联,实现了对跨客户端时序依赖关系的可解释性。
Comments Manuscript under review
通过图模仿学习构建深度图预测器
发表机构 * Karlsruhe Institute of Technology (KIT)(卡尔斯鲁厄理工学院)
AI总结 本文提出GRAIL框架,通过图模仿学习解决图生成中的表示问题,实验证明其在多个基准测试中表现优异。
在寻找更少歧视性算法中统计保证
发表机构 * MIT(麻省理工学院) ; Cornell University(康奈尔大学) ; Microsoft Research(微软研究院)
AI总结 本文研究了在高风险领域中,企业为减少对受保护群体的歧视性影响而寻找更少歧视性算法的统计保证问题,提出了一种自适应停止算法以确定何时停止搜索以证明进一步搜索不会带来有意义的改进。
Comments 38 pages, 10 figures
理解并改进多节点LLM推理中的通信性能
发表机构 * Department of Computer Science, University of Maryland(马里兰大学计算机科学系) ; Lawrence Livermore National Laboratory(劳伦斯利弗莫尔国家实验室)
AI总结 本研究探讨了多节点分布式推理中通信性能的优化,通过分析不同模型并行方案的强标度行为,提出了一种基于递归倍增的分层all-reduce算法NVRAR,显著降低了推理延迟。
Comments 17 Figures, To Appear in Proceedings of ACM Conference on AI and Agentic Systems 2026
多样化的大语言模型还是多样化的问题解释?那是集成的问题
发表机构 * Intel Labs(英特尔实验室)
AI总结 本文比较了使用大语言模型回答二元问题的两种多样性方法:模型多样性和问题解释多样性,并发现问题解释多样性在集成准确性上表现更优。
批量单索引全局多臂老虎机与协变量
发表机构 * Department of Mathematics, Applied Mathematics and Statistics, Case Western Reserve University(数学系、应用数学与统计学系,凯斯西储大学) ; Department of Statistics, Pennsylvania State University(统计系,宾夕法尼亚州立大学)
AI总结 本文提出了一种新的半参数框架,用于带有协变量的批量老虎机问题,通过引入共享参数和单索引回归模型来捕捉臂奖励之间的关系,提出BIDS算法,在两种设置下推导了理论遗憾界,证明了在协变量维度为1时非参数批量老虎机的最优率。
创建从未存在过的虚拟学生:利用大型语言模型和CTGANs进行合成数据生成
发表机构 * Centre for the Science of Learning & Technology (SLATE)(学习科学与技术中心(SLATE)) ; University of Bergen(卑尔根大学)
AI总结 本文研究了利用生成对抗网络(GANs)和大型语言模型(LLMs)生成合成表格数据的潜力,探讨了通过合成数据创建虚拟学生以服务于学习分析模型的可能性,并评估了不同生成模型的性能。
合成数据能否公平且隐私?合成数据生成与公平性算法的比较研究
发表机构 * Centre for the Science of Learning & Technology (SLATE), University of Bergen(学习科学与技术中心(SLATE),卑尔根大学) ; University of South Australia(澳大利亚南澳大利亚大学)
AI总结 本研究探讨了合成数据生成与公平性算法在平衡隐私和公平性方面的效果,发现DECAF算法在隐私和公平性之间取得最佳平衡,但其预测准确性较低,而对合成数据应用预处理公平算法能进一步提升公平性。
通过可穿戴设备和人工智能实现个性化体重管理
发表机构 * Department of Mathematics, Universidad de Las Palmas de Gran Canaria, 35001, Spain(拉斯帕尔马斯德Gran Canaria大学数学系) ; Cancer Research Program, IMDEA Food Institute(IMDEA食品研究所癌症研究计划) ; Health, IMDEA Food Institute(IMDEA食品研究所健康)
AI总结 本文研究利用可穿戴设备和人工智能预测超重和肥胖人群的体重变化,通过分析100名受试者的生物标志物、体征和行为数据,发现体重减轻者与未减轻者的关键差异,使用梯度提升分类器达到84.44%的AUC,表明多数据源整合在个性化医疗中的潜力。
Comments 25 pages, 6 figures, 7 tables, 1 appendix
关于思维链的成本与收益:一种学习理论视角
发表机构 * University of Ottawa(渥太华大学)
AI总结 本文从学习理论的角度出发,研究了思维链(CoT)的成本与收益,通过分析回答映射与链式规则的交互作用,定义了假设在该交互下的推理风险,并推导出该风险的紧分解,揭示了CoT在不同条件下的帮助与损害作用。
关于组成式得分方法在基于模拟的推断中的退火动力学理论指南
发表机构 * Univ. Grenoble Alpes(格勒诺布尔阿尔卑斯大学) ; Inria(法国国家信息与自动化技术研究所) ; CNRS(法国国家科学研究中心) ; Grenoble INP(格勒诺布尔INP) ; LJK(实验室) ; Geostatistics team(地质统计学团队) ; Centre for geosciences and geoengineering(地球科学与地球工程中心) ; Mines Paris(巴黎矿校) ; PSL University(巴黎 sciences et lettres 大学)
AI总结 本文研究了基于模拟的推断中组成式得分方法的退火动力学理论,提出了一种新的理论框架,通过推导Wasserstein界,为超参数选择提供了理论指导,并在高斯情况下证明了不同复合得分方法在步长和总动力学步数上的差异。
划分与对比:无需增强学习鲁棒的时间特征
发表机构 * Department of Computer Science, Norwegian University of Science(挪威科学与技术大学计算机科学系) ; Department of Computer Science, United States Naval Academy(美国海军学院计算机科学系)
AI总结 本文提出Di-COT框架,通过对比时间窗口内的信息子结构而非单个时间步,实现了无需数据增强和多编码器传递的自监督学习,从而在六个大规模真实世界数据集和UCR/UEA基准上取得了最先进的性能,同时显著减少了训练时间。
Comments Published in the 43rd International Conference on Machine Learning (ICML 2026)
APEX:自主策略探索用于自演化大语言模型代理
发表机构 * National University of Singapore(新加坡国立大学) ; Beijing University of Posts and Telecommunications(北京邮电大学)
AI总结 本文提出APEX,一种用于自演化大语言模型代理的自主策略探索方法,通过构建和维护显式的策略空间来解决探索崩溃问题,并在多个基准测试中表现出色。
OCTOPUS: 通过在最优平方误差量化下的八面体参数化优化Transformer的KV缓存
发表机构 * Stability AI
AI总结 OCTOPUS通过联合量化旋转坐标三元组,优化了Transformer的KV缓存,在保持内存带宽和足迹的同时,通过八面体参数化将方向映射到平方,并利用Lloyd-Max量化来实现非均匀的位分配,从而在各种数据类型中实现了优于现有旋转编码器的性能。
PREFINE: 基于偏好的隐式奖励和成本微调以实现安全对齐
发表机构 * TCS Research, \ of CSE, IIT Madras India ; Department of Computing Science, \ of Alberta Canada ; Qatar Computing Research Institute, \ Bin Khalifa University Qatar ; Department of Data Science \& AI, Wadhwani School of Data Science \& AI, IIT Madras India ; TCS Research, \ of CSE, IIT Madras ; Department of Computing Science, \ of Alberta ; Qatar Computing Research Institute, \ Bin Khalifa University ; Department of Data Science \& AI, Wadhwani School of Data Science \& AI, IIT Madras
AI总结 该研究提出PREFINE方法,通过基于偏好的隐式奖励和成本微调,在连续控制环境中实现安全策略对齐,通过微调预训练强化学习策略以生成低成本行为同时保持高奖励。
Comments Accepted at AAMAS 2026 as a full paper
通过协作对齐的联邦LoRA微调大型语言模型
发表机构 * School of Computing & Data Science, The University of Hong Kong(计算与数据科学学院,香港大学)
AI总结 本文研究了在联邦学习环境下使用LoRA进行参数高效微调的问题,提出了一种名为CLAIR的框架,通过结构低秩加块稀疏分解来恢复共享LoRA子空间并检测污染客户端,从而在噪声情况下实现精确恢复,并在不同条件下实现稳定和一致的协作集恢复。
通过量子计算增强的强化学习过程合成
发表机构 * Department of Chemical and Biomedical Engineering, West Virginia University(西弗吉尼亚大学化学与生物医学工程系) ; R.F. Smith School of Chemical and Biomolecular Engineering, Cornell University(康奈尔大学R.F. Smith化学与生物分子工程学院)
AI总结 本文提出了一种基于量子强化学习的过程合成方法,通过构建通用框架将过程合成问题形式化为马尔可夫决策过程,并引入量子增强的强化学习算法以提高可扩展性,同时通过经典强化学习作为基准进行比较,展示了量子方法在过程合成中的竞争力。
基于Y-wise affine神经网络的强化学习控制:化学过程的比较案例研究
发表机构 * Department of Chemical and Biomedical Engineering(化学与生物医学工程系)
AI总结 本文提出了一种高效且实用的强化学习控制方法,用于化学过程系统,通过Y-wise Affine Neural Network (YANN)-RL算法解决信任RL算法和训练可靠智能体的挑战,并在三个公开的化学工程案例研究中展示了其在减少训练时间和数据需求方面的优势。
Comments Accepted for publication at the 23rd IFAC World Congress, 2026
用于密集奖励的领域可适应强化学习代码生成
发表机构 * Hessian Center for Artificial Intelligence (hessian.AI)(海斯曼人工智能中心) ; National Research Center for Applied Cybersecurity ATHENE(应用网络安全国家研究中心ATHENE)
AI总结 本研究提出了一种领域可适应的强化学习框架,用于改进代码生成的正确性、质量和安全性,通过定制化的执行感知奖励公式和令牌级奖励映射机制,提高了代码生成在不同领域中的适应性和执行效率。
Comments 10 pages, 2 figures, under review
ChunkFT: 用于内存高效全微调的分块优化
发表机构 * Northeastern University, China(中国东北大学) ; Shanghai Jiao Tong University, China(上海交通大学) ; CIS, LMU Munich, Germany(慕尼黑大学CIS实验室) ; MCML, Germany(德国MCML实验室) ; Shandong University, China(山东大学)
AI总结 本文提出ChunkFT框架,通过动态激活的工作集重新定义全参数微调,实现了无需修改网络架构即可对任意子张量进行梯度计算,理论分析和实验表明其在内存使用、运行时间和优化质量上均有效,且在下游任务中表现优于现有内存高效基线。
一个严格且可计算的模型复杂度度量
发表机构 * KTH Royal Institute of Technology(皇家理工学院) ; Uppsala University(乌普萨拉大学)
AI总结 本文提出了一种严格且易于计算的模型复杂度度量方法,基于模型在不同输入上的梯度相似性,适用于参数模型和非参数模型,并扩展了多项式度数、核长度尺度等模型特定复杂度度量,同时揭示了随机傅里叶特征、随机森林、神经网络和梯度提升中的双下降现象。
Q-SYNTH:混合量子-经典对抗增强用于不平衡欺诈检测
发表机构 * Quantum Physics and Spintronics Team, LPMC, Faculty of Sciences Ben M'sick(量子物理与自旋电子团队,拉瓦尔学院,本·马西克科学学院) ; eBRAIN Lab, Division of Engineering, New York University Abu Dhabi (NYUAD)(eBRAIN实验室,工程学院,纽约大学阿布扎比分校(NYUAD)) ; Center for Quantum and Topological Systems (CQTS), NYUAD Research Institute(量子与拓扑系统中心(CQTS),NYUAD研究机构)
AI总结 本文提出Q-SYNTH,一种混合量子-经典对抗框架,用于生成不平衡欺诈检测中的少数类样本,通过量子电路生成器和经典神经网络判别器,提升欺诈检测的召回率和F1分数。
Comments 13 pages, 6 figures
通过反向生成数据和引导强化学习学习第一积分
发表机构 * Shanghai Jiao Tong University(上海交通大学)
AI总结 本文提出FISolver,一种基于LLM的求解器,通过反向生成数据和引导强化学习方法,解决第一积分发现中的数据稀缺问题,并在挑战性基准上显著优于其他方法。
Comments 17 pages, 2 figures, 3 tables
多光谱下无人机影像用于军事检测的比较分析
发表机构 * School of Computer Engineering KIIT Deemed to be University(计算机工程学院 KIIT deemed to be 大学)
AI总结 本文研究了不同光谱条件下无人机影像用于军事目标检测的问题,通过构建四种不同数据集(灰度、热成像、夜视和模糊成像)来评估模型在不同环境下的性能,提出了一种改进的YOLOv11-small模型以提升无人机作战的性能和可靠性。
Comments 6 pages, 7 figures. Accepted at the 16th International Conference on Computing, Communication and Networking Technologies (ICCCNT), July 6-11, 2025, IIT Indore. Proceedings pending publication
精神病诊断的ICD分类自动化:从经典NLP到大语言模型
发表机构 * Department of Sistemas Informáticos, Universidad Politécnica de Madrid, Spain(西班牙马德里理工大学信息系统系) ; KNODIS Research Group, Universidad Politécnica de Madrid, Spain(西班牙马德里理工大学KNODIS研究组) ; CIBERSAM ISCIII, Spain(西班牙ISCIII CIBERSAM) ; Department of Legal Medicine, Psychiatry and Pathology. Complutense University of Madrid, Spain(西班牙马德里康普顿斯大学法医学、精神病学与病理学系) ; Hospital Universitario de Móstoles, Universidad Rey Juan Carlos, Spain(西班牙雷阿尔皇家卡洛斯大学莫斯特oles大学医院) ; Department of Psychiatry, University Hospital Jimenez Díaz Fundation, Madrid, Spain(西班牙圣地亚哥· jiménez Díaz基金会精神病科部) ; Department of Psychiatry, University Hospital Rey Juan Carlos, Móstoles, Spain(西班牙雷阿尔皇家卡洛斯大学莫斯特oles医院精神病科部) ; Department of Psychiatry, General Hospital of Villalba, Madrid, Spain(西班牙维拉尔巴医院精神病科部) ; Department of Psychiatry, University Hospital Infanta Elena, Madrid, Spain(西班牙伊菲格尼亚医院精神病科部) ; Department of Psychology, Universidad Catolica del Maule, Talca, Chile(智利马尔学院心理学系) ; Department of Psychiatry, Madrid Autonomous University, Madrid, Spain(西班牙马德里自治大学精神病科部)
AI总结 本研究提出利用NLP和机器学习技术将自由文本描述映射到国际疾病分类(ICD),以自动化精神病诊断分析,通过评估从经典频率模型到先进大语言模型的多种文本表示方法,展示了transformer嵌入在捕捉隐含语义线索和细致医学术语方面的优势。
SMoA:用于参数高效微调的频谱调制适配器
发表机构 * Northeastern University, China(东北大学,中国) ; Shandong University, China(山东大学,中国) ; CIS, LMU Munich, Germany(慕尼黑莱布尼茨大学CIS中心,德国) ; MCML, Germany(德国MCML)
AI总结 本文提出SMoA,一种频谱感知更新的适配器,通过在较小的参数预算下扩大可访问的频谱更新家族,提升参数高效微调的性能。
推理轨迹坍缩:在微调过程中显式推理能力的丧失评估
发表机构 * King’s College London(伦敦国王学院)
AI总结 本文研究了在微调过程中显式推理能力的丧失问题,提出了一种结构评估框架来区分答案正确性与推理轨迹的有效性,并发现标准监督微调会迅速抑制有效的推理轨迹,而仅关注答案的指标会掩盖这一问题。
Comments 22 pages, 3 tables, 3 figures
Linear-DPO: 用于扩散和流匹配生成模型的线性直接偏好优化
发表机构 * School of Computer Science and Technology, Harbin Institute of Technology(哈尔滨工业大学计算机科学与技术学院) ; Alibaba Group(阿里巴巴集团)
AI总结 本文提出Linear-DPO,通过统一的反向时间SDE框架推导出涵盖扩散和流匹配的通用DPO目标,指出标准DPO目标在文本到图像生成中不最优,并通过定性定量实验验证了其在扩散模型和流匹配模型上的优越性。
Comments Code and models are available at: https://github.com/Whynot0101/Linear-DPO . Work done during an internship at Alibaba Group
不确定性感知可解释人工智能的统一框架:电力质量扰动分类的案例研究
发表机构 * School of Engineering, Deakin University(德肯大学工程学院) ; Faculty of Mathematics and Computer Science, FernUniversität in Hagen(哈根应用科学大学数学与计算机科学学院) ; Department of Computing Technologies, Swinburne University of Technology(斯威本科技大学计算技术学院)
AI总结 本文提出了一种统一的框架,用于不确定性感知的可解释人工智能,通过在电力质量扰动分类任务中使用贝叶斯神经网络来捕捉解释分布的变异性,以提高决策的不确定性意识。
通过自收缩性获得约束在线凸优化的改进保证
发表机构 * Department of Computer Science and Engineering, Indian Institute of Technology Kharagpur(计算机科学与工程系,印度理工学院Kharagpur分校) ; School of Technology and Computer Science, Tata Institute of Fundamental Research, Mumbai, India(技术与计算机科学学院,印度基础研究科学研究院,孟买,印度)
AI总结 本文提出了一种基于投影的算法,在强凸损失下同时实现O(log T)的 regrets 和 O(log T) 的 CCV,对于凸损失则在保持最优 O(√T) regrets 的同时将 CCV 提升到 O(√T)。
HORST:用于稀疏Transformer训练的优化几何组合
发表机构 * CISPA Helmholtz Center for Information Security(CISPA 河岸信息安全中心)
AI总结 本文提出HORST,一种结合优化几何的模块化优化器,通过超几何镜像映射引入L1稀疏性偏置,以在保持训练稳定性的同时促进稀疏性。
Comments 22 pages, 8 figures
一种用于联邦学习的类型化张量语言
发表机构 * Athena Research Center(阿提卡研究中心) ; National and Kapodistrian University of Athens(雅典国家与卡波迪斯蒂亚诺大学) ; National Technical University of Athens(雅典技术大学)
AI总结 本文提出了一种类型化的张量语言,用于形式化联邦学习中的结构,通过共享状态因子分解理论和可微片段,实现了联邦学习计算的正式描述。
UOTIP:用于无配对逆问题的不平衡最优传输映射
发表机构 * Sungkyunkwan University(成均馆大学) ; IPAI (Interdisciplinary Program in Artificial Intelligence, Seoul National University)(人工智能跨学科项目(Seoul National University)) ; Department of Mathematical Sciences, Seoul National University(首尔国立大学数学科学系)
AI总结 本文提出了一种基于不平衡最优传输的逆问题求解器UOTIP,通过引入基于似然的成本函数,将重建任务建模为从噪声测量分布到干净信号分布的学习过程,从而在无配对逆问题上实现了最先进的性能。
Comments Accepted at ICML 2026
在现代深度时间序列预测中复兴误差校正
发表机构 * Deakin Applied AI Initiative, Deakin University, Australia(德克萨斯应用人工智能倡议,德克萨斯大学,澳大利亚)
AI总结 本文研究了深度时间序列预测中的误差累积问题,提出了一种通用误差校正器,通过分解趋势和季节性成分来提升预测的准确性和鲁棒性。
Comments 27 pages
分离通信与策略:在带宽限制下的鲁棒多智能体强化学习
发表机构 * École polytechnique (LIX)(巴黎高等理工学院(LIX)) ; CNRS(国家科学研究中心) ; Institut Polytechnique de Paris(巴黎高等理工学院) ; Palaiseau, France(法国Palaiseau)
AI总结 本文提出了一种新的方法,通过引入β指标和SLIM架构,将通信路径与策略的潜在表示分离,从而在带宽受限的情况下提高多智能体强化学习的鲁棒性和性能。
AIMBio-Mat: 一个面向AI的FAIR平台,用于闭环材料发现与生物医学转化
发表机构 * Department of Physics, University of South Dakota(南达科他大学物理系) ; South Dakota School of Mines and Technology(南达科他州矿学院) ; Department of Chemistry, Physics and Materials Science, Fayetteville State University(费耶特维尔州立大学化学、物理与材料科学系) ; University of South Dakota(南达科他大学) ; PROMISE Lab, Sanford Research(桑福德研究机构PROMISE实验室) ; Department of Mechanical Engineering, University of Mississippi(密西西比大学机械工程系) ; Department of Physics and Astronomy, University of Kansas(堪萨斯大学物理与天文学系) ; Tiospa Zina Tribal School(蒂奥萨宾纳部落学校) ; Department of Mechanical and Materials Engineering, University of Nebraska–Lincoln(内布拉斯加大学林肯分校机械与材料工程系)
AI总结 本文提出AIMBio-Mat平台,通过整合材料来源、生物医学背景、知识图谱、不确定性感知的机器学习和人机协作主动学习,解决材料发现与生物医学转化中跨领域推理的问题,并提供可验证的平台蓝图。
Comments 35 pages, 4 figures, and 12 tables
音乐注意力转换器:使用音乐特定的注意力模型进行音乐生成
发表机构 * Department of Computer Science, School of Science and Technology, Meiji University(计算机科学系,科学与技术学部,立命馆大学)
AI总结 本文提出了一种音乐特定的注意力模型,通过整合元信息来提升音乐生成的质量,核心方法是将音乐结构和元数据结合,主要贡献是提高了生成音乐的连贯性和多样性。
Comments 32 pages, 13 figures
SpectralEarth-FM: 将高光谱图像引入多模态地球观测预训练
发表机构 * Chair of Data Science in Earth Observation(地球观测数据科学主任) ; Technical University of Munich(慕尼黑技术大学) ; Remote Sensing Technology Institute(遥感技术研究所) ; German Aerospace Center (DLR)(德国航空航天中心) ; Department of Aerospace Engineering(航空航天工程系) ; University of the Bundeswehr Munich(联邦国防军慕尼黑大学) ; LEAP ; Munich Center for Machine Learning (MCML)(慕尼黑机器学习中心) ; Univ. Grenoble Alpes(格勒诺布尔阿尔卑斯大学) ; Inria(法国国家信息与自动化技术研究院) ; CNRS(法国国家科学研究中心) ; Grenoble INP(格勒诺布尔INP) ; LJK
AI总结 本文提出SpectralEarth-FM,一种用于多传感器地球观测输入的分层变压器,旨在联合处理高光谱图像与低通道观测。通过构建SpectralEarth-MM数据集,采用JEPA风格的目标进行预训练,实现了在高光谱下游任务和标准EO基准上的最佳性能。
向序列分类中的自预训练理解迈进
发表机构 * Unit of Artificial Intelligence & Computer Systems, Università Campus Bio-Medico di Roma(人工智能与计算机系统单位,罗马生物医学学院) ; Unit of Advanced Robotics and Human-Centered Technologies, Università Campus Bio-Medico di Roma(先进机器人与以人为本技术单位,罗马生物医学学院) ; Department of Diagnostics and Intervention, Radiation Physics, Biomedical Engineering, Umeå University(诊断与介入部门,辐射物理,生物医学工程,乌梅拉大学) ; Max Planck Institute for Intelligent Systems(智能系统马克斯·普朗克研究所) ; ELLIS Institute Tübingen(图宾根ELLIS研究所) ; Tübingen AI Center(图宾根人工智能中心)
AI总结 本文通过复制和系统消融Amos等人的研究,揭示了自预训练(SPT)在序列分类中提升性能的关键因素,发现标签监督在学习有用的查询-键注意力模式方面存在瓶颈,并通过简化理论框架证明了自预训练通过学习接近性交互来提升性能。
Comments v1: Preliminary, extension of the version accepted at ICML 2025 Workshop MOSS
在MNAR中具有隐藏混杂因素的鲁棒个性化推荐
发表机构 * Guangdong University of Technology(广东工业大学) ; Chinese Academy of Sciences(中国科学院) ; Peking University(北京大学)
AI总结 本文提出了一种新的框架,通过估计用户-项目层面的敏感度界限,缓解了全局敏感度界限中固有的同质性假设,从而在存在隐藏混杂因素的情况下实现更鲁棒和准确的个性化推荐。
Divide et Calibra: 通过向量量化实现多类局部校准
发表机构 * University of Pisa(比萨大学) ; University of Trento(特伦托大学) ; Meta(Meta公司) ; Fondazione Bruno Kessler(布鲁诺·凯斯勒基金会)
AI总结 本文提出了一种复合方法,通过向量量化诱导表示空间的结构划分,并利用Dirichlet浓度的参数化实现跨区域参数共享,从而学习出能泛化到稀疏区域的异质校准映射,提升了局部校准性能同时保持了全局校准和预测性能。
基于成对模态的多模态大语言模型
发表机构 * Mohamed bin Zayed University of Artificial Intelligence(穆罕默德·本·扎耶德人工智能大学) ; Carnegie Mellon University(卡内基梅隆大学)
AI总结 本文提出了一种基于成对模态训练多模态大语言模型的方法,通过理论分析和表示学习框架,实现了跨模态对齐和重构,提升了模型的跨模态性能。
因果与传统表征学习之间的对话:在统一框架中实现相互受益
发表机构 * Mohamed bin Zayed University of Artificial Intelligence(莫扎伊德·本·扎耶德人工智能大学) ; Carnegie Mellon University(卡内基梅隆大学)
AI总结 本文探讨了因果表征学习与传统表征学习之间的对话,提出统一框架,通过任务组件和约束组件相互促进发展,实验表明因果约束的有效性依赖于所配的任务。
基于变压器的突变遗传编程用于近似电路设计
发表机构 * Brno University of Technology, Faculty of Information Technology(布拉格技术大学信息科技学院)
AI总结 本文提出了一种基于变压器的突变算子,用于改进遗传编程在近似算术电路自动设计中的进化设计和优化过程,通过混合方案防止电路近似过程停滞,并在多个目标误差约束下优于EvoApproxLib库中的现有高优化设计。
Comments To appear at IEEE World Congress on Computational Intelligence, Congress on Evolutionary Computation, Maastricht, NL, 2026
对几乎任何事物进行高斯过程的条件化
发表机构 * Lancaster University(兰卡斯特大学) ; University of New South Wales(新南威尔士大学) ; University of Cambridge(剑桥大学) ; University of Tübingen(图宾根大学)
AI总结 本文提出了一种通用的方法,通过将高斯过程与线性扩散模型建立等价关系,实现了对任意条件语句的高效条件化,包括非线性物理模型和自然语言,从而扩展了高斯过程在现实世界建模中的应用。
高效基于Banzhaf值的$k$-最近邻分类数据估值
发表机构 * Shenzhen Technology University(深圳技术大学) ; University of Liverpool(利物浦大学) ; Nanyang Technological University(南洋理工大学)
AI总结 本文提出了一种高效计算$k$-最近邻分类器中Banzhaf值的方法,解决了数据估值中的计算复杂性问题,通过动态规划框架实现了显著的计算效率提升。
Comments To appear at VLDB 2026
一般随机逼近的集中性在重尾马尔可夫噪声下
发表机构 * Indian Institute of Science(印度科学研究院) ; Georgia Institute of Technology(佐治亚理工学院) ; University of Minnesota(明尼苏达大学)
AI总结 本文研究了在具有有限状态马尔可夫分量和马丁格尔差分分量的噪声下,随机逼近算法迭代项的最大集中性界。通过新的Lyapunov函数和辅助投影算法,分析了不同步长序列和随机算子性质对误差尾部行为的影响,并展示了在无界马丁格尔差分噪声情况下,误差尾部的集中性结果。
Comments 67 pages
基于TanDEM-X和Landsat数据的混合机器学习模型用于森林高度估计
发表机构 * German Aerospace Center (DLR)(德国航空航天中心(DLR)) ; Institute of Environmental Engineering, ETH Zürich(环境工程研究所,苏黎世联邦理工学院)
AI总结 本文提出了一种结合机器学习与物理模型的混合方法,利用TanDEM-X干涉相干测量和Landsat光学数据来提高森林高度估计的精度,通过扩展特征空间减少高度和基线地形坡度的模糊性,实验结果表明RMSE和MAE分别降低了13.5%和16.6%。
超越贝尔曼递归:一种指导性框架用于非指数折扣
发表机构 * Department of Mathematics, Sungkyunkwan University, Suwon, Republic of Korea(韩国首尔大学数学系)
AI总结 本文提出了一种基于庞特里亚金原理的直接策略优化框架(PG-DPO),以解决非指数折扣问题,通过放弃递归方法,结合庞特里亚金最大原理和蒙特卡洛回放,提高动态规划的准确性和稳定性。
用潜在高斯过程和最优传输建模时间序列scRNA-seq数据
发表机构 * Department of Computer Science, Aalto University, Espoo, Finland(奥卢大学计算机科学系,埃斯波,芬兰)
AI总结 本文提出了一种生成框架,利用潜在异方差高斯过程建模种群趋势,并通过最优传输对齐生成和观测的种群分布,以捕捉生物异质性,从而在复杂插值和外推基准上实现最先进的性能。
调度操作中的开销诊断:跨架构观测站
发表机构 * DeepSeek-V2-Lite MLA ; DeepSeek-MoE-16B MHA ; Qwen3-30B GQA ; Nemotron-30B Mamba-2 ; Qwen3.5-35B GDN
AI总结 该研究通过测试四个缓解方案的假设,发现扩展进程(EP)规模变化对专家最大/均值token比率的影响最多为5%,并且mock-token基准在路由Gini系数和批大小缩放趋势上存在高估。研究发现五种架构在相同矩阵中形成两个稳定的带状分布,这些带状分布而非EP度或mock数据配置是AlltoAll-aware互连和调度设计的正确工作负载输入。
用于材料条件化图网络模拟器的点云序列编码
发表机构 * Autonomous Learning Robots(自主学习机器人) ; Methods for Big Data(大数据方法) ; Institute of Vehicle System Technology(车辆系统技术研究所)
AI总结 本文提出PEACH框架,通过点云序列编码实现对未知物理属性的适应,提高了模拟到现实的零样本转移精度,并在实际部署中更具实用性。
Comments 9 pages + appendix, 7 figures. Submitted to the 40th Conference on Neural Information Processing Systems (NeurIPS 2026)
发布侧风险的符合性分诊部署审计
发表机构 * University of Illinois Chicago(伊利诺伊大学芝加哥分校) ; Manteia Technologies Co., Ltd(Manteia技术有限公司) ; University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校) ; University of California Los Angeles(加州大学洛杉矶分校)
AI总结 本文提出了一种泄漏感知的发布侧符合性分诊审计方法,用于评估在患病率变化下,是否真正经历目标事件的患者被释放而无需审查,通过将目标主体分为三个非重叠角色来评估发布直接安全性。
Comments 18 pages, 4 figures, 5 tables
DASH:在单个GPU上几分钟内完成的快速可微架构搜索用于混合注意力
发表机构 * Harbin Institute of Technology (Shenzhen)(哈尔滨工业大学(深圳))
AI总结 本研究提出DASH,一种快速可微架构搜索框架,用于混合注意力架构设计,通过将离散的层间注意力操作放置转化为连续的架构logits,准备可重用的教师对齐线性候选,并在模型和操作权重冻结的情况下进行架构仅搜索,显著提高了搜索效率。DASH在Qwen2.5-3B-Instruct上优于现有的所有选择器风格的混合注意力设计基线,展示了直接可微搜索可以发现更强的混合架构。此外,DASH在RULER性能上优于已发布的Jet-Nemotron模型,同时在重叠的短上下文和通用基准上保持竞争力。值得注意的是,每个DASH搜索运行仅使用12.3M tokens,并在单个RTX Pro 6000 GPU上仅需约20分钟,对应Jet-Nemotron报告的PostNAS搜索tokens的0.006%。这些结果表明,通过分钟级的可微搜索可以获得高质量的混合注意力架构,为混合架构设计提供了有前景的方向。
Comments 19 pages, 7 figures
Winfree振荡神经网络
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; Shanghai Qi Zhi Institute(上海启智研究院) ; College of AI, Tsinghua University(清华大学人工智能学院)
AI总结 本文提出了一种基于广义Winfree动力学的振荡神经网络WONN,通过结构化的振荡交互在流形$(S^1)^d$上进化表示,结合基于相位的归纳偏置与灵活的层次交互机制,实现了在图像识别和复杂推理任务上的竞争力和参数效率。
Comments Project page: https://jiawen-dai.github.io/WONN_Project_Page/
校准与决策制定:重新审视未学习语言模型中的可靠性悖论
发表机构 * Indian Institute of Technology Kanpur (IIT Kanpur)(印度理工学院坎浦尔学院(IIT坎浦尔))
AI总结 本文研究了生成语言模型中校准与决策可靠性之间的差距,通过TOFU基准测试中的多项选择问答评估协议,发现经过微调的模型在校准误差较低,而未学习后的模型在校准误差仍低,但依赖于相关性特征的决策规则增加,扩展了可靠性悖论到机器未学习领域。
Comments Accepted at SRW, ACL 2026; 17 pages (9 + 2 + 6)
我们应该持续打击多久?在格斗游戏中学习动作持续时间
发表机构 * Department of Advanced Computing Sciences, Maastricht University(马斯特里赫特大学高级计算科学系)
AI总结 本文研究了在格斗游戏中如何通过学习动作持续时间来提高强化学习代理的决策能力,探讨了动态调整反应时间的方法及其对性能和行为模式的影响。
Comments Accepted at Computers and Games 2026
训练分布决定了药物盲癌敏感性预测的上限
发表机构 * Taekyung Heo
AI总结 本文研究了药物盲癌敏感性预测中训练分布对预测性能的影响,发现传统指标存在偏差,通过机制分层训练和响应匹配策略恢复了预测增益。
通过最优传输学习跨个体几何的fMRI激活字典
发表机构 * CMAP, Ecole Polytechnique Palaiseau, France(CMAP,巴黎政治学院帕莱索校区,法国) ; Mind, Inria-Saclay Palaiseau, France(Mind,法国国家信息与自动化研究所萨克雷帕莱索分所,法国)
AI总结 本文提出了一种基于最优传输的fMRI字典学习方法,通过Fused Gromov-Wasserstein距离处理个体脑几何差异,利用amortized优化减少计算成本,并学习依赖FGW参数平衡特征对齐与结构一致性的字典原子。
NeighborDiv: 一种基于邻居多样性、无需训练的跨域通用图异常检测方法
发表机构 * Netease Yidun AI Lab(网易易盾AI实验室) ; School of Software Technology(软件学院) ; Zhejiang University(浙江大学)
AI总结 本文提出NeighborDiv,一种无需训练的通用图异常检测方法,通过邻居多样性原理来检测异常,克服了传统方法在训练复杂度、数据依赖性和跨域泛化稳定性方面的不足,实验表明其在多个评估框架下均取得最佳性能。
CIG: 通过条件信息增益进行探索
发表机构 * FZI Karlsruhe(弗赖堡研究所卡尔斯鲁厄分所) ; KIT Karlsruhe(卡尔斯鲁厄理工学院)
AI总结 该研究提出了一种条件信息增益(CIG)奖励机制,用于强化学习中的探索问题,通过可追溯的log-determinant目标和Ensemble Disagreement核来生成因果每步奖励,从而在高维状态空间中实现有效的探索。
Comments 28 pages, 10 figures, 3 tables
CAdam: 3D高斯密度细化中的上下文自适应矩估计
发表机构 * IIIXR Lab, Kyung Hee University(庆尚大学IIIXR实验室) ; IIIXR Lab, Korea University(韩国大学IIIXR实验室)
AI总结 本文提出CAdam方法,通过将密度细化问题转化为统计信号验证问题,解决生成式蒸馏中密度估计的瓶颈,从而在保持视觉质量的同时显著减少高斯点数量。
Comments Accepted to SIGGRAPH 2026 Conference Papers. 12 pages, 8 figures
具有运行时认证的误差受限量化注意
发表机构 * Independent Researcher(独立研究者)
AI总结 本文提出了一种分层的KV缓存架构,通过在GPU内存中存储INT8键和INT4值,同时在系统RAM中保留FP16原始数据,实现了运行时认证的注意机制,通过误差分解得到每头每步的误差界,以驱动自适应精度选择和多阶段回退流程,确保在需要时能恢复到精确的密集注意输出。
Comments 32 pages, 1 figure
LOSCAR-SGD:局部SGD与通信-计算重叠及延迟校正的稀疏模型平均
发表机构 * KAUST(卡塔尔科技大学)
AI总结 本文研究了在异构计算环境下结合通信压缩、局部训练和通信-计算重叠的局部SGD方法,提出LOSCAR-SGD通过仅通信稀疏模型坐标并持续优化来提高分布式学习效率,首次给出了这种组合方法的理论保证。
多步似然比校正用于可验证奖励的强化学习
发表机构 * Seoul National University(首尔国立大学) ; Upstage
AI总结 本文提出了一种多步前向轨迹政策优化(NFPO)算法,通过引入N步前向轨迹来改进PPO的近似目标,从而在可验证奖励的强化学习中实现更精确的策略改进。
PlexRL: 服务化大语言模型执行在RLVR中的集群级编排
发表机构 * National University of Singapore(新加坡国立大学) ; Beihang University(北航) ; Shanghai Qiji Zhifeng Co., Ltd.(上海启智风科技有限公司) ; Nanyang Technological University(南洋理工大学) ; Shanghai Innovation Institute(上海创新研究院)
AI总结 本文提出PlexRL,通过集群级编排服务化大语言模型执行,解决RLVR训练中的效率问题,提升集群容量并降低GPU小时成本,同时保持算法灵活性和最小的单任务开销。
DISC: 通过策略生成解耦指令与状态条件控制
发表机构 * Zhejiang University(浙江大学) ; The University of Hong Kong(香港大学) ; TranscEngram
AI总结 DISC通过策略生成解耦指令与状态条件控制,解决了任务状态耦合导致的观察泄漏问题,并在多个基准测试中表现出色,证明了语言生成的策略参数驱动行为。
无需激活的图像识别回骨:在MetaFormer风格视觉模型中的多项式替代方案
发表机构 * University of Wisconsin--Madison(威斯康星大学麦迪逊分校)
AI总结 本文提出无需激活函数的多项式替代方法,用于在MetaFormer风格的视觉模型中实现图像识别,展示了多项式模块在多个数据集上的优越性能。
Comments Accepted to ICML 2026
DPO与RLHF的条件等价性:隐含假设、失败模式与可证明对齐
发表机构 * The Hong Kong University of Science(香港科技大学) ; Hong Kong Baptist University(香港 Baptist 大学)
AI总结 本文研究了DPO与RLHF的等价性问题,指出其等价性依赖于一个隐含假设,当该假设不成立时,DPO会优化相对优势而非绝对对齐,从而导致路径性收敛。作者提出CPO方法,通过引入约束实现可证明对齐,并通过几何解释揭示DPO的margin ranking机制。
Comments 49 pages
马尔可夫电路追踪用于Transformer状态动态
发表机构 * Project AWARE and Zephara AI(项目AWARE和Zephara AI)
AI总结 本研究提出马尔可夫电路追踪(MCT)方法,用于评估Transformer激活是否包含粗粒度的状态转移结构,通过合成的隐马尔可夫模型任务验证了残差激活中包含部分贝叶斯信念信息,并展示了状态抽象在不同状态下恢复粗粒度转移信号的效果。
在消费级硬件上实现GraphRAG:对本地LLMs在医疗EHR模式检索中的基准测试
发表机构 * Department of Computer Engineering(计算机工程系) ; California Polytechnic State University(加州州立大学波特兰分校)
AI总结 本文研究了在消费级硬件上使用本地LLMs进行医疗EHR模式检索的GraphRAG方法,评估了四种不同模型在索引效率、知识图构建、查询延迟、回答质量和幻觉方面的表现,发现模型参数大小和检索模式对结果有显著影响。
Comments 9 pages, 1 figure, 5 tables
OlmoEarth v1.1: 一个更高效的OlmoEarth模型家族
发表机构 * Allen Institute for AI(人工智能研究所)
AI总结 本文提出了一种改进的OlmoEarth模型家族,通过优化训练和推理过程,显著降低了计算成本,同时保持了模型的整体性能。
可调MAGMAX:面向持续学习的偏好感知模型融合
发表机构 * Yokohama National University(Yokohama国立大学)
AI总结 本文提出了一种名为可调MAGMAX的模型融合框架,通过引入偏好向量控制任务特定性能,以适应不同的部署环境和用户偏好,从而在持续学习中实现更有效的模型融合。
Comments 17 pages, 4 figures. Accepted at ICPR 2026
在舰队规模上实现GPU效率的即时可见性
发表机构 * Microsoft(微软) ; Alphabet ; Meta
AI总结 本文提出了一种硬件级别的GPU效率指标Overall FLOP Utilization (OFU),用于HPC系统上的AI工作负载,通过两种芯片级性能计数器:张量管道活动和SM时钟频率来推导。OFU无需应用程序仪器化,适用于所有GPU代际和数值精度。通过在H100和GB200上进行受控的GEMM实验,研究了OFU近似值的五个属性,并在FP16、TF32、FP8和NVFP4上进行了验证。经过瓷砖量化修正后,OFU可以预测应用级别的MFU误差不超过2个百分点。在608个生产训练任务中,OFU与应用级别的MFU相关性达到0.78,并揭示了两个框架级别的FLOPs计算错误。在大规模GPU舰队上部署后,OFU检测到2.5倍的效率退化,并追踪了混合精度预训练中的精度依赖性利用变化。评估和运营经验表明,OFU是应用级别MFU的实用且可部署的补充,用于持续的舰队级效率监控。
Comments 12 pages, 7 figures, 3 tables
大多数变换器修改仍无法在1-3B规模上迁移:对Narang等人(2021)的2020-2026年更新,包含下游评估和噪声底限
发表机构 * Tencent(腾讯)
AI总结 本文在1-3B参数规模下,大多数变换器修改仍无法迁移,通过严格的等数据、等计算、等配方控制测试,并结合下游评估和噪声底限进行验证。
Comments 19 pages, 3 figures, under review at EMNLP 2026
超越数值特征:通过等高线图进行CNN驱动的算法选择用于连续黑盒优化
发表机构 * Mohamed bin Zayed University of Artificial Intelligence, Masdar City, United Arab Emirates(莫扎德人工智能大学,马斯达尔城,阿拉伯联合酋长国)
AI总结 本文提出了一种基于表示的实例级算法选择方法,应用于黑盒优化,用于自动从固定组合中选择最有前途的求解器。传统连续优化工作主要依赖于数值描述符,包括探索景观分析特征和学习嵌入如Deep-ELA。本文研究了一种互补的表示:探测景观的等高线图可视化。一个CNN回归器利用多个实例特定的等高线视图(堆叠或编码每个视图并聚合)来预测每个求解器的性能,从而通过预测的最佳值进行选择。在标准BBOB 2009单目标协议上,所得到的选者显著优于单最佳求解器(SBS),并与基于特征的基线具有竞争力。随后在DeepELA设置下的双目标评估进一步表明,当使用窗口等高线视图时,基于图像的原则同样具有竞争力。总体而言,结果表明,简单的视觉模型可以利用探测景观中的空间结构进行算法选择,而无需手工设计ELA特征。
层次递归推理中的交互局部性
发表机构 * CyberAgent Inc.(CyberAgent公司)
AI总结 本文提出交互局部性框架,用于测量信息流是否在附近单元或语义段内传输或跨越,通过在HRM和TRM等层次递归推理模型上应用,验证了局部执行与全局规划的可重复测量框架。
因果机器学习并非万能:健康领域观察性因果推断的路线图
发表机构 * Division of Computer Science and Engineering, University of Michigan(密歇根大学计算机科学与工程系) ; Department of Electrical and Electronic Engineering, Imperial College London(伦敦帝国理工学院电子与电气工程系) ; Courant Institute of Mathematical Sciences, New York University(纽约大学Courant数学科学研究所) ; Center for Data Science, New York University(纽约大学数据科学中心) ; Department of Mathematics & Statistics, Elon University(埃洛伊大学数学与统计学系) ; Department of Ophthalmology, Cambridge University Hospitals(剑桥大学医院眼科部) ; Department of Biomedical Informatics, Columbia University(哥伦比亚大学生物医学信息学系) ; School of Engineering and Applied Science, Harvard University(哈佛大学工程与应用科学学院) ; Laboratory for Computational Physiology, Institute for Medical Engineering and Science, Massachusetts Institute of Technology(麻省理工学院医学工程与科学研究所计算生理学实验室) ; Department of Medicine, Beth Israel Deaconess Medical Center(贝斯以色列德aconess医疗中心医学部) ; Department of Biostatistics, Harvard T.H. Chan School of Public Health(哈佛T.H. Chan公共卫生学院生物统计学系)
AI总结 本文探讨了因果机器学习在观察性数据中的应用,强调了验证有效性假设和合理使用因果机器学习的重要性,提出了加强因果分析严谨性和可解释性的模板。
学习物理中的推理:通过表征对齐打破科学扩散中的捷径学习
发表机构 * The Hong Kong University of Science and Technology (Guangzhou)(香港理工大学(广州)) ; Shandong University(山东大学) ; LimX Dynamics Technology Co., Ltd.(LimX动态技术有限公司) ; Xidian University(西安电子科技大学) ; Peking University(北京大学) ; Institute of Deep Perception Technology, Jiangsu Industrial Technology Research Institute (JITRI)(感知技术研究院,江苏工业技术研究院(JITRI)) ; Griffith University(格里菲斯大学)
AI总结 该研究提出了一种无需教师的框架REPA-P,通过使用原理残差对中间特征与物理状态进行对齐,以解决物理信息扩散模型中中间表示在边界条件变化时容易产生捷径学习的问题,从而在四个PDE任务中提高了收敛速度、减少了物理残差并增强了分布外鲁棒性。
通过主动学习查询进行累积元学习以增强对虚假相关性的鲁棒性
发表机构 * Department of Computer Science(计算机科学系) ; National University of Singapore(新加坡国立大学)
AI总结 本文提出了一种累积主动元学习(CAML)框架,通过主动学习查询样本来元学习先验知识,以提高模型对虚假相关性的鲁棒性,实验结果显示在多个基准测试中性能显著提升。
Comments Under review. 26 pages, 7 figures
干预的幻觉:你的LLM模拟实验实际上是一个观察性研究
发表机构 * Google DeepMind(谷歌深Mind) ; Carnegie Mellon University(卡内基梅隆大学)
AI总结 本文探讨了大型语言模型在模拟人类行为中的潜在作用,指出在LLM模拟的合成用户中进行干预可能引起潜在用户属性的意外变化,从而导致用户漂移,影响效果估计。本文提出了使用负对照结果来检测分布变化的方法,并通过调整角色描述以减少偏倚来缓解漂移问题。
面向组合奖励的冲突感知加法引导:流模型中的对抗性生成
发表机构 * Smart Systems Institute, National University of Singapore, Singapore(新加坡国立大学智能系统研究所) ; Faculty of Computing, Harbin Institute of Technology, Harbin, China(哈尔滨工业大学计算机学院) ; School of Computing, National University of Singapore, Singapore(新加坡国立大学计算机学院)
AI总结 本文提出了一种面向组合奖励的冲突感知加法引导方法,用于在流模型中处理对抗性生成问题,通过动态检测和解决梯度冲突来纠正离曼福德漂移,提升了生成保真度。
Comments Forty-Third International Conference on Machine Learning (ICML 2026)
纠正预条件语言模型优化器中的随机更新偏差
发表机构 * Fastino Labs(Fastino实验室)
AI总结 本文研究了预条件优化器中随机更新规则的有限样本偏差问题,提出了一种单批次偏差校正框架,通过交叉拟合预条件估计和方差校正逆运算来减少梯度-预条件器耦合偏差和逆运算偏差,从而提升预条件优化器的性能。
Comments 32 pages, 3 figures, 13 tables
PACD-Net: 假设增强对比学习用于从SMBG估计血糖控制
发表机构 * University of Virginia, School of Data Science, Charlottesville, VA 22903, USA(弗吉尼亚大学数据科学学院) ; University of Virginia, Department of Pediatrics, Charlottesville, VA 22903, USA(弗吉尼亚大学儿科系)
AI总结 本研究提出PACD-Net,一种自监督对比学习框架,用于从稀疏不规则采样的SMBG数据中估计血糖控制指标,通过伪SMBG样本指导学习并提高模型的准确性和稳定性。
验证器严格性的隐含信号:通过选择性潜在引导控制和改进逐步验证
发表机构 * Dartmouth College(达特茅斯学院) ; Datadog AI Research(Datadog人工智能研究) ; Salesforce AI Research(Salesforce人工智能研究)
AI总结 本文研究了通过隐藏状态干预控制验证器严格性的方法,提出VerifySteer通过利用潜在正确性信号进行样本级路由并选择性干预段落边界,从而在ProcessBench和Hard2Verify数据集上优于基线方法,且在推理计算上更高效。
可验证的环境:面向大规模评估奖励黑客的尝试
发表机构 * Tel Aviv University(特拉维夫大学) ; Columbia University(哥伦比亚大学) ; Taso Labs(Taso实验室)
AI总结 本文提出了一种新的评估方法来衡量奖励黑客,通过在环境中嵌入可检测的奖励黑客机会,使评估更加可靠和自动化,通过TextArena测试床分析了不同语言模型在多样化环境中的奖励黑客行为。
Comments Project Page - https://majoroth.github.io/hack-verifiable-environments/
Distribution-Aware Reward: 用于LLM回归的预测分布强化学习
发表机构 * Georgia Institute of Technology(佐治亚理工学院) ; Allen Institute for AI(人工智能研究院)
AI总结 本文提出Distribution-Aware Reward,一种基于预测分布的强化学习方法,旨在提升语言模型在回归任务中的预测分布质量,而非仅优化单个解码输出。通过连续排名概率分数评估多个解码样本的分布,并基于每个rollout对分布质量的边际贡献分配信用,从而提升预测的准确性和分散性。实验表明,该方法在多个任务中优于监督微调和点wise强化学习基线,尤其在KBSS数据集上Spearman相关性提升6点。
Comments 21 pages, 5 figures
在资源受限的Android蜂窝中实现内存高效的分区DNN推理
发表机构 * Department of Computer Science and Engineering, University of Moratuwa, Moratuwa, Sri Lanka(计算机科学与工程系,莫图瓦大学,莫图瓦,斯里兰卡)
AI总结 本文提出了一种在资源受限的Android设备上实现高效DNN推理的方法,通过五个机制将内存压力分散到多个设备上,从而在不修改模型的情况下实现ONNX推理,显著降低了电池消耗和延迟。
Comments 6 pages, 3 figures, 4 tables. Accepted at the ICML 2026 Workshop on Machine Learning for the Global South
AGPO: 基于双统计反馈的自适应群体策略优化
发表机构 * Institute of Information Engineering, Chinese Academy of Sciences(中国科学院信息工程研究所) ; School of Cyber Security, University of Chinese Academy of Sciences(中国科学院大学网络安全学院) ; School of Artificial Intelligence, University of Chinese Academy of Sciences(中国科学院大学人工智能学院)
AI总结 本文提出AGPO,一种无 critic 的 GRPO 改进方法,通过群体层面的统计信息控制更新幅度和探索。在九个英语和中文数学/STEM 基准上,Qwen2.5-14B 在相同生成 token 预算下优于 PPO/GRPO,达到 GSM8K 67.3% 和 MATH 40.5%。
从噪声隐式反馈中鲁棒推荐:一种加权贝叶斯标签转移矩阵框架
发表机构 * Guangdong University of Technology(广东工业大学) ; University of Chinese Academy of Sciences(中国科学院大学) ; Capital Normal University(首都师范大学) ; Xiamen University(厦门大学) ; Beijing Jiaotong University(北京交通大学)
AI总结 本文提出了一种鲁棒的高斯混合模型加权贝叶斯标签转移矩阵框架(RGBT),通过利用高斯混合模型生成实例特定的可靠性评分,系统校准贝叶斯标签转移矩阵估计以减少偏差,从而在保证全样本利用的同时,实现一致的估计和显著的估计方差减少。
SAVER:选择性所需视觉证据用于多模态信息提取
发表机构 * Institute of Information Engineering, Chinese Academy of Sciences(中国科学院信息工程研究所) ; University of Chinese Academy of Sciences(中国科学院大学) ; School of Cyber Security, University of Chinese Academy of Sciences(中国科学院大学网络安全学院) ; School of Artificial Intelligence, University of Chinese Academy of Sciences(中国科学院大学人工智能学院)
AI总结 该研究提出SAVER框架,通过选择性视觉证据提升多模态命名实体识别和关系抽取的性能,减少计算开销并提高准确性。
分布式直接偏好优化
发表机构 * Translational AI Center, Iowa State University, Ames, USA(翻译人工智能中心,爱荷华州立大学,爱荷华州阿姆斯)
AI总结 本文研究了在分布式环境中直接偏好优化(DPO)的收敛性和时间复杂度,分析了联邦学习和去中心化学习中偏好数据碎片化对优化动态的影响,并提出了具有理论保证的鲁棒且可扩展的实现实现方法。
Comments 29 pages, 12 figures
DIVE: 通过自限制梯度更新实现嵌入压缩
发表机构 * University of Washington Tacoma School of Engineering and Technology(华盛顿大学塔可姆分校工程与技术学院)
AI总结 本文提出DIVE方法,通过自限制的三元组损失和头级NT-Xent对比损失解决嵌入压缩中因标注数据稀缺导致的过拟合问题,提升了检索性能。
运动鲁棒深度重建用于自由呼吸心脏 cine MRI
发表机构 * Stanford University(斯坦福大学) ; KIST ; GE Healthcare(通用电气医疗)
AI总结 本文提出Cine-DL框架,通过结合目标k空间预处理和快速模型基于深度重建,解决自由呼吸径向采集在高加速下的运动伪影问题,提升临床应用可行性。
基于尺度校准的中位数-均值方法用于鲁棒分布式主成分分析
发表机构 * Baruch College(巴彻学院) ; The Graduate Center, City University of New York(纽约市立大学研究生中心)
AI总结 本文研究了基于尺度校准的中位数-均值估计器,用于鲁棒分布式主成分分析,通过欧几里得空间和格拉斯曼流形的产品几何结构,提出了一个节点级PCA展开,证明了所提出的产品流形中位数-均值估计器的渐近等价性,并展示了鲁棒块尺度和推断最优校准规则,以及高概率中位数-均值界限。
动态TMoE:一种针对非平稳时间序列预测的漂移感知动态专家混合框架
发表机构 * School of Software Technology, Zhejiang University, Ningbo, China ; State Key Lab of CAD\&CG, Zhejiang University, Hangzhou, China
AI总结 本文提出Dynamic TMoE框架,通过动态构建异构专家和剪枝冗余专家来优化容量,并利用时间记忆路由器确保稳定且上下文感知的专家选择,从而在非平稳时间序列预测中实现更优性能。
Comments 27 pages, 7 figures. Accepted to ICML 2026
无需微调的模块化多模态分类:一种简单的组合方法
发表机构 * Chalmers University of Technology and University of Gothenburg(查尔姆斯理工大学和哥德堡大学) ; Vector Institute(向量研究所) ; University of Toronto(多伦多大学)
AI总结 本文提出CoMET,一种无需微调的多模态分类方法,通过冻结预训练的backbone对每个模态进行处理,使用PCA压缩嵌入并输入到表格基础模型中进行预测,展示了PCA作为适配器在不同模态上的强大鲁棒性能,并提出了PALPooling来提升表示质量,实现了无需训练的多模态学习最佳结果。
Comments 30 pages, 17 figures
人工智能审稿人的局限与机遇:对Nature系列论文审稿的45位专家科学家的审查
发表机构 * Nature(自然)
AI总结 本文通过大规模专家标注研究,探讨了AI审稿人在科学同行评审中的能力与局限,发现AI审稿在准确性、显著性和证据充分性方面表现优异,但存在领域知识有限、上下文管理不足等弱点,表明AI审稿是人类审稿的补充而非替代。
Comments Work in progress
RoPeSLR: 3D RoPE驱动的稀疏低秩注意力用于高效的扩散变换器
发表机构 * Peking University(北京大学) ; University of Electronic Science and Technology of China(电子科技大学) ; Beijing University of Posts and Telecommunications(北京邮电大学)
AI总结 本研究提出RoPeSLR,一种基于3D RoPE的稀疏低秩注意力框架,旨在解决扩散变换器中长序列生成的高复杂度问题,通过结合高频率语义尖峰集和极低秩背景连续体,实现子二次稀疏性和子线性秩增长,从而在超长视频推理中表现出色。
AMAR: 基于注意力机制的轻量级多用户活动识别从Wi-Fi CSI
发表机构 * Department of Electrical Engineering and Computer Science(电气工程与计算机科学系)
AI总结 本文提出了一种基于注意力机制的轻量级多用户活动识别框架AMAR,通过将活动识别转化为集合预测问题,利用Transformer架构和边缘-云混合架构,实现了在多用户环境下对并发活动的高精度识别,同时显著减少带宽使用和占用估计误差。
Comments 25 pages, 6 figures, 3 tables
制造设计:一种集成制造知识的强化学习框架用于航空发动机自由形管道路由
发表机构 * State Key Laboratory of Fluid Power and Mechatronic Systems, Zhejiang University(浙江大学流体动力与机电系统国家重点实验室) ; Engineering Research Center for Design Engineering and Digital Twin of Zhejiang Province, Zhejiang University(浙江省设计工程与数字孪生工程研究中心) ; Zhejiang Changxing Heliang Intelligent Equipment Co., Ltd.(浙江长兴鹤浪智能装备有限公司)
AI总结 本文提出了一种集成制造知识的强化学习框架,用于航空发动机中自由形管道路由优化,通过将制造知识作为约束条件,提高了管道路径的可制造性和几何平滑度。
AVSD:通过平衡共识和教师特定的特权信号实现自适应视图自蒸馏
发表机构 * UNC Chapel Hill(北卡罗来纳大学教堂山分校) ; Capital One(Capital One公司) ; The University of Texas at Austin(德克萨斯大学奥斯汀分校)
AI总结 本文提出AVSD,一种通过平衡共识和教师特定的特权信号来实现自适应视图自蒸馏的方法,以解决自蒸馏中教师和学生信息不对称和特权信息选择的问题。
Comments Code: https://github.com/duykhuongnguyen/AVSD
相同目标,不同盆地:标注者分布中的硬标签与软标签
发表机构 * Independent Researcher(独立研究者)
AI总结 本文研究了在标注者分布中硬标签与软标签的区别,发现当每个示例的标注数量较少时,硬标签方法在性能上优于软标签训练,尤其是在稀疏经验目标远离完整标注者分布时效果更佳。
Comments 14 pages, 12 figures. Accepted to the 2nd Workshop on Epistemic Intelligence in Machine Learning (EIML @ ICML 2026)
可信的权重,危险的优化?针对大语言模型的优化触发后门攻击
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; Beihang University(北京航空航天大学) ; Tongji University(同济大学) ; Nanyang Technological University(南洋理工大学)
AI总结 本文提出了一种利用编译优化过程植入隐蔽后门的攻击方法,通过两种互补策略在无需修改编译器或硬件的情况下,实现对大语言模型的后门攻击,并展示了其在多个开源大语言模型上的高成功率。
Comments 20 pages, 3 figures
通过弱形式潜变量动力学进行时间依赖的PDE约束优化
发表机构 * Department of Applied Mathematics, University of Colorado(应用数学系,科罗拉多大学) ; Center for Applied Scientific Computing, Lawrence Livermore National Laboratory(应用科学计算中心,劳伦斯利弗莫尔国家实验室)
AI总结 本文提出了一种基于弱形式潜空间降阶建模的框架,用于加速梯度基PDE约束优化,通过弱形式系统识别方法压缩高维解轨迹并识别参数化潜变量动力学,从而在多查询设计和控制场景中实现高效优化。
用自回归扩散模型加速视频逆问题求解器
发表机构 * KAIST(韩国科学技术院) ; EverEx
AI总结 本文提出自回归视频逆问题求解器(AVIS),通过自回归扩散模型实现流式视频恢复,显著降低初始延迟并提高吞吐量,同时保持高质量的恢复效果,并进一步提出加速变体AVIS Flash,实现更高的吞吐量和更优的效率-性能权衡,为实时部署铺平道路。
Comments Project page is available here: https://avis-project.github.io/
动态Shapley值计算
发表机构 * Duke University(杜克大学) ; National Taiwan University(国立台湾大学)
AI总结 本文提出D-Shap框架,通过将Shapley值表示为玩家-任务矩阵,解决动态环境下训练数据贡献评估的高效更新问题,利用任务和联盟的局部性特性实现快速更新和自评估。
SURF: 通过调整标量化权重以均匀遍历帕累托前沿
发表机构 * Department of Electrical and Computer Engineering(电气与计算机工程系)
AI总结 本文提出SURF方法,通过调整标量化权重以实现帕累托前沿的均匀覆盖,解决了传统标量化方法在多目标优化中导致非均匀覆盖的问题。
基于潜在类比的组合转导用于离线目标条件强化学习
发表机构 * Department of Electrical and Computer Engineering and ASRI, Seoul National University(电气与计算机工程系和首尔国立大学ASRI) ; Independent researcher(独立研究者) ; Robotics Institute, Carnegie Mellon University(卡内基梅隆大学机器人研究所)
AI总结 本文提出了一种基于潜在类比的组合转导方法,用于解决离线目标条件强化学习中面对新情境时的目标泛化问题,通过引入新的类比表示方法,提升了在不同情境下的目标达到能力。
Comments ICML 2026
基于视觉着陆系统的学习保证机制解释
发表机构 * Stanford Intelligent Systems Laboratory, Stanford University, Stanford, CA, USA(斯坦福智能系统实验室,斯坦福大学,斯坦福,CA,美国)
AI总结 本文提出了一种基于视觉着陆系统的学习保证机制,通过分离内容与风格来构建可解释的模型,从而提供可靠的证据支持,同时引入了新的运行时保证方法来监控模型的情境表示。
Comments 10 pages, 4 figures
自我训练不使语言扁平化——它重构了它:表面标记增强而深层语法消失
发表机构 * Amazon(亚马逊)
AI总结 该研究通过实验发现自我训练过程并非使语言扁平化,而是重构了语言结构,表面标记增强而深层语法结构消失,并提出了结构性深度假说来解释这一现象。
Comments 19 pages (14 main + 5 appendix), 8 figures, 3 tables
无监督聚类和分类功能性运动中上肢EMG信号:一种数据驱动的方法
发表机构 * In2Lab, Engineer Faculty, Universidad de Antioquia(1 In2实验室,工程师学院,安提奥基亚大学) ; School of Engineering and Sciencies, Tecnológico de Monterrey(2 工程与科学学院,蒙特雷技术学院)
AI总结 本文提出了一种综合方法,用于对功能性抓取和抓握运动中上肢表面肌电信号进行聚类和分类,通过数据驱动的方法在NINAPRO DB4数据集上应用,提出了一种四阶段流程,包括信号预处理、特征提取、通过层次聚类选择手势以及比较模型评估,最终选出五个关键特征用于分类任务。
Comments 19 Congreso Colombiano de Computación (19CCC)
ReversedQ: 在回合制在线强化学习中更快的Q学习机会
发表机构 * University of Maryland(马里兰大学)
AI总结 本文研究了在回合有限的马尔可夫决策过程(MDPs)中使用无模型Q学习的效率问题,提出了ReversedQ方法,通过改进价值函数更新顺序、更新频率和初始化来提升学习速度,实验表明其在多个任务中均优于现有方法。
Comments This paper contains 5 pages and 2 figures. To be presented at the Adaptive and Learning Agents workshop (ALA 2026) at AAMAS 2026
TriForces: 为可迁移表示增强原子istic GNNs
发表机构 * Université Paris-Saclay, CentraleSupélec, Inria, Gif-sur-Yvette, France(巴黎-萨克雷大学,中央超算研究所,法国国家信息与自动化技术研究院,法国吉夫-sur-耶vette)
AI总结 TriForces通过分离组成和结构信息并结合自监督学习,提升MatBench和QM9的性能,无需DFT标签,并在OMat24上实现高效相似结构检索。
Comments 28 pages, 11 figures. Accepted at ICML 2026
深度学习代理用于模拟随机气候临界动态
发表机构 * Johns Hopkins Applied Physics Laboratory(约翰霍普金斯应用物理实验室) ; Johns Hopkins University(约翰霍普金斯大学)
AI总结 本文提出了一种基于动态信息的时序融合变换器作为数据驱动的代理,用于高效模拟复杂的地球系统模拟,通过预测临界事件的时间来提高计算效率。
Mahjax: 一种用于在JAX中进行强化学习的GPU加速麻将模拟器
发表机构 * The University of Tokyo(东京大学) ; RIKEN AIP(日本理化学研究院AIP) ; Nara Institute of Science and Technology(奈良科学技術大學) ; Kobe University(Kobe大学) ; Kyoto University(京都大学) ; ATR ; The University of Sydney(悉尼大学)
AI总结 本文提出Mahjax,一种基于JAX实现的麻将环境,利用GPU加速大规模并行化,以解决麻将游戏中的高维状态空间和随机性问题,为强化学习提供高效的训练平台。
具有状态管理的多智能体协作
发表机构 * Shanghai Jiaotong University(上海交通大学) ; Cortices AI ; Emory University(埃默里大学) ; Peking University(北京大学)
AI总结 本文提出STORM,一种面向多智能体协作的状态管理方法,通过在共享工作区中调解智能体的交互,确保每个智能体在一致的代码库视图上操作,并在写入时检测和解决冲突。STORM在多个LLM上优于基于git-worktree的多智能体基线,且在成本效率上具有竞争力,表明显式状态管理比工作区隔离更有效。
基于群体的矩阵估计与潜在子空间恢复
发表机构 * Department of Statistics, Columbia University(哥伦比亚大学统计系) ; Irving Institute for Cellular Dynamics, Zuckerman Institute Columbia University(Zuckerman研究所细胞动力学院,哥伦比亚大学) ; School of Data and Information Sciences, University of North Carolina at Chapel Hill(北卡罗来纳大学教堂山分校数据与信息科学学院)
AI总结 本文提出了一种针对异质数据中群体特定低秩矩阵估计的凸估计器GAME,通过重叠核范数惩罚正则化来恢复子群特定的子空间结构,同时在共享坐标系中保留局部潜在结构,并在不同数据集上验证了其在结构缺失情况下优于传统低秩方法的性能。
Comments 12 pages, 6 main figures, 1 main algorithm
通过logit平均在LLMs后训练中补充强化学习
发表机构 * UC San Diego(加州大学圣迭戈分校)
AI总结 本文提出一种在LLMs后训练中通过logit平均补充强化学习的方法,将该方法整合到Group Relative Policy Optimization (GRPO)中,无需使用KL正则化或critic,通过logit平均结构将可训练策略与参考策略耦合,以利用可训练策略的推理能力并保持SFT的格式优势。
图上平滑函数的谱带it问题及其在推荐系统中的应用
发表机构 * SequeL team, Inria France Microsoft Research New England(Inria法国微软新英格兰研究实验室SequeL团队) ; Technicolor Research Center California(Technicolor加州研究中心) ; Microsoft Research New England(微软新英格兰研究实验室) ; Microsoft Research Bangalore India(微软班加罗尔印度研究实验室)
AI总结 本文研究了图上平滑函数的带it问题,提出了一种在推荐系统中有效学习用户偏好的方法,通过有效维度的定义和线性缩放的算法,实现了低悔的在线学习。
Comments Published at AAAI 2014 - SDMBD
潜在过程生成器匹配
发表机构 * Department of Microbiology, Tumor and Cell Biology, Karolinska Institutet(微生物学、肿瘤和细胞生物学系,Karolinska研究院)
AI总结 本文提出了一种潜在过程生成器匹配框架,该框架将观测到的生成状态视为可 tractable 马尔可夫过程的确定性图像,从而扩展了生成器匹配理论,使其适用于时间依赖的潜在条件过程。
Comments 18 pages, 1 figure
迁移学习的样本复杂性:一种最优传输方法
发表机构 * Tsinghua-Berkeley Shenzhen Institute(清华大学-伯克利深圳研究院)
AI总结 本文通过最优传输视角分析迁移学习的样本效率,发现当数据维度d大于3时,迁移学习的样本复杂性为O(m^{-(α+1)/d}),优于直接学习的O(m^{-p/d}),其中α表示数据分布的光滑度,p表示最优目标模型的光滑度。
Take It or Leave It: Intent-Controlled Partial Optimal Transport
发表机构 * OceanDataLab ; Ifremer ; Université Bretagne Sud(布列塔尼大学) ; IMT Atlantique(IMT阿蒂提斯)
AI总结 本文提出了一种意图控制的局部最优传输(IC-POT),通过引入点wise拒绝成本替代全局拒绝机制,解决了在应用中需要更结构化的点wise拒绝机制的问题,并展示了其在正样本无标签学习和开放部分领域适应中的实际应用价值。
沉默的超参数:量化推理后端对LLM可重复性的影响
发表机构 * CISPA Helmholtz Center for Information Security(CISPA海德堡信息安全研究中心)
AI总结 本文研究了推理后端对LLM基准测试结果的影响,发现不同后端可能导致基准分数变化达16.6个百分点,并引发高比例的输出分歧,强调了推理后端作为关键超参数的重要性。
ARC-RL: 一种受ARC Raiders启发的强化学习游乐场
发表机构 * Media Integration and Communication Center – University of Florence(媒体整合与通信中心——佛罗伦萨大学)
AI总结 本文提出ARC-RL,一个包含四种MuJoCo连续控制环境的强化学习游乐场,这些环境的机器人形态灵感来自ARC Raiders的生物目录,通过统一的观察模板、动作约定和奖励函数,研究不同形态和动画风格约束下的强化学习算法性能。
波动率预测是否能带来更好的投资组合?图神经网络的实证证据
发表机构 * University of Southern California(南加州大学)
AI总结 本文研究图神经网络是否能提高实际波动率预测,并探讨这些预测是否能提升投资组合表现。通过2015-2025年间465只标普500股票的每周实际波动率数据,将异质自回归和长短期记忆基线模型与基于滚动相关性、行业和格兰杰因果图的图神经网络模型进行比较,包括和不包括宏观经济状态特征。实证发现,预测误差最小、横截面排名准确度最高、投资组合夏普比率最高的模型是三种不同的模型。预测准确性、排名质量与投资组合表现相关但不等同。只有当投资规则能利用其编码的横截面结构时,图波动率模型才具有价值。
COBALT: 通过基于云的远程操作利用智能手机进行机器人学习
发表机构 * Georgia Institute of Technology(佐治亚理工学院) ; University of California, Berkeley(加州大学伯克利分校) ; New York University Abu Dhabi (NYUAD)(纽约大学阿布扎克分校) ; University of Toronto(多伦多大学) ; NVIDIA(英伟达)
AI总结 本文提出COBALT平台,通过基于云的远程操作技术,利用智能手机等设备大规模收集高质量的机器人学习数据,提高仿真实验和现实世界中的机器人学习效率。
谱结构扭曲揭示神经网络中的冗余神经元
AI总结 本文提出了一种基于谱结构扭曲的神经元冗余判定方法,通过分析神经网络层变换前后的关系结构,识别可移除的神经元并保持任务性能。
利用知识图谱嵌入进行自动化大数据质量评估
发表机构 * Saint-Joseph University(圣约瑟夫大学) ; Lebanese University(黎巴嫩大学)
AI总结 本文提出了一种基于知识图谱嵌入的自动化大数据质量评估方法,通过整合多样化的知识图谱表示,利用上下文信息生成针对每个情境的全面数据质量评估计划。
Comments 17 pages, 10 figures
S2Aligner: 用于稀疏文本属性图的高效且可迁移的预训练方法
发表机构 * Beihang University(北航大学) ; Tianjin University(天津大学)
AI总结 本文提出S2Aligner,一种针对稀疏文本属性图的高效且可迁移的预训练方法,通过解耦语义对齐与结构建模,增强对齐过程而不污染共享的语义空间,从而减少跨域泛化差距。
Comments 19 pages
SVFSearch: 一种面向游戏垂直领域的多模态知识密集型短视频帧搜索基准
发表机构 * Kuaishou Technology(快手科技)
AI总结 本文提出SVFSearch,首个针对中文游戏领域短视频帧搜索的多模态知识密集型基准,通过5000个四选一测试示例和4198个辅助训练示例,评估了从直接问答到计划-行动-重新计划代理等多种方法在短视频帧搜索中的性能。
Charon:一种用于大规模大语言模型训练和推理的统一且细粒度模拟器
发表机构 * University of Texas at Austin(德克萨斯大学奥斯汀分校)
AI总结 本文提出Charon模拟器,通过统一、模块化和细粒度的方法,准确预测大语言模型性能,实验显示其在不同模型和配置上具有高精度,预测误差低于5.35%,并在实际推理部署中发现提升系统吞吐量的配置,展示了其实际价值。
Comments Accepted by MLSys 2026
Jacobian-Guided Anisotropic Noise Reshaping for Enhancing Representation Utility under Local Differential Privacy
发表机构 * Imperial College London(帝国理工学院伦敦分校) ; Imperial College London, Imperial Global Singapore(帝国理工学院伦敦分校,帝国全球新加坡)
AI总结 本文提出了一种基于雅可比矩阵的各向异性噪声重塑方法,以在局部差分隐私下提升表示的效用。该方法通过识别任务关键子空间,选择性地衰减噪声,并将标准LDP的各向同性噪声重塑为各向异性分布,从而在保持每个维度隐私预算的同时,异质地调节噪声影响,显著提升数据效用。
PULSE: 非平稳时间序列预测的生成性相演变
发表机构 * College of Computer Science, Sichuan University, Chengdu, China(四川大学计算机学院) ; University of Chinese Academy of Sciences, Beijing, China(中国科学院大学) ; Institute of Computing Technology, Chinese Academy of Sciences, Beijing, China(中国科学院计算技术研究所) ; Institute of Artificial Intelligence, University of Central Florida, Orlando, USA(佛罗里达大学人工智能研究所)
AI总结 针对非平稳时间序列预测中稳定表示与分布偏移之间的矛盾,本文提出PULSE框架,通过物理假设引导相演变,采用解耦-演化-模拟设计哲学,通过相锚解耦、相路由器和统计感知混合等方法提升模型鲁棒性,实验证明物理引导的归纳偏置比原始架构复杂度更重要。
FocalPolicy: 频率优化的分块和局部锚定的流匹配用于连贯的视觉-运动策略
发表机构 * State Key Laboratory of Robotics and Intelligent Systems, Shenyang Institute of Automation, Chinese Academy of Sciences(机器人与智能系统国家重点实验室,沈阳自动化研究所,中国科学院) ; University of the Chinese Academy of Sciences(中国科学院大学) ; University of Trento(特伦多大学)
AI总结 本文提出FocalPolicy,一种面向视觉-运动策略的策略,通过频率优化的分块和局部锚定的流匹配,解决连续视觉-运动策略中的精度与远见之间的平衡问题。
SEED:通过加权独立集实现目标数据选择
发表机构 * School of Computer Science, Peking University(北京大学计算机科学学院) ; Beijing University of Posts and Telecommunications(北京邮电大学) ; Tianjin University(天津大学) ; EECS, UC Berkeley(伯克利大学电子工程与计算机科学系) ; Chinese Academy of Sciences(中国科学院)
AI总结 本文提出SEED方法,通过将数据选择问题建模为加权独立集(WIS)在相似性图上,解决样本质量与多样性之间的平衡问题,并引入节点价值校准和局部尺度归一化来提升数据选择的鲁棒性和可扩展性。
Comments 20 pages
WorldParticle:通过Transformer实现拉格朗日粒子动力学的统一世界模拟
发表机构 * University of British Columbia(不列颠哥伦比亚大学) ; MIT CSAIL(麻省理工学院计算机科学与人工智能实验室) ; Georgia Institute of Technology(佐治亚理工学院) ; Inria(法国国家信息与自动化技术研究院) ; Meta(Meta公司) ; Independent Researcher(独立研究者) ; University of Pennsylvania(宾夕法尼亚大学) ; University of Utah(犹他大学) ; University of California Los Angeles(加州大学洛杉矶分校) ; University of Hong Kong(香港大学)
AI总结 本文提出基于Transformer架构的粒子模拟器,能够统一模拟布料、弹性固体、牛顿流体、非牛顿流体、颗粒材料和分子动力学等不同物理现象,通过预测-校正设计和粒子表示,实现高效的模拟与泛化。
手在环中:通过无缝手臂干预改进VLA策略以实现灵巧操作
发表机构 * State Key Laboratory of Mechanical System and Vibration, School of Mechanical Engineering, Shanghai Jiao Tong University(机械系统与振动国家重点实验室,机械工程学院,上海交通大学) ; Shanghai Key Laboratory of Intelligent Robotics, Meta Robotics Institute, Shanghai Jiao Tong University, Shanghai 200240, China(智能机器人上海市重点实验室,元机器人研究院,上海交通大学,上海200240,中国) ; The University of Tokyo(东京大学)
AI总结 本文提出Hand-in-the-Loop方法,通过无缝整合人类干预与自主策略执行,减少手部操作中的突兀变化,提升双臂灵巧操作的鲁棒性和效率。
MoRe:模块化表示用于序列数据的原理化持续表示学习
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; Mohamed bin Zayed University of Artificial Intelligence(穆罕默德·本·扎耶德人工智能大学)
AI总结 本文提出MoRe框架,通过模块化表示方法实现序列数据的原理化持续学习,其核心贡献是通过分解知识为可识别的模块层级,实现模块的重用、对齐和扩展,从而在保持旧模块的同时提升模型的可塑性和稳定性。
安全的贝叶斯优化用于线性共区域化模型中的不确定相关矩阵
发表机构 * Institute of Control Systems, Hamburg University of Technology(控制系统研究所,汉堡技术大学)
AI总结 本文将多任务贝叶斯优化的安全保证从内在共区域化模型扩展到线性共区域化模型,通过组合多个特征更灵活地建模任务间相关性,并推导了从线性共区域化核高斯过程中采样的向量值函数的统一误差界,同时在安全多任务贝叶斯优化基准上的数值比较中展示了线性共区域化模型的潜在性能优势。
Comments Accepted at IFAC WC26
超越GRPO和在线策略蒸馏:一种经验性稀疏到密集奖励原则用于语言模型后训练
AI总结 本文提出了一种经验性的稀疏到密集奖励原则,用于语言模型后训练,通过在教师模型上使用稀疏奖励进行探索和发现,然后通过密集监督将行为压缩到部署模型中,从而在数学问题上实现了优于GRPO的性能。
ECTO:用于超短期风功率预测的外源性条件化时间运算符
发表机构 * Wuhan Polytechnic University(武汉理工大学) ; Wuhan Public Meteorological Service Center(武汉市气象局)
AI总结 本文提出了一种统一框架ECTO,通过物理基础变量选择和外源性条件化制度细化模块,实现了对超短期风功率预测中非平稳、条件依赖的风力发电的高效建模,从而在不同气候、容量和外源变量维度的风场中取得最佳的均方误差性能。
Comments 42 pages, 10 figures, 9 tables
时间敏感语言生成理论:稀疏幻觉战胜模式崩溃
发表机构 * University of Southern California(美国南加州大学)
AI总结 本文研究了在全局偏好顺序下语言生成的极限情况,提出了一种时间敏感的语言生成方法,通过稀疏幻觉技术克服了模式崩溃问题,证明了在特定条件下可以实现最优密度。
通过潜在后验采样预测3D结构
发表机构 * Department of Computer Science(计算机科学系) ; University of Haifa(海法大学) ; Department of Computational Science(计算科学系)
AI总结 本文提出了一种结合NeRF表示和扩散模型的概率建模方法,用于从不同类型的观测数据(如单视角、多视角、噪声图像、稀疏像素和稀疏深度数据)中准确预测3D结构。
单线程JPEG解码器基准测试误评了ML数据加载器
发表机构 * Ternaus ; Independent Researcher(独立研究者)
AI总结 本文通过评估不同Python可访问的JPEG解码路径在五种匹配的16核Google Cloud CPU上的表现,发现单线程基准测试无法准确评价ML数据加载器的性能,揭示了不同架构和解码器在多线程工作负载下的差异。
Comments 10 pages, 4 figures. Code and data: https://github.com/ternaus/imread_benchmark
块级可微的Sinkhorn注意力:带有间隙意识的尘桶桥尾部细化
发表机构 * Independent Researcher(独立研究者)
AI总结 本文研究了通过停止基固定深度尾部细化代理在TPU硬件上实现长上下文平衡熵最优传输(OT)注意力。通过停止T步Sinkhorn求解后,展开一个短的细化尾部并精确地对这个代理进行微分。对于报告的R=2 TPU路径,反向传播包含四个阶梯计划因子。我们证明了一个精确的一参考瓷砖计划:R=2分数余切是单个参考计划瓷砖乘以一个由向量余切和双差分构建的显式修改字段。这导致了块级成本O((T+R)LW),O(Ld)输入存储,以及O(L)额外的HBM使用,对于固定头部维度d和带宽W在平衡固定支撑路径上。我们还正式化了当前dustbin_block路径作为在增强支撑上的相同单位目标代理,因此共轭计划提升到单个活跃尘桶路径,这在我们的TPU运行中使用;这个桥是代数的,不声称一般KL不平衡或任意容量间隙模型。我们提供了局部代理偏置界,后验偏置证书和严格正活跃块的投影收缩证书。在合成掩码问题上,优化的内核在10^-5至10^-10范围内与相同中心代理的精确自动微分匹配。在TPU v6e-8上,一个四配置Pfam屏幕完成端到端,一个提升的平衡R=2运行通过三小时预算,每秒维持大约8.5个示例,达到第1437步。保留的Pfam测试碎片将重建从5.57提高到2.05,稀疏CE从5.53提高到5.30,相对于第0步,CE被诊断性记录而不是直接优化;目标-均值对齐度量没有显著改善,而确定性对角参考在这些度量上仍更强。
列表式策略优化:基于组的RLVR作为LLM响应单纯形上的目标投影
发表机构 * Department of Automation, Tsinghua University(清华大学自动化系) ; LLM Department, Tencent(腾讯LLM部门)
AI总结 本文提出列表式策略优化(LPO),通过显式执行目标投影来解构隐式目标,利用响应单纯形限制近端RL目标,并通过精确散度最小化进行策略投影,从而在多样推理任务和LLM基础上提升训练性能,同时保持优化稳定性和响应多样性。
SOPE: 通过先验数据稳定在线强化学习中的策略评估
发表机构 * Media Integration and Communication Center – University of Florence(媒体集成与通信中心——佛罗伦萨大学) ; SEED – Electronic Arts(SEED——电子艺界)
AI总结 本文提出SOPE算法,通过使用与演员对齐的离策略策略评估(OPE)信号作为自动早停机制,动态控制离线训练阶段的长度,从而在连续控制任务中提高基线性能并减少计算资源消耗。
JoyAI-Image: 激活统一多模态理解和生成中的空间智能
发表机构 * Joy Future Academy, JD(joy未来学院,京东)
AI总结 本文提出JoyAI-Image,一种统一的多模态基础模型,用于视觉理解、文本到图像生成和指令引导的图像编辑。该模型结合了空间增强的多模态大语言模型(MLLM)和多模态扩散Transformer(MMDiT),通过共享的多模态接口实现感知与生成的交互。构建可扩展的训练配方,结合统一指令微调、长文本渲染监督、空间 grounded 数据和通用及空间编辑信号,使模型具备广泛的多模态能力,同时增强几何感知推理和可控视觉合成。实验表明,JoyAI-Image在理解、生成、长文本渲染和编辑基准上达到最先进的性能。更重要的是,增强的理解、可控的空间编辑和新视角辅助推理之间的双向循环使模型超越一般视觉能力,向更强的空间智能发展。
Comments Code: https://github.com/jd-opensource/JoyAI-Image
基于图神经网络的面向层次的知识图谱嵌入:应用于酵母表型预测
发表机构 * Department of Computer Science and Engineering, Chalmers University of Technology and University of Gothenburg(计算机科学与工程系,查尔姆斯理工大学和哥德堡大学) ; Department of Life Sciences, Chalmers University of Technology(生命科学系,查尔姆斯理工大学) ; Department of Industrial Biotechnology, KTH Royal Institute of Technology(工业生物技术系,皇家理工学院) ; Department of Chemical Engineering and Biotechnology, University of Cambridge(化学工程与生物技术系,剑桥大学)
AI总结 本文提出了一种利用图神经网络和来自底层本体的语义损失来生成层次感知的知识图谱嵌入的方法,用于酵母表型预测,并展示了其在基因敲除效应预测和知识图谱修订评估中的应用。
基于物理信息神经网络和傅里叶神经算子的浮式海上风力涡轮机多尺度动态涡流建模与预测
发表机构 * College of Renewable Energy, Hohai University, Changzhou, 213200, China(能源学院,河海大学,常州,213200,中国) ; College of Water Conservancy and Hydropower Engineering(水利水电工程学院) ; National Technology Innovation Center for Wind Power, Hohai University, Changzhou, 213200, China(风能技术创新中心,河海大学,常州,213200,中国)
AI总结 本文提出利用物理信息神经网络和傅里叶神经算子对浮式海上风力涡轮机的多尺度动态涡流进行建模与预测,通过高保真数据集验证了FNOs在效率、长期预测能力和多尺度相干结构保真度方面的优势。
差分隐私模型融合
发表机构 * The University of Chicago(芝加哥大学) ; Google DeepMind(谷歌DeepMind)
AI总结 本文提出两种后处理技术,随机选择和线性组合,用于在不额外训练的情况下生成满足任意目标差分隐私要求的最终私有模型,同时分析了这些方法在一般问题和私有均值估计中的隐私-效用权衡。
向虚拟细胞中的自主机理推理迈进
发表机构 * Korea Advanced Institute of Science and Technology (KAIST)(韩国科学技术院) ; Valence Labs(Valence实验室) ; University College London(伦敦大学学院)
AI总结 本文提出了一种结构化解释形式化方法,用于虚拟细胞中的生物推理,通过机理动作图实现系统验证和反驳,并引入VCR-Agent多智能体框架,结合生物基础知识检索和基于验证器的过滤方法,生成并验证机理推理。
轻量级低光照图像增强 via 分布归一化预处理和深度卷积U-Net
发表机构 * Sony Semiconductor Solutions Corporation(索尼半导体解决方案公司)
AI总结 本文提出了一种轻量级两阶段框架,通过分布归一化预处理和深度卷积U-Net实现低光照图像增强,相比现有方法参数更少且感知质量更优。
Comments Technical report for the NTIRE 2026 Efficient Low-Light Image Enhancement Challenge (CVPR 2026 Workshops), 3rd place solution
隐式流形上的扩散过程
发表机构 * Signal Processing Laboratory 2(信号处理实验室2) ; Institute of Artificial Intelligence(人工智能研究所) ; EPFL(瑞士联邦理工学院) ; Medical University of Vienna(维也纳医学大学)
AI总结 本文研究如何仅使用点云样本在数据流形上构建扩散过程,提出隐式流形估值扩散(IMDs)方法,通过近似扩散过程的无穷小生成元和carré-du-champ来定义高维空间中的随机微分方程,实现流形内在过程的外推,并通过实验验证其在数据流形上的约束性和探索性。
Comments Comments are more than welcome!
IMPACT: 开集时间序列异常检测中的影响建模
发表机构 * National Key Laboratory of Parallel and Distributed Computing(国家级并行与分布式计算实验室) ; College of Computer Science and Technology, National University of Defense Technology(国防科技大学计算机科学与技术学院) ; Intelligent Game and Decision Lab (IGDL)(智能游戏与决策实验室(IGDL)) ; Information Systems Technology and Design, Singapore University of Technology and Design(新加坡科技设计大学信息系统技术与设计系) ; School of Computing and Information Systems, Singapore Management University(新加坡管理大学计算与信息系统学院)
AI总结 本文提出IMPACT框架,通过影响建模方法解决开集时间序列异常检测中的挑战,通过学习影响函数生成真实异常模式并净化训练数据。
Comments Accepted by ICML 2026
Praxium:基于AI的遥测和依赖分析的云异常诊断
发表机构 * Boston University(波士顿大学)
AI总结 本文提出Praxium框架,利用AI技术进行云服务异常检测和根本原因推断,通过遥测数据和依赖分析提高故障诊断效率和准确性。
基于脑机接口的沉浸式通信的脉冲个性化联邦学习
发表机构 * School of Electrical and Data Engineering, University of Technology Sydney(悉尼技术大学电气与数据工程学院) ; Thrust of Internet of Things, The Hong Kong University of Science and Technology (Guangzhou)(香港科学与技术大学(广州)物联网研究所)
AI总结 本文提出了一种利用脑机接口获取脑信号以推断用户中心状态(如意图和感知相关不适)的沉浸式通信框架,通过个性化联邦学习模型处理脑信号,以适应神经多样性数据并防止敏感脑信号信息泄露,同时通过嵌入脉冲神经网络降低能耗,实验表明在真实脑信号数据集上识别准确率最高且能耗降低6.46倍。
Comments 6 pages, 3 figures
基于可微世界模型的离线强化学习推理时间策略优化
发表机构 * Siebel School of Computing and Data Science(计算与数据科学学院) ; Department of Computer Sciences(计算机科学系) ; University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校) ; University of Wisconsin Madison(威斯康星大学麦迪逊分校)
AI总结 本文提出了一种在推理时间利用可微世界模型优化策略参数的方法,通过端到端的梯度计算提升离线强化学习的性能,同时探讨了推理时间适应的计算开销与收益的权衡。
TabPFN扩展在可解释地质建模中的应用
发表机构 * Department of Civil and Environmental Engineering, Tohoku University(东北大学土木环境工程系) ; Research Organization of Information and Systems, The Institute of Statistical Mathematics(信息与系统研究所统计数学研究所) ; Department of Statistical Science, The Graduate University for Advanced Studies(高级研究大学统计科学系)
AI总结 本文评估了TabPFN及其扩展库在地质任务中的表现,通过土壤类型分类和参数迭代填补,展示了TabPFN在不确定性量化和可解释性方面的优势。
CRANE:利用隐马尔可夫模型纠正原始纳米孔信号中的错误
发表机构 * University of Maryland(马里兰大学) ; ETH Zurich(苏黎世联邦理工学院) ; Bilkent University(比尔肯特大学)
AI总结 本文提出CRANE方法,通过训练和使用隐马尔可夫模型(HMM)来纠正纳米孔信号中的错误,从而提高原始信号分析的准确性,减少分析管道优化的负担,并且不引入显著的计算开销。
用于李雅普诺夫和哈密尔顿-雅可比-贝尔曼方程的物理信息神经网络解的可验证误差界
发表机构 * Department of Applied Mathematics, Faculty of Mathematics, University of Waterloo(应用数学系,数学学院,滑铁卢大学)
AI总结 本文研究了如何通过物理信息神经网络求解李雅普诺夫和哈密尔顿-雅可比-贝尔曼方程的可验证误差界,提出了基于这些方程的解的误差界计算方法,并展示了如何通过残差界来估计真实解的相对误差以及近似解的后验估计。
Comments The paper will appear in the IEEE Control Systems Letters
FEAT: 一个线性复杂度的超大规模结构化数据基础模型
发表机构 * Zhejiang University(浙江大学) ; Ant Group(蚂蚁集团) ; Aalborg University(奥尔堡大学)
AI总结 本文提出FEAT,一种线性复杂度的基础模型,用于处理超大规模结构化数据,通过多层双轴编码架构和自适应融合双向状态空间模型,实现线性时间内的跨元组上下文化,同时支持排列不变的表示学习。
WestWorld: 一种知识编码的可扩展轨迹世界模型用于多样化机器人系统
发表机构 * Georgia Institute of Technology(佐治亚理工学院) ; University of Illinois at Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校) ; Carnegie Mellon University(卡内基梅隆大学) ; Mohamed bin Zayed University of Artificial Intelligence(穆罕默德·本·扎耶德人工智能大学)
AI总结 本文提出WestWorld,一种知识编码的可扩展轨迹世界模型,用于多样化机器人系统,通过引入系统感知的混合专家(Sys-MoE)和结构嵌入来提升可扩展性和零样本泛化能力,实现了在多种机器人环境中的高效轨迹预测和控制。
Comments ICML 2026 spotlight
扩散模型在训练中记忆,而在推理中泛化
发表机构 * Heinrich-Heine-University Düsseldorf(杜伊斯堡-埃森大学)
AI总结 本文研究了扩散模型在训练中过度拟合去噪目标,导致训练样本与验证样本性能差距,但通过模型误差使采样轨迹远离训练样本分布,从而在推理中实现泛化。
Comments 31 pages and 29 figures
PrefixWall: 缓解共享LLM系统中的前缀缓存侧信道
发表机构 * IMDEA Software Institute(IMDEA软件研究所) ; Universidad Politécnica de Madrid(马德里理工大学)
AI总结 本文提出PrefixWall系统,通过监控缓存重用并选择性隔离前缀,有效缓解多租户LLM服务系统中自动前缀缓存(APC)侧信道带来的安全风险,同时提升缓存利用率和推理效率。
在漂移后何时重新训练:对后漂移数据大小充分性的数据-only测试
发表机构 * SANKEN, The University of Osaka, Japan(SANKEN大学大阪大学日本)
AI总结 本文提出CALIPER方法,通过数据-only测试估计后漂移数据大小以确保稳定重新训练,该方法利用动态系统生成的数据状态依赖性,通过单次加权局部回归和局部性参数θ跟踪一歩代理误差,当有效样本量门控满足时,误差随局部性参数增加而单调非递增,表明数据足够用于重新训练。
Comments Accepted by ICLR 2026
C$^2$FG: 通过分数差异分析实现控制分类器无关引导
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; vivo BlueImage Lab(vivo 蓝影实验室) ; vivo Mobile Communication Co., Ltd.(vivo 通信有限公司)
AI总结 本文提出C$^2$FG,一种基于分数差异分析的控制分类器无关引导方法,通过严格理论分析建立了条件分布与无条件分布在不同时间步的分数差异上界,从而为时间依赖引导提供了理论基础,并通过实验验证了其在多种生成任务中的有效性。
Comments Accepted to CVPR 2026 (Highlight)
FT-Dojo: 向自主LLM微调迈进的语言代理
发表机构 * Peking University(北京大学) ; Nanjing University(南京大学) ; Microsoft Research Asia(微软亚洲研究院) ; The University of Chicago(芝加哥大学)
AI总结 本文提出FT-Dojo交互式基准环境,用于研究自主LLM微调,通过标准化任务接口、共享数据仓库、沙盒执行环境和反馈协议,开发了FT-Agent框架,实现了结构化迭代规划和多级反馈分析,实验显示FT-Agent在13个任务中表现优异,且展示了代理在故障恢复和长期规划中的能力。
Comments 26 pages, 6 figures, 11 tables
一个运算符统治一切?关于神经PDE求解器中边界索引运算符家族的探讨
发表机构 * College of Computing, Georgia Institute of Technology(佐治亚理工学院计算机学院) ; Department of Mathematics and Systems Engineering, Florida Institute of Technology(佛罗里达理工学院数学与系统工程系)
AI总结 本文探讨了神经PDE求解器中边界索引运算符家族的核心问题,指出传统方法在边界条件变化时存在非识别性问题,并通过实验验证了在不同边界条件下求解器的局限性。
Comments Published in the ICLR 2026 Workshop on AI & PDEs. 10 pages, 5 figures
GeoPT:通过提升几何预训练实现物理模拟的扩展
发表机构 * MIT CSAIL ; Tsinghua University(清华大学)
AI总结 本文提出GeoPT,一种基于提升几何预训练的通用物理模拟预训练模型,通过合成动态增强几何,实现动态感知的自监督学习,从而提升物理模拟的效率和效果。
Comments Project Page: https://physics-scaling.github.io/GeoPT/
可解释的人工智能:面向Transformer模型的上下文感知分层集成梯度方法
发表机构 * College of Engineering and Applied Science, University of Colorado Colorado Springs(科罗拉多州立大学工程与应用科学学院)
AI总结 本文提出了一种上下文感知分层集成梯度框架(CA-LIG),用于解释Transformer模型的决策过程,通过计算每个Transformer块内的分层集成梯度,并将这些token级属性与类特定的注意力梯度融合,从而生成具有符号和上下文敏感性的属性图,以捕捉支持和反对的证据,并追踪Transformer层中的相关性层次流动。
基于声学地图的多通道回放语音检测
发表机构 * Faculty of Information Technology(信息科技学院) ; Commmunication Sciences(通信科学) ; Tampere University(塔尔皮奥大学) ; Tampere, Finland(芬兰塔尔皮奥)
AI总结 本文提出利用声学地图作为新型空间特征表示方法,用于多通道录音中的回放语音检测,通过轻量级卷积神经网络在ReMASC数据集上实现了竞争性性能,展示了声学地图在不同设备和声学环境下的紧凑且物理可解释的特征空间。
Comments Accepted in EUSIPCO 2026
变分最优的Föllmer过程在生成扩散中的应用
发表机构 * Department of Mathematics, University of California, Los Angeles, CA, USA(加州大学洛杉矶分校数学系) ; Machine Learning Lab, Capital Fund Management, Paris, France(Capital Fund Management机器学习实验室) ; Courant Institute, New York University, NY, USA(纽约大学Courant研究所)
AI总结 本文研究了利用随机插值框架构造和分析生成扩散的过程,通过条件期望估计漂移项,证明了在变分最优条件下Föllmer过程在路径空间中最小化相对熵,并提供了数据驱动的模拟方法。
只计算一次:用于高效大规模推荐模型的UG分离
发表机构 * ByteDance AML(字节跳动人工智能实验室)
AI总结 本文提出UG分离方法,通过在TokenMixer密集交互模型中显式分离用户侧和物品侧的信息流,实现用户侧计算的重用,从而减少冗余推理成本,并通过信息补偿策略和权重量化技术提升效率。
Comments Large Recommender Model, Industrial Recommenders, Scaling Law
基于测试时间可调节的贝叶斯偏好学习的奖励模型
发表机构 * LinkedIn Corporation(LinkedIn公司) ; Nubank
AI总结 本文提出了一种新的贝叶斯奖励建模目标,即变分上下文奖励建模(ICRM),通过上下文偏好演示实现测试时间可调节性,从而适应未见过的偏好分布,提高了奖励模型的准确性和鲁棒性。
Comments Preprint
微 canonical 动力学能否利用小批量梯度噪声?
发表机构 * Department of Statistics, LMU Munich(统计系,慕尼黑大学) ; Munich Center for Machine Learning(慕尼黑机器学习中心) ; Department of Physics, University of California, Berkeley(伯克利大学物理系) ; Department of Astronomy, Tsinghua University(清华大学天文系) ; Physics Division, Lawrence Berkeley National Lab(伯克利国家实验室物理部)
AI总结 本文研究了微 canonical 动力学能否有效利用小批量梯度噪声,提出了一种梯度噪声预条件化方案和能量方差基于的自适应调节器,从而开发出一种鲁棒且可扩展的微 canonical 采样器,实现了在高维推断任务中的最佳性能。
Comments In Proceedings of the 43rd International Conference on Machine Learning
从不完美物理模型下的异方差随机动力系统中进行因果发现
发表机构 * Department of Mechanical & Industrial Engineering(机械与工业工程系) ; Northeastern University(东北大学) ; Department of Industrial Engineering and Management Sciences(工业工程与管理科学系) ; Department of Mechanical Engineering(机械工程系) ; Northwestern University(西北大学)
AI总结 本文提出了一种整合因果发现框架,利用随机微分方程中的部分物理知识来提高动态系统中因果图的恢复能力,同时分析了在不完美物理模型下的鲁棒性。
Comments 101 pages
用于过程监控的图自编码器
发表机构 * School of Information and Control Engineering, China University of Mining and Technology(信息与控制工程学院,中国矿业大学)
AI总结 本文提出了一种因果图时空自编码器(CGSTAE),通过结合基于空间自注意力机制的空间相关图结构学习模块和利用图卷积长短期记忆(GCLSTM)的空间-时间编码器-解码器模块,以提高工业过程监控的可靠性和可解释性。
比较解释并不足够,解释变化:需要新的标准来解释大型语言模型中的行为转变
发表机构 * Scuola Normale Superiore(诺莱学院) ; ISTI-CNR(意大利国家研究委员会ISTI研究所) ; University of Pisa(比萨大学)
AI总结 本文提出了一种新的XAI方法,旨在解释大型语言模型在干预后行为转变的原因和机制,以应对现有解释方法无法解释行为转变的问题。
DC-LA:差分凸拉格朗日算法
发表机构 * Division of Mathematical Sciences, School of Physical and Mathematical Sciences, Nanyang Technological University, Singapore(数学科学系,物理与数学科学学院,南洋理工大学,新加坡)
AI总结 本文研究了一个采样问题,其目标分布为π∝exp(-f-r),其中数据保真项f是Lipschitz光滑的,而正则化项r=r1-r2是一个非光滑的差分凸(DC)函数。通过利用r的DC结构,分别对r1和r2应用Moreau包络以平滑r。随后,将正则化部分的凹部分分配给数据保真项,并研究相应的近端拉格朗日算法(称为DC-LA)。在V远离耗散的假设下,建立了DC-LA在q-Wasserstein距离上收敛到目标分布π的结论,且在离散化和平滑误差范围内对所有q∈ℕ*成立。结果在非对数凹采样方面改进了之前的成果。
在社会困境中的多智能体系统中学习合作韧性激励结构
发表机构 * School of Engineering, Universidad de los Andes(工程学院,亚诺斯大学)
AI总结 本文研究了在社会困境中通过多智能体强化学习系统学习促进集体福祉的激励结构,提出了一种评估和排名智能体轨迹的韧性度量标准,并通过三种激励结构评估了资源共享环境中的系统性能。
Comments Supplementary material in https://github.com/mavivi95/supplementary_files/blob/main/Learning_TCSS___Supplementary_File__AN_.pdf Updated version submitted to IEEE Transactions on Computational Social Systems (TCSS). This preprint is under review for possible publication in IEEE
通过黎曼流匹配对预训练视觉语言模型进行知识不确定性量化
发表机构 * Department of Information Technology, Uppsala University, Uppsala, Sweden(瑞典乌普萨拉大学信息科技系) ; Science for Life Laboratory, Uppsala University, Uppsala, Sweden(瑞典乌普萨拉大学生命科学实验室)
AI总结 本文提出REPVLM方法,通过黎曼流匹配在视觉语言模型嵌入的超球面流形上计算概率密度,以量化模型的知识不确定性,并在分类和异常检测中取得显著效果。
用于硬件木马检测的可解释性方法:系统性比较
发表机构 * Electrical, Computer, and Systems Engineering(电子工程与系统工程)
AI总结 本文针对硬件木马检测中的可解释性方法进行系统性比较,探讨领域感知属性分析、基于案例的推理和特征归因技术在硬件安全应用中的性能差异。
自 refining 视频采样
AI总结 本文提出了一种自 refining 视频采样方法,通过预训练的视频生成器作为自身 refine 器,无需外部验证器或额外训练,在推理时实现迭代内部循环 refine,提高了运动一致性和物理对齐性。
Comments ICML 2026. Project page: https://agwmon.github.io/self-refine-video/
深度神经网络作为离散动力系统:对物理信息学习的启示
发表机构 * Engineering Mechanics Unit, Jawaharlal Nehru Centre for Advanced Scientific Research(纳拉扬·德赛高级科学研究中心工程力学单元) ; Italian Institute of Technology(意大利理工学院) ; University of Roma Tre(罗马三大学) ; Physics Department, Harvard University(哈佛大学物理系) ; Cornell University(康奈尔大学)
AI总结 本文探讨了深度神经网络与离散动力系统之间的类比,通过比较Burgers方程和Eikonal方程的数值/精确解与PINNs获得的解,展示了PINN学习在近似相同系统动力学时提供了一种不同的计算路径,同时指出PINNs的密集参数表示在高维情况下可能具有优势。
通过基于共识的隐私保护数据分发实现安全、可验证和可扩展的多客户端数据共享
发表机构 * School of Computer Engineering, KIIT University(KIIT大学计算机工程学院) ; Department of Mathematics, Kathmandu University(加德满都大学数学系)
AI总结 本文提出了一种基于共识的隐私保护数据分发(CPPDD)框架,该框架是一种轻量级且在设置后自动运行的协议,用于安全的多客户端数据聚合。该框架通过结合每个客户端的仿射掩码和优先级驱动的顺序共识锁定的双层保护机制,强制实施一致发布保密性。通过步骤(sigma_S)和数据(sigma_D)校验和实现去中心化完整性,从而在不需要持续协调的情况下实现自动恶意偏差检测和原子回滚。该设计支持标量、向量和矩阵负载,具有O(N*D)的计算和通信复杂度,可选边缘服务器卸载,并在N-1破坏情况下具有抗合谋性。形式分析证明了正确性、共识依赖完整性与公平性(CDIF)以及在偏差下的高概率回滚,并假设伪随机函数族的情况下证明了IND-CPA安全性。在MNIST衍生向量上的实证评估显示,可扩展性线性增长到N=500,每个客户端的计算时间亚毫秒级。该框架实现了100%的恶意偏差检测、精确的数据恢复以及与MPC和HE基线相比低三个到四个数量级的FLOPs。CPPDD在安全投票、联盟联邦学习、区块链担保和地理信息能力构建中实现了原子协作,解决了在受监管和资源受限环境中可扩展性、信任最小化和可验证多方计算的关键差距。
Comments 25 pages, 6 figures, preprint
通过基于采样的权重空间投影进行约束策略优化
发表机构 * Department of Mechanical Engineering, Seoul National University, Seoul, Korea(首尔国立大学机械工程系)
AI总结 该研究提出了一种基于采样的权重空间投影方法SCPO,用于在不离开安全操作范围的情况下优化策略,通过在参数空间中直接强制安全约束,确保在训练过程中保持安全性和可行性,同时在约束控制任务中实现闭环稳定性。
Comments Accepted for publication at IFAC World Congress 2026; fixed minor notation inconsistencies
从稀疏输出测量中学习动态以实现不确定性感知的最优控制
发表机构 * Chair of Information-oriented Control, School of Computation, Information and Technology(信息导向控制研究所,计算、信息与技术学院)
AI总结 该研究提出了一种基于贝叶斯先验的连续时间动态和潜在状态轨迹建模方法,利用目标Metropolis-Hastings采样器和数值ODE求解器进行更新,通过场景优化方法解决不确定性下的最优控制问题,验证了在1型糖尿病血糖调节中的有效性。
Comments Accepted for publication in the Proceedings of the 2026 IFAC World Congress
E-PCN:利用可解释的粒子切比雪夫网络进行喷注标记:使用动量学特征
发表机构 * a Center for Computational \& Data Sciences, Independent University, Bangladesh, Dhaka-1229, Bangladesh b Department of Physical Sciences, Independent University, Bangladesh, Dhaka-1229, Bangladesh c Department of Theoretical Physics, University of Dhaka, Dhaka-1000, Bangladesh [-1em]
AI总结 本文提出E-PCN,一种结合动量学特征的可解释粒子切比雪夫网络,用于喷注标记,通过构建四个图表示来提高分类的可解释性和准确性。
Comments 25 pages, 3 figures
一种可微的代数复杂性度量:证明精确发现群结构
发表机构 * Independent Researcher(独立研究者) ; IBM Research(IBM研究院) ; University at Albany, SUNY(阿尔巴尼大学,SUNY)
AI总结 本文提出了一种可微的代数复杂性度量,通过Cayley表完成问题,证明了通过超立方体操作符张量分解可以精确发现群结构,解决了Huh(2025)的核心开放猜想。
Comments 29 pages, 3 figures. All theoretical conjectures are formally proven as theorems and verified in Lean 4. v4: Minor typographical corrections
Maxitive Donsker-Varadhan Formulation for Possibilistic Variational Inference
发表机构 * Nanyang Technological University(南洋理工大学)
AI总结 本文提出了一种基于可能性理论的变分推断方法,通过建立最大性Donsker-Varadhan公式,解决了传统变分推断中对加法性假设的依赖问题,并提出了CBOpt优化器以提升图像分类任务的性能。
Comments 37 pages, 3 figures, 13 tables
在LLM压缩中寻找免费午餐:重新审视剪枝后的重新训练
发表机构 * Department for AI in Society, Science, and Technology, Zuse Institute Berlin(人工智能社会、科学与技术系,柏林Zuse研究所) ; Institute of Mathematics, Technische Universität Berlin(数学系,柏林技术大学)
AI总结 本文研究了在剪枝后通过局部重建进行适应的方法,发现其在减少数据和计算成本的同时能有效提升模型性能,并揭示了在不同粒度下重建参数窗口对最终质量的影响,挑战了LLM剪枝后适应不可行的主流观点。
通过单token数字嵌入提升语言模型的数值处理效率
发表机构 * Chair for AI in Healthcare and Medicine, Technical University of Munich (TUM) and TUM University Hospital, Munich, Germany(人工智能在医疗和医学中的Chair,慕尼黑技术大学(TUM)和慕尼黑技术大学医院,德国慕尼黑) ; Department of Computing, Imperial College London, UK(计算系,伦敦帝国学院,英国) ; Munich Center for Machine Learning (MCML), Munich, Germany(慕尼黑机器学习中心(MCML),德国慕尼黑) ; Hasso Plattner Institute for Digital Engineering, University of Potsdam, Germany(哈索·platzer研究所数字工程学院,波茨坦大学,德国)
AI总结 本文提出BitTokens,一种利用IEEE 754二进制浮点表示将数字编码为单token的方法,使语言模型能更高效地处理数值计算,从而提升其解决复杂问题的能力。
在Jaynes-Cummings模型中进行量子回声计算:非线性记忆与时间序列预测
发表机构 * Institute for Cross-Disciplinary Physics and Complex Systems (IFISC) UIB-CSIC(交叉学科物理与复杂系统研究所(IFISC) UIB-CSIC)
AI总结 本文研究了基于Jaynes-Cummings模型的量子回声计算,探讨了非线性记忆和时间序列预测的核心方法,并展示了其在复杂动态系统中的应用价值。
Comments 16 pages, 14 figures, published version
TimeRewarder: 通过帧间时间距离从被动视频中学习密集奖励
发表机构 * Institute for Interdisciplinary Information Sciences, Tsinghua University, Beijing, China(清华大学交叉信息研究院) ; Shanghai Qi Zhi Institute(上海启智研究院) ; Shanghai Jiao Tong University(上海交通大学) ; University of Pennsylvania(宾夕法尼亚大学)
AI总结 本文提出TimeRewarder方法,通过帧间时间距离从被动视频中学习密集奖励,以提升强化学习在稀疏奖励任务中的性能,实验表明其在多个任务中显著提高了成功率和样本效率。
Comments ICML 2026 spotlight paper
有效模型剪枝:衡量模型组件的冗余性
发表机构 * Department of Mechanical and Aerospace Engineering, University of Florida(佛罗里达大学机械与航空航天工程系) ; Department of Mathematics, Ohio University(俄亥俄大学数学系)
AI总结 本文研究了模型剪枝中的基本问题,提出了一种基于有效样本大小的剪枝方法,通过分析重要性评分分布来确定可丢弃的组件数量,并在多种网络架构上验证了该方法的有效性。
Comments 18 pages, 4 figures. Accepted at ICML 2026 (Spotlight)
基于离散扩散策略的强化学习
发表机构 * Google Research(谷歌研究) ; Harvard University(哈佛大学) ; Google DeepMind(谷歌DeepMind) ; Nvidia Research(Nvidia研究)
AI总结 本文提出了一种新的框架,用于在复杂的组合动作空间中训练高效的离散扩散模型策略,通过高效的在线训练过程和策略镜像下降方法,实现了稳定的策略改进,并在多个挑战性组合基准上取得了最先进的性能。
Comments 22 pages, 10 figures. Haitong Ma and Ofir Nabati contributed equally to this paper
生成推荐中的序列数据增强
发表机构 * Snap Inc.(Snap公司)
AI总结 本文研究了生成推荐中数据增强的影响,提出了一种系统化的框架GenPAS,通过三种受偏步骤统一了多种增强策略,提升了模型的准确率、数据效率和参数效率。
基于Y-wise仿射神经网络的强化学习控制
发表机构 * Department of Chemical and Biomedical Engineering, West Virginia University(化学与生物医学工程系,西弗吉尼亚大学)
AI总结 本文提出了一种基于Y-wise仿射神经网络(YANNs)的新型强化学习算法,通过利用YANNs的可解释性,将多参数线性模型预测控制的显式解重新表述,并在初始化RL策略网络和评估网络时提供线性最优控制的自信度,最终实现对一般非线性优化问题的求解。
TikTok上的反 Establishment 情绪:对社交媒体中影响者和专业知识理解的启示
发表机构 * GitHub
AI总结 本文研究了TikTok上反 Establishment 情绪的普遍性,通过计算方法分析了金融、健康和阴谋论等主题内容中反 Establishment 情绪的分布,并探讨了社交媒体环境中反 Establishment 情绪对用户参与和平台激励的影响。
Comments 10 pages excluding references; 14 pages in total; 4 figures; Accepted by the AAAI Conference on Web and Social Media (ICWSM-2026)
FunduSegmenter:利用RETFound基础模型进行视网膜底照相图像中视盘和视杯联合分割
发表机构 * University of Dundee(邓迪大学)
AI总结 本文提出了一种基于RETFound基础模型的FunduSegmenter模型,通过引入一系列新颖模块实现视盘和视杯的联合分割,实验表明该模型在多个数据集上均优于现有方法。
回顾性稀疏注意力用于高效长上下文生成
发表机构 * Seoul National University(首尔国立大学)
AI总结 本文提出RetroAttention,一种新的KV缓存更新技术,通过回顾后续解码步骤的KV条目来修正过去的注意力输出,从而提高长上下文生成的效率和准确性。
通过建模内模和跨模态因果注意力来解构偏见以进行多模态情感分析
发表机构 * School of Computer Science, South China Normal University(华南师范大学计算机学院) ; School of Electronics and Information Technology, Sun Yat-sen University(中山大学电子与信息学院)
AI总结 本文提出了一种多关系多模态因果干预(MMCI)框架,通过因果理论的后门调整来解决多模态情感分析中因统计捷径导致的偏见问题,通过建模多模态输入为多关系图并应用注意力机制分离因果特征和捷径特征,从而提升模型在分布偏移下的稳定性。
Comments Corrected several hyperparameter settings. Updated some experimental results
FAIR-Pruner: 一种通过差异容忍性实现自动分层剪枝的灵活框架
发表机构 * School of Statistics and Mathematics, Zhejiang Gongshang University(浙江工商大学统计与数学学院) ; École de technologie supérieure (ÉTS), Université du Québec(魁北克大学埃克森技术学院) ; Southern University of Science and Technology(南方科技大学)
AI总结 本文提出FAIR-Pruner,一种无需搜索的自适应分层结构化剪枝框架,通过引入差异容忍度(ToD)来实现非均匀的分层剪枝深度,从而在多个数据集和模型上实现了良好的准确率-压缩率权衡。
Comments Submitted to IEEE Transactions on Pattern Analysis and Machine Intelligence
基于耦合簇水平精度的机器学习力场用于晶格动力学
发表机构 * Institute of Theoretical Physics, Technical University of Vienna(维也纳技术大学理论物理研究所) ; Faculty of Physics and Center for Computational Materials Science, University of Vienna(维也纳大学物理系和计算材料科学中心)
AI总结 本文研究了基于近似密度泛函理论和耦合簇水平势能面训练的机器学习力场,通过计算声子色散关系和振动密度态与实验和参考ab initio结果进行比较,验证了其在碳金刚石和锂氢固体中的准确性和精度,并探讨了通过耦合簇与密度泛函结果差异的delta学习方法和带电意识的机器学习力场方法。
Comments 17 pages, 7 figures
量子成本景观的梯度可扩展性与泰勒近似
发表机构 * Department of Mathematics and Computer Science, University of Basel(数学与计算机科学系,巴塞尔大学) ; IBM Quantum, IBM Research Europe -- Zurich(IBM量子,IBM欧洲研究院——苏黎世)
AI总结 本文研究了变分量子算法中梯度可扩展性与计算复杂性之间的关系,提出了一种经典模拟技术泰勒近似,并引入了线性克莱因编码器以确保梯度的常数可扩展性,通过数值实验发现梯度可能在超多项式复杂区域中衰减多项式而非指数。
Comments 12 pages, 6 figures, 54 pages of supplementary material
严格子目标执行:在分层强化学习中的可靠长 horizon 规划
发表机构 * Graduate School of Artificial Intelligence(人工智能研究生院) ; Ulsan National Institute of Science and Technology (UNIST)(釜山国立科学与技术研究所) ; Ulsan, South Korea(韩国釜山)
AI总结 本文提出严格子目标执行(SSE)框架,通过前沿经验回放(FER)分离不可达与可接受的子目标,提高高层决策效率,从而在长horizon任务中实现更可靠的规划。
Comments 10 pages for main, 26 pages for total, Accepted to ICLR 2026
Time-Prompt: 集成异构提示以解锁时间序列预测中的LLM
发表机构 * Central South University, Changsha, China(中南大学,长沙,中国)
AI总结 本文提出Time-Prompt框架,通过构建统一的提示范式、设计语义空间嵌入和跨模态对齐模块以及高效微调LLM参数,提升时间序列预测性能,并在碳排放数据集上验证其有效性。
Comments Accepted at IJCNN 2026
Universal Reasoner: 一个单一、可组合的即插即用推理器用于冻结的LLM
发表机构 * Graduate School of Artificial Intelligence, Korea Advanced Institute of Science and Technology(人工智能研究生院,韩国科学技术院)
AI总结 本文提出Universal Reasoner,一种可组合且即插即用的推理模块,能够在冻结的大规模语言模型上提供专门的推理能力,通过共享或对齐的token空间实现弱到强的泛化,实验表明其在数学推理和机器翻译中优于现有微调方法。
Comments ICML 2026
YANNs: Y-wise Affine Neural Networks for Exact and Efficient Representations of Piecewise Linear Functions
发表机构 * Department of Chemical and Biomedical Engineering, West Virginia University, United States of America(化学与生物医学工程系,西弗吉尼亚大学,美国)
AI总结 本文提出YANNs,一种能够精确且高效表示分段线性函数的Y-wise仿射神经网络,无需训练即可实现功能等效表示,为多参数模型预测控制提供了应用展示,展示了在实时计算中的高效性与控制理论保证。
LLMs on the Line: 数据决定损失-损失缩放定律
发表机构 * Max Planck Institute for Intelligent Systems(智能系统马克斯·普朗克研究所) ; ELLIS Institute Tübingen(图宾根ELLIS研究所) ; Tübingen AI Center(图宾根人工智能中心) ; University of Tübingen(图宾根大学)
AI总结 研究探讨了影响LLM损失-损失缩放定律的主要因素,发现预训练数据决定了缩放趋势,而模型大小、优化超参数、分词器和架构差异对缩放影响有限,因此应精心选择预训练数据以获得最佳下游性能。
Comments ICML 2025 camera-ready version
基于鲁棒技能的元强化学习中的自我改进技能学习
发表机构 * Graduate School of Artificial Intelligence(人工智能研究生院) ; Ulsan National Institute of Science and Technology (UNIST)(釜山国立科学技术研究院 (UNIST))
AI总结 本文提出Self-Improving Skill Learning (SISL)方法,通过解耦的高层和技能改进策略进行自我指导的技能细化,并利用最大回报重标记进行技能优先级排序,从而在噪声和次优数据下实现鲁棒且稳定的适应,优于其他基于技能的元强化学习方法。
Comments 10 pages main, 27 pages appendix with reference. Accepted to ICLR 2026
狼群对抗攻击用于鲁棒多智能体强化学习
发表机构 * Graduate School of Artificial Intelligence, UNIST, Ulsan, South Korea(人工智能研究生院,UNIST,韩国乌山)
AI总结 本文提出狼群对抗攻击框架,用于对抗多智能体强化学习中的协同对抗攻击,并引入狼群-对抗学习框架来训练鲁棒的MARL策略以防御该攻击。
Comments 9 pages main, 23 pages appendix with reference. Accepeted by ICML 2025
任务感知虚拟训练:增强元强化学习在分布外任务中的泛化能力
发表机构 * Graduate School of Artificial Intelligence, UNIST, Ulsan, South Korea(人工智能研究生院,UNIST,韩国乌山)
AI总结 本文提出Task-Aware Virtual Training方法,通过度量学习提升元强化学习在分布外任务中的泛化能力,采用虚拟任务保持任务特征并利用状态正则化技术减少状态变化环境中的过估计误差。
Comments 9 pages main paper, 20 pages appendices with reference. Accepted to ICML 2025
朝向语言模型的匿名化
发表机构 * INSA Lyon, Inria, CITI, UR3720(里昂国家理工学院、法国国家科学研究中心、CITI、UR3720) ; Inria, INSA Lyon, CITI, UR3720(法国国家科学研究中心、里昂国家理工学院、CITI、UR3720)
AI总结 本文提出了一种隐私保护的语言模型方法,通过掩码语言模型(MLM)和因果语言模型(CLM)方法,旨在解决语言模型的匿名化问题,从而促进其共享。研究通过医疗数据集评估了这两种方法,并表明在避免记忆直接和间接标识信息的同时,能够保持高隐私性和高实用性。
谱不稳定性节点驱动图学习中的可靠性故障
发表机构 * MTU(MTU大学)
AI总结 研究探讨了图学习中谱不稳定性节点对可靠性故障的影响,提出了一种可靠性感知干预方法以隔离这些节点,从而提升算法在对抗性和内在噪声下的鲁棒性。
kNN图拉普拉斯算子的改进收敛速度:可微自调亲和力
发表机构 * Department of Mathematics, Duke University(杜克大学数学系) ; Department of Mathematical Sciences, The University of Texas at Dallas(德克萨斯大学达拉斯分校数学科学系)
AI总结 本文研究了kNN图的收敛速度问题,提出了一种可微自调亲和力的方法,通过改进分析得到在流形数据设定下,kNN图拉普拉斯算子以O(N^{-2/(d+6)})的速度收敛到极限流形算子,验证了理论结果。
SLIDE:一种基于机器学习的多体系统强迫动态响应估计方法
发表机构 * University of Innsbruck, Austria(奥地利因斯布鲁克大学) ; Johannes Kepler University Linz, Austria(奥地利林茨约翰尼斯·凯普勒大学) ; University of Oulu, Finland(芬兰奥卢大学)
AI总结 本文提出了一种基于机器学习的SLIDE方法,用于估计机械或多体系统的输出序列,通过滑动窗口初始截断动态响应估计器,利用复数特征值近似阻尼效应,提高模拟速度并实现实时性能。
Comments Paper currently in submission for journal publication
大语言模型的优化超参数规律
发表机构 * Department of Mathematics, National University of Singapore, Singapore(新加坡国立大学数学系) ; School of Computing, National University of Singapore(新加坡国立大学计算机学院) ; Department of Mathematics and Institute of Operations Research and Analytics, National University of Singapore, Singapore(新加坡国立大学数学系和运筹分析研究所) ; Skywork AI, Beijing(北京Skywork AI)
AI总结 本文提出Opt-Laws框架,通过分析SDE收敛和逃逸特性,预测最终训练损失,从而在小规模实验中预选学习率调度方案,提高了超参数选择的准确性。
TRAM: 测试时风险适应与代理混合
发表机构 * UT Austin(得克萨斯大学) ; University of Central Florida(中央佛罗里达大学) ; MIT(麻省理工学院) ; UMD(大学公园分校)
AI总结 本文研究了在部署时无需更新的零更新适应问题,提出TRAM方法通过混合代理评估源策略的风险调整分数,以降低部署风险并保持奖励。
核两样本检验中计算与统计的权衡:随机傅里叶特征
发表机构 * Department of Statistics and Data Sciences, The University of Texas at Austin(德克萨斯大学奥斯汀分校统计与数据科学系) ; Department of Mathematical Sciences, KAIST(韩国科学技术院数学科学系)
AI总结 本文研究了使用随机傅里叶特征近似MMD检验在计算复杂度与统计功效之间的权衡,证明通过合理选择随机特征数量可以在亚二次时间内达到与MMD检验相同的最小最大分离率。
CARACAS:用于详细CAN攻击模拟的车辆架构
发表机构 * Politecnico di Torino, Department of Control(都灵理工大学控制与计算机工程系)
AI总结 本文提出CARACAS,一种用于模拟详细CAN攻击的车辆模型,通过结合Simulink等仿真框架和攻击模型的稳健表示,生成合成数据集以提高IDS的检测能力,重点展示电池电动车的扭矩控制攻击模拟。
Comments 6 pages, 8 figures, TrustAICyberSec workshop - IEEE ISCC 2024
关于多项式有效乐观性下GP-UCB的次优性质
发表机构 * Department of Industrial Systems Engineering and Management, National University of Singapore(新加坡国立大学工业系统工程与管理系) ; Department of Industrial Engineering and Decision Analytics, The Hong Kong University of Science and Technology(香港科学与技术大学工业工程与决策分析系)
AI总结 本文研究了GP-UCB在多项式有效乐观性下的次优性质,通过定义有效乐观性水平(核岭回归中的探索系数与正则化参数的乘积),在统一置信假设下证明了GP-UCB在Matérn核下的新后悔下界,表明有效乐观性水平的多项式增长排除了最小最大最优后悔率,揭示了标准GP-UCB证明最小最大最优性的障碍。
从岭函数视角出发的Mercer大规模核机
发表机构 * Faculty of Applied Mathematics, The Gda\'nsk University of Technology, ul. G. Narutowicza 11/12, 80-952 Gda\'nsk, Poland
AI总结 本文从岭函数视角出发,研究大规模核机的Mercer性质,探讨了通过余弦函数的乘积之和近似核函数的可行性,并分析了该方法的障碍,应用于图像处理中的'一对一'方法。
Comments 17 pages, 3 figures
隐式生成建模的分数差流
发表机构 * Disney Research(迪士尼研究)
AI总结 本文提出分数差流作为隐式生成建模的一种新方法,通过最优减少两个分布之间的KL散度,展示了其与去噪扩散模型的等价性,并揭示了生成对抗网络训练中隐含的数据优化子问题与分数差流之间的联系。
Comments 25 pages, 5 figures, 4 tables. Updated final version of a paper originally published in Transactions on Machine Learning Research (TMLR), including minor typographical corrections and post-publication commentary connecting the SD flow to drifting models
深度学习应用于计算力学:综述、现状和经典方法
发表机构 * University of Illinois at Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校) ; Johannes Kepler University(约翰尼斯·开普勒大学)
AI总结 本文综述了深度学习在计算力学中的应用,包括固体力学、流体力学和有限元技术,并讨论了混合和纯机器学习方法在解决非线性偏微分方程中的作用,同时介绍了LSTM、注意力机制和核方法等技术。
Comments 275 pages, 158 figures. Appeared online on 2023.03.01 at CMES-Computer Modeling in Engineering & Sciences
基于AI的独立施工安全结果的属性预测
发表机构 * University of Edinburgh, UK(爱丁堡大学,英国) ; University of Colorado at Boulder, USA(科罗拉多大学博尔德分校,美国)
AI总结 本文改进并验证了先前研究中通过机器学习从属性中预测安全结果的方法,使用NLP提取属性并训练模型预测伤害严重性、类型、受影响身体部位和事件类型,通过独立人工标注消除潜在的人工相关性,结果表明属性仍具有高度预测性,同时引入了更大的数据集、新模型、模型堆叠和更合适的评估指标,最终成功预测伤害严重性,这是重大进展。
Comments Added author contributions and journal reference, updated corresponding author, fixed a few typos
OpenSeisML: 开放式大规模真实地震和井历数据集用于生成式AI
发表机构 * Georgia Institute of Technology(佐治亚理工学院) ; Osokey Ltd(Osokey公司)
AI总结 本文提出OpenSeisML,一个开放的大型真实地震和井历数据集,用于支持生成式AI在地震反演中的应用,通过自动化数据整理流程提供可重复的地震数据准备,以训练生成模型捕捉地下属性的统计分布,从而生成多个统计上一致的现实实现用于不确定性量化。
Comments 5 pages, 8 figures
通过子空间追求轴心化神经网络
发表机构 * Tampere University, Faculty of ITC, Finland(芬兰塔尔库大学信息与通信技术学院) ; Department of Electrical Engineering, Qatar University, Qatar(卡塔尔大学电气工程系) ; Donders Institute, Radboud University, The Netherlands(荷兰拉德堡德大学多纳尔斯研究所)
AI总结 本文提出一个基于几何公理的框架,用于解释神经网络的行为,通过子空间追求假设,统一了表示、计算和泛化在浅层和深层架构中的视角。
Comments 43 pages, 25 figures. Code and additional materials will be released
Ada2MS: 一种基于元素级和全局二阶矩估计指数混合的混合优化算法
发表机构 * School of Information Management and Mathematics, Jiangxi University of Finance and Economics(江西财经大学信息管理与数学学院) ; School of Mathematics and Computer Science, Nanchang University(南昌大学数学与计算机科学学院) ; Institute of Metaverse, Nanchang University(南昌大学元宇宙研究院) ; Jiangxi Provincial Key Laboratory of Virtual Reality(江西省虚拟现实重点实验室)
AI总结 本文提出Ada2MS算法,通过连续指数插值元素级和全局二阶矩估计,平衡AdamW和动量SGD的优缺点,在视觉任务中取得竞争性结果。
NeuroQA: 一种大规模的3D脑部MRI理解图像 grounded 评估基准
发表机构 * Stanford University(斯坦福大学)
AI总结 本文提出NeuroQA,一个大规模的3D脑部MRI视觉问答基准,包含来自12977名受试者的56953个问答对,涵盖5-104岁及五个临床领域,通过3D体积评估11种临床推理技能,并提供可复现的生成脚本和在线排行榜。
Comments 30 pages, dataset and benchmark release
机器学习增强的非侵入性测试用于MASLD纤维化:浅层-深层神经网络与FIB-4、表格基础模型和大语言模型的比较
发表机构 * BioML Lab, RI CODE, UniBw, Munich, Germany(BioML实验室,RI CODE,UniBw,慕尼黑,德国) ; Department of Epidemiology and Data Science, Amsterdam UMC, Amsterdam, Netherlands(流行病学与数据科学系,阿姆斯特丹大学医学中心,阿姆斯特丹,荷兰) ; Alpha Indicium, Rijswijk, Netherlands(Alpha Indicium,里杰斯霍伊斯,荷兰) ; Department of Computer Science, University of Salerno, Salerno, Italy(计算机科学系,萨勒诺大学,萨勒诺,意大利) ; GI-Liver Unit, 2nd Department of Internal Medicine, National and Kapodistrian University of Athens, General Hospital of Athens “Hippocratio”, Athens, Greece(肝病单位,第二内科部,雅典国家与卡波迪斯托里亚大学,雅典“希波克拉底”医院,希腊)
AI总结 本文研究了机器学习增强的非侵入性测试在MASLD纤维化检测中的应用,比较了浅层-深层神经网络、FIB-4、表格基础模型和大语言模型在不同队列中的性能,发现浅层-深层神经网络在保持FIB-4变量空间的同时提供了更平衡的外部操作性能。
Comments 26 pages, 4 figures, 3 tables. Preprint
基于二次近似的指数机制用于具有隐私保障的机器学习模型微调
发表机构 * Computer Science and Mathematics Division, Oak Ridge National Laboratory(橡树岭国家实验室计算机科学与数学 division) ; Computational Science and Engineering Division, Oak Ridge National Laboratory(橡树岭国家实验室计算科学与工程 division) ; HPC Department, Cineca(Cineca 高性能计算部)
AI总结 本文提出一种基于指数机制的随机算法,用于在保证差分隐私的前提下微调预训练模型,通过结合局部二次近似和新数据集信息构建效用函数,并引入随机投影策略提升高维模型的可扩展性。
在线腐蚀反馈下的符合预测
发表机构 * Department of Engineering, King’s College London(伦敦国王学院工程系) ; Communication Systems Department, EURECOM(EURECOM通信系统部) ; Institute for Intelligent Networked Systems, Northeastern University London(伦敦东北大学智能网络系统研究所)
AI总结 本文研究了在存在腐蚀反馈的情况下在线符合预测的鲁棒性问题,提出两种鲁棒方案并通过实验验证了其在腐蚀反馈下的改进性能。
通过言语反馈强化人类行为模拟
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; Microsoft(微软)
AI总结 本文提出DITTO模型,通过将言语反馈作为强化学习中的首要信号来提升LLM模拟人类行为的能力,并引入SOUL基准测试平台,展示了在多个任务中显著提升性能的成果。
基于表示空间扩散模型的Tippett最小融合多编码器异常检测
发表机构 * Georgia Institute of Technology(佐治亚理工学院)
AI总结 本文提出了一种多编码器融合的表示空间扩散模型,通过统计分析每个编码器对特定分布偏移类型的敏感性,引入EncMin2L门控机制,无需使用OOD标签即可在较低参数成本下提升异常检测性能,同时在四种分布偏移类型上均达到0.94以上的AUROC。
Comments 14 pages
具有风依赖性路径转换的10,000年全球随机热带气旋目录(WHITS)
发表机构 * Lamont-Doherty Earth Observatory, Columbia University(哥伦比亚大学拉蒙特-多赫蒂地球观测站) ; School of Complex Adaptive Systems, Arizona State University(亚利桑那州立大学复杂适应系统学院) ; Earth and Environmental Engineering, Columbia University(哥伦比亚大学地球与环境工程系)
AI总结 本文提出WHITS方法,通过非参数半马尔可夫路径生成器生成全球10,000年合成气旋目录,以提高保险损失评估的可靠性。
ZEBRA: 零样本预算化资源分配用于LLM编排
发表机构 * Tel Aviv University(特拉维夫大学)
AI总结 该研究提出ZEBRA框架,通过将多阶段预算分配转化为连续非线性背包问题,有效解决多智能体流水线中预算分配问题,实验显示其在多个任务上均优于传统方法。
二次特性用于神经网络可达性分析
发表机构 * Kevin T. Crofton Department of Aerospace and Ocean Engineering, Virginia Tech(凯文·T·克罗夫顿航空航天与海洋工程系,弗吉尼亚理工学院) ; Federation ENAC ISAE-SUPAERO ONERA, Universite de Toulouse(ENAC ISAE-SUPAERO ONERA联盟,图卢兹大学)
AI总结 本文提出了一种构建二维实平面上标量关系的验证二次特性的框架,通过局部生成候选二次不等式并全局验证,以提高神经网络可达性分析的精度和效率。
用于基于模型的图像去噪中超参数预测的Oracle监督转移
发表机构 * Department of Mathematics Syracuse University(数学系苏利文大学) ; Department of Mathematics & Statistics Old Dominion University(数学与统计学系老 Dominion 大学)
AI总结 该研究提出HyperDn,一种单配置条件预测器,通过聚合源配置的Oracle监督,预测新的去噪器-噪声配置的异质超参数,展示了在跨范式实验中,从相对便宜的TV/TGV变分源转移到更昂贵的扩散模型DiffPIR时,通过少量或无目标Oracle标签实现接近Oracle性能的成果。
训练语言代理以从经验中学习
发表机构 * University of Cambridge(剑桥大学)
AI总结 本文提出了一种名为In-context Training(ICT)的任务框架,用于评估语言代理在跨任务中的自我改进能力,并通过基于强化学习的训练管道直接从经验中学习反思,从而在多个基准任务中优于基线模型,展示了从经验中学习的能力本身可以被学习。
通过微分测试时间缩放进行代码生成
发表机构 * University of California, Davis(加州大学戴维斯分校)
AI总结 本文提出DiffCodeGen,一种基于覆盖引导的微分分析的代码生成方法,通过生成多样化的代码候选并利用覆盖引导模糊测试来合成输入,无需现有测试用例或大语言模型,从而提高效率和可扩展性。
Comments 16 main text, 21 pages with references
SMA-DP:基于频谱记忆的差分隐私用于深度学习
发表机构 * Department of Electrical Engineering and Computer Science(电气工程与计算机科学系) ; University of California, Merced(加州大学默塞德分校) ; Department of Applied Mathematics(应用数学系)
AI总结 本文提出了一种名为SMA-DP-SGD的差分隐私随机梯度下降方法,通过引入频谱记忆分支来增强DP-SGD的隐私保护性能,从而在多个数据集上实现了更优的准确率和隐私保护。
LLM预训练塑造了可泛化的流形:跨模态迁移至时间序列的洞察
发表机构 * McGill University(麦吉尔大学) ; Mila - Quebec AI Institute(魁北克人工智能研究所) ; Université de Montréal(蒙特利尔大学) ; University of Toronto(多伦多大学) ; Concordia University(康科迪亚大学) ; com(42.com)
AI总结 研究探讨了语言预训练的Transformer能否成为有效的时序预测器,并揭示了跨模态迁移的机制,指出预训练构建了流形,微调则将数值动态投影到任务相关方向。
Transformer在Grokking中的权重衰减区域:廉价的在线诊断
发表机构 * Independent Researcher(独立研究者)
AI总结 研究探讨了在模运算中训练的Transformer模型在记忆、泛化和崩溃之间的尖锐转变,并通过权重衰减作为标量经验控制参数来分析这些区域,引入了两种廉价的在线诊断方法,通过注意力激活来跟踪训练动态,并在较低计算成本下补充损失景观诊断。
Comments 28 pages, 11 figures, 5 tables. Code and aggregate JSONs: https://github.com/lucky-verma/grokking-diagnostics. Per-run JSONs: https://huggingface.co/datasets/lucky-verma/grokking-diagnostics-runs. Lean 4/mathlib v4.29.0 formal checks available in the code repository
群代数张量:可证明最优的等变学习与物理对称性发现
发表机构 * UT Austin(得克萨斯大学奥斯汀分校) ; IBM Research(IBM研究院) ; Independent(独立) ; Tufts University(塔夫茨大学) ; Tel-Aviv University(特拉维夫大学)
AI总结 本文提出了一种群代数张量框架,通过将有限群G的乘法规则引入张量代数,使等变性成为代数属性而非架构限制。该框架基于三个理论支柱:(i) Eckart-Young最优性保证的星G-SVD;(ii)通过Kronecker分解组合多个对称性;(iii)600行的Lean4形式化证明。该框架提供了等变神经网络无法实现的能力:每个预测的闭式分解和数据驱动发现最佳对称群。在QM9分子几何上,通过八面体子群恢复角动量选择规则,展示了数据驱动的物理发现。
对话式XAI能否提升用户表现?一项实证研究
发表机构 * TU Dresden(德累斯顿技术大学) ; University of Regensburg(罗滕堡大学)
AI总结 本研究通过实验评估对话式XAI对用户表现的影响,探讨其在预测准确性、模型理解和错误识别方面的核心方法及主要贡献。
Comments Accepted at Thirty-Fourth European Conference on Information Systems (ECIS 2026), Milan, Italy
矛盾图确定VC维
发表机构 * Department of Mathematics, Statistics, & Computer Science(数学、统计与计算机科学系)
AI总结 本文研究二元概念类的矛盾图,通过分析矛盾图的结构确定VC维的阈值,从而精确计算VC维并区分有限与无限VC维。
监督潜在重构在植物表型小数据量子学习中的应用
发表机构 * Nebraska Water Center, IANR University of Nebraska–Lincoln(内布拉斯加水中心,IA NR 内布拉斯加大学林肯分校) ; Adaptive Cropping Systems Laboratory USDA-ARS(适应性种植系统实验室 USDA-ARS) ; Nebraska Water Center, DWFI University of Nebraska–Lincoln(内布拉斯加水中心,DWFI 内布拉斯加大学林肯分校)
AI总结 本文研究了在小数据条件下,通过监督潜在重构提升植物表型数据中高维特征压缩的几何分离性,提出混合工作流程结合PCA和LDA进行潜在空间重构,并利用GPU加速的量子核对齐方法,发现潜在几何结构在小数据量子学习中是关键设计变量。
Comments 11 pages, 4 Tables, 3 Figures
谱汤:一种在线偏好对齐的统一框架
发表机构 * Google DeepMind(谷歌深Mind) ; Google Research(谷歌研究)
AI总结 本文提出了一种统一的在线偏好对齐框架Spectral Souping,通过发现LLM中的通用谱表示,实现了高效的模型合并,从而在不需昂贵在线重训练的情况下快速适应个体用户偏好。
理解基础设施管理中的劣化随机效应以进行因果发现
AI总结 本文提出了一种结合贝叶斯分层危险模型与因果发现的新框架,用于识别驱动泵设备异质劣化率的操作模式,通过GPU加速NUTS估计随机效应并验证线性假设,揭示不同操作制度需要不同的管理策略。
Comments 20 pages, 7 figures, 4 tables
基于得分的潜在变量因果模型因果发现
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; University of California, San Diego(加州大学圣地亚哥分校) ; Mohamed bin Zayed University of Artificial Intelligence(穆罕默德·本·扎耶德人工智能大学)
AI总结 本文提出了一种基于得分的方法,用于识别包含因果相关潜在变量的因果结构,并提供了可识别性保证,同时通过实验验证了方法的有效性。
Comments ICML 2024
潜在几何作为结构监视器:用于匿名网络异常检测的特征空间对齐
发表机构 * USPTO(美国专利局)
AI总结 本文提出利用潜在几何结构来监测匿名网络中的异常,通过特征空间对齐方法检测行为群体中的异常模式,展示了在Tor网络中通过双观察者流程识别稳定九维负载子空间的方法,并验证了其结构稳定性。
Comments 14 pages, 5 figures, 1 table
STELLAR: 为自动驾驶扩展3D感知大模型
发表机构 * Waymo ; UCSD(加州大学圣地亚哥分校)
AI总结 本文研究了大规模训练在自动驾驶感知系统中的应用,通过扩展输入模态并训练大规模模型,实现了在Waymo数据集上的新状态-of-the-art性能。
非局部算子学习用于fMRI编码和解码任务
发表机构 * Department of Computer Science, Idaho State University(计算机科学系,爱达荷州立大学) ; Department of Mathematics and Statistics, Idaho State University(数学与统计学系,爱达荷州立大学)
AI总结 本文提出了一种基于神经积分算子的框架,用于fMRI数据的编码和解码任务,探讨了非局部时空上下文的作用,并通过实验验证了更长的时间窗口和视觉皮层与全脑记录对性能和潜在空间几何的影响。
Comments 18 pages, 4 figures, 5 tables. Comments are welcome!
DEL:用于大语言模型数值学习的数字熵损失
发表机构 * The Hong Kong Polytechnic University(香港理工大学) ; VCIP, College of Computer Science, Nankai University(南开大学计算机学院VCIP)
AI总结 本文提出Digit Entropy Loss (DEL)用于大语言模型的自回归数值学习,通过重新设计传统无监督熵优化,引入数字条件概率和二元交叉熵,使熵优化转向监督方式,同时推广整数基于的数值学习到浮点数优化,从而提升数值预测的准确性。
一致信息软标签温度用于知识蒸馏
发表机构 * Rochester Institute of Technology(罗切斯特理工学院) ; Oakland University(奥克兰大学)
AI总结 本文提出CIST方法,通过为教师和学生分配样本级自适应温度,解决传统固定温度设计中教师软标签熵不一致和教师-学生logit尺度对齐过严的问题,从而提升知识蒸馏效果。
近端状态引导:减少人工智能辅助下的技能退化
发表机构 * Stanford University(斯坦福大学) ; University of California Los Angeles(加州大学洛杉矶分校) ; Toyota Research Institute(丰田研究院)
AI总结 本文提出了一种名为近端状态引导(PSN)的共享自主算法,通过引导用户向最易学习的状态发展,同时优化技能发展和任务表现,以减少人工智能辅助下的技能退化问题。
Comments 9 pages
修正的积分拉普拉斯近似法用于潜在高斯模型的贝叶斯推断
发表机构 * Manning College of Information and Computer Sciences University of Massachusetts Amherst(信息与计算机科学学院 马萨诸塞大学阿姆赫斯特分校) ; Department of Statistics University of British Columbia(统计学系 不列颠哥伦比亚大学)
AI总结 本文提出了一种重要性采样方案来纠正积分拉普拉斯近似法(ILA)在潜在高斯模型(LGMs)中引入的误差,通过增加重要性采样的样本数使近似后验收敛到正确后验,并在自动微分框架中实现该方法以支持超参数推断中的梯度基算法,特别是哈密顿蒙特卡洛方法。
数据更少,训练更快:重复较小的数据集通过采样偏差加速学习
发表机构 * Columbia University(哥伦比亚大学) ; University of Pennsylvania(宾夕法尼亚大学) ; Harvard University(哈佛大学)
AI总结 研究探讨了'小数据与大数据差距'现象,即使用更少样本重复训练比使用更大数据集更节省计算资源,通过层间增长和采样偏差机制实现加速,为优化提供了新的归纳偏差。
Comments ICML 2026
WaveGraphNet: 通过耦合逆向-前向图学习实现物理一致的引导波损伤定位
发表机构 * EPFL, Intelligent Maintenance and Operations Systems(瑞士联邦理工学院智能维护与运营系统) ; EPFL, Intelligent Maintenance(瑞士联邦理工学院智能维护)
AI总结 本文提出WaveGraphNet,一种用于碳纤维增强聚合物板引导波损伤定位的耦合逆向-前向图学习框架,通过图结构建模传感布局,利用图连接性表示测量传播路径,结合逆向分支和前向分支实现损伤定位的鲁棒性提升。
SDM:评估模型鲁棒性的强大工具
发表机构 * Information Engineering University, Zhengzhou, China ; Key Laboratory of Cyberspace Endogenous Safety \& Security of Henan Province, Zhengzhou, China ; Key Laboratory of Cyberspace Security Ministry of Education of China, Zhengzhou, China ; Songshan Laboratory, Zhengzhou, China
AI总结 本文提出了一种名为SDM的新型梯度攻击方法,通过重新定义对抗样本生成的目标,解决了传统方法中'高损失非对抗样本'导致的性能下降问题,并在实验中证明了其在攻击性能和成本效率上的优势。
Comments 16 pages
鲁棒的子空间约束二次模型用于低维结构学习
发表机构 * Department of Statistics, Faculty of Arts and Sciences at Beijing Normal University, Zhuhai(北京师范大学统计学系,北京师范大学艺术科学 faculty,珠海分校)
AI总结 本文提出了一种鲁棒的子空间约束二次模型(SCQM),用于从高维数据中学习低维结构。基于子空间约束二次矩阵分解(SQMF)框架,该模型能够适应广泛噪声分布,包括广义高斯和径向拉普拉斯模型。这种泛化能力使其在重尾和轻尾噪声下均能保持稳定性能,显著提高了在不同数据场景下的鲁棒性。为高效解决由此产生的非凸优化问题,我们开发了一种基于梯度的算法,配备回溯线搜索策略以确保稳定和高效的收敛。此外,我们还对$\ell_p^p$和$\ell_2$损失函数进行了敏感性分析,阐明了它们在不同噪声特性下的不同行为。大量数值实验验证了理论分析,并展示了所提方法在鲁棒性和重建准确性方面优于现有方法。
物理序列建模中泛化错误的机制
发表机构 * Harvard College(哈佛大学) ; Harvard John A. Paulson School of Engineering and Applied Sciences(哈佛大学约翰·A·保罗森工程与应用科学学院) ; Comcast AI ; CBS-NTT Program in Physics of Intelligence, Harvard University(哈佛大学物理智能计划) ; Physics of Artificial Intelligence Group, NTT Research, Inc., Sunnyvale, CA, USA(人工智能物理研究组,NTT研究公司,美国加利福尼亚州山景城) ; Microsoft(微软)
AI总结 本文研究了物理序列建模中由于局部误差传播导致的物理泛化错误,提出了一种数据偏差核来预测物理量的质量变化,并提出了基于核的干预策略。
Comments Preprint. kentonishi.com/physical-misgeneralization
MedCRP-CL: 通过贝叶斯非参数语义模态发现实现连续医学图像分割
发表机构 * University College London, London, United Kingdom(伦敦大学学院)
AI总结 该研究提出MedCRP-CL框架,通过在线任务结构发现和结构感知的连续学习方法,解决医学图像分割在持续学习中的挑战,实现了73.3%的Dice得分和仅4.1%的遗忘率。
Comments Accepted by ICML 2026
谱遗忘:无需重新训练的后验能力恢复
发表机构 * Zeta Labs(泽塔实验室) ; Lahore University of Management Sciences(拉合尔管理科学大学)
AI总结 研究探讨了语言模型在目标任务微调过程中因训练数据未显式威胁而退化的能力现象,提出了一种仅使用预训练检查点和微调后检查点的后验修复方法,通过谱修复技术恢复受损能力并保留目标任务收益。
Quant.npu:通过完全静态量化实现高效的移动NPU推理以支持设备端LLM
发表机构 * Qualcomm(高通)
AI总结 本文提出Quant.npu框架,通过完全静态量化方法实现高效的移动NPU推理,解决了传统后训练量化方法在NPU硬件约束下的兼容性问题,并在实际移动NPU上实现了较高的准确性和较低的推理延迟。
通过分层高斯滤波器实现闭式预测编码
发表机构 * Center for Humanities Computing(人文计算中心) ; Aarhus University(奥胡斯大学) ; Interacting Minds Center(互动心灵中心)
AI总结 本文提出通过分层高斯滤波器实现预测编码,恢复了精度加权的信息传递,实现了动态不确定性估计和Hebbian兼容的更新规则,从而在单个自由能目标下同时学习激活、权重和精度,无需全局误差信号,且无需迭代或自动微分。
TreeText-CTS: 用于不规则临床时间序列预测的紧凑、可追溯的树路径证据
发表机构 * Kim Jaechul Graduate School of AI, KAIST(金 Jaechul人工智能研究生院,韩国科学技术院)
AI总结 本文提出TreeText-CTS,一种用于不规则临床时间序列预测的紧凑、可追溯的树路径证据方法,通过冻结XGBoost模型生成多尺度窗口摘要,并将激活的树路径转换为确定性、可追溯的证据单元,从而在多个数据集上实现了最佳的AUROC和AUPRC性能。
Comments 27 pages, 4 figures
插件式脉冲运算符:突破脉冲变换器中的非线性瓶颈
发表机构 * IASM, Harbin Institute of Technology, China(哈尔滨工业大学人工智能研究所,中国) ; School of Artificial Intelligence, Jilin University, China(吉林大学人工智能学院,中国)
AI总结 本文提出了一种插件式框架,通过将Transformer中的非线性运算分解为三个基本算子(除法、指数和ℓ2范数),并利用LIF神经元群体和轻量级位移缩放实现脉冲友好的近似,从而在不需微调的情况下支持常见的Transformer非线性运算。
Comments Accepted to ICML 2026. 9 pages main paper, 8 pages appendix, 6 figures, 5 tables. Correspondence to Bin Gu and Huan Xiong
FusionCell: 跨注意力融合布局几何与网络列表拓扑以实现标准单元性能预测
发表机构 * School of Integrated Circuits, Peking University, Beijing, China(集成电路学院,北京大学,北京,中国)
AI总结 本文提出FusionCell,通过跨注意力机制融合布局几何和网络列表拓扑,以提高标准单元性能预测的准确性,解决了传统方法忽略布局几何导致的耦合和布局依赖效应的问题。
适应性探针引导用于鲁棒大语言模型劫持
发表机构 * School of Computer Science(计算机科学学院) ; Engineering, Sun Yat-Sen University, China(中山大学工程学院,中国) ; Nanyang Technological University, Singapore(南洋理工大学,新加坡)
AI总结 本文提出了一种基于模型提取的适应性探针引导方法,通过动态调整引导强度来提升大语言模型劫持的鲁棒性和有效性,无需额外对比提示或手动调参,显著提高了攻击效果。
Comments 19 pages, 13 figures, accepted by ICML 2026
反思式X训练:反馈条件化提升跨所有LLM训练阶段的扩展性
发表机构 * NVIDIA ; University of Washington(华盛顿大学) ; Carnegie Mellon University(卡内基梅隆大学) ; UC San Diego(南加州大学)
AI总结 本文提出反思式训练(IXT),通过利用后续阶段的动态来改进早期阶段,从而提高LLM训练的扩展效率,实验表明该方法在计算效率和性能上均有显著提升。
JUDO: 一种面向工业异常问答的多模态推理框架
发表机构 * Sungkyunkwan University(成均馆大学) ; Seoul National University(首尔国立大学)
AI总结 本文提出JUDO框架,通过结合领域知识和上下文提升多模态推理能力,以解决工业异常检测中模型缺乏领域知识的问题,实验表明其在MMAD基准上优于Qwen2.5-VL-7B和GPT-4o。
Comments Published at ICLR 2026
人工智能推理的经济学:通胀动态、福利成本和在推理成本菲利普曲线下的最优货币政策
发表机构 * Department of Economics(经济系) ; Stockholm University(斯德哥尔摩大学)
AI总结 本文提出了一种统一的微观经济学和货币理论,研究人工智能推理成本及其对通胀、福利和最优货币政策的影响。通过引入推理成本菲利普曲线(ICPC),并证明了其结构斜率,分析了消费者福利的 Hicks-卡尔多分解,推导了广义的泰勒原则,并确定了最优货币政策响应系数。
Comments 6 pages, 5 tables
模型崩溃的经济学:均衡、福利与合成数据市场中的最优来源补贴
发表机构 * Department of Economics(经济系) ; Stockholm University(斯德哥尔摩大学)
AI总结 本文研究了合成数据市场中模型崩溃的微观经济学问题,提出了合成数据污染均衡理论,推导了福利分解公式,并得出了最优来源补贴和水印强度的闭式表达式,同时证明了信息约束下的实现不可能性。
Comments 7 pages, 5 tables, 1 algorithm; IEEEtran conference format; submitted to IEEE BigData 2026
OmniISR: 一个通过中间监督和正则化实现集中学习和联邦学习统一框架
发表机构 * Tsinghua Shenzhen International Graduate School, Tsinghua University, Shenzhen, China(清华大学深圳国际研究生院,清华大学,深圳,中国) ; Shenzhen Research Institute of Big Data, Shenzhen, China(深圳大数据研究院,深圳,中国) ; Department of Computer Science and Engineering, Southern University of Science and Technology, Shenzhen, China(南方科技大学计算机科学与工程系,深圳,中国) ; Department of Electrical and Electronic Engineering, The University of Hong Kong, Hong Kong, China(香港大学电子与电气工程系,香港,中国) ; Yinwang Intelligent Technology Co. Ltd., Shenzhen, China(云网智能科技有限公司,深圳,中国)
AI总结 本文提出OmniISR框架,通过中间监督和正则化信号融合纯集中学习、纯联邦学习和混合集中-联邦学习训练模式,解决了集中学习和联邦学习之间的不兼容优化问题,并在理论上推导了收敛界、联邦漂移界、梯度对齐保证和逃逸时间界。
Comments 18 pages
模态解耦的在线递归编辑
发表机构 * Harbin Institute of Technology, Shenzhen, China.(哈尔滨工业大学(深圳)) ; Peng Cheng Laboratory, China.(鹏城实验室) ; Huazhong University of Science and Technology, China(华中科技大学)
AI总结 本文提出M-ORE,一种用于持续多模态大语言模型适应的模态解耦在线递归编辑器,通过统一的近端投影公式和Sherman-Morrison递归实现常数级的每编辑开销,从而在保持模块局部统计信息和固定正交低秩编辑子空间的同时,减少长周期干扰,提升可靠性、通用性和局部性。
更小的抽象状态空间在强化学习中实现跨尺度泛化
发表机构 * Department of Computer Science(计算机科学系) ; University of Saskatchewan(萨斯喀彻温大学) ; Saskatoon, Saskatchewan, Canada(加拿大萨斯喀彻温省萨斯喀彻温市)
AI总结 本文提出了一种理论模型,通过扩展POMDP中的状态抽象框架,定义了 successor-weighted model reduction,从而在强化学习代理中实现跨尺度泛化,并分析了抽象状态空间大小对泛化能力的影响。
多头注意力作为恩德里亚-沃森估计的集合:方差减少、去相关和最优头多样性
发表机构 * School of Mathematics and Statistics, College of Science(数学与统计学学院,科学学院)
AI总结 本文提出多头注意力可以视为恩德里亚-沃森核回归估计器的集合,通过分析头输出的去相关性,推导出方差减少与头多样性之间的关系,并提出头多样性指数来衡量不同头之间的去相关程度,最终得出最优的头数量和维度分配方案。
Comments 14 pages
conformal selective acting: any-time-valid risk control for rlvr-trained llms
发表机构 * Georgia Institute of Technology(佐治亚理工学院)
AI总结 该研究提出了一种 conformal selective acting 方法,用于在 rlvr 训练的 llms 部署中实现 anytime-valid 的风险控制,通过在部署要求下强制一个空单元,利用 e-process 和 bonferroni 网格来维护 pathwise 有效性,同时在多个基准测试中证明了其有效性。
捕捉移动子空间:超越平稳性的低秩老虎机
发表机构 * H. Milton Stewart School of Industrial and Systems Engineering(H. Milton Stewart工业与系统工程学院) ; Georgia Institute of Technology(佐治亚理工学院)
AI总结 本文研究了在子空间漂移的情况下,低秩线性上下文老虎机的问题,提出了一种新的算法SPSC,在保持子空间变化的同时,实现了基于秩的动态遗憾率。
Chronicle:一种用于联合语言和时间序列理解的多模态基础模型
发表机构 * InertialAI ; Department of Electrical and Computer Engineering, Queen’s University(皇后大学电气与计算机工程系) ; Department of Mechanical and Materials Engineering, Queen’s University(皇后大学机械与材料工程系)
AI总结 本文提出Chronicle,一种联合训练语言和时间序列的多模态基础模型,通过统一架构实现两者共享参数,从而在多个任务上取得了优异表现。
残差铺垫:在选择性拒绝编辑中的路由瓶颈诊断
发表机构 * University of Texas at San Antonio(德克萨斯大学圣安东尼奥分校)
AI总结 本文研究了选择性拒绝编辑作为三重控制问题,通过引入残差铺垫方法,分离路由选择、是否干预和残差编辑能力,从而减少编辑拒绝率并提高良性分布和有害分布的保留率。
需要两人:互补的自我蒸馏用于大语言模型中的上下文完整性
发表机构 * KAIST(韩国科学技术院)
AI总结 本文提出SELFCI框架,通过分离信息抑制与任务解决,解决大语言模型中隐私与效用的权衡问题,通过互补的自我蒸馏方法提升上下文完整性。
Comments 28 pages, 16 figures
实例判别用于链接预测
AI总结 本文提出了一种基于链接表示的新模型L-GRACE和L-BGRL,用于改进链接预测任务的性能,特别是在无属性图上,并展示了其在监督和自监督场景下的竞争力。
FBOS-RL: 基于反馈的双目标协同强化学习
发表机构 * Hangzhou International Innovation Institute, Beihang University(北京航空航天大学杭州国际创新研究院) ; School of Artificial Intelligence, Beihang University(北京航空航天大学人工智能学院) ; Kuaishou Technology(快手科技)
AI总结 本文提出FBOS-RL框架,通过环境反馈引导探索增强,并设计两个相互促进的目标:以利用为导向的策略对齐(EPA)和以探索为导向的能力培养(ECC),从而提高强化学习的训练效率和最终性能。
通过表格网格导航和逐步推理提示实现高效的表格问答
发表机构 * Vision Intelligence Lab, IIIT Allahabad, Prayagraj, India(视觉智能实验室,印度拉贾斯坦邦阿拉哈巴德)
AI总结 本文提出了一种无需训练的表格问答方法,通过TableGrid导航和Progressive Inference Prompting框架,提升了表格问答的精度和效率,并在多个数据集上验证了其有效性。
Comments Accepted for Presentation in ICDAR 2026, Vienna, Austria
具有物理信息的卷积神经网络用于多孔介质中的流体流动
发表机构 * Dioscuri Center in Topological Data Analysis, Institute of Mathematics, Polish Academy of Sciences(拓扑数据分析迪奥斯库里中心,波兰科学院数学研究所) ; Institute of Experimental Physics, Faculty of Physics and Astronomy, University of Wrocław(物理学与天文学系实验物理研究所,沃林堡大学) ; Institute of Theoretical Physics, Faculty of Physics and Astronomy, University of Wrocław(天文学与物理学系理论物理研究所,沃林堡大学) ; Parallel and Distributed Systems Laboratory, Jožef Stefan Institute(乔泽夫·斯蒂芬研究所并行与分布式系统实验室)
AI总结 本文提出了一种基于卷积神经网络的框架,用于直接从样本几何结构预测孔隙尺度的流速场,通过结合流体不可压缩性、固体内部无流条件、周期性约束和全局迂曲度指数等物理一致性约束,提高预测精度,并在不同几何和边界条件下验证了模型的泛化能力。
Comments 14 pages, supplement, dedicated github repo
面向高维贝叶斯优化理解的自动核发现
发表机构 * Korea Advanced Institute of Science and Technology (KAIST)(韩国科学技术院)
AI总结 本文提出了一种基于大语言模型的进化框架,用于高维贝叶斯优化中的自动核发现,通过扩展核空间并避免依赖观测条件,提高了高维问题中核设计的有效性。
Comments 36 pages, 27 figures, 12 tables
图转导锐化:利用未标记预测进行节点分类
发表机构 * University of Cambridge(剑桥大学)
AI总结 本文提出了一种转导锐化方法,通过利用未标记节点的预测来改进节点分类任务,无需改变基础架构即可在多个基准上提升性能。
Comments 19 pages, 4 figures, 17 tables
CP-MoE:一致性保留的混合专家用于持续学习
发表机构 * School of Computer Science and Engineering University of New South Wales(计算机科学与工程学院 新南威尔士大学)
AI总结 本文提出CP-MoE,一种基于瞬时专家的持续学习框架,通过一致性保留的路由偏置和瞬时专家引导的正则化机制,减少参数干扰和遗忘,同时保留跨任务知识转移。
Prism:通过双重视约束拉普拉斯投影进行结构对称性扫描
发表机构 * Independent researcher(独立研究者)
AI总结 Prism通过双重视约束拉普拉斯投影方法,利用图拉普拉斯矩阵和双重视算子计算结构对称性缺陷,以检测复杂网络的结构自一致性偏离程度,并在不同数据集上验证其在社区检测和结构应力检测中的有效性。
Comments 10 pages, 4 tables, 1 figure. This work presents a first-principles unsupervised network structural diagnosis framework based on symmetric involution operator and Laplacian commutator constraint. It achieves noise-robust community detection and early structural risk detection in financial time-series networks without supervised training data
Lean Refactor: 通过代理策略搜索实现多目标可控的证明优化
发表机构 * Simon Fraser University(西蒙弗雷泽大学) ; Amazon Web Services(亚马逊网络服务) ; MiroMind ; University of Texas at Austin(德克萨斯大学奥斯汀分校)
AI总结 本文提出Lean Refactor框架,通过检索增强的代理策略搜索,解决多目标、可控和版本鲁棒的Lean证明重构问题,主要贡献是通过预注释的多目标重构策略数据库实现高效的证明优化。
LEAP:一种用于钙钛矿前驱体添加剂发现的闭环框架
发表机构 * School of Physics, Renmin University of China(中国人民大学物理学院) ; School of Chemistry and Life Resource, Renmin University of China(中国人民大学化学与生命资源学院)
AI总结 该研究提出LEAP框架,结合大语言模型和主动学习,通过文献驱动的机制相关描述符和贝叶斯优化,实现了钙钛矿太阳能电池添加剂的高效发现,实验验证显示其在性能提升方面优于通用模型。
Comments 30 pages; 11 figures
Geometry-Lite: 通过层间边际几何进行可解释的安全探测
发表机构 * Yonsei University(延世大学) ; Yonsei University College of Medicine(延世大学医学院) ; Department Biomedical Systems Informatics(生物医学系统信息学部门)
AI总结 本文研究了大语言模型在提示级别上的安全探测问题,提出了一种名为Geometry-Lite的紧凑探测器,通过层间边际几何分析来提高安全检测的可解释性和准确性。
MagBridge-Battery: 一种用于锂离子磁测和健康状态诊断的合成桥梁数据集
发表机构 * Dept.\ of Computer Science \& Engineering Amrita School of Computing Amrita Vishwa Vidyapeetham, India ORCID: 0009-0006-0153-5674 , 0000-0001-6103-259X
AI总结 本文提出MagBridge-Battery数据集,通过结合Mohammadi-Jerschow开放科学框架中的真实磁形态数据与PulseBat数据集的健康状态标签,为锂离子电池的磁测和健康状态诊断提供了一个公开的基准测试平台,同时验证了数据集在健康状态回归、二次生命分类和异常检测等任务上的有效性。
Comments 10 pages, 3 figures, 4 tables. Synthetic dataset and benchmark suite for battery magnetometry and state-of-health diagnostics; dataset released on Zenodo and code available on GitHub
在流形假设下证明学习扩散模型:坍缩与细化
发表机构 * RIKEN AIP & The Institute of Statistical Mathematics(日本理化学研究所AIP及统计数学研究所) ; University of Sydney(悉尼大学) ; Agency for Science, Technology and Research & The Institute of Statistical Mathematics(科技研究局及统计数学研究所) ; The University of Tokyo(东京大学) ; Nanyang Technological University(南洋理工大学) ; The Institute of Statistical Mathematics(统计数学研究所)
AI总结 本文在流形假设下研究扩散模型的学习问题,提出了一种由得分函数几何特性驱动的坍缩与细化机制,并通过Score-induced Latent Diffusion模型验证了其理论预测,证明样本复杂性依赖于内在维度而非外在维度。
Comments 3 figures
TabPFN-MT: 一种原生多任务上下文学习器用于表格数据
发表机构 * McGill University(麦吉尔大学) ; Mila - Quebec AI Institute(Mila-魁北克人工智能研究所)
AI总结 本文提出TabPFN-MT,一种针对表格数据的原生多任务上下文学习器,通过扩展多目标合成先验来捕捉上下文中的任务依赖性,实现多任务上下文学习和同时推断,同时在小到中等规模数据集上表现出色,提升了多目标表格应用的计算效率。
Comments 24 pages, 7 figures
量子端到端学习用于上下文组合优化
发表机构 * KAIST(韩国科学技术院) ; Omelet
AI总结 本文提出量子端到端学习框架QEL,用于解决上下文组合优化问题,通过量子近似优化算法实现端到端训练,有效捕捉上下文、不确定系数和最优解之间的复杂关系,避免调用NP难优化求解器,展现出在量子时代应用的潜力。
Comments 23 pages, 2 figures, preprint
高级科学方法论应用于罗西尼
发表机构 * University of Palermo, Department of Engineering(巴勒莫大学工程系) ; Conservatory Alfredo Casella(阿尔弗雷多·卡塞拉音乐学院)
AI总结 本文通过计算分析方法,对罗西尼为梅斯塔西奥的《Mi lagnerò tacendo》所作的音乐作品进行结构分析,揭示其旋律、和声及文本创作选择,为音乐文献学研究提供新的系统研究基础。
NaP-Control: 为多功能和快速字符控制导航扩散先验
发表机构 * ETH Zurich(苏黎世联邦理工学院)
AI总结 本文提出NaP-Control方法,通过强化学习操控任务无关的扩散策略先验的潜在噪声,实现快速、鲁棒且高保真的字符控制,同时通过环境交互优化任务奖励,提升成功率并适应挑战性场景。
增强分析与决策质量:非技术BI用户之间的信任作用
发表机构 * British International School Ho Chi Minh City, Vietnam(越南河内国际学校) ; Truong Thanh Viet Nam Group, Vietnam(越南Truong Thanh Viet Nam集团) ; Hanoi College of Industry and Trade, Vietnam(越南河内工业贸易学院) ; University of Languages and International Studies, Ha Noi, Vietnam(越南河内语言与国际研究大学)
AI总结 本研究探讨了增强分析如何通过非技术BI用户对系统信任的提升来改善决策质量,采用认知委托理论分析了信任在决策质量中的作用。
Comments 13 pages, 1 figure, 4 tables
数据扩展作为预测贡献光谱的渐进覆盖
发表机构 * sysu.edu.cn(华南理工大学) ; stu.hit.edu.cn(哈尔滨理工大学)
AI总结 本文研究了真实数据扩展定律是由潜在预测贡献光谱的渐进覆盖而非仅由词频尾部决定的假设,通过文本语料库的后缀自动机表示,定义了数据内在的全局KL预测贡献光谱,每个状态根据其经验质量乘以与全局下一个词基线的KL偏差进行贡献。在12个真实语料库上,该光谱的尾部斜率与固定小GPT学习者的经验数据扩展指数有强相关性。然后定义了每个训练规模N的有效截断秩K(N),通过匹配观察到的超额损失与准备的100万全球KL光谱的残余尾部质量。实证结果显示,log K接近log N的线性关系,原始光谱的R²约为0.96,平滑光谱的R²约为0.90。这些发现为简单机制图提供了有力的实证支持:训练规模通过预测状态光谱推进有效前沿,该光谱的残余尾部质量跟踪剩余超额损失。
Comments 8 pages,6 figures
面向目标的主动对话中规划的伪孪生网络
发表机构 * School of Computer Science and Technology(计算机科学与技术学院)
AI总结 本文提出了一种面向目标的主动对话规划方法,通过FF-BPSN网络实现对话路径规划,提升目标导向型主动对话系统的有效性。
Comments ICASSP2026
并行大语言模型推理用于偏见鲁棒、稳健的概念抽象
发表机构 * University of Turku, Turku, Finland(图尔库大学,芬兰图尔库) ; Brilloconnetz Partners avoin yhtiö, Turku, Finland(Brilloconnetz Partners 公司,芬兰图尔库)
AI总结 本文提出了一种结合并行分块处理与证据锚定整合的结构化框架,旨在减少长文档分析中的偏见、遗漏误差和过度泛化问题,通过并行处理和证据锚定提高文本分析的可靠性和可扩展性。
Comments Accepted to be Published in 12th Intelligent Systems Conference 2026, 3-4 September 2026 in Amsterdam, The Netherlands
通过多轮提示验证提升量化模型在定性分析中的性能
发表机构 * University of Turku, Turku, Finland(图尔库大学,芬兰图尔库) ; Brilloconnetz Partners avoin yhtiö, Turku, Finland(Brilloconnetz Partners 有限公司,芬兰图尔库)
AI总结 本文研究了不同位数量化级别和类型对LLaMA-3.1(8B)在定性分析中的性能影响,提出了一种量化感知的多轮提示验证方法以提高模型的稳定性和准确性,结果显示8位模型最接近黄金标准,4位模型在应用方法后变得稳定,3位和2位模型在提示设计和验证后性能有所提升。
Comments Accepted to publish in 12th Intelligent Systems Conference 2026; 3-4 September 2026 in Amsterdam, The Netherlands
SOLAR:一种自优化的开放式自主代理,用于终身学习和持续适应
发表机构 * Department of Ophthalmology, Yong Loo Lin School of Medicine, National University of Singapore, Singapore(眼科学系,Yong Loo Lin医学院,新加坡国立大学,新加坡) ; Department of Computational and Data Sciences, Indian Institute of Science, Bangalore, Karnataka, India(计算与数据科学系,印度科学研究院,班加罗尔,卡纳塔克邦,印度)
AI总结 本文提出SOLAR,一种自优化的开放式自主代理,通过参数级元学习实现自我改进,解决了动态真实世界中概念漂移和梯度基适应成本高的问题,展示了在常识、数学、医学、编程、社交和逻辑推理任务上的优越性能。
Comments Accepted at "Association for the Advancement of Artificial Intelligence 2026 Conference" in Streaming Continual Learning Bridge. Published in CEUR Workshop Proceedings (Original version at https://ceur-ws.org/Vol-4183/paper2.pdf)
GraphDiffMed: 基于药理图先验的知识约束差分注意力用于药物推荐
发表机构 * Kyushu Institute of Technology(九州工业大学)
AI总结 本文提出GraphDiffMed,一种结合噪声感知注意力和药理约束的药物推荐框架,通过双尺度差分注意力在院内和院间层面过滤虚假信号,提升推荐质量和安全性。
在遮蔽离散序列模型中神经估计成对互信息
发表机构 * University of California, Berkeley, CA, USA(加州大学伯克利分校)
AI总结 本文提出了一种神经框架,直接从预训练的遮蔽扩散模型(MDMs)的隐藏状态中估计成对条件互信息(MI),利用模型自身条件分布计算的地面真实MI进行监督,从而捕捉模型内部对依赖结构的信念,并在单次前向传递中预测完整的MI矩阵,实现MI引导的并行解码。
Comments 6 pages, 3 figures; submitting to ICML 2026
图标签选择的近似算法
发表机构 * Department of Computer Science, ETH Zurich(苏黎世联邦理工学院计算机科学系)
AI总结 本文提出了一种新的图标签选择算法,在标准预算约束下,首次实现了O(log^{1.5}n)的近似比,解决了如何从整个图中选择少量代表性顶点以准确预测剩余顶点标签的问题。
Comments Accepted at ICML 2026. 9 pages, 7 figures
结构化神经标记点过程用于可解释的事件交互建模
发表机构 * Kahlert School of Computing, University of Utah(犹他大学计算学院) ; Celonis AI
AI总结 本文提出了一种结构化神经标记点过程(SNMPP),通过显式发现事件级和类别级的关系,实现高灵活性的建模,同时在合成和现实数据集上验证了其揭示结构关系和强预测性能的能力。
Lagrangian Flow Matching: 一个基于最小作用原理的路径设计框架
发表机构 * Department of Mathematics, Syracuse University(数学系,苏利文大学) ; Department of EECS, Syracuse University(电子工程与计算机科学系,苏利文大学)
AI总结 本文提出了一种基于最小作用原理的路径设计框架,通过最小化一般拉格朗日量的作用来确定概率路径和速度场,展示了其在最优传输和条件流匹配中的应用。
WriteSAE: 用于递归状态的稀疏自编码器
发表机构 * Indiana University(印第安纳大学)
AI总结 本文提出WriteSAE,一种用于递归语言模型状态中矩阵更新的稀疏自编码器,通过在递归缓存中替换原始写入操作来提升生成效果,并在多个模型上验证了其有效性。
Comments 26 pages, 14 figures, 21 tables; code at https://github.com/JackYoung27/writesae
通过希尔伯特丛和细胞sheaf实现一致的几何深度学习
发表机构 * University of Pennsylvania(宾夕法尼亚大学) ; Sakana AI ; Northeastern University(东北大学) ; Harvard University(哈佛大学)
AI总结 本文提出了一种新的卷积学习框架,用于在流形上支持的可能无限维信号,通过希尔伯特丛关联的连接拉普拉斯算子作为卷积算子,引入了称为HilbNets的滤波器和神经网络,并通过两阶段采样过程实现,证明了采样诱导的希尔伯特细胞sheaf的sheaf拉普拉斯收敛于底层连接拉普拉斯,从而在无限维丛设置中推广了Belkin和Niyogi的收敛结果,最终在合成和现实任务中验证了该框架。
Comments 51 pages, 3 figures, 5 tables
大多数ReLU网络允许可识别的参数
发表机构 * Max Planck Institute for Mathematics in the Sciences(马克斯·普朗克数学研究所)
AI总结 研究ReLU深度网络的实现映射,探讨函数是否能确定其参数(除缩放和排列外),引入基于加权多面体复形的框架,证明对于输入和隐藏层宽度至少为2的架构,存在可识别参数的开集,且函数维度等于参数数量减去隐藏神经元数量,并建立通用深度层次。
HeadQ: KV-Cache量化中的模型可见失真与分数空间校正
AI总结 本文提出HeadQ方法,通过在键侧存储低秩残差侧码并在校准学习的查询基上应用作为加性对数修正,以解决KV缓存量化中的模型可见失真问题,并通过分数空间误差预测注意力KL散度,优于原始键MSE。
Comments Withdrawn by the author because ethical concerns were identified after posting
计算对齐训练:优化测试时间推断
发表机构 * Department of Statistics(统计学系) ; University of Michigan(密歇根大学)
AI总结 本文提出计算对齐训练方法,通过将训练目标与测试时间策略对齐,提升大语言模型在测试时的推断性能。
当公平性指标产生分歧:评估机器学习中人口公平性评估的可靠性
发表机构 * Founder, Ducaltus(Ducaltus创始人) ; BSc (Hons) Artificial Intelligence(人工智能学士(荣誉)) ; School of Computing, Engineering & Digital Technologies(计算、工程与数字技术学院) ; Teesside University, UK(英国泰赛德大学)
AI总结 本文研究了公平性评估的一致性问题,通过多指标分析评估机器学习模型中的人口偏见,发现不同公平性指标可能导致矛盾的评估结果,引入了公平性分歧指数(FDI)来量化指标间的不一致程度。
Comments 15 pages, 4 figues, 5 tables
当AI出错时:AI辅助用药决策系统中的可靠性与风险
发表机构 * Ducaltus(Ducaltus公司) ; School of Computing, Engineering & Digital Technologies(计算、工程与数字技术学院) ; Teesside University(泰赛德大学)
AI总结 本文研究了AI辅助用药系统在现实决策中的可靠性问题,通过模拟药物相互作用和剂量决策场景,分析系统故障类型及其潜在临床影响,强调在安全关键领域如药房实践中,需补充传统性能指标的风险意识评估方法。
Comments 9 pages, 1 figure. Position paper with simulated experimental analysis of AI reliability in medication decision systems. Minor Correction to Title Metadata (Typo Fix)
为何聚合准确率不足以评估执法面部识别系统的公平性
发表机构 * Ducaltus ; School of Computing, Engineering & Digital Technologies(计算、工程与数字技术学院) ; Teesside University(泰赛德大学)
AI总结 本文探讨了在执法场景中,面部识别系统的聚合准确率作为公平性评估指标的不足,通过分析子群体误差分布,指出聚合指标可能掩盖不同群体间的显著差异,并强调需要更全面的评估框架来确保负责任的AI部署。
Comments 9 pages, 2 tables, 1 figure. Position paper with empirical subgroup analysis highlighting limitations of aggregate accuracy in fairness evaluation
信息压缩匿名化:非降级的敏感输入保护用于隐私保护的监督机器学习
发表机构 * EVP Artificial Intelligence & Innovation(EVP人工智能与创新)
AI总结 本文提出了一种信息压缩匿名化(ICA)方法和VEIL架构,通过架构和数学设计而非噪声注入或密码学来实现强隐私保障,确保在隐私保护监督机器学习中保留预测效用,同时支持可扩展的多地区部署。
Comments 47 pages, 29 figures
预归一化变换器中的门控归一化移除与尺度锚定
发表机构 * Department of Electrical Engineering(电气工程系) ; Department of Computer Science(计算机科学系) ; Stanford University(斯坦福大学)
AI总结 本文研究了预归一化变换器中归一化层的必要性,提出了一种门控归一化移除方法,通过TaperNorm逐步将归一化操作转为样本无关的线性或仿射映射,并揭示了最终归一化层对预logit表示尺度的锚定作用。
CompilerKV: 通过离线经验编译实现风险适应性的键值压缩
发表机构 * Institute of Automation, Chinese Academy of Sciences(中国科学院自动化研究所) ; University of Electronic Science and Technology of China(电子科技大学) ; The Chinese University of Hong Kong, Shenzhen(香港中文大学(深圳)) ; ByteDance(字节跳动) ; University of Science and Technology Beijing(北京科技大学)
AI总结 本文提出CompilerKV,一种通过离线经验编译实现风险适应性的键值压缩方法,通过离线编译校准语料库中的纠正表,将在线纠正减少到O(1)查找加预算限制,从而在多个模型架构上实现了压缩SOTA,并在不同压力条件下保持最优性能。
rePIRL: 通过逆强化学习学习PRM以提高LLM推理
发表机构 * Meta AI ; Department of Computer Science, University of California, Santa Barbara(加州大学圣芭芭拉分校计算机科学系) ; Google DeepMind(谷歌DeepMind) ; Independent Researcher(独立研究者)
AI总结 本文提出rePIRL框架,通过逆强化学习学习高效的PRM,无需依赖专家策略的强假设,解决了传统方法中熵崩溃等固有限制问题,通过双学习过程和定制技术提升LLM推理性能,并在数学和编程任务数据集上验证了其有效性。
何时适应胜出?量子控制中元学习的缩放定律
发表机构 * The MITRE Corporation(MITRE公司)
AI总结 本文研究了元学习在量子控制中的适应性问题,推导了适应增益的缩放定律,表明适应增益随着梯度步数指数饱和,而随任务方差线性增长,为判断适应的必要性提供了量化标准。
Comments 28 pages, 11 figures
通过序列知识蒸馏实现紧凑压缩模型的高效训练
发表机构 * Univ. Rennes, Inria, CNRS, IRISA, Rennes, France(里昂大学、法国国家科学研究中心、法国国家信息与自动化研究所、IRISA、里昂,法国)
AI总结 本文提出了一种通过序列知识蒸馏减少自动编码器压缩网络的方法,通过简化早期优化目标和逐步引入复杂性,提高了轻量级模型的重建质量与统计保真度,适用于资源受限环境。
基于聚类的广义加性模型:受随机傅里叶特征启发
发表机构 * Department of Mathematics and Mathematical Statistics, Umeå University(数学与统计学系,乌梅大学) ; Department of Statistics, The Pennsylvania State University(统计系,宾夕法尼亚州立大学)
AI总结 本文提出了一种结合响应引导的谱表示学习与局部加性建模的可解释回归框架,用于处理异质数据。通过随机傅里叶特征回归模型构建谱特征图,并利用主成分分析压缩以获得低维潜在嵌入,随后通过高斯混合模型发现软区域,在每个区域中使用聚类特定的广义加性模型捕捉非线性协变量效应,最终通过软混合这些局部加性模型实现对非线性和异质结构的灵活建模,同时保持可解释性。
Comments 33 pages, 13 figures, 7 tables
通过自编码器潜在空间验证未知动态系统
发表机构 * Delft University of Technology(代尔夫特理工大学) ; AI4I, Turin, Italy(意大利都灵AI4I)
AI总结 本文提出了一种基于凸自编码器和核方法的学习方法,用于减少动态系统维度并验证其在潜在空间中的行为,从而在高维情况下实现更有效的形式验证。
Comments 25 pages, 6 figures, under review
TriagerX: 用于基于内容和交互的缺陷分类任务的双变换器
发表机构 * University of Calgary(卡尔加里大学) ; York University(约克大学) ; IBM Canada(IBM加拿大)
AI总结 本文提出TriagerX,一种双变换器架构,通过结合内容和交互信息来改进缺陷分类任务的推荐准确性,优于现有最先进方法。
Comments Accepted to IEEE Transactions on Software Engineering (TSE). 17 pages, 15 figures
神经偏微分方程在监督学习中的控制与优化
发表机构 * Naveen Jindal School of Management, The University of Texas at Dallas, Richardson, TX 75080, USA ; Department of Mathematics, Texas A\&M University, College Station, TX 77843, USA
AI总结 本文提出将神经网络视为偏微分方程的新视角,研究了在抛物型和双曲型算子中优化和控制系数的问题,并证明了抛物型偏微分方程控制问题的可解性。
LAION-C: 一个用于网络级视觉模型的分布外基准
发表机构 * Max Planck Institute for Intelligent Systems, Tübingen, Germany(马克斯·普朗克智能系统研究所,图宾根,德国) ; ELLIS Institute Tübingen(图宾根ELLIS研究所) ; Tübingen AI Center(图宾根人工智能中心) ; Google DeepMind(谷歌DeepMind)
AI总结 本文提出LAION-C作为ImageNet-C的替代基准,旨在评估网络级数据集下的分布外鲁棒性,通过引入六种新的分布外扰动类型,发现现代模型在这些扰动下的表现显著提升,甚至超过人类观察者。
Comments ICML 2025 camera ready version
基于任务的指令调制多模态大语言模型探测:在自然主义刺激下的区域特定大脑对齐模式
发表机构 * Technische Universität Berlin(柏林技术大学) ; Rice University(Rice 大学) ; AWS AI Labs, Amazon(Amazon 人工智能实验室) ; IIT Delhi(德里理工学院) ; University of Wisconsin - Madison(威斯康星大学麦迪逊分校) ; Spector Inc(Spector 公司) ; IIIT-Hyderabad(海得拉巴理工学院) ; Microsoft(微软)
AI总结 本研究探讨了指令调制多模态大语言模型在自然主义刺激下的大脑对齐模式,通过比较不同模型在视频和音频任务中的表现,揭示了指令调制对模型表示能力的影响。
Comments 57 pages, 39 figures
FLUME-FNO:在未见的城市形态中高效且可扩展地预测三维风场和温度场
发表机构 * Department of Building, Civil and Environmental Engineering, Cetner Zero Energy Building Studies, Concordia University(建筑、土木与环境工程系,零能耗建筑研究中心,康科迪亚大学) ; School of Computer Science, McGill University(计算机科学系,麦吉尔大学) ; Mohamed bin Zayed University of Artificial Intelligence, Abu Dhabi, United Arab Emirates(人工智能Mohamed bin Zayed大学,阿布扎比,阿拉伯联合酋长国)
AI总结 本文提出FLUME-FNO方法,通过仅使用建筑几何信息高效且可扩展地预测未见城市形态中的三维风场和温度场,解决了传统CFD计算成本高和深度学习方法依赖大量训练数据的问题。
控制、最优传输与神经微分方程在监督学习中的应用
发表机构 * Department of Mathematics, Texas A\&M University, College Station, TX 77843, USA(德克萨斯A&M大学数学系)
AI总结 本文研究了使用神经微分方程近似最优传输方程的基本计算问题,提出了一个新颖的框架用于用神经ODE近似连续域中的不平衡最优传输,通过推广具有皮尔逊发散的离散UOT问题,构造了收敛于真实UOT动态的向量场,推动了计算传输和机器学习的数学基础。
模糊卷积神经网络用于表格数据分类
发表机构 * Computer Science Department, University of Texas at Tyler(德克萨斯大学泰勒分校计算机科学系)
AI总结 本文提出了一种针对表格数据分类的模糊卷积神经网络(FCNN),通过将特征值映射为模糊隶属度并转换为图像来训练CNN模型,从而在表格数据分类任务中实现有效的学习和优于现有方法的性能。
Comments 10 pages, 16 figures, Submitted to IEEE Access
AI增强的调查:利用大型语言模型和调查进行意见预测
发表机构 * Department of Sociology(社会学系) ; University of Chicago(芝加哥大学) ; New York University(纽约大学) ; Chicago, IL(伊利诺伊州芝加哥市) ; New York, NY(纽约州纽约市)
AI总结 本文提出了一种基于大型语言模型的框架,通过结合问题、受访者和调查时期的嵌入表示,预测重复横断面调查中缺失的响应,从而弥补传统调查在捕捉历史变化方面的不足。