Tokenisation via Convex Relaxations
基于凸松弛的分词
发表机构 * ETH Zurich(苏黎世联邦理工学院) ; Kensho Technologies(Kensho科技公司)
AI总结 本文提出了一种基于凸松弛的分词方法ConvexTok,通过将分词构建问题转化为线性规划并利用凸优化工具求解,改进了分词指标和语言模型的bits-per-byte性能,并提升了下游任务表现。
基于凸松弛的分词
发表机构 * ETH Zurich(苏黎世联邦理工学院) ; Kensho Technologies(Kensho科技公司)
AI总结 本文提出了一种基于凸松弛的分词方法ConvexTok,通过将分词构建问题转化为线性规划并利用凸优化工具求解,改进了分词指标和语言模型的bits-per-byte性能,并提升了下游任务表现。
通过神经需求势实现可积弹性
发表机构 * IAMM Research, Department of Applied Artificial Intelligence(IAMM研究院,应用人工智能系) ; DAMM
AI总结 本文提出了一种以需求为导向的神经网络模型ICDN,用于多产品零售需求预测。该模型学习对数需求作为对数价格的平滑、上下文依赖函数,从而能够精确推导出弹性。在Dominick's啤酒数据集上,ICDN在样本外泛化性能上优于有向对数-对数基准,并产生了更稳定、更具经济合理性的弹性估计,尤其是在交叉价格效应较弱的情况下。
Comments 44 pages, 7 figures
向量策略优化:为多样性训练改进测试时间搜索
发表机构 * MIT(麻省理工学院) ; Improbable AI Lab(Improbable AI 实验室) ; MIT-IBM Computing Research Lab(麻省理工-IBM 计算研究实验室) ; Sakana AI
AI总结 本文提出向量策略优化(VPO)方法,通过训练策略以预测多样化的下游奖励函数,从而产生多样化的解决方案,以改进测试时间搜索的性能。
Comments 24 pages
记住保持好奇:用于3D探索的片段上下文和持久世界
发表机构 * University of Toronto(多伦多大学) ; UC Berkeley(加州大学伯克利分校) ; Wayve ; Vector Institute(向量研究所) ; Simon Fraser University(西蒙 Fraser大学)
AI总结 本研究提出了一种基于好奇心驱动强化学习的方法,通过引入持久世界模型和片段上下文来解决3D环境中稀疏奖励长周期任务中的探索问题,实验表明该方法在HM3D数据集上优于基于强化学习的主动映射基线,并能泛化到Gibson和AI生成的世界。
LCGuard: 多智能体系统中安全KV共享的潜在通信守护者
发表机构 * Rensselaer Polytechnic Institute(伦斯勒理工学院) ; IBM Research(IBM研究院)
AI总结 本文提出LCGuard框架,通过在智能体间共享KV缓存前学习表示层面的转换,以防止敏感信息泄露,同时在多个模型家族和多智能体基准测试中验证了其在减少重建攻击成功率和保持任务性能方面的有效性。
FAME:面向失败的混合专家模型用于消息级日志异常检测
发表机构 * Department of Electrical and Computer Engineering(电气与计算机工程系)
AI总结 本文提出FAME,一种面向失败的混合专家模型,用于消息级日志异常检测。该方法通过少量标注数据训练轻量级路由器和领域专家,实现高效的异常检测,同时在BGL和Thunderbird数据集上取得了高精度和召回率。
Comments 12 pages, 5 figures
SDPM:用于连续时间生存分析的生存扩散概率模型
发表机构 * Peter the Great St.Petersburg Polytechnic University(彼得大帝圣彼得堡国立大学)
AI总结 本文提出SDPM,一种用于连续时间生存分析的生成模型,通过去噪扩散模型建模生存结果的条件分布,避免了对事件时间分布的参数假设,并在变换的目标空间中使用标准化对数时间和连续高斯混合表示来表示删失指示符,从而在多个真实生存数据集上取得了竞争力的预测性能。
MambaGaze: 通过显式缺失数据建模的双向Mamba用于从眼动追踪数据中评估认知负荷
发表机构 * Department of Computer Science, College of AI, Cyber and Computing, The University of Texas at San Antonio(计算机科学系,人工智能、网络与计算学院,德克萨斯大学圣安东尼奥分校) ; Department of Educational Psychology, College of Education and Human Development, The University of Texas at San Antonio(教育心理学系,教育与人类发展学院,德克萨斯大学圣安东尼奥分校) ; Department of Neuroscience, Developmental and Regenerative Biology, College of Sciences, The University of Texas at San Antonio(神经科学系,发育与再生生物学系,科学学院,德克萨斯大学圣安东尼奥分校)
AI总结 本文提出MambaGaze,通过XMD编码和双向Mamba-2框架,解决眼动追踪数据中频繁缺失和长时序依赖建模的问题,实验证明其在认知负荷评估中的优越性能和边缘部署可行性。
Comments Submitted to IEEE-EMBS International Conference on Biomedical and Health Informatics (BHI 2026)
统一扩散模型再审视:留一法去噪器和吸收状态重述
发表机构 * CMAP, Ecole polytechnique(巴黎高等学院CMAP实验室) ; Institute of Foundation Models(基础模型研究所) ; Inria, PSL Research University(法国国家信息与自动化研究所) ; MBZUAI(马尔科姆·布罗德本特大学人工智能研究所) ; EPITA, LRE(EPITA实验室)
AI总结 本文研究了统一扩散模型中去噪后验与留一法后验之间的不匹配问题,并通过改进的参数化和采样方法提升了模型性能。
Comments preprint
Lumberjack: 通过树中的Heavy Hitter检测实现更好的差分隐私随机森林
发表机构 * PreMeDICaL ; Inria(法国国家信息与自动化研究所) ; Université de Montpellier(蒙彼利埃大学) ; INSERM(国家医学研究院) ; Technical University of Munich(慕尼黑技术大学)
AI总结 本文提出Lumberjack算法,通过构建大规模随机决策树并应用隐私保护的剪枝技术,显著提升了差分隐私随机森林的实用性。该方法引入了新的(ε,δ)-DP Heavy Hitter检测算法,具有O_{ε,δ}(√log h)的误差,使得树的高度可以更深,从而在隐私约束下提高表达能力。实验表明,Lumberjack在基准数据集上优于现有差分隐私随机森林方法,特别是在隐私预算下的隐私-效用权衡上取得显著改进。
基于机器学习和元启发式特征优化的物联网智能电网中网络-物理异常检测
发表机构 * Department of Mathematical and Computer Sciences, University of Sarajevo(萨拉热窝大学数学与计算机科学系) ; Singidunum University(辛吉杜姆大学) ; Trinity University(特里尼蒂大学) ; Sinergija University(辛格里雅大学)
AI总结 本文研究了如何利用机器学习和元启发式特征优化方法,在物联网智能电网中检测网络-物理异常,通过评估多个基线模型,发现基于树的集成模型在该数据集上表现最佳,且经过特征优化后,模型在准确率和AUC指标上均有显著提升。
插件损失用于证据深度学习:一个简化框架用于不确定性估计,其中包括softmax分类器
发表机构 * TU Munich(慕尼黑技术大学) ; MCML(慕尼黑实验室) ; Infineon Technologies(英飞凌科技)
AI总结 本文提出了一种简化框架,用于通过插件损失近似证据深度学习中的不确定性估计,证明了在特定证据到狄利克雷分布映射下,该框架包含标准的softmax分类器,并在Google语音命令数据集上验证了其有效性。
SeqLoRA: 为持续多概念生成的双水平正则化适应
发表机构 * Uppsala University(乌普萨拉大学) ; ETH Zurich(苏黎世联邦理工学院) ; Sweden(瑞典)
AI总结 本文提出SeqLoRA,一种双水平优化框架,通过联合优化LoRA因素来解决文本到图像扩散模型中多自定义概念组合时的表示干扰问题,提高了身份保持性和可扩展性。
在两个流形交集上的优化
发表机构 * State Key Laboratory of Mathematical Sciences, Academy of Mathematics and Systems Science, Chinese Academy of Sciences, and University of Chinese Academy of Sciences, China(数学科学国家重点实验室,数学与系统科学研究院,中国科学院,以及中国科学院大学,中国)
AI总结 本文提出了一种几何方法,通过在单个流形上进行重新参数化,并在两个正交方向上更新迭代点,以解决两个流形交集上的优化问题,证明了清洁交集和内在横贯性是等价的,并展示了该方法在稀疏和低秩优化问题中的有效性。
Comments 26 pages, 5 figures, 3 tables
训练后是关于状态,而不是标记:一种状态分布视角下的SFT、RL和在线策略蒸馏
发表机构 * Independent Researcher(独立研究者)
AI总结 本文从状态分布的角度研究了监督微调(SFT)、强化学习(RL)和在线策略蒸馏(OPD)等大语言模型训练后方法,发现训练状态的来源和局部性与监督信号的形式同样重要。
多重神经算子在多任务学习中实现接近最优的速率
发表机构 * Department of Mathematics,Id University of California Los Angeles,Id(数学系,加州大学洛杉矶分校)
AI总结 本文研究了共享多任务设置中学习一组算子的近似性和统计复杂性,重点探讨了多重神经算子(MNO)架构。对于广泛类别的Lipschitz多重算子映射,推导出近似和统计泛化性的近优上界。同时,建立了参数复杂性的诅咒并证明了相应的最小最大速率。这些结果表明,跨任务共享表示不会增加总体成本:多任务算子学习遵循与单算子学习相同的缩放定律。此外,本文还比较了MNO与基于拼接任务输入的深度ONet多任务扩展版本,并表明从最坏情况的近似复杂性角度看,两种架构满足本质上相同的渐进行速率。
高斯DDPM中协方差匹配的价值及兰扎斯采样器
发表机构 * Electrical Engineering and Computer Science(电气工程与计算机科学系) ; Massachusetts Institute of Technology(麻省理工学院) ; Operations Research Center(运筹学研究中心) ; Sloan School of Management(斯隆管理学院)
AI总结 本文研究了高斯DDPM中协方差匹配在路径空间KL散度中的价值,提出兰扎斯采样器方法,通过矩阵自由技术实现最优反向协方差采样,从而提升采样质量。
阅读任务失败的激活特征:GPT-2小模型在间接对象识别任务上的稀疏特征审计
发表机构 * Research Division, BrightMind AI(BrightMind AI研究部) ; Texas Tech University(德克萨斯理工大学) ; University of Texas at Arlington(德克萨斯大学阿灵顿分校)
AI总结 该研究通过审计GPT-2小模型在间接对象识别任务中失败与成功样本的稀疏自动编码器特征,发现特定特征与任务失败高度相关,并通过多种控制实验验证了其相关性而非因果性。
Comments 10 pages, 7 figures
实时音乐扩散模型:交互式音乐生成扩散模型的高效微调与后训练
发表机构 * UC San Diego(加州大学圣迭戈分校) ; MIT(麻省理工学院) ; Adobe(Adobe公司)
AI总结 本文研究了音频扩散模型能否通过块级KV缓存高效地转化为交互式模型,从而在消费级硬件上实现。提出的Live Music Diffusion Models (LMDMs)通过块级KV缓存恢复并超越了离散Live Music Models (LMMs)的推理复杂度,并通过ARC-Forcing范式实现稳定的后训练对齐,从而在无需显式RL或奖励模型的情况下减少误差累积。
离线目标条件强化学习中的抽象
发表机构 * FLAIR, MLRG University of Oxford(FLAIR、MLRG 欧洲大学)
AI总结 本文提出了一种在离线目标条件强化学习中利用抽象的方法,通过引入相对化选项和不同层次的表示,提高了在相似状态空间上下文中的经验复用能力,从而提升了性能。
剪裁瓶颈:通过近边界信号的随机恢复稳定RLVR
发表机构 * Alibaba Group(阿里巴巴集团)
AI总结 本文研究了强化学习可验证奖励(RLVR)中由于硬剪裁决策导致的训练不稳定问题,提出了一种名为近边界随机救援(NSR)的简单方法,通过随机保留略微超出边界范围的token来恢复丢失的信号,从而提升训练稳定性和性能。
后验坍缩作为自动谱剪枝
发表机构 * Image Processing Laboratory (IPL), Universitat de València, Paterna, València 46980, Spain(图像处理实验室(IPL),瓦伦西亚大学,帕特erna,瓦伦西亚 46980,西班牙)
AI总结 本文研究了β-VAE中的后验坍缩现象,揭示其本质上是一种自动谱剪枝过程,通过分析不同β值下的均衡解,展示了潜在模式从最不有用的到最有用的逐步解耦的崩溃过程。
将嵌入概念化:面向视觉-语言模型的稀疏解缠
发表机构 * Faculty of Mathematics and Computer Science, Jagiellonian University(雅盖隆大学数学与计算机科学学院) ; Doctoral School of Exact and Natural Sciences, Jagiellonian University(雅盖隆大学精确与自然科学博士学校) ; Centre for Credible AI, Warsaw University of Technology(华沙技术大学可信人工智能中心)
AI总结 本文提出CEDAR方法,通过稀疏解缠技术在不增加维度的情况下揭示预训练嵌入的组成结构,从而提升视觉-语言模型的可解释性和与人类感知的一致性。
全息函数与神经网络
发表机构 * Rényi Institute of Mathematics(雷尼数学研究所)
AI总结 本文研究了全息函数的复杂性,通过三种不同方法(采样性质、结构性质和计算性质)探讨了全息函数的复杂性界限,并证明了这三种性质在参数上是等价的。
SegCompass: 探索通过稀疏自编码器实现可解释对齐以增强推理分割
发表机构 * Shenzhen Institutes of Advanced Technology, Chinese Academy of Sciences(深圳先进技术研究院,中国科学院) ; Peng Cheng Laboratory(鹏城实验室) ; Harbin Institute of Technology, Shenzhen(哈尔滨工业大学(深圳)) ; Meituan, Beijing(美团,北京) ; University of Chinese Academy of Sciences(中国科学院大学) ; College of Computer Science and Technology, Jilin University(吉林大学计算机科学与技术学院)
AI总结 本文提出SegCompass,一种通过稀疏自编码器实现可解释对齐的端到端模型,以提升推理分割的性能和可解释性。
Comments Accepted by CVPR 2026. 15 pages, 9 figures, 6 tables
带随机前导的秘书问题
发表机构 * Institut für Mathematik, Technische Universität Berlin, Germany(柏林技术大学数学研究所,德国)
AI总结 本文研究了带随机前导的秘书问题,展示了预测仅因其到达时间而有价值。在随机顺序模型中,单个均匀时间的前导可使成功概率达到至少1/2,优于经典1/e的基准。在对抗性顺序模型中,足够集中的前导可恢复常数成功保证。
从基线到随访:利用因果层次变分自编码器在UK Biobank中生成脊柱DXA图像
发表机构 * School of Electronics and Computer Science(电子与计算机科学学院) ; University of Southampton(萨塞克斯大学) ; MRC Lifecourse Epidemiology Centre(英国医学研究理事会生命周期流行病学中心) ; University of Southampton, Southampton General Hospital(萨塞克斯大学索马塞特医院) ; Computer Science University of Southampton(计算机科学萨塞克斯大学)
AI总结 本文提出了一种基于元数据的因果层次变分自编码器,用于在UK Biobank中生成一致的脊柱DXA图像,通过基线到随访的设置评估因果一致性,展示了年龄干预下关键椎体形态学变量的高一致性,支持了在解剖上合理的DXA图像合成。
Comments 7 pages, 4 figures, 3 tables. Accepted at the 48th Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC 2026)
为何SGD不是布朗运动:对随机动力学的新视角
发表机构 * Basic Research of Artificial Intelligence Laboratory (BRAIn Lab)(人工智能基础研究实验室(BRAIn Lab)) ; Innopolis University(因诺普利斯大学) ; P.N. Lebedev Physical Institute of the Russian Academy of Sciences(俄罗斯科学院皮亚琴佐·列别杰夫物理研究所)
AI总结 本文从离散更新出发,提出了一种将SGD视为在波动损失景观中确定性动力学的新方法,揭示了在临界点附近SGD的动力学行为,并通过实验验证了其在神经网络模型中的表现。
Comments Preprint
关于Wasserstein策略优化收敛性的注记
发表机构 * School of Mathematics, University of Edinburgh(爱丁堡大学数学学院) ; Department of Mathematics, Imperial College London(伦敦帝国理工学院数学系)
AI总结 本文探讨了Wasserstein策略优化在连续状态和动作空间中的收敛性问题,通过利用均场分析和log-Sobole不等式,证明了在熵正则化的马尔可夫决策过程框架下,WPO算法能够线性收敛到全局最优解。
UNAD+: 一种用于未知网络攻击检测的可解释混合框架
发表机构 * Department of Computer Science, University of Exeter(埃克塞特大学计算机科学系) ; German Research Center for Artificial Intelligence GmbH (DFKI)(德国人工智能研究中心(DFKI)) ; Marine Perception(海洋感知)
AI总结 本文提出UNAD+框架,结合无监督集成与监督精修阶段,通过集成可解释性层提升未知网络攻击检测的性能和透明度。
两个优于一个:一种无崩溃的多奖励RLIF训练框架
发表机构 * Bangladesh University of Engineering and Technology(孟加拉工程科技大学) ; West Virginia University(西弗吉尼亚大学) ; University of Aberdeen(阿伯丁大学) ; Fogsphere (Redev.AI Ltd, UK)(Fogsphere(Redev.AI Ltd,英国)) ; University College London(伦敦大学学院)
AI总结 本文提出一种多奖励RLIF框架,通过分解训练信号为答案级奖励和完成级奖励,并结合GDPO归一化和KL-Cov正则化,提升稳定性和鲁棒性,同时在数学推理和代码生成任务中接近监督RLVR方法的性能。
为LLM引导的程序发现设计的进化多任务优化
发表机构 * University of Michigan - Ann Arbor(密歇根大学安娜堡分校) ; University of California San Diego(加州大学圣地亚哥分校)
AI总结 本文提出了一种进化多任务优化(EMO)方法,用于LLM引导的程序发现,通过两个阶段框架EMO-STA(共享后适应)在多个任务家族中提高了程序发现的效率和鲁棒性,同时展示了共享进化在减少过拟合方面的优势。
医疗LLM基准测试的可靠性仅取决于其显式假设
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; New York University(纽约大学)
AI总结 本文提出医疗LLM基准测试的评估-部署差距源于隐式假设,而非基准设计问题,并通过BenchmarkCards和分阶段评估方法来解决这一问题。
Comments 13 pages, 1 figure
对儿科ICU中抗菌药物使用管理的机器学习架构进行基准测试
发表机构 * Department of Intensive Care and Neonatology and Children’s Research Center University of Zurich University Children’s Hospital Zurich(重症护理与新生儿科及儿童研究中心,苏黎世大学苏黎世儿童医院) ; Department of Health Sciences and Technology ETH Zurich(健康科学与技术系,苏黎世联邦理工学院) ; Department of Computer Science ETH Zurich(计算机科学系,苏黎世联邦理工学院)
AI总结 本研究针对儿科ICU中抗菌药物使用管理的机器学习模型进行基准测试,通过公共数据集和私人机构队列系统评估了四种临床相关的目标,发现预测性能主要由目标流行率和数据集特征决定,而非模型复杂度,序列模型在粗粒度下提升了精度-召回权衡,但细粒度建模带来的收益有限,且校准效果较差。
Comments 16 pages, 6 figures, code: https://anonymous.4open.science/r/AMS_intervention_prediction-C024
无卡人工智能银行业创新:基于机器学习算法的全面框架用于网络安全与欺诈防范
发表机构 * Computer Engineering, University of Central Florida, Orlando, Florida, USA
AI总结 本文提出了一种全面的框架,利用机器学习算法增强无卡人工智能银行系统的网络安全和欺诈防范能力,通过AI驱动的数据加密生成虚拟卡,减少信息泄露风险。
MoSA: 通过学习残余各向异性来缓解连续动力学中现实到模拟差距的运动约束应力适应
发表机构 * Hong Kong University of Science(香港科学大学) ; MMLab, Chinese University of Hong Kong, Hong Kong SAR(香港中文大学MMLab, 香港特别行政区) ; The University of Hong Kong, Hong Kong SAR(香港大学, 香港特别行政区)
AI总结 本文提出MoSA框架,通过运动约束应力适应来缓解连续动力学中现实到模拟差距,利用各向同性模型作为物理先验,并学习残余应力算子以捕捉轻微各向异性和非均匀性,最终在机器人操作中验证了其有效性。
因子扩散策略:一种单一分数网络的组成通用机器人控制
发表机构 * University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校)
AI总结 本文提出了一种因子扩散策略,通过单一共享的扩散网络实现通用机器人控制,该网络在推理时能将分数分解为各因子的加法形式,从而在训练任务预算上从因子基数的乘积减少到求和,通过轨迹管证书将分数界转化为闭环状态轨迹管,实验验证了其泛化界和证书的有效性。
深度集成是否真的在图神经网络中捕捉了不确定性?
发表机构 * University of Edinburgh(爱丁堡大学) ; DCC/FCUP, University of Porto(葡萄牙里斯本大学数据与计算中心/里斯本大学)
AI总结 本文研究了深度集成在图神经网络中的有效性,发现其在不确定性量化中效果有限,主要归因于模型优化噪声的稳定而非不确定性估计的提升,揭示了集成崩溃现象。
SceneAligner: 在真实场景中实现基于3D的平面定位
发表机构 * Cornell University(康奈尔大学) ; Kempner Institute, Harvard University(哈佛大学 Kempner 院)
AI总结 本文提出了一种在真实场景中实现基于3D重建的平面定位方法,通过将任务 grounding 在场景的重建3D表示中,解决了现有方法在大规模建筑和栅格化平面图中应用受限的问题。
Comments Project Page: https://Cornell-VAILab.github.io/SceneAligner
GraphFlow: 一种基于图的流程管理用于高效的LLM代理服务
发表机构 * School of Cyber Science and Engineering, Xi'an Jiaotong University, Xi'an, China(西安交通大学计算机科学与工程学院) ; School of Artificial Intelligence, Shandong University, Jinan, China(山东大学人工智能学院) ; Shanghai Advanced Research Institute, Chinese Academy of Sciences, Shanghai, China(中国科学院上海先进研究院)
AI总结 本文提出了一种基于图的流程管理方法GraphFlow,通过统一图结构wGraph动态生成任务特定流程,提高LLM代理服务的效率和性能,实验表明其在多个基准数据集上表现优异,性能提升显著且内存占用减少。
Comments Accepted to ICML 2026
SynAE: 一个用于评估工具调用代理合成数据质量的框架
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; Microsoft Research(微软研究院)
AI总结 本文提出SynAE框架,用于评估多轮工具调用代理合成数据的质量,通过四个指标类别评估合成数据的有效性、保真度和多样性,揭示单一指标不足以全面表征合成数据质量。
基于遗憾的贝叶斯优化(ε,δ)-最优停止准则
发表机构 * National University of Singapore(新加坡国立大学) ; Lawrence Livermore National Laboratory(劳伦斯利弗莫尔国家实验室) ; The University of Manchester(曼彻斯特大学)
AI总结 本文提出了一种基于更紧的高斯过程上置信界(GP-UCB)即时遗憾界限的停止准则,确保在终止时以高概率1-δ获得ε-最优解,并通过数值实验验证其有效性。
Comments 21 pages
ImplicitTerrainV2: 基于小波引导的时空自适应神经地形表示
发表机构 * University of Maryland, College Park(马里兰大学学院市分校)
AI总结 本文提出ImplicitTerrainV2,通过结合频谱控制机制、小波引导的空间自适应性、导数感知监督和训练后模型压缩,实现了紧凑高效的神经地形数据格式,提升了地形分析的精度和效率。
Comments 14 pages, 8 figures
一个鞅核独立性检验
发表机构 * Imperial College London(伦敦帝国学院)
AI总结 本文提出两种学生化统计量,通过自归一化和半样本分割,实现了无需排列校准的独立性检验,显著提升了计算效率和测试性能。
F-TIS: 利用多样化模型进行协作GRPO
发表机构 * Gensyn University of Neuchatel(日内瓦大学内沙特尔分校) ; Gensyn(盖森) ; TU Delft(代尔夫特理工大学) ; University of Neuchatel(日内瓦大学内沙特尔分校)
AI总结 本文提出F-TIS方法,通过利用异构模型在协同GRPO训练中提高本地模型的学习效果,实现了高效的通信和一致的最终模型收敛,同时在某些情况下提升了模型在分布外任务上的泛化能力。
Comments Accepted to ICML 2026 Workshop Scalable Learning and Optimization for Efficient Multimodal AI Agents (SCALE)
超越生成模型的解缠:黎曼ICA
发表机构 * University of Massachusetts Amherst(马萨诸塞大学阿默斯特分校)
AI总结 本文提出黎曼ICA,一种不依赖生成模型的解缠方法,通过引入解缠张量来研究局部解缠特性,为理解无生成假设下的特征解缠提供了理论基础。
在网络安全AI中稳定可解释性脆弱性:公共基准数据集中的多重共线性影响与缓解
发表机构 * Netrity Ltd(Netrity有限公司) ; University of Glasgow(格拉斯哥大学)
AI总结 本文研究了在入侵检测(IDS)中使用AI可解释性时的一个未被探索但重要的漏洞:多重共线性导致的不稳定性。尽管广泛依赖于事后可解释性工具如SHAP或LIME,但相关特征对解释鲁棒性的影响未被评估。我们引入了一个正式定理,表明多重共线性会放大归因方差。这证明了在多重共线性下,解释和特征重要性是非可识别的。在代表性的基准数据集UNSW-NB15上,通过一系列全面的实验验证了该定理。评估了四种广泛使用的模型家族,包括线性、基于树的、核和神经网络模型,在基于VIF和相关性阈值的完整和剪枝特征集上。我们提出了新的指标Explanability Fragility Score,并提出了两种新的缓解方法,具有变量整合复杂度。CAA-Filtering专注于通过分组训练模型的归因来稳定解释。SHARP是一种新的训练时间正则化框架,通过惩罚归因不稳定性,使可解释性稳定性可控且单调提高。研究结果支持稳定的预测性能,使用Kendall's τ量化在重采样解释中的不稳定性。这项工作对XAI在安全关键领域中的可信度和可重复性有直接影响,并促使将多重共线性缓解措施纳入IDS流程,为从业者提供了一套指南。
Comments 35 pages, 3 figures, submitted to ACM TAISAP
通过价值驱动传输进行生成建模
发表机构 * Universitat Pompeu Fabra Barcelona(巴塞罗那庞培乌法布拉大学) ; ETH Zürich(苏黎世联邦理工学院) ; ICREA & Universitat Pompeu Fabra Barcelona(ICREA与巴塞罗那庞培乌法布拉大学)
AI总结 本文提出了一种基于测度传输离散时间随机控制 formulations 的新生成建模框架,通过线性规划的对偶变量直接编码最优控制策略,并开发了高效的模拟-free 原始-对偶算法来计算近似最优价值函数和价值驱动传输(VDT)策略,这些策略在多个实验中表现出优越的性能和良好的可扩展性。
EnCAgg: 增强型聚类聚合用于对抗动态模型中毒的联邦学习
发表机构 * School of Cyberspace Security, Beijing University of Posts and Telecommunications(信息安全部门,北京邮电大学) ; School of Computer Science and Technology, Huazhong University of Science and Technology(计算机科学与技术学院,华中科技大学) ; Department of Electronic Engineering, Tsinghua University(电子工程系,清华大学)
AI总结 本文提出了一种新的鲁棒聚合方法,通过利用少量已知的良性客户端作为参考,准确识别和过滤恶意梯度,同时保留尽可能多的良性梯度,即使恶意客户端的数量未知且变化。方法包括密度基低维梯度聚类、增强聚类低维梯度生成模型和低维梯度重新聚类。
将代理工作流编译为LLM权重:在成本上减少两个数量级的情况下实现接近前沿质量
发表机构 * University of Melbourne(墨尔本大学)
AI总结 本文研究如何将代理工作流编译为LLM权重以提高效率,通过在旅行预订、Zoom支持和保险索赔等任务中验证,展示了编译方法在减少成本的同时保持高质量性能。
Comments 19 pages
神经编译器:程序到网络的翻译用于混合科学机器学习
发表机构 * Institute for Interdisciplinary Data Sciences(跨学科数据科学研究所) ; University of Idaho(爱达荷大学)
AI总结 该研究提出了一种神经编译器,能够将程序转换为可微的PyTorch模块,用于混合科学机器学习,通过符号规范生成正确且可微的模块,实现系统化的可组合性。
Comments Use: 21 pages, 10 figures, 10 tables. Preprint; source code available at https://github.com/sheneman/neural_compiler
噪声中的信号:通过因子化潜在空间中的拟合性检验进行分布外检测
发表机构 * School of Informatics University of Edinburgh(信息学院爱丁堡大学)
AI总结 本文提出了一种基于因子化潜在空间中拟合性检验的分布外检测方法SITN,该方法无需访问分布外数据,计算开销小,并能严格控制误报率。
理解动作分块行为克隆中的多模态失败
发表机构 * NCT-Dresden(NCT-德累斯顿)
AI总结 研究行为克隆在多模态情况下失败的机制,分析不同多模态参数化在动作分块策略中的不同失效方式,并提出通过调整正则化程度和改进生成策略来提升鲁棒性的方法。
表示不等于计算:一个变换器的因果测试,检验候选算法中间变量
发表机构 * MKSSS's Cummins College of Engineering for Women(MKSSS女子工程学院) ; Institute of Cognitive Science(认知科学研究所) ; Osnabrück University(奥斯纳布吕克大学)
AI总结 本文研究了变换器在执行算术任务时如何整合组件,发现模型虽然能准确回答问题,但其内部表示与计算路径之间存在因果分离,表明探针结果可能与实际因果观察有显著差异。
Comments 16 pages, 4 figures
当更强的触发器反噬:高维背景下后门攻击的理论
发表机构 * Mathematical Institute, University of Oxford(牛津大学数学研究所) ; School of Mathematical Science, Tel Aviv University(特拉维夫大学数学科学学院) ; School of Mathematical Science and Computer Science, Tel Aviv University(特拉维夫大学数学科学与计算机科学学院)
AI总结 本文研究了在高维情况下后门毒化攻击的行为,发现更强的训练触发器有助于防御者,并通过高维理论分析了后门攻击的核心机制和影响因素。
图神经网络中mini-batch训练的隐式正则化
发表机构 * Institut Polytechnique de Paris(巴黎理工学院) ; Mirakl
AI总结 本文研究了图神经网络中mini-batch训练的隐式正则化现象,发现简单的随机节点采样方法在多个数据集上表现优异,且效率更高。
结构稀疏注意力用于具有次二次序列复杂度的实体跟踪
发表机构 * ESPCI PSL(ESPCI 法国巴黎大学) ; LAMSADE, Université Paris Dauphine - PSL(LAMSADE 巴黎dauphine大学-巴黎科学实验室)
AI总结 本文提出了一种结构稀疏注意力机制,用于在长序列中高效维护和更新实体和属性的潜在状态,通过减少计算复杂度提升实体跟踪的效率和准确性。
Comments 12 pages, 1 figure, 9 tables
赢家通吃瓶颈强制多任务学习中的解耦符号表示
发表机构 * Institute of Machine Learning and Neural Computation(机器学习与神经计算研究所) ; Graz University of Technology(格拉茨技术大学) ; Graz, Austria(奥地利格拉茨)
AI总结 本文研究了赢家通吃瓶颈在多任务学习中强制提取数据类别潜在因素的作用,证明了其产生的表示具有高度符号性,并通过实验验证了其在一般化中的优势。
迷失在标记化中:图标记化在Transformer中的基本权衡
发表机构 * Courant Institute of Mathematical Sciences, New York University(纽约大学数学科学学院) ; John A. Paulson School of Engineering and Applied Sciences, Harvard University(哈佛大学工程与应用科学学院) ; Google Research(谷歌研究) ; Tel-Aviv University(特拉维夫大学)
AI总结 本文研究了图标记化在Transformer中的基本权衡,探讨了不同标记化方法对模型表达能力的影响,并通过实验验证了不同任务对不同结构视图的偏好。
基于受限离子量子计算机的离子穿梭强化学习
发表机构 * Institute for Information Processing (tnt), L3S, Leibniz University Hannover, Germany ; Institute for Gravitational Physics, Leibniz University Hannover, Germany ; QUDORA Technologies GmbH ; Institute for Theoretical Physics, Leibniz University Hannover, Germany
AI总结 本文提出利用强化学习优化受限离子量子计算机中的离子穿梭过程,通过直接交互学习策略,显著提高了离子穿梭效率,减少了36.3%的穿梭操作,并展示了方法在不同芯片架构中的广泛应用潜力。
Comments 15 pages + 9 pages supplementary material, 6 figures
使离散的成为连续的:合成RAW增强用于细粒度评估人检测性能在低光环境
发表机构 * University of Glasgow(格拉斯哥大学) ; Dotphoton
AI总结 本文提出了一种合成RAW增强方法,用于在低光条件下更准确地评估人检测模型的性能,通过生成与相机传感器噪声模型匹配的低光样本,以改善基准测试的数据覆盖。
Comments Accepted non-archival paper at the CVPR 2026 AUTOPILOT Workshop (Autonomous Understanding Through Open-world Perception and Integrated Language Models for On-road Tasks)
不要忘记批评者:基于价值的多循环持续强化学习中的数据复习
发表机构 * Department of Computer Science(计算机科学系) ; University of North Carolina at Charlotte(北卡罗来纳大学夏洛特分校)
AI总结 本文提出了一种基于价值的数据复习方法,用于多循环持续强化学习,通过引入Qreg+NWLU方法改进学习效率、遗忘缓解和知识转移。
不要相信拍卖师:在反馈操纵拍卖中学习出价
发表机构 * Università degli Studi di Milano(米兰大学) ; Crest-Ensae(Ensae研究中心) ; IP Paris(巴黎研究所) ; CRITEO AI Team(CRITEO人工智能团队)
AI总结 研究在反馈操纵拍卖中学习出价的问题,提出一种结合鲁棒区间消除分支和乐观分支的算法,以应对反馈操纵带来的挑战,并在单活跃区域情况下提供匹配下界。
对Intel神经计算Stick 2在单脉冲电磁故障注入下的故障响应进行表征
发表机构 * Faculty of Informatics and Information Technologies, Slovak University of Technology(信息与信息技术学院,斯洛伐克技术大学) ; State Key Laboratory of Blockchain and Data Security(区块链与数据安全国家重点实验室) ; TTControl GmbH
AI总结 本文研究了Intel神经计算Stick 2在单脉冲电磁故障注入下的故障响应,通过系统性的测试发现四种可重复的故障类别,并探讨了针对这些故障类别的缓解策略。
AMUSE: 任何时刻的Muon with Stable Gradient Evaluation
发表机构 * KAIST(韩国科学技术院) ; KRAFTON(KRAFTON公司) ; Seoul National University(首尔国立大学)
AI总结 本文研究了Muon算法的机制,提出了一种名为AMUSE的算法,通过结合Muon的快速批量进步和Schedule-Free平均的稳定效果,实现了无需学习率调度的任何时刻训练,并在视觉任务和大语言模型预训练中提升了性能-迭代帕累托前沿。
Comments 41 pages, 25 figures
异构虚拟内存分页用于混合Mamba-Transformer推理
发表机构 * Ho Chi Minh City Vietnam(越南胡志明市)
AI总结 本文提出了一种异构虚拟内存分页方法,用于解决混合Mamba-Transformer模型推理中不同内存缓存类型的内存管理问题,通过分离两种缓存类型到物理上不同的池中,并在需要时迁移容量以提高内存利用率和推理吞吐量。
Comments 11 pages, 8 figures, 6 tables. Code and reproducibility artifacts at https://github.com/codepawl/cachepawl
DeferMem: 通过强化学习进行长时记忆问答的查询时证据蒸馏
发表机构 * State Key Lab of CAD&CG(计算机辅助设计与图形学国家重点实验室)
AI总结 本文提出DeferMem,一种长时记忆框架,通过分离问题为高召回候选检索和查询条件证据蒸馏,以提升长时记忆问答的准确性和效率。
Comments 31 pages, 3 figures
基于最小描述长度的粒状球树正则化谱聚类
发表机构 * Department of Mathematics and Computer Science, Gannan Normal University(赣南师范大学数学与计算机科学学院) ; Key Laboratory of Data Science and Artificial Intelligence of Jiangxi Education Institutes, Gannan Normal University(江西省教育研究院数据科学与人工智能重点实验室)
AI总结 本文提出一种基于最小描述长度的粒状球树正则化谱聚类方法,通过局部MDL模型选择构建粒状球树,利用反向邻域连续性抑制破坏可靠局部连接的分裂,利用稳定的叶球提供编码尺度信息正则化样本级亲和图,并引入共享邻居桥码调整弱局部桥接关系,从而在统一的谱聚类框架中连接可解释的局部表示学习与亲和图构建。
Comments 28 pages, 5 figures, 6 tables
跨物种RSA揭示人类fMRI和猴子电生理学中早期视觉对齐的保守性,但更高区域的排名却呈现分歧
发表机构 * Independent Researcher(独立研究者)
AI总结 该研究通过跨物种比较,发现早期视觉对齐在人类和猴子之间具有保守性,但更高区域的对齐性受模型容量和刺激域影响。
Comments 9 pages, 6 figures
后验预测方差分解用于风力发电中的epistemic和aleatoric不确定性
发表机构 * School of Engineering, Deakin University(德肯大学工程学院) ; ARC Training Centre in Energy Technologies for Future Grids, School of Engineering, University of Wollongong(未来电网能源技术培训中心,沃林戈大学工程学院)
AI总结 本文提出了一种后验预测方差分解方法,用于分离风力发电预测中的epistemic和aleatoric不确定性,通过总不确定性分解为aleatoric和epistemic组件,并提出特定于风力发电的评估框架来验证分解的有效性。
混合 Kolmogorov-Arnold 网络与 XGBoost 框架用于澳大利亚国家电力市场的周 ahead 电价预测
发表机构 * Department of Data Science and AI, Faculty of IT, Monash University, Australia(数据科学与人工智能系,IT学院,墨尔本大学,澳大利亚) ; School of Electrical Engineering and Computer Science, University of Queensland, Australia(电气工程与计算机科学学院,昆士兰大学,澳大利亚) ; Monash Energy Institute, Monash University, Australia(墨尔本能源研究所,墨尔本大学,澳大利亚)
AI总结 本文提出了一种混合 KAN+XGBoost 框架,用于预测澳大利亚国家电力市场的周 ahead 电价,该框架结合了 Kolmogorov-Arnold 网络的全局非线性表示能力和 XGBoost 的局部鲁棒性,以捕捉长期依赖和短期价格波动,实验表明该模型在 MAE 上比 XGBoost 和 naive 基线模型分别减少了 12% 和 50% 以上。
Comments The 24th IEEE International Conference on Industrial Informatics, 2026
通过消息传递实现高效的高阶子图归因
发表机构 * BIFOLD -- Berlin Institute for the Foundations of Learning(柏林学习与数据基础研究院) ; Department of Artificial Intelligence, Korea University, Seoul 136-713, Korea(韩国大学人工智能系) ; RIKEN Center for AIP, Japan(日本AIP研究中心)
AI总结 本文提出了一种基于消息传递的高效算法,能够在线性时间内通过GNN-LRP对子图进行归因,并扩展了子图归因方法以考虑邻接图特征,实验表明该方法具有显著加速和高实用性。
Comments Published in ICML 2022
印地语中辱骂评论检测的多阶段训练
发表机构 * Department of CSE, JIIT Noida(计算机科学与工程系,印度尼泊尔理工学院诺伊达) ; Department of ICE, NSUT Delhi(电子与计算机工程系,NSUT德里) ; Department of IT, VIT Vellore(信息科技系,维杰学院维洛雷) ; Department of CSE, IIIT Delhi(计算机科学与工程系,德里理工学院)
AI总结 本文提出了一种多阶段训练方法,通过语言预处理和多个模型的集成,提高印地语中辱骂评论检测的准确性,减少误报率以保护言论自由。
Comments 4 pages, EAM2021 selected
基于时间异步对齐对比学习的跨受体EEG情绪识别
发表机构 * School of Biomedical Engineering, Shenzhen Campus of Sun Yat-sen University(中山大学生物医学工程学院深圳校区) ; School of Computer Science and Technology, Tianjin University(天津大学计算机科学与技术学院)
AI总结 本文提出了一种基于时间异步对齐对比学习(TA2CL)的框架,用于解决跨受体EEG情绪识别中由于不同受体响应时间不一致导致的识别问题,通过改进相似性计算策略,提升模型对跨受体差异和时间延迟的鲁棒性。
Comments 16 pages, 7 figures
通过研究token层面激活实现SLMs的可解释性
发表机构 * Information Technology(信息技术) ; A.K. Choudhury School of Information Technology(A.K. Choudhury 信息技术学院) ; Computer Science & Engineering(Artificial Intelligence)(计算机科学与工程(人工智能)) ; Institute of Engineering & Management(工程与管理学院) ; Computer Science & Engineering(计算机科学与工程) ; University of Calcutta(加尔各答大学)
AI总结 本文提出了一种轻量且通用的框架,通过BERT第8层隐藏状态的激活强度量化token层面的表示重要性,揭示了语义信息在激活强度上的集中分布,为将BERT从黑箱模型转变为更透明的玻璃箱模型提供了可解释且计算高效的替代方法。
目标对齐的贝尔曼备份用于跨域离线强化学习
发表机构 * School of Artificial Intelligence(人工智能学院) ; Jilin University(吉林大学)
AI总结 本文提出了一种基于目标域贝尔曼目标对齐的跨域离线强化学习方法,旨在通过评估源域过渡与目标域贝尔曼目标的一致性来提升策略学习性能。
ASAP: 以注意力汇点为中心的剪枝
AI总结 本文提出ASAP方法,通过将注意力汇点作为特征,利用懒惰随机游走建模视觉Transformer的信息流,实现单次剪枝过程中的token分区和背景冗余压缩,从而在保持或超越基线精度的同时,提升吞吐量达48%。
VeriScale:对抗性测试套件缩放用于可验证代码生成
发表机构 * School of Mathematical Sciences, Shanghai Jiao Tong University(上海交通大学数学科学学院) ; School of Science and Engineering, The Chinese University of Hong Kong, Shenzhen(香港中文大学(深圳)科学与工程学院) ; School of Mathematics, Jilin University(吉林大学数学学院) ; School of Mathematical Sciences, Tongji University(同济大学数学科学学院) ; Zhiyuan College, Shanghai Jiao Tong University(上海交通大学紫阳学院) ; School of Future Technology, South China University of Technology(华南理工大学未来技术学院) ; Institute of Natural Sciences, Shanghai Jiao Tong University(上海交通大学自然科学研究院) ; MOE-LSC, CMA-Shanghai, Shanghai Jiao Tong University(上海交通大学MOE-LSC、CMA-上海)
AI总结 本文提出VeriScale框架,通过对抗性实现扩展和缩减测试套件,提升代码生成的可验证性,实验表明VerinaPlus显著暴露了模型弱点,而VerinaLite在低成本下保持判别能力。
TransitLM: 一个大规模数据集和基准,用于无地图的公共交通路线生成
发表机构 * Alibaba Group(阿里巴巴集团) ; AMAP
AI总结 本文提出TransitLM,一个包含1300万条公共交通路线规划记录的数据集,用于无地图的公共交通路线生成,展示了通过数据训练模型生成有效路线的能力。
一种用于在线Softmax分类中三分之一缩放的边界层机制
发表机构 * Institute for Theoretical Physics, Leipzig University(理论物理研究所,莱比锡大学) ; ScaDS.AI Dresden/Leipzig(ScaDS.AI 德累斯顿/莱比锡)
AI总结 本文研究了在线教师-学生模型中平滑替代损失与离散标签之间的不匹配如何产生幂律学习曲线的边界层机制,揭示了测试损失和泛化误差的α^{-1/3}缩放特性,以及学习率调度对泛化误差的改进。
Comments 20 pages, 7 figures
从快照到轨迹:通过条件流匹配学习单细胞基因表达动力学
发表机构 * Computer Network Information Center, Chinese Academy of Sciences(中国科学院计算机网络信息中心) ; University of California, Los Angeles(加州大学洛杉矶分校)
AI总结 本文提出单细胞流匹配(scFM)方法,通过条件流匹配学习单细胞基因表达的动力学,解决时间点不连续和长时间预测中的分布漂移问题,提升轨迹推断的准确性和时间一致性。
物理引导的生成求解器:连接数据驱动先验与守恒定律以稳定时空场重建
发表机构 * School of Advanced Manufacturing Engineering, Nanjing University(南京大学先进制造工程学院) ; National Laboratory of Solid State Microstructures, Nanjing University(南京大学固态微结构国家实验室) ; Suzhou Acoustics Industry Technology Research Institute Co., Ltd.(苏州声学工业技术研究所有限公司) ; School of Mechanical and Electric Engineering, Soochow University(苏州大学机械与电子工程学院) ; Shishan Laboratory, Nanjing University(仙山实验室)
AI总结 本文提出了一种物理引导的生成求解器,通过分离稳定的先验学习与推理时的守恒定律强制执行,解决了从稀疏测量中重建连续物理场的问题,同时在声学和气象学中实现了高效且稳定的场重建。
在上下文中的表格预测中学习因果顺序
发表机构 * Department of XXX, University of YYY, Location, Country(XXX系,YYY大学,地点,国家) ; School of ZZZ, Institute of WWW, Location, Country(ZZZ学院,WWW研究所,地点,国家)
AI总结 本文研究了如何在表格预测中同时推断和强制因果结构,通过拓扑变量顺序形式进行因果结构推断,提出TabOrder模型利用因果顺序约束注意力机制,在学习的因果顺序下仅基于先于目标的特征进行预测,并通过似然目标无监督学习最优变量顺序,同时探讨了样本缺失对因果方向识别的影响。
黎曼几何与fMRI的结合:建模相关流形和特征向量子空间的优势
发表机构 * Department of Information Engineering, University of Padova(信息工程系,帕多瓦大学) ; Department of Neuroimaging, Institute of Psychiatry, Psychology and Neuroscience (IoPPN), King’s College London(神经影像系,精神病学、心理学与神经科学研究所(IoPPN),伦敦国王学院) ; Department of Psychiatry, University of Oxford(精神病学系,牛津大学) ; Oxford Health NHS Foundation Trust, Warneford Hospital(牛津健康国家卫生信托基金,沃内福德医院) ; Department of Psychosis Studies, Institute of Psychiatry, Psychology and Neuroscience, King’s College London(精神病学研究系,精神病学、心理学与神经科学研究所,伦敦国王学院)
AI总结 本文提出了一种可扩展的几何框架,通过Off-log度量和Grassmannian子空间判别方法,改进了fMRI数据的分析,提高了敏感性和预测性能。
SepsisAI Orchestrator:一个容器化和可扩展的平台,用于部署AI模型和实时监控以实现早期败血症检测
发表机构 * School of Systems Engineering and Computing, University of Valle(系统工程与计算学院,山谷大学) ; Digital Medicine Unit, Balgrist University Hospital(数字医学单元,巴尔格里斯大学医院) ; Nucleus-AI Research(核芯AI研究所)
AI总结 本文提出SepsisAI-Orchestrator平台,通过整合HL7 FHIR启发的临床文档架构(CDA)预处理、NoSQL存储、容器化LightGBM分类器和Streamlit临床仪表板,解决了早期败血症检测中AI模型部署的挑战,并通过负载测试展示了U型扩展行为。
Comments 13 pages, 5 figures. Submitted to BioCARLA 2025 Workshop
数据整合到知识图谱的管道评估
发表机构 * ScaDS.AI Dresden/Leipzig(ScaDS.AI 德累斯顿/莱比锡) ; Leipzig University(莱比锡大学)
AI总结 本文提出KGI-Bench基准测试,用于评估将不同输入数据整合到现有知识图谱的管道,通过覆盖度、正确性和一致性三个指标分析输出的知识图谱质量,并在电影领域提供基准数据集以评估12种管道的性能。
跨领域基准测试揭示协调AI代理在部分证据下提升科学推断何时有效
发表机构 * Laboratory for Atomistic and Molecular Mechanics (LAMM)(原子分子力学实验室) ; Department of Biological Engineering(生物工程系) ; Department of Mechanical Engineering(机械工程系) ; Department of Civil and Environmental Engineering(土木与环境工程系) ; Center for Computational Science and Engineering, Schwarzman College of Computing(计算科学与工程中心) ; Massachusetts Institute of Technology(麻省理工学院)
AI总结 本文通过跨领域基准测试探讨协调AI代理在部分证据下提升科学推断的有效性,发现当不同学科各自捕捉现象部分时,跨通道复合方法优于单一通道基线,但在某些情况下分解并不总是提升整体性能。
长期公平性与选择性标签
发表机构 * Department of Computer Science, Saarland University, Saarbrücken, Germany(萨尔布吕肯大学计算机科学系)
AI总结 本文研究了在选择性标签设置下长期公平性的问题,提出了一种新的框架,通过结合观测数据和标签预测模型来估计真实的公平性度量,并提出了一种新的强化学习算法以实现有效长期公平决策。
EmoTrack: 从咨询记录中跨会话制度实现稳健的抑郁跟踪
发表机构 * Department of Computer Science National University of Singapore(新加坡国立大学计算机科学系)
AI总结 本文研究了从单次会话和多会话制度中通过咨询记录进行稳健抑郁跟踪的问题,提出了LongCounsel多会话咨询数据集和EmoTrack框架,结合LLM提取的临床信号和冻结的轮次级语义嵌入,训练症状特定预测器,并通过紧凑的跨会话记忆进一步结合先前会话,实验表明在真实单次会话基准上表现优异。
适应性测量分配用于在噪声观测下学习核化SVM
发表机构 * Φ \Phi -lab, European Space Agency (ESA/ESRIN), Frascati, Italy(Φ \Phi 实验室,欧洲航天局(ESA/ESRIN),弗拉斯卡蒂,意大利)
AI总结 本文提出了一种适应性测量分配策略,用于在噪声观测下学习核化支持向量机,通过结合几何敏感性和主动集不稳定性,优化核矩阵中决策关键区域的测量分配,从而提升支持向量恢复、边距估计和决策函数准确性。
Comments 20 pages, 9 figures
通过表示层面的分歧检测联邦学习中的非典型客户端
发表机构 * Universitat Politècnica de València(巴塞罗那理工大学) ; Universitat Jaume I(Jaime I 大学)
AI总结 本文提出了一种轻量级的几何信号来量化客户端与全局模型之间的功能偏差,以检测联邦学习中的非典型客户端,通过评估输入空间的激活诱导分区变化来区分稳定但异质的客户端与显著偏离全局范式的客户端。
按能力定制教学:方向自适应自蒸馏用于LLM推理
发表机构 * Institute of Computing and Intelligence, Harbin Institute of Technology(计算智能研究所,哈尔滨工业大学) ; Peng Cheng Laboratory(鹏城实验室) ; Keeta AI, Meituan(Keeta AI,美团)
AI总结 本文提出方向自适应自蒸馏(DASD),通过熵引导的定向监督改进LLM推理,通过分析发现统一的教师监督导致探索被压制,DASD在六个数学推理基准中取得最佳表现。
Comments Under Review
自动上下文音频去噪
发表机构 * Tampere University(塔尔皮奥大学) ; Nokia(诺基亚)
AI总结 本文提出了一种自动上下文音频去噪方法,通过推断音频场景类别来区分有用和无关声音成分,从而提高去噪效果。
基于OSINT辅助异质传感器融合的贝叶斯目标分类证据层级
发表机构 * Center for Digital Safety & Security, Austrian Institute of Technology GmbH (AIT)(数字安全与安全研究所,奥地利技术研究院(AIT))
AI总结 本文提出了一种基于OSINT辅助的异质传感器融合方法,通过建立新的证据层级模型,结合上下文信息和领域知识,提升对CBRNE威胁的分类准确率,实验结果表明该方法在抗干扰和先验不匹配方面具有优势,分类准确率高达95%。
Comments 6 pages, 1 figure; \c{opyright} 2026 The Authors. Submitted to the 2026 IEEE International Conference on Multisensor Fusion and Integration (MFI 2026). Under review
正式定理推理中应有的对称性是什么?
发表机构 * University of Oxford(牛津大学) ; KAIST(韩国科学技术院) ; TU Wien(维也纳技术大学) ; AITHYRA
AI总结 本文探讨了正式定理推理中应尊重的对称性,提出了基于范畴论的重写范畴框架,用于形式化证明等价性和成功不变性,并通过测试时方法改进了LLM基定理证明器的鲁棒性和性能。
没有比现在更严峻的挑战:鲁棒的气候模拟需要分布外泛化
发表机构 * Applied AI Lab University of Oxford, UK(应用人工智能实验室,牛津大学,英国) ; Atmospheric, Oceanic and Planetary Physics University of Oxford, UK(大气、海洋和行星物理,牛津大学,英国)
AI总结 本文研究了气候模拟中分布外泛化的重要性,提出了一种新的评估框架,通过季节变化来测试模拟器的鲁棒性,并展示了物理驱动的分解方法如何在不显著牺牲分布内性能的情况下提升分布外性能。
Comments 36 pages, 12 figures
为高维预测研究的数据驱动设计开发可解释的AI
发表机构 * School of Engineering, University of Edinburgh(爱丁堡大学工程学院) ; Causality in Healthcare AI Hub (CHAI)(医疗因果AI枢纽) ; Advanced Care Research Centre, Usher School of Population Health Sciences, University of Edinburgh(先进护理研究中心,乌瑟人口健康科学学院,爱丁堡大学) ; Centre for Medical Informatics, Usher School of Population Health Sciences, University of Edinburgh(医学信息学中心,乌瑟人口健康科学学院,爱丁堡大学)
AI总结 本文提出了一种可解释的AI推荐系统,通过数据驱动的方法改进现有可解释统计模型的预测性能,主要贡献是通过可解释AI技术提供三种推荐类型以提高模型的预测能力和透明度。
Comments 41 pages, 7 figures
具有Kolmogorov-Arnold网络的全纯神经ODEs用于复杂动力学的可解释发现
AI总结 本文提出了一种基于Kolmogorov-Arnold网络的全纯神经ODE框架,用于在复杂动力学系统中发现可解释的 governing equations,通过可微的正则化保持全纯结构,并在多个复杂动力学系统上验证了其有效性。
Comments 16 pages. Comments are welcome
变换器能生成多少种不同的输出?
发表机构 * Department of Mathematics, National University of Singapore, Singapore, 117543(新加坡国立大学数学系) ; School of Computing, National University of Singapore, Singapore, 117543(新加坡国立大学计算学院) ; Aix Marseille Univ, CNRS, I2M, Marseille, France(法国马赛大学、国家科学研究中心、I2M研究所) ; Department of Electrical and Computer Engineering, National University of Singapore(新加坡国立大学电子与计算机工程系)
AI总结 研究如何利用变换器架构中的少量特性来准确预测其能生成的不同序列数量,包括定性和定量分析,并提供基于提示长度的上限,实验证明在不同架构和模型大小下该上限紧致于10倍以内。分析还解释了之前在简单序列任务(如复制和填塞)中观察到的变换器经验性失败现象。
Comments ICML 2026 Spotlight
Transformer能否在回溯搜索中学习验证?
发表机构 * Yin Jun Phua (corresponding author) Institute of Science Tokyo, 2-12-1 Ookayama, Meguro-ku, Tokyo 152-8550, Japan Tony Ribeiro Centrale Nantes, CNRS, Laboratoire des Sciences du Num\'erique de Nantes, LS2N, UMR 6004, F-44000 Nantes, France National Institute of Informatics, 2-1-2 Hitotsubashi, Chiyoda-ku, Tokyo 101-8430, Japan Steelous Protocol, 8-20-32, Ginza, Chuo-ku, Tokyo 104-0061, Japan Tuan Nguyen Hanoi University of Science ; Technology, No. 1 Dai Co Viet, Hai Ba Trung, Ha Noi, Vietnam Katsumi Inoue National Institute of Informatics, 2-1-2 Hitotsubashi, Chiyoda-ku, Tokyo 101-8430, Japan
AI总结 本文研究了Transformer在回溯搜索中的验证能力,指出传统方法在处理轨迹数据时存在散列检索和历史纠缠问题,并提出局部化和选择性状态注意力(SSA)来解决这些问题,通过实验验证了SSA在3-SAT、图着色、Blocks World和回溯解析等任务中的有效性。
生存或崩溃:自我博弈强化学习中数据门控与奖励基础的不对称作用
发表机构 * University of California, Santa Barbara(加州大学圣巴巴拉分校) ; Cisco Research(思科研究)
AI总结 本文研究了自我博弈强化学习中数据门控和奖励基础的不对称作用,发现数据门控是维持稳定的关键因素,而奖励信号在门控移除后无法单独保证稳定性,揭示了'基础提出者悖论'。
基于核的深度强化学习安全探索
发表机构 * Max Planck Institute for Software Systems(马克斯·普朗克软件系统研究所)
AI总结 本文提出了一种基于核的方法,用于在深度强化学习中安全探索,通过学习屏障函数来保证策略不会进入危险区域,同时在探索过程中同时学习最优策略和屏障函数,提供更可靠的概率安全保证。
Comments Accepted at L4DC Conference (22 Jan 2026)
技能编织:通过模块化技能包实现高效的LLM改进
发表机构 * Harbin Institute of Technology, Shenzhen, China(哈尔滨工业大学(深圳)) ; The Hong Kong Polytechnic University(香港理工大学) ; Huawei Technologies Co., Ltd.(华为技术有限公司) ; Shanghai Jiaotong University(上海交通大学)
AI总结 本研究提出SkillWeave框架,通过模块化技能包使LLM在固定内存预算下实现领域专业化,通过SkillZip压缩技术实现高效部署,实验表明其在多任务和代理基准上表现优异,速度提升达4倍。
Comments Accepted by ACL2026
OSS: 2024-2025 开放缝合技能基于视觉的评估挑战
发表机构 * Department of Translational Surgical Oncology, National Center for Tumor Diseases (NCT/UCC) Dresden(转化外科肿瘤学部,肿瘤疾病国家中心(NCT/UCC)德累斯顿) ; The Centre for Tactile Internet with Human-in-the-Loop (CeTI), TUD Dresden University of Technology(具有人环路触觉互联网中心(CeTI),德累斯顿技术大学) ; Department of Oral and Maxillofacial Surgery, University Hospital RWTH Aachen(口腔和颌面外科部,亚琛大学医院) ; Center for Tooth-, Mouth- and Jaw Medicine, University Göttingen(牙科、口科和颌科医学中心,哥廷根大学) ; Institute of Medical Informatics, University Hospital RWTH Aachen(医学信息学研究所,亚琛大学医院) ; Faculty of Medicine and University Hospital Carl Gustav Carus, TUD Dresden University of Technology(医学系和卡尔·戈斯塔·卡鲁斯大学医院,德累斯顿技术大学) ; German Cancer Research Center (DKFZ)(德国癌症研究中心(DKFZ)) ; Muroran Institute of Technology(牟然技术学院) ; Niigata University of Health and Welfare(北九州市保健福利大学) ; Konica Minolta, Inc.(柯尼卡美能达公司) ; Jmees, Inc.(Jmees公司) ; Department of Computer Science and Engineering, The Hong Kong University of Science and Technology(计算机科学与工程部,香港科学与技术大学) ; Center Algoritmi/LASI, University of Minho(算法中心/ALASI,米尼奥大学) ; Life and Health Sciences Research Institute (ICVS), School of Medicine, University of Minho(生命与健康科学研究院(ICVS),医学院,米尼奥大学) ; ICVS/3B's - PT Government Associate Laboratory(ICVS/3B's - PT政府附属实验室) ; Institute for AI in Medicine (IKIM), University Medicine Essen(医学人工智能研究所(IKIM),埃森大学医学部) ; The Faculty of Data and Decisions Science, Technion - Israel Institute of Technology(数据与决策科学系,技术学院-以色列理工学院) ; UCL Hawkes Institute, University College London(UCL Hawkes研究所,伦敦大学学院) ; School of Computing, Queen's University(计算学院,皇后大学) ; Department of Transdisciplinary Medicine, Seoul National University Hospital(跨学科医学部,首尔国立大学医院) ; Interdisciplinary Program in Medical Informatics, Seoul National University(医学信息学跨学科项目,首尔国立大学) ; Department of Clinical Medical Sciences, Seoul National University(临床医学科学部,首尔国立大学) ; Institute of Convergence Medicine with Innovative Technology, Seoul National University Hospital(融合医学与创新技术研究所,首尔国立大学医院) ; Department of Surgery, Seoul National University College of Medicine and Seoul National University Hospital(外科部,首尔国立大学医学院和首尔国立大学医院)
AI总结 本文提出OSS挑战,旨在通过基于视觉的评估方法提升开放手术技能训练,通过挑战数据集和多任务评估,评估不同方法在开放手术技能评估中的表现,揭示视频评估的潜力与限制。
Comments Stefanie Speidel and Behrus Hinrichs-Puladi jointly supervised this work. Submitted to MEDIA
思维图增强:由强化学习驱动的LLM自适应提示方法
发表机构 * School of Engineering and Computer Science(工程与计算机科学学院) ; Bern University of Applied Sciences(伯恩应用科学大学)
AI总结 本文提出Reinforced Graph of Thoughts (RGoT),通过强化学习自动生成适应任务复杂度的思维图结构,提升大型语言模型的提示效果。
Comments 26 pages (including appendix), 16 figures
带梯度预测自适应的带状凸优化
发表机构 * Department of Mathematics, National University of Singapore, Singapore(新加坡国立大学数学系) ; Department of Computer Science and Engineering, Indian Institute of Technology Delhi, India(印度理工学院德里分校计算机科学与工程系) ; Department of Electrical and Computer Engineering, National University of Singapore, Singapore(新加坡国立大学电子与计算机工程系)
AI总结 本文研究了在预测自适应方式下,乐观梯度预测能否改进最坏情况下的后悔保证。提出了一种双点反馈设置下的两种点方差减少乐观梯度下降算法,该算法的梯度估计器方差与预测误差相关,从而得到O(√(dE[S_T]))的后悔界,并建立了信息论下界,证明了该算法在预测自适应后悔上的最优性。
从顺序节点到GPU批处理:并行分支限界法用于最优k-稀疏广义线性模型
发表机构 * Jacobs Technion-Cornell Institute, Cornell Tech and Technion–IIT(雅各布斯技术学院-康奈尔学院,康奈尔科技与技术学院)
AI总结 本文提出了一种CPU-GPU框架,通过批量处理GPU上的分支限界节点,显著加速了大规模优化问题的求解,特别是在具有离散变量、组合结构和非线性目标的优化问题中,如验证卡数约束下的最优广义线性模型解。
增强多模态大语言模型以用于安全关键驾驶视频分析
发表机构 * Verizon Connect
AI总结 本研究通过融合降采样视频帧与同步高频 telemetry 数据及专用计算机视觉模型的语义信息,提升多模态大语言模型在安全关键驾驶场景中的感知与推理能力,从而更准确地识别和描述现实驾驶中的安全关键事件。
Comments Accepted at the 2026 IEEE International Conference on Intelligent Transportation Systems (ITSC 2026)
IKNO:无限阶核神经算子
发表机构 * Nanyang Technological University(南洋理工大学) ; Centre for Frontier AI Research(CFAR), Agency for Science, Technology and Research (A*STAR)(前沿人工智能研究中心(CFAR),科技研究局(A*STAR))
AI总结 本文提出IKNO,一种通过无限阶核积分构建的神经算子,解决了传统模型因依赖一阶核积分而限制表达能力的问题,通过两种互补的构造方法实现了高效的全局信息聚合,并在多个基准数据集上取得了SOTA精度。
Maestro:通过强化学习协调分层模型-技能集合
发表机构 * Tsinghua University(清华大学) ; Zhejiang University(浙江大学) ; The Chinese University of Hong Kong(香港中文大学) ; Nanyang Technological University(南洋理工大学) ; Tongji University(同济大学)
AI总结 本文提出Maestro框架,通过强化学习协调多模态任务,利用分层模型-技能集合提升多模态任务性能,实现高效且通用的协调策略。
衡量跨模态协同:VLM可解释性的一个基准
发表机构 * University of Luxembourg(卢森堡大学) ; Luxembourg Institute of Health (LIH)(卢森堡健康研究院)
AI总结 本文提出Synergistic Faithfulness作为衡量VLM跨模态协同的指标,解决了传统单模态评估方法在评估VLM可解释性时的不足,通过引入Shapley交互指数,实现了对多模态协同的准确评估,同时提升了计算效率。
超越欧几里得距离:通过地平线匹配轨迹可达性度量修复潜在世界模型
发表机构 * Tongji University(同济大学)
AI总结 本文提出轨迹可达性度量(TRM)作为固定潜在世界模型的后处理终端排名方法,通过训练小的成对头部来改进终端排名,从而提高连续操控任务的性能。
Comments 26 pages, 7 figures
单向策略优化用于自演化大语言模型
发表机构 * Shenzhen Graduate School, Peking University(北京大学深圳研究生院) ; Dartmouth College(达特茅斯学院) ; Alibaba(阿里巴巴)
AI总结 本文提出单向策略优化方法,通过解耦优化方向与更新幅度,解决传统方法中验证器奖励稀疏导致的训练不稳定问题,实现大语言模型的持续自演化。
代数机器学习在小至中等数据集上的表现与强标准基线竞争
发表机构 * Mathematics of Behavior and Intelligence Lab(行为与智能数学实验室) ; Champalimaud Foundation(Champalimaud基金会)
AI总结 本文研究了代数机器学习在小至中等规模数据集上的表现,发现其在图像和表格分类任务中能与CNN等强基线方法竞争,且无需交叉验证。
Comments 9 pages, 4 figures
通过自我调节模拟规划实现高效的代理推理
发表机构 * Institute of Foundation Models (IFM)(基础模型研究所) ; Carnegie Mellon University(卡内基梅隆大学)
AI总结 本文提出通过分解决策过程为三个系统:模拟推理、自我调节和反应执行,来提升代理推理的效率,并展示了SR$^2$AM模型在不同任务中的表现。
Comments Code and model artifacts are available at https://github.com/sailing-lab/sr2am
从赌局到经验伯恩斯坦LIL
AI总结 本文通过在线投注策略的财富保证,推导出迭代对数定律,并提出经验伯恩斯坦LIL方法。
基于自监督的ConvLSTM用于费米大视场望远镜瞬变检测
发表机构 * Idea-RE
AI总结 本文提出了一种结合端到端模拟和自监督时空深度学习的方法,用于在受控环境中检测费米- LAT中的瞬变伽马射线现象,通过生成一个十年合成宇宙并利用ConvLSTM网络来建模天空的典型演变,以检测异常。
Comments 17 pages, 5 figures. Accepted for publication in Astronomy and Computing. Author-accepted manuscript version
利用物理信息高斯过程进行气动力重建
发表机构 * Bauhaus-Universität Weimar(魏玛应用科学大学) ; University of Cambridge(剑桥大学)
AI总结 本文提出一种基于物理信息的机器学习方法,用于从结构动态响应的噪声测量中重建底层气动载荷,通过避免过拟合和无需正则化方案,提高了模型的准确性和适用性。
TextTeacher: 语言能教会我们关于图像什么?
发表机构 * RPTU University Kaiserslautern-Landau(赖兴海大学凯撒斯劳滕-兰道分校) ; German Research Center for Artificial Intelligence (DFKI)(德国人工智能研究中心(DFKI))
AI总结 该研究提出TextTeacher方法,通过将语言模型的语义知识注入到图像分类训练中,提升视觉模型的性能,同时保持推理时的模型简洁性。
Comments Published at TMLR
Q-PhotoNAS:基于光子设备的混合量子神经架构搜索框架
发表机构 * Quandela Ascella photonic QPU(Quandela Ascella 光子量子处理器)
AI总结 本文提出了一种结合遗传算法和可学习量子相位编码的混合光子量子-经典模型神经架构搜索框架,通过系统探索经典和量子组件的联合设计空间,提高了图像分类任务的准确率和硬件兼容性。
行为一致的深度强化学习
发表机构 * University of Pennsylvania(宾夕法尼亚大学) ; Princeton University(普林斯顿大学) ; University of Texas at Austin(德克萨斯大学奥斯汀分校)
AI总结 本文提出了一种行为一致的深度强化学习方法,通过控制策略的分布相似性来减少跨训练运行的策略分歧,从而提高稳定性和性能。
CoarseSoundNet:构建一个可靠的生态声音景观分析模型
发表机构 * organization= TUM University Hospital, CHI -- Chair of Health Informatics , addressline= Ismaninger Str. 22 , city= Munich , postcode= 81675 , state= Bavaria , country= Germany ; organization= University of Freiburg, Faculty of Biology, Geobotany , addressline= Schaenzlestr. 1 , city= Freiburg , postcode= 79104 , state= Baden-Württemberg , country= Germany ; organization= MCML -- Munich Center for Machine Learning , city= Munich , state= Bavaria , country= Germany ; organization= Imperial College London, GLAM -- Group on Language, Audio, \& Music , city= London , country= UK
AI总结 本文提出CoarseSoundNet模型,用于在真实噪声环境下对生物声音、地质声音和人类声音进行分类,并通过系统研究模型架构、训练数据和评估策略,提高了模型在被动声学监测中的泛化能力。
Comments Currently under review
明智且私密地选择:为公平和高效的联邦学习进行主动客户端选择
发表机构 * GitHub
AI总结 本文提出了一种主动客户端选择框架,旨在在训练前找到满足效用和公平性要求的最佳客户端联邦,以提高联邦学习的效率和公平性。
用于稳定随机选择的平滑部分彩票
发表机构 * New Zealand Health Research Council(新西兰健康研究理事会) ; Swiss National Science Foundation(瑞士国家科学基金会) ; European Research Council(欧洲研究理事会) ; Science Foundation Ireland(爱尔兰科学基金会) ; Volkswagen Foundation(大众基金会) ; The British Academy(英国学院) ; Austrian Science Fund (FWF)(奥地利科学基金) ; Formas(Formas基金会) ; Luebber et al.(Luebber等人)
AI总结 本文提出平滑性作为部分彩票设计原则,通过定义评分到选择概率的Lipschitz条件,提出Clipped Linear Lottery机制,证明其在平滑性与遗憾之间取得更好的平衡,并通过实验验证其在实际应用中的有效性。
通过局部可塑性和树突计算进行源分离的规范网络
发表机构 * Gatsby Computational Neuroscience Unit, University College London, UK(Gatsby计算神经科学单元,伦敦大学学院,英国) ; Department of Computer Science, University of Oxford, UK(计算机科学系,牛津大学,英国) ; Brain Network Dynamics Unit, University of Oxford, UK(脑网络动力学单元,牛津大学,英国) ; MRC Centre of Research Excellence in Restorative Neural Dynamics, UK(英国医学研究委员会修复神经动力学研究卓越中心)
AI总结 本文提出了一种基于局部可塑性和树突计算的预测熵最大化方法,用于源分离,该方法在结构化源域上最大化正则化的二阶熵,实现了在增加的源相关性和观测噪声下的鲁棒性,并在生物合理算法和精确基线中表现优异。
stationary 物理系统的信息处理能力:理论、数据高效估计方法和光子演示
发表机构 * Laboratoire d’Information Quantique CP224, Université libre de Bruxelles(量子信息实验室CP224,布鲁塞尔自由大学)
AI总结 本文研究了 stationary 物理系统的信息处理能力,提出了一种理论框架,并开发了数据高效估计方法,通过光子计算系统实验验证了其有效性。
Comments added 2 new references
Symphony for Speech-to-Text: 支持实时医疗语音接口
发表机构 * Corti
AI总结 本文提出Symphony for Speech-to-Text,一种医疗级实时语音识别系统,通过分解转录过程为识别、格式化和上下文校正等专业化组件,优化医学术语召回,实现实时临床结构文本生成,并在医疗场景中显著优于现有系统,同时在通用领域表现不逊。
Comments Updated with a correction and improvement to Symphony's performance in spoken punctuation evaluation (R_punct, P_punct)
TextSeal: 一种用于溯源与蒸馏保护的本地化大语言模型水印
发表机构 * FAIR, Meta Superintelligence Labs(FAIR,Meta超智能实验室)
AI总结 本文提出TextSeal,一种先进的大语言模型水印技术,通过Gumbel-max采样引入双密钥生成以恢复输出多样性,并结合熵加权评分和多区域定位提升检测性能。该方法支持推测解码和多令牌预测等服务优化,不增加推理开销。在检测强度上严格优于基线方法SynthID-text,并对稀释具有鲁棒性,即使在混合的人类/AI文档中也能保持自信的本地化检测。理论上该方案无失真,经推理基准评估证实其保持下游性能;同时通过多语言人工评估(6000次A/B对比,5种语言)显示无明显质量差异。除了用于溯源检测外,TextSeal还具有'放射性'特性:其水印信号通过模型蒸馏传递,可检测未经授权的使用。
Hölder Policy Optimisation
发表机构 * University College London(伦敦大学学院) ; Shanghai Jiao Tong University(上海交通大学) ; The Hong Kong University of Science and Technology (Guangzhou)(香港科学与技术大学(广州))
AI总结 本文提出HölderPO框架,通过Hölder均值统一token级概率聚合,解决固定聚合机制导致的训练崩溃与性能不足问题,理论证明不同p值对梯度集中度和方差的平衡作用,并通过动态退火算法实现训练周期内的p值调度,实验表明其在多个数学基准测试中取得更优的稳定性和收敛性。
支持接近增强的扩散估计用于离线黑盒优化
发表机构 * MBZUAI - Mohamed bin Zayed University of Artificial Intelligence(MBZUAI - 摩擦 bin Zayed 大学) ; McGill University(麦吉尔大学) ; Mila - Quebec AI Institute(Mila - 加拿大AI研究所) ; Amazon AGI(亚马逊人工智能实验室)
AI总结 本文提出SPADE框架,通过条件生成建模重新想象前向替代建模,利用扩散模型建模前向似然p(y|x),并引入校准扩散估计模块和支撑接近正则化机制,以提高优化性能。
Comments Accepted by ICML 2026. First two authors contributed equally
PMCTS:用于原理化并行推断时间扩展的粒子蒙特卡洛树搜索
发表机构 * Department of Intelligent Systems, TU Delft(代尔夫特理工大学智能系统系) ; Department of Computer Science, ETH Zürich(苏黎世联邦理工学院计算机科学系) ; Trent AI Limited(Trent AI有限公司) ; Information Systems, TU Eindhoven(埃因霍温理工大学信息系统系) ; Centrum Wiskunde & Informatica, Amsterdam(阿姆斯特丹数学与信息学研究中心)
AI总结 本文提出PMCTS,一种适用于神经网络评估的原理化并行MCTS算法,通过并行计算实现推断时间扩展,并在多个领域中显著优于传统启发式基线方法。
通过双目标决策树学习实现最优补救摘要
发表机构 * Artificial Intelligence and Learning Systems Laboratory(人工智能与学习系统实验室) ; National Technical University of Athens(希腊国家技术大学)
AI总结 本文提出SOGAR方法,通过将补救摘要学习转化为最优决策树学习问题,找到帕累托前沿,实现补救效果与成本之间的平衡,产生稳定、低成本且有效的补救摘要。
评估教育LLM导师的提示注入防御:安全-可用性-延迟的权衡
发表机构 * Lumytics
AI总结 本文提出了一种评估提示注入防御方法的框架,探讨了在教育LLM导师中安全、可用性和延迟之间的权衡,并通过实验比较了不同防御机制的性能。
Comments 19 pages, 4 figures, 9 tables
UniSD:面向大语言模型的统一自蒸馏框架
发表机构 * Georgia Institute of Technology(佐治亚理工学院) ; University of California, Los Angeles(加州大学洛杉矶分校) ; Carnegie Mellon University(卡内基梅隆大学) ; William & Mary(威廉与玛丽大学)
AI总结 本文提出UniSD框架,系统研究自蒸馏方法,通过整合多种机制提升监督可靠性、表征对齐和训练稳定性,从而在多个基准和模型上验证自蒸馏的有效性,并构建出性能最优的UniSDfull流水线。
Comments Website: https://unifiedsd.github.io/ Code: https://github.com/Ahren09/UniSD
关于漂移模型的Wasserstein梯度流解释
发表机构 * Google DeepMind(谷歌深Mind)
AI总结 本文通过Wasserstein梯度流分析了漂移模型,揭示了GMD框架与WGF路径之间的关系,展示了三种主要结果:漂移模型中的算法对应于KL散度的WGF极限点,实际实现的算法对应于Sinkhorn散度的固定点但缺乏某些特性,同时该方法可以扩展到其他WGF的极限点,如MMD、切线Wasserstein距离和GAN批评者函数。
Jordan-RoPE: 通过复Jordan块实现非半单相对位置编码
发表机构 * School of Physics, Ningxia University(宁夏大学物理学院)
AI总结 本文提出了一种非半单相对位置编码Jordan-RoPE,通过复旋转特征和Nilpotent响应在同一缺陷Jordan块中实现距离调制的相位基,从而生成振荡-多项式特征,如e^{-γd}cos(ωd)、e^{-γd}sin(ωd)等,并在语言模型中验证了其有效性。
Comments 15 pages, 4 figures, 6 tables; code available at https://github.com/ybzhang-nxu/jordan_rope
EdgeRazor: 一种通过混合精度量化感知蒸馏实现大语言模型轻量化的框架
发表机构 * National Key Laboratory for Novel Software Technology, Nanjing University(南京大学新型软件技术国家重点实验室) ; School of Intelligent Science and Technology, Nanjing University(南京大学智能科学与技术学院) ; School of Artificial Intelligence, Nanjing University(南京大学人工智能学院) ; Microsoft AI(微软AI)
AI总结 本文提出EdgeRazor框架,通过混合精度量化感知蒸馏方法,在资源受限设备上部署大语言模型,实现了更高的压缩比和更高效的性能。
在碳捕集与封存应用中诱导排列不变的先验分布
发表机构 * School of Mining and Metallurgical Engineering, National Technical University of Athens(采矿与冶金工程学院,国家技术大学雅典)
AI总结 本文提出了一种新的高斯过程核(GP-Perm),用于在碳捕集与封存项目中处理排列对称性问题,同时结合深度核学习模型(DKL-DS)以学习排列不变的嵌入,通过八个用例评估了所提出的方法。
MU-SHOT-Fi: 基于源无关无监督域适应的多用户Wi-Fi感知
发表机构 * department of Electrical Engineering and Computer Science(电气工程与计算机科学系)
AI总结 本文提出MU-SHOT-Fi框架,通过源无关无监督域适应方法,在单用户和多用户Wi-Fi感知中实现准确的活动分类和占用估计,同时防止模型崩溃。
RTPrune: 两次阅读启发的令牌修剪用于高效DeepSeek-OCR推理
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; University of Science and Technology of China(中国科学技术大学) ; Tsinghua University(清华大学)
AI总结 本文提出RTPrune,一种针对DeepSeek-OCR的两次阶段令牌修剪方法,通过优先保留高范数视觉令牌并利用最优传输理论进行令牌配对和合并,从而在OCR任务中实现更高效的推理性能和更优的效率-精度权衡。
Comments 21 pages, accepted by ICML2026
具有不确定性的预测安全过滤器用于概率神经网络动态
发表机构 * Institute for Data Science in Mechanical Engineering (DSME), RWTH Aachen University(机械工程数据科学研究所(DSME),亚琛工业大学) ; Institute of Climate and Energy Systems (ICE), Energy Systems Engineering (ICE-1), Forschungszentrum Jülich GmbH(气候与能源系统研究所(ICE),能源系统工程(ICE-1),焦耳研究中心有限公司)
AI总结 本文提出了一种具有不确定性的预测安全过滤器(UPSi),通过将未来结果建模为可达集,利用概率集合(PE)神经网络动态模型提供严格的安全预测,从而在模型基于强化学习(MBRL)中提升探索安全性,同时保持与标准MBRL相当的性能。
基于原型的可验证概念模型用于可验证的概念对齐
发表机构 * Department of Computer Science, KU Leuven(卢森堡大学计算机科学系) ; IBM Research, Zurich(苏黎世IBM研究院)
AI总结 本研究提出了一种基于原型的概念模型(PGCMs),通过将概念与学习到的视觉原型关联起来,从而提高概念对齐的可验证性和可解释性,同时保持预测性能。
GeoPAS: 在连续黑盒优化中用于算法选择的几何探测
发表机构 * Duke Kunshan University(杜克昆山大学) ; Mohamed bin Zayed University of Artificial Intelligence(穆罕默德·本·扎耶德人工智能大学)
AI总结 本文提出了一种几何探测框架,通过随机采样多尺度二维切片来表示问题实例,并结合有效性掩码感知的视觉池化进行聚合,从而在连续黑盒优化中实现算法选择。
Comments 20 pages, 9 figures, 6 tables; extended version of a GECCO 2026 poster-track paper; code available at https://github.com/BradWangW/GeoPAS
迈向真实世界的人类行为模拟:在长时间跨度、跨场景、异质行为轨迹上对大语言模型进行基准测试
发表机构 * Chinese Information Processing Laboratory, Institute of Software, Chinese Academy of Sciences(中国科学院软件研究所信息处理实验室) ; University of Chinese Academy of Sciences(中国科学院大学) ; Kuaishou Technology(快手科技)
AI总结 本文提出OmniBehavior基准测试,通过真实世界数据整合长周期、跨场景和异质行为模式,揭示现有模型在模拟复杂人类行为时的局限性,包括对正向平均人的趋同、人格同质化和乌托邦偏见,为未来高保真模拟研究指明方向。
Comments Project page: https://OmniBehavior.github.io
重新思考高维数据同化中的分数基非线性数据同化前向过程
发表机构 * KAIST(韩国科学技术院)
AI总结 本文提出了一种针对数据同化问题的改进前向过程,用于高维非线性系统的状态估计,通过改进的分数基滤波器在测量空间中转换系统状态,提高了同化性能。
在空间预测中对齐验证与部署:目标加权交叉验证
发表机构 * Friedrich Schiller University Jena(耶拿弗里德里希-施勒辛格大学) ; ELLIS Unit Jena(耶拿ELLIS单位)
AI总结 本文提出了一种基于加权交叉验证的部署导向验证框架,通过引入目标加权交叉验证(TWCV)来对齐验证任务与指定领域内预测任务的分布,以减少因采样偏差导致的预测误差。
基于Minkowski加权k均值的聚类自适应特征提取及其理论基础
发表机构 * School of Computer Science and Electronic Engineering, University of Essex, Wivenhoe, UK(埃塞克斯大学计算机科学与电子工程学院,英国威文豪斯) ; Département d’informatique, Université du Québec à Montréal, C.P. 8888 succ. Centre-Ville, Montreal (QC) H3C 3P8 Canada(魁北克大学蒙特利尔分校计算机科学系,加拿大蒙特利尔(QC)H3C 3P8) ; Mila - Quebec AI Institute, Montreal, QC, Canada(魁北克人工智能研究所,加拿大蒙特利尔(QC))
AI总结 本文提出了一种基于Minkowski加权k均值的聚类自适应特征提取方法,通过理论分析揭示了特征权重的结构,并证明了该方法在抑制高分散特征和增强信息性特征方面的有效性。
使用 Opus 4.6 和 Rocq-MCP 的 2025 年 Putnam 问题
发表机构 * IRIF, Université Paris Cité, Inria, CNRS(IRIF,巴黎Cité大学,法国国家信息与自动化研究所,法国国家科学研究中心) ; DI ENS, PSL University, Inria(ENS巴黎大学DI,巴黎科学实验室大学,法国国家信息与自动化研究所)
AI总结 研究探讨了使用 Opus 4.6 配合 Rocq-MCP 工具自主证明 2025 年 Putnam 数学竞赛中 12 个问题中的 10 个,展示了基于模型上下文协议 (MCP) 的自动证明方法及公开可用的证明过程。
Volterra签名
发表机构 * Department of Statistics and Operations Research, University of Vienna(统计与运筹学系,维也纳大学) ; Department of Economics, BI Norwegian Business School(经济学系,BI挪威商学院) ; Department of Mathematics, Purdue University(数学系,普渡大学)
AI总结 本文提出Volterra签名作为处理历史依赖系统的显式特征表示,通过将输入路径与时间核结合到张量代数中,利用Volterra-Chen恒等式推导出严谨的学习理论保证,并展示其在动态学习任务中的有效性。
将信任转化为交易:追踪YouTube的影响力经济中的affiliate营销与FTC合规性
发表机构 * University of Iowa(爱荷华大学) ; UC Davis(加州大学戴维斯分校)
AI总结 本研究通过Web测量和NLP技术开发工具,分析YouTube上affiliate营销生态系统的现状,揭示affiliate链接的普及程度及非合规行为的比例,并提出通过标准化披露功能提高合规性的建议。
Comments ICWSM 2026
[Re] FairDICE:多目标离线RL中的公平权衡
发表机构 * University of Amsterdam(阿姆斯特丹大学)
AI总结 该研究探讨了多目标离线强化学习中公平权衡的问题,提出FairDICE算法通过自适应学习多目标权重来实现公平妥协,但发现代码错误导致其在连续环境中退化为标准行为克隆,并需修正超参数以提升实验有效性。
Comments 12 pages, 8 figures in main text. Code at https://github.com/p-adema/re-fairdice. Reviewed at https://openreview.net/forum?id=Tr6MBt0hAj
超越一刀切:基于大语言模型的零样本图学习中的自适应子图去噪
发表机构 * JIUTIAN Research(JIUTIAN研究) ; The Hong Kong University of Science and Technology (Guangzhou)(香港科技大学(广州)) ; MIIT Key Laboratory of Data and Decision Intelligence(信息与决策智能重点实验室) ; Beihang University(北航)
AI总结 本文提出GraphSSR框架,通过自适应子图提取和去噪方法,解决传统图神经网络在零样本学习中泛化能力不足的问题,提升大语言模型在图推理任务中的表现。
通过激活子空间瓶颈解释和操控状态空间模型
发表机构 * Microsoft Research, Redmond(微软研究院(红mond)) ; Independent Researcher(独立研究员)
AI总结 本文通过识别Mamba家族状态空间模型中的激活子空间瓶颈,提出了一种在测试时通过乘以标量来操控激活的干预方法,从而在多个模型和基准测试中提升了性能,并验证了这些瓶颈对性能的阻碍作用。
先验知识增强的时空疫情预测
发表机构 * Beijing Institute of Technology(北京理工大学) ; Zhejiang Provincial Center for Disease Control and Prevention(浙江省疾病预防控制中心) ; JD Technology(京东科技) ; The University of Hong Kong(香港大学) ; China Mobile Internet(中国移动互联网)
AI总结 本文提出了一种结合隐式时空先验和显式专家先验的新型混合框架STOEP,通过动态调整区域依赖关系、放大弱信号和机制性预测来提升时空疫情预测的准确性。
Comments 12 pages, 10 figures, accepted to IJCAI 2026
图诱导扩散:用于谱GNNs的可学习加权拉普拉斯算子
发表机构 * École Polytechnique Fédérale de Lausanne (EPFL)(瑞士联邦理工学院(EPFL)) ; École Normale Supérieure – PSL(巴黎高等师范学院–PSL)
AI总结 本文提出了一种简单的谱GNN架构mu-ChebNet,通过学习节点级权重函数mu来修改图拉普拉斯算子,从而改变传播几何而不改变图拓扑,从而促进信息传播的优选路径,帮助长距离信号避免高收缩瓶颈,无需重复层堆叠。
MoralityGym:用于评估序列决策代理中分层道德对齐的基准
发表机构 * University of the Witwatersrand(威特沃特斯兰大学)
AI总结 本文提出MoralityGym基准,通过将道德规范表示为有序的规范约束,评估序列决策代理中分层道德对齐的挑战,展示了98个伦理困境问题,并通过心理学和哲学的见解改进了伦理决策方法。
Comments Accepted at AAMAS 2026
在不同架构间传输任务向量而无需训练
发表机构 * AImageLab, University of Modena and Reggio Emilia(AImageLab,Modena和雷吉奥艾米利亚大学)
AI总结 本文提出Theseus方法,通过功能匹配在不同宽度模型间传输任务更新,无需训练或反向传播,展示了在视觉和语言模型上的改进效果。
Comments Accepted at the International Conference on Machine Learning (ICML), 2026
关于RL微调VLMs的鲁棒性和链式思维一致性
发表机构 * Apple(苹果公司) ; OpenAI
AI总结 本文研究了RL微调VLMs在视觉推理任务中的鲁棒性和链式思维一致性,发现文本扰动和CoT不一致会显著降低模型的鲁棒性和信心,而闭源模型在保持鲁棒性和推理一致性方面表现更佳,指出这一差距源于当前开源RL微调的不足而非任务本身的限制。
Comments ICML 2026
重新审视正则化策略优化以实现稳定且高效的双人博弈强化学习
发表机构 * The University of Tokyo, Japan(东京大学) ; RIKEN Center for Advanced Intelligence Project, Japan(日本RIKEN高级智能项目中心)
AI总结 本文重新审视了带有反向Kullback-Leibler正则化和熵正则化的策略优化方法,在双人零和设置中从理论和经验角度分析其组合,提供了新的收敛保证并通过合成游戏的数值实验验证了理论结果,并基于正则化策略优化推导出一种实用的模型无关强化学习算法,通过在五个棋盘游戏中进行的全面实验验证了算法的训练效率。
Comments Accepted at ICML 2026
CoFEH: 由协作贝叶斯超参数优化赋能的LLM驱动特征工程
发表机构 * School of CS \& Key Lab of High Confidence Software Technologies (MOE), Peking University Beijing China ; School of CS \& Beijing Key Laboratory of Software ; Hardware Cooperative Artificial Intelligence Systems, Peking University Beijing China ; School of CS \& Key Lab of High Confidence Software Technologies (MOE), Peking University ; Hardware Cooperative Artificial Intelligence Systems, Peking University
AI总结 本文提出CoFEH框架,通过结合LLM驱动的特征工程和贝叶斯超参数优化,实现鲁棒的端到端AutoML,解决了传统方法在搜索空间刚性和缺乏领域意识的问题,并引入互条件机制提升FE与HPO的协同效果。
Comments Accepted at KDD 2026. Extended version with full appendices
SiameseNorm: 突破预规范与后规范之间的障碍
发表机构 * Leap Lab, Tsinghua University(清华大学 Leap 实验室) ; Qwen Large Model Application Team, Alibaba(阿里巴巴 Qwen 大模型应用团队) ; Institute for Interdisciplinary Information Sciences, Tsinghua University(清华大学交叉信息学研究院)
AI总结 本文提出SiameseNorm,一种双流架构,通过共享残差块将预规范和后规范结合,从而在保持训练稳定性的同时提升模型性能,适用于多种架构和模态。
Comments Accepted to ICML 2026; camera-ready version; revised presentation and added additional experimental results
通过选择性几何控制重新审视LLM安全对齐的鲁棒性
发表机构 * National University of Singapore(新加坡国立大学) ; Hefei University of Technology(合肥工业大学) ; ST Engineering Ltd., Singapore(新加坡ST工程有限公司)
AI总结 本文通过优化几何视角重新审视LLM安全对齐的鲁棒性,提出ShaPO框架,通过选择性几何控制在对齐关键参数子空间上强制最坏对齐目标,提升安全鲁棒性。
大规模基于分数的变分后验推断用于贝叶斯深度神经网络
发表机构 * Samsung AI Center(三星人工智能中心)
AI总结 本文提出了一种适用于大规模贝叶斯深度神经网络的变分后验推断方法,结合了分数匹配损失和近端惩罚项,避免了重新参数化采样,实现了大规模神经网络的高效训练。
当共享知识有害:模型融合中的谱过积累
发表机构 * National Key Laboratory for Novel Software Technology, Nanjing University, Nanjing 210023, China.(新型软件技术国家重点实验室,南京大学,南京210023,中国。) ; Institute of Brain-Computer Interface, Nanjing University, Nanjing 210023, China.(脑机接口研究院,南京大学,南京210023,中国。)
AI总结 本文研究了模型融合中共享知识过积累的问题,提出SVC方法通过校准奇异值来恢复谱平衡,提升了模型融合和任务算术的性能。
Comments Accepted by ICML 2026
SAG、SAGA和IAG算法的简短统一收敛性分析
发表机构 * Department of Electrical and Computer Engineering, North Carolina State University, Raleigh, USA(北卡罗来纳州立大学电气与计算机工程系) ; Department of Electrical and Computer Engineering, University of California, San Diego, USA(加州大学圣地亚哥分校电气与计算机工程系)
AI总结 本文提出了一种统一的收敛性分析方法,适用于SAG、SAGA和IAG算法,通过简单的集中工具建立延迟界并设计新的Lyapunov函数,从而得到高概率界,并扩展到非凸目标和马尔可夫采样。
Comments To appear at the 43rd International Conference on Machine Learning (ICML)
十亿级图基础模型
发表机构 * Meta
AI总结 本文提出GraphBFF,一种用于构建大规模异构图的十亿参数图基础模型的端到端方法,通过引入GraphBFF Transformer架构,揭示了异构图的神经缩放定律,并在多个下游任务中展示了其优越的性能。
利用亚6GHz通道进行毫米波波束预测的知识蒸馏
发表机构 * Centre for Wireless Communications, University of Oulu, P.O.Box 4500, FI-90014, Finland(奥卢大学无线通信中心,芬兰) ; School of Electrical, Computer, and Energy Engineering, Arizona State University, AZ, USA(亚利桑那州立大学电气、计算机与能源工程学院)
AI总结 本文提出了一种基于知识蒸馏技术的高效框架,利用亚6GHz通道预测毫米波波束,通过紧凑的学生深度学习架构在减少计算和内存需求的同时保持性能。
Comments 5 pages, 4 figures. Accepted for publication at IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) 2026
统一多种生成顺序及超越的掩码扩散模型
发表机构 * Graduate School of AI, KAIST, South Korea(韩国延世大学人工智能研究生院)
AI总结 本文提出Order-Expressive Masked Diffusion Model (OeMDM)和Learnable-Order Masked Diffusion Model (LoMDM),统一了不同生成顺序的扩散生成过程,并通过单目标学习生成顺序和扩散骨干,提升了文本生成性能。
Comments Accepted at ICML 2026
可证明地保护微调的LLM免受训练数据提取攻击同时保持效用
发表机构 * Department of Software and Information Systems Engineering, Ben-Gurion University of the Negev, Beer Sheva, Israel(软件与信息系统工程系,内盖夫本·古里安大学,贝尔谢巴,以色列)
AI总结 本文提出了一种基于近访问自由(NAF)的算法SCP-Δ_r,通过相对概率和基础模型对低影响token进行平滑处理,从而在理论上有更优的界限,并在实践中有效抵御训练数据提取攻击,同时保持性能损失最小。
Comments 21 pages, 5 figures
LEMUR: 学习多向量检索
发表机构 * Department of Computer Science, University of Helsinki, Helsinki, Finland(赫尔辛基大学计算机科学系)
AI总结 LEMUR通过将多向量相似性搜索转化为监督学习问题,并利用现有单向量搜索索引加速检索,实现了高效的多向量相似性搜索,比现有方法快一个数量级。
Comments Accepted to ICML 2026
通过专家混合层进行超参数迁移
发表机构 * Operations Research ; Financial Engineering, Princeton University, Princeton, NJ, USA ; Center of Mathematical Sciences ; Applications, Harvard University, Cambridge, MA, USA ; John A. Paulson School of Engineering ; Applied Sciences, Center for Brain Science, Kempner Institute for the Study of Natural ; Artificial Intelligence, Harvard University, Cambridge, MA, USA
AI总结 本文提出了一种新的参数化方法,用于在扩展模型宽度、深度、专家数量和专家(隐藏)大小时,通过专家混合层的变压器模型进行超参数迁移,该方法基于动态平均场理论分析,实验证明其在不同规模模型间可靠地迁移超参数。
Comments ICML 2026
在大语言模型RLVR训练中的线性动力学
发表机构 * Department of Data Science, City University of Hong Kong(香港城市大学数据科学系) ; Hong Kong Institute of AI for Science, City University of Hong Kong(香港城市大学人工智能科学研究院) ; Li Auto Inc. ; Beihang University(北航大学)
AI总结 本文研究了强化学习可验证奖励(RLVR)在大语言模型训练中的内部动态,发现RLVR在多种模型和训练配置下均进入线性区域,通过实验和理论分析证明这种线性特性源于训练信号的高方差和噪声,且具有预测性和实用性。
Comments Major revision: substantially reorganized the manuscript and added a theoretical explanation section. The replacement is intended for the same arXiv paper; the core topic and contribution remain the same
AutoBaxBuilder: 通过代码安全基准测试进行代码安全性评估
发表机构 * ETH Zurich(苏黎世联邦理工学院) ; INSAIT, Sofia University "St. Kliment Ohridski"(INSAIT,索菲亚大学"圣克莱门特·奥赫里德斯基")
AI总结 本文提出AutoBaxBuilder,一种自动化生成代码安全基准测试任务的流水线,通过结合LLM的代码理解能力与可靠性检查,构建功能测试和端到端的安全性探测利用,从而提高代码安全性的评估效率和准确性。
Comments ICML 2026
两次序贯蒙特卡洛用于树搜索
发表机构 * Delft University of Technology(代尔夫特理工大学)
AI总结 本文提出Twice Sequential Monte Carlo Tree Search(TSMCTS)方法,通过减少方差和缓解路径退化问题,提高了在离散和连续环境中比SMC基线和现代MCTS版本更优的性能,同时在顺序计算上具有良好的扩展性。
解开转换匹配之谜:何时以及为何它能超越流匹配
发表机构 * KAIST(韩国科学技术院) ; Amazon Web Services(亚马逊网络服务)
AI总结 本文研究了转换匹配(TM)在何时以及为何能超越流匹配(FM),通过证明在单峰高斯分布下TM具有更低的KL散度,并分析了在高斯混合分布中TM在局部单峰区域的优势,以及在目标方差非可忽略时TM的优越性。
Comments Code: https://github.com/amazon-science/TransitionFlowMatching (AISTATS 2026)
原子锚定的大语言模型:化学 retrosynthesis 的演示
发表机构 * Machine Learning Research(机器学习研究) ; Pfizer Research and Development(辉瑞研发) ; Leiden Institute of Advanced Computer Science(莱顿高级计算机科学研究所) ; Leiden University(莱顿大学) ; Leiden Academic Centre for Drug Research(莱顿药物研究中心) ; Leiden Institute of Chemistry(莱顿化学研究所)
AI总结 本研究提出了一种利用通用大语言模型进行分子推理的框架,通过原子标识符将链式推理与分子结构锚定,无需任务特定的模型训练,在单步 retrosynthesis 任务中实现了高成功率。
Comments Alan Kai Hassen and Andrius Bernatavicius contributed equally to this work
事件感知的动态图提示学习
发表机构 * The Chinese University of Hong Kong(香港中文大学) ; University of Science and Technology of China(中国科学技术大学) ; The University of Tokyo(东京大学) ; Shanxi University(山西大学) ; Singapore Management University(新加坡国立大学)
AI总结 本文提出EVP框架,通过提取历史事件并引入事件适应机制,增强动态图学习模型对历史事件知识的利用能力。
Comments Under review
CacheClip: 通过有效的KV缓存重用加速RAG
发表机构 * Intel Corporation(英特尔公司)
AI总结 本文提出CacheClip框架,通过有效利用KV缓存重用,解决了RAG系统中TTFT瓶颈问题,同时保持高质量生成。
去中心化SGD的高概率收敛保证
发表机构 * STI, EPFL, Lausanne, Switzerland(瑞士洛桑联邦理工学院(EPFL)信息与通信系统研究所(STI))
AI总结 本文研究了在轻尾噪声下去中心化SGD的高概率收敛性,证明了在与MSE收敛相同的成本条件下,去中心化SGD能够实现高概率收敛,同时提供了非凸和强凸成本的最优速率,以及用户数量的线性加速效果。
Comments 43 pages, 6 figures
决策潜力面:大型语言模型决策边界的理论与实用近似
发表机构 * The Hong Kong Polytechnic University(香港理工大学) ; University of Macau(澳门大学) ; Shanghai Jiaotong University(上海交通大学) ; Huawei(华为) ; Rochester Institute of Technology(罗切斯特理工学院) ; PolyU Research Centre for Privacy and Security Technologies in Future Smart Systems(PolyU未来智能系统隐私与安全技术研究中心)
AI总结 本文提出决策潜力面(DPS)作为一种新的分析大型语言模型决策性质的方法,通过K-DPS算法以有限样本近似决策边界,理论推导了误差上限,展示了误差与采样次数的权衡。
Comments Source code: https://github.com/liangzid/DPS
DecepChain: 在大型语言模型中诱导欺骗性推理
发表机构 * University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校)
AI总结 研究探讨了大型语言模型是否能够生成看似合理但错误的推理链,并提出DecepChain方法通过放大模型自身的幻觉来诱导欺骗性推理,同时保持表面合理性和有效性。
Comments ICML 2026
BALLAST:基于空间-时间向量场的海漂体轨迹的贝叶斯主动学习与前瞻性修正
发表机构 * Lancaster University(兰卡斯特大学) ; University of New South Wales(新南威尔士大学) ; University of Western Australia(西澳大学)
AI总结 本文提出了一种正式的主动学习方法,用于指导拉格朗日观测器的布置,以推断时间依赖的向量场,该方法利用了物理信息的空间-时间高斯过程代理模型。现有放置活动主要遵循标准的'空间填充'设计或相对随意的专家意见。在该设置中应用原理性主动学习的主要挑战是拉格朗日观测器持续被向量场推动,因此在不同位置和时间进行测量。因此,考虑已放置观测器的可能未来轨迹以评估候选放置位置的效用至关重要。为此,我们提出了BALLAST:用于海漂体轨迹的贝叶斯主动学习与前瞻性修正。我们观察到BALLAST辅助的顺序观测器布置策略在合成和高保真海洋流模型中均表现出显著优势。此外,我们还开发了一种新的GP推理方法——Vanilla SPDE Exchange(VaSE)——以提高GP后验采样效率,这也具有独立的研究价值。
Comments ICML 2026
物理先验在时空预测中的准确性-碳足迹权衡中提供有用的折中
发表机构 * Department of Computer Science, University of Copenhagen, Denmark(丹麦哥本哈根大学计算机科学系) ; Niels Bohr Institute, University of Copenhagen, Denmark(丹麦哥本哈根大学尼尔斯·玻尔研究所)
AI总结 本文研究了在不可压缩剪切流的时空预测任务中,物理归纳偏置如何在模型效能和效率(计算、能源和碳足迹)之间提供有用的折中,发现更强的物理先验能显著降低训练足迹,但这一优势不直接延伸到推理阶段,强调了在完整模型生命周期中评估碳成本的重要性。
Comments Source code available at https://github.com/sophiawilson18/shear-flow
具有近最优速率的容错异步Q学习
发表机构 * Electrical and Computer Engineering, North Carolina State University, Raleigh, NC, USA(北卡罗来纳州立大学电气与计算机工程系)
AI总结 本文研究了在存在对抗性损坏奖励的情况下,在折扣无限时间 horizon 的强化学习设置中学习最优策略的问题。通过开发一种新的鲁棒Q学习变体,并在具有时间相关数据的挑战性异步采样模型下分析该算法,证明了在存在损坏的情况下,该方法的有限时间保证与现有界限相匹配,仅在加性项上与损坏样本的比例成比例。还建立了信息论下界,揭示了我们的保证是近最优的。值得注意的是,我们的算法对底层奖励分布不敏感,并为异步Q学习提供了首次有限时间鲁棒性保证。分析中的关键元素是针对近鞅的改进Azuma-Hoeffding不等式,这可能在研究强化学习算法时有更广泛的应用。
Comments To appear at the 43rd International Conference on Machine Learning (ICML)
通过世界模型的模拟推理实现通用代理规划
发表机构 * Institute of Foundation Models (IFM)(基础模型研究所) ; Carnegie Mellon University(卡内基梅隆大学) ; UC San Diego(南加州大学)
AI总结 本文提出通过模拟推理实现通用代理规划,利用世界模型进行未来状态预测,提升决策能力,通过SiRA架构在不同任务中取得更高任务完成率。
Comments Winner of Berkeley LLM Agents Hackathon (Fundamentals Track); code available at https://github.com/sailing-lab/sira
从自由能原理中涌现的自正交吸引子神经网络
发表机构 * Center for Translational Neuro- and Behavioral Sciences (C-TNBS), University Medicine Essen, Germany(转化神经与行为科学中心(C-TNBS),埃森大学医学中心,德国) ; Queen Square Institute of Neurology, University College London, WC1N 3AR, UK(皇后广场神经病学研究所,伦敦大学学院,英国) ; VERSES, Los Angeles, CA 90067, USA(VERSES,美国加利福尼亚州洛杉矶90067)
AI总结 本文基于自由能原理,研究了自组织动力学如何从随机动力系统的基本原理中涌现,提出了一种无需显式学习和推断规则的高效且生物合理的方法,实现了多层贝叶斯主动推断过程,通过分析和模拟证明了所提网络倾向于产生近似正交化的吸引子表示,从而提升泛化能力和隐变量与可观测效应间的互信息。
Comments 27 pages main text, 8 pages appendix, 7 figures; interactive manuscript available at: https://pni-lab.github.io/fep-attractor-network Associated GitHub repository: https://github.com/pni-lab/fep-attractor-network
马尔可夫链诱导的martingales的不确定性量化及其在时间差学习中的应用
发表机构 * The Voleon Group(Voleon集团) ; Department of Statistics and Data Science, The Wharton School, University of Pennsylvania(统计与数据科学系,沃顿商学院,宾夕法尼亚大学) ; Department of Statistics and Data Sciences, University of Texas(统计与数据科学系,德克萨斯大学)
AI总结 本文提出了一种新的高维集中不等式和Berry-Esseen界,用于分析由马尔可夫链诱导的向量martingales,并将其应用于时间差学习算法的性能分析,得到了与渐近方差相符的高概率一致性保证,并建立了Gaussian近似的时间差估计器的分布收敛速率。
神经符号AI用于微分方程的解析解
发表机构 * Seminar for Applied Mathematics, ETH Zurich, Switzerland(应用数学研讨会,苏黎世联邦理工学院,瑞士) ; ETH AI Center, Zurich, Switzerland(苏黎世联邦理工学院人工智能中心,瑞士) ; IBM Research Europe, Zurich, Switzerland(IBM欧洲研究院,苏黎世,瑞士) ; Institute for Atmospheric and Climate Science, ETH Zurich, Switzerland(大气与气候科学研究所,苏黎世联邦理工学院,瑞士) ; Swiss Data Science Center, ETH Zurich, Switzerland(瑞士数据科学中心,苏黎世联邦理工学院,瑞士)
AI总结 本文提出SIGS神经符号框架,通过上下文无关文法生成数学上有效且物理上有意义的构建块,并结合用户指定的Ansatz进行组合,嵌入到拓扑正则化的连续潜在流形中,通过两阶段搜索发现解析解,提高了微分方程解析解的准确性和效率。
Comments Updates the method and added extra results
利用多时相哨兵1和2卫星数据进行叶面积指数估计的深度学习方法
发表机构 * Austrian Institute of Technology - Vienna, Austria(奥地利技术研究所-维也纳,奥地利)
AI总结 本文提出了一种基于多时相哨兵1雷达数据和哨兵2多谱段数据的深度学习方法,用于像素级叶面积指数预测,通过多U-Net网络结构和共同潜在空间实现不同输入模态的互补信息融合,最终在公开数据上取得了0.06 RMSE和0.93 R2分数。
Music102: 一个 $D_{12}$-等价变换器用于和弦进行伴奏
发表机构 * Massachusetts Institute of Technology(麻省理工学院)
AI总结 本文提出Music102,一种基于群论和音乐结构的等价变换器,用于提升和弦进行伴奏的质量,通过整合音乐对称性如转位和反射操作,改进了非等价变换器Music101的性能。
Comments 10 pages, 3 figures
用置信度衡量异质处理效应中的变量重要性
发表机构 * Roche Pharma Research \& Early Development, Roche Innovation Center Basel, F. Hoffmann-La Roche Ltd, Basel, Switzerland ; Université Paris-Saclay, Inria, CEA, Palaiseau, France
AI总结 本文提出PermuCATE算法,用于在估计条件平均处理效应时进行统计严谨的全局变量重要性评估,通过理论分析和实证研究证明其比LOCO方法具有更低的方差,从而提高统计功效,适用于生物医学应用中的有限数据环境。
攻击尖峰:关于脉冲神经网络对抗示例的转移性和安全性
发表机构 * Lehigh University(莱文大学) ; University of Minnesota Twin Cities(明尼苏达大学双城分校) ; North Carolina State University(北卡罗来纳州立大学) ; University of Rhode Island(罗德岛大学) ; Northeastern University(东北大学)
AI总结 本文研究了脉冲神经网络(SNN)在对抗示例中的鲁棒性,揭示了对抗攻击的转移性,并提出了混合动态脉冲估计(MDSE)攻击方法,以提高SNN和非SNN模型的对抗示例生成效果。
Comments Accepted manuscript. Published in *Neurocomputing*, Volume 656, 2025, Article 131506. Available online 12 September 2025. DOI: 10.1016/j.neucom.2025.131506
RobustSpeechFlow: 通过基于增强的对比流匹配学习鲁棒的文本到语音轨迹
发表机构 * Supertone Inc(Supertone公司) ; Independent Researcher(独立研究者)
AI总结 本文提出RobustSpeechFlow,一种通过引入长度保持重复和跳过潜在增强来改进对齐鲁棒性的训练策略,从而在无需外部对齐器或偏好数据的情况下,直接惩罚现实中的失败模式,并能无缝集成到现有流程中,实验表明其在文本到语音任务中显著提升了语音质量与鲁棒性。
Comments Submitted to INTERSPEECH 2026
呼吸生物标志物能否因果影响血糖?探讨VOC介导的糖尿病调节
发表机构 * TCS Research(TCS研究) ; Department of E&ECE, IIT Kharagpur(印度理工学院Kharagpur电子与电气工程系)
AI总结 本研究通过非侵入式数据驱动框架,利用挥发性有机化合物(VOCs)和生活方式变量识别糖尿病高风险个体,采用因果推断技术估计VOCs如乙酮、异丙醇、异戊二烯和乙醇对血糖水平的影响,并设计分类器区分糖尿病患者与非糖尿病患者,建立基于风险的排名系统和高斯混合模型识别自然聚类。
从推理链到可验证子问题:课程强化学习使LLM推理能够进行信用分配
发表机构 * LeapLab, Tsinghua University(清华大学 LeapLab) ; Qiuzhen College, Tsinghua University(清华大学 旗正学院)
AI总结 该研究提出SCRL框架,通过从参考推理链中生成可验证子问题,解决LLM推理中信用分配问题,提升了在数学推理任务中的性能。
基于原型的分类子任务解耦框架:提升多变量时间序列的泛化能力与可解释性
发表机构 * East China Normal University(华东师范大学) ; Shanghai Jiao Tong University(上海交通大学)
AI总结 本文提出PDFTime框架,通过多阶段决策过程解耦时间序列分类任务,提升模型的泛化能力和可解释性,实现了在UEA和UCR基准测试中的最优性能。
LABO: 通过广泛探索和选择性实验实现的LLM加速贝叶斯优化
发表机构 * Shanghai Artificial Intelligence Laboratory(上海人工智能实验室) ; School of Mechanical Engineering, Shanghai Jiao Tong University(上海交通大学机械工程学院) ; Institute for Advanced Study in Mathematics, Harbin Institute of Technology(哈尔滨工业大学数学研究所) ; School of Computer Science, Shanghai Jiao Tong University(上海交通大学计算机科学学院) ; School of Automation, Central South University(中南大学自动化学院) ; College of New Energy and Materials, China University of Petroleum, Beijing(中国石油大学(北京)新能源与材料学院) ; College of Carbon Neutrality Future Technology, China University of Petroleum, Beijing(中国石油大学(北京)碳中和未来技术学院) ; DeepVerse PTE. LTD.
AI总结 本文提出LABO框架,通过结合LLM预测与实验观测,在贝叶斯优化中实现更高效的样本优化,理论分析和实验结果表明其在科学任务中优于现有方法。
Comments Accepted to ICML 2026
CASE-NET:通过因果注意力和通道重校准进行多变量时间序列分类的深度时空表示学习
发表机构 * Shandong Technology and Business University(山东技术与商业大学) ; Ludong University(鲁东大学)
AI总结 本文提出CASE-NET,通过因果注意力和通道重校准模块,解决多变量时间序列分类中时空表示不准确的问题,实现在四个任务上达到新的最先进基准,最高准确率达98.6%。
Comments 9 pages, 6 figures, 2 tables
RADAR: 通过动态防御对抗RAG的检索腐败
发表机构 * School of Intelligence Science and Technology, Nanjing University, Suzhou, China(南京大学智能科学与技术学院,中国,苏州) ; City University of Hong Kong, Hong Kong, China(香港城市大学,中国,香港) ; Institute of Automation, Chinese Academy of Sciences, Beijing, China(中国科学院自动化研究所,北京,中国)
AI总结 RADAR通过将可靠的上下文选择建模为图基能最小化问题,利用最大流最小割算法进行精确求解,采用贝叶斯记忆节点递归更新信念状态,以平衡稳定性和对抗性攻击,同时适应真实知识变化,在动态数据集上实现了比基线方法更优越的鲁棒性和响应质量,且存储开销小。
PointLLM-R: 通过链式推理增强3D点云推理
发表机构 * Visual Computing Research Center (VCC), College of Computer Science(视觉计算研究中心(VCC),计算机科学学院) ; Software Engineering (CSSE) Shenzhen University China(软件工程(CSSE)深圳大学中国) ; VCC, CSSE Shenzhen University China(VCC,CSSE 深圳大学中国) ; Shenzhen University(深圳大学)
AI总结 本文提出了一种数据驱动的框架,用于构建大规模链式推理监督,以改进3D点云理解。通过两阶段流程优化点文本指令数据,并合成高质量推理路径,构建了包含55K样本的PoCoTI数据集,训练PointLLM-R实现3D多模态语言模型的推理能力,实验表明其在生成3D分类和描述任务中达到最先进的性能。
浅层神经网络中关于时间的弱传播混沌性
发表机构 * Massachusetts Institute of Technology(麻省理工学院) ; Courant Institute School of Mathematics, Computing and Data Science(Courant研究所数学、计算与数据科学学院) ; New York University(纽约大学)
AI总结 本文研究了在特征学习模式下使用梯度下降训练的一层神经网络,将有限宽度网络的输出与无限宽度网络的输出联系起来,并通过均场动力学来研究其长期行为。
Comments 46 pages
从TF-IDF到Transformer:一种比较和集成的方法用于情感分类
发表机构 * School of Computer Engineering KIIT Deemed to be University(计算机工程学院 KIIT 被认定大学)
AI总结 本文比较了多种机器学习模型,包括Naive Bayes、逻辑回归、SVM、LightGBM、LSTM以及基于Transformer的RoBERTa和DistilBERT,旨在对电影评论进行情感分类,并发现RoBERTa在准确率上表现最佳,同时集成所有模型的软投票方法进一步提升了分类性能。
Comments 6 pages, 9 figures. This is the author's accepted manuscript, presented at the International Conference on Intelligent Computing, Networks and Security (IC-ICNS 2026), March 26-28, Bhubaneswar, India. Proceedings publication pending
迈向理解对抗蒸馏:为何鲁棒教师失败
发表机构 * School of Electrical Engineering, KAIST, Daejeon, Korea(韩国科学技术院电子工程学院)
AI总结 本文研究了对抗蒸馏中鲁棒教师与学生鲁棒性之间的关系,揭示了教师监督信心与学生表示限制之间的不匹配导致鲁棒过拟合现象,并提出了理论框架和实验验证。
Comments Accepted to ICML 2026. Code is available at https://github.com/HongsinLee/why-robust-teachers-fail
Ex-GraphRAG:图增强大语言模型中的可解释证据路由
发表机构 * Tel Aviv University(特拉维夫大学) ; Institute for AI, University of Stuttgart(人工智能研究所,斯图加特大学) ; NVIDIA(英伟达) ; Meta AI
AI总结 本文提出Ex-GraphRAG,通过引入多变量图神经加法网络(M-GNAN)来解决图增强大语言模型中证据路由的可解释性问题,揭示了语义重要性与结构连通性之间的不匹配,对检索剪枝、上下文构建和失败诊断有重要影响。
ECPO:基于证据的策略优化用于证据认证的候选者排序
发表机构 * Institute of Information Engineering, Chinese Academy of Sciences(信息工程研究所,中国科学院) ; School of Cyber Security, University of Chinese Academy of Sciences(中国科学院大学网络安全学院) ; School of Artificial Intelligence, University of Chinese Academy of Sciences(中国科学院大学人工智能学院)
AI总结 本文研究了证据认证候选者排序问题,提出了一种名为ECPO的策略优化方法,通过结合排序和证据证书来提升排序效果和证据可靠性。
通过可验证的预测动作进行推理:面向金融大语言模型的一致性导向强化学习
发表机构 * Yale University(耶鲁大学) ; University of Texas Rio Grande Valley(德克萨斯理工大学) ; Arizona State University(亚利桑那州立大学)
AI总结 本文提出StockR1,一种结合时间序列的LLM,通过可验证的预测动作统一股票预测与金融推理,利用强化学习优化整个流程,提升金融问答和股票预测的准确性。
稀疏性分配如何塑造无标签后剪枝恢复能力
发表机构 * Marquette University(马凯特大学) ; Cornell University(康奈尔大学) ; Tongji University(同济大学)
AI总结 本文研究了在固定激活统计修复后端下,稀疏性分配如何影响后修复恢复能力,通过比较ERK和LAMP分配在不同数据集和模型上的表现,发现分配选择对后修复准确性有显著影响,并揭示了修复敏感的过渡区域。
一种改进的自适应PID优化器,具有增强的收敛性和稳定性,用于深度学习
发表机构 * 1 Department of Computer Science \& Engineering, Indian Institute of Technology Indore, India. ; 3 National Remote Sensing Centre, Indian Space Research Organisation, India.
AI总结 本文提出了一种改进的自适应PID优化器IAdaPID-ADG,通过引入非递增有效学习率和基于梯度差的调制因子来解决AdaPID在收敛性和稳定性方面的不足,实验表明其在多个数据集上表现优异。
Comments 11 Pages, Double Column, 6 Tables, 5 Figures
ChronoMedicalWorld:一个用于从纵向护理数据中学习患者轨迹的医学世界模型
发表机构 * Beijing KidneyTec Medical Technology Co., Ltd.(北京肾科医疗技术有限公司)
AI总结 本文提出了一种名为ChronoMedicalWorld的模型,旨在通过纵向护理数据学习患者轨迹,该模型结合了联合嵌入状态编码器和宽动作编码器,并在六个术语目标下训练了循环潜在转移模块,以提高慢性病护理中长期预测的准确性。
Comments 14 pages, 2 figures, 6 tables
动态潜在记忆混合用于自演化智能体
发表机构 * The Chinese University of Hong Kong(香港中文大学) ; University of Oxford(牛津大学) ; Nanyang Technological University(南洋理工大学) ; University of Edinburgh(爱丁堡大学) ; Shanghai Jiao Tong University(上海交通大学)
AI总结 本文提出MoLEM框架,通过动态混合专家机制实现智能体的持续学习,避免灾难性遗忘,提升任务学习和能力保持。
Comments 19 pages, 5 figures, 5 tables
SCI-Defense: 防御生成引擎优化的操纵攻击
发表机构 * Siebel School of Computing and Data Science, University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校计算机科学与数据科学学院) ; School of Information Sciences, University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校信息科学学院) ; Amazon topcited.ai(亚马逊topcited.ai)
AI总结 本文提出SCI-Defense框架,通过检测困惑度、语义完整性评分和跨候选检测三种组件,有效识别生成引擎优化攻击,实现了高精度和低误报率,同时揭示了现有防御方法的局限性及未来研究方向。
Comments 20 pages, NeurIPS 2026 submission
对Rényi差分隐私机器学习的最优审计保证
发表机构 * Massachusetts Institute of Technology(麻省理工学院) ; Stony Brook University(石溪大学)
AI总结 本文研究了声称具有Rényi差分隐私(RDP)保证的机器学习算法的黑盒审计问题,提出了一种基于假设检验的审计框架,利用Donsker-Varadhan(DV)变分估计器直接估计相邻执行之间的Rényi散度,并通过类受限DV估计器得出非渐近的置信区间,证明了样本复杂度保证在信息论上最优,首次建立了通过DV估计器审计RDP的最优保证。
Comments 28 pages, 3 figures
训练算法的热力学不可逆性
发表机构 * Massachusetts Institute of Technology(麻省理工学院) ; NTT Research(NTT研究所)
AI总结 本文提出了一种通用框架,用于定义和分析训练算法的不可逆性,证明了四种不同方法在步长η的主导阶近似下是等价的,并展示了不可逆性如何导致时间反演对称性破缺的新兴力。
Comments preprint
CausalGuard: 在图不确定性下的契合推断
发表机构 * Case Western Reserve University(凯斯西储大学)
AI总结 本文提出CausalGuard,一种结构加权的契合框架,通过聚合图条件双稳健伪结果进行校准,以在图不确定性下提供无分布的有限样本边际覆盖。
A2QTGN:自适应幅度量子集成时间图网络用于动态链接预测
发表机构 * eBRAIN Lab, Division of Engineering, New York University Abu Dhabi (NYUAD)(eBRAIN实验室,工程学院,纽约大学阿布扎比分校) ; Center for Quantum and Topological Systems (CQTS), NYUAD Research Institute, NYUAD(量子与拓扑系统中心(CQTS),NYUAD研究院,NYUAD) ; Indian Institute of Technology Palakkad (IITPKD)(帕拉卡德印度理工学院(IITPKD))
AI总结 本文提出A2QTGN,一种结合自适应幅度编码和时间图网络的混合量子-经典框架,用于动态链接预测,通过量子状态表示节点交互特征并根据时间活动选择性刷新幅度嵌入,提升时间表示能力。
Comments 9 pages, 3 figures
CCLab: 学习型和非学习型拥塞控制器的对抗测试
AI总结 本文提出CCLab框架,用于系统评估学习型和非学习型拥塞控制器在对抗性条件下的鲁棒性,发现学习型控制器在对抗测试中比传统算法更鲁棒,并展示了对抗性追踪可用于训练更鲁棒的拥塞控制器。
Comments 13 pages for main paper, 16 pages in total
扩散模型的噪声调度设计:一个最优控制视角
发表机构 * ECE & CSL University of Illinois Urbana-Champaign(电子工程与计算机科学实验室,伊利诺伊大学厄巴纳-香槟分校) ; Computer Science Department Carnegie Mellon University(计算机科学系,卡内基梅隆大学) ; ECE, CSL & NCSA University of Illinois Urbana-Champaign(电子工程、计算机科学实验室及国家计算科学中心,伊利诺伊大学厄巴纳-香槟分校)
AI总结 本文从最优控制的角度出发,提出了一种分析和设计扩散模型噪声调度的框架,通过将噪声调度问题转化为最优控制问题,推导出噪声调度的充分条件,实现了更优的采样误差,并通过参数调整得到新的噪声调度方案,提升了图像生成的FID分数。
为下一代电力系统工程混合物理指导神经网络:最新综述
发表机构 * Energy Exemplar(1能源典范)
AI总结 本文综述了用于电力系统的混合物理指导机器学习架构,探讨了物理指导神经网络(PINNs)、深度算子网络(DeepONets)、傅里叶神经算子、极端学习机增强的PINNs、基于图的PINNs(PIGNNs)和域分解PINNs等方法,展示了这些方法在场分析、故障检测、数字孪生、替代建模和控制优化中的应用,以及嵌入麦克斯韦方程等第一原理约束对预测精度、仿真时间和泛化能力的提升。
Comments 59 pages, 6 Figures
何时切换,而不仅仅是选择:Clash Royale中的切换质量预测
AI总结 该研究探讨了竞技游戏中玩家在连续失利后切换策略的频率与胜率之间的反向关联,提出了一种基于切换质量预测(TQP)的三阶段方法,通过PersonaGate、TimingGate和ScoreFusion来优化策略推荐,并引入SwitchGap作为评估指标,以衡量策略的判别质量。
Comments 11 pages, 2 figures, 4 tables; Accepted at IEEE Conference on Games (CoG) 2026
PhylaFlow:在Billera-Holmes-Vogtmann树空间中进行混合流匹配用于系统发育推断
发表机构 * Eric and Wendy Schmidt Center, Broad Institute of MIT and Harvard(埃里克和wendy Schmidt中心,MIT和哈佛大学Broad研究所) ; Department of Biomedical Informatics, Harvard Medical School(哈佛医学院生物医学信息学系) ; Centennial High School(Centennial高中) ; Infectious Disease and Microbiome Program, Broad Institute of MIT and Harvard(传染病与微生物组计划,MIT和哈佛大学Broad研究所)
AI总结 该研究提出PhylaFlow模型,通过在Billera-Holmes-Vogtmann树空间中学习后验盆地运输,实现混合流匹配,从而提高系统发育推断的效率和准确性。
Comments 9 pages, 3 figures
推理的幻觉:通过零CoT截断揭示LLM中的逃避数据污染
发表机构 * The Pennsylvania State University(宾夕法尼亚州立大学)
AI总结 本文提出零CoT探针(ZCP)方法,通过截断整个推理过程来暴露模型中的潜在捷径映射,以检测LLM中的直接和逃避数据污染,提出了 contamination confidence 指标来量化污染的可能性和严重性。
基于几何适应的解释器:在分布偏移下字典基础可解释性的忠实性
发表机构 * Yonsei University(延世大学) ; Harvard University(哈佛大学)
AI总结 本文提出了一种几何适应解释器(GAE),用于在分布偏移下提高基于字典的可解释性。通过重新对齐解释器的字典与偏移活跃子空间,同时保持原始特征结构,GAE在无监督的情况下减少了分布偏移下的忠实性差距。
在等噪声方差假设下结构VAR模型中的因果发现
发表机构 * Bourns College of Engineering, University of California, Riverside(加州大学河滨分校工程学院) ; University of California, San Francisco(加州大学旧金山分校) ; Department of Mathematics and Statistics, Boston University(波士顿大学数学与统计学系)
AI总结 本文研究了在等噪声方差假设下线性高斯结构VAR模型中的因果发现问题,提出了一种基于稀疏性的方法ENVAR,用于在观测等价类中寻找稀疏的结构代表,并在合成数据和fMRI数据集上进行了评估。
能量门控注意力:频谱显著性作为Transformer注意力的归纳偏置
发表机构 * Independent Researcher, Athens, Greece(雅典,希腊独立研究者)
AI总结 本文提出能量门控注意力(EGA),通过频谱显著性作为归纳偏置来改进Transformer注意力机制,通过在键嵌入的频谱能量上进行门控,提高了信息密集位置的注意力权重,实验结果显示在多个数据集上均取得显著效果。
Comments 12 pages, 4 figures
基于策略的一致性训练通过最小能力退化提升大语言模型安全性
发表机构 * New York University(纽约大学)
AI总结 本文提出基于策略的一致性训练(OPCT)方法,通过模型自身响应对比性提示来提升大语言模型的安全性,实验表明OPCT在抑制顺从性、防止越狱和增强安全意识方面优于传统监督微调(SFT),同时避免了SFT导致的能力退化问题。
超越标量目标:基于专家反馈的自主实验探索用于纳米尺度科学发现
发表机构 * Center for Nanophase Materials Sciences, Oak Ridge National Laboratory(橡树岭国家实验室纳米相材料中心) ; University of Tennessee-Oak Ridge Innovation Institute, University of Tennessee(田纳西大学橡树岭创新研究所) ; Department of Material Science and Engineering, School of Materials and Chemical Technology, Institute of Science Tokyo(东京科学大学材料科学与工程系、材料与化学技术学院) ; Department of Materials Science and Engineering, Norwegian University of Science and Technology (NTNU)(挪威科学技术大学(NTNU)材料科学与工程系) ; Faculty of Physics and Center for Nanointegration Duisburg-Essen (CENIDE), University of Duisburg-Essen(杜伊斯堡- Essen大学物理系和杜伊斯堡- Essen纳米集成中心(CENIDE)) ; Research Center Future Energy Materials and Systems, Research Alliance Ruhr(鲁尔研究联盟未来能源材料与系统研究中心)
AI总结 本文提出了一种名为深度核成对学习(DKPL)的方法,通过整合专家知识和跨学科科学知识,改进自主显微实验,从而在纳米尺度上更有效地发现科学现象。
截断神经似然估计用于状态空间模型中的基于模拟的推断
发表机构 * School of Mathematics, University of Edinburgh(爱丁堡大学数学学院)
AI总结 本文提出了一种改进的截断神经似然估计(T-SNL)方法,解决了传统序列神经似然(SNL)在状态空间模型中推断时存在的样本需求大、扩展性差和不可 amortization 的问题,从而提高了推断的准确性、稳定性与鲁棒性。
使用AlphaEarth地理空间嵌入和深度学习分析映射加利福尼亚州番茄种植系统
发表机构 * Department of Biological and Agricultural Engineering, University of California, Davis(加州大学戴维斯分校生物与农业工程系)
AI总结 本研究评估了Google DeepMind的AlphaEarth地理空间嵌入是否可以作为替代方法,用于加利福尼亚州番茄种植系统的映射,通过使用LandIQ 2018的作物多边形构建平衡参考数据集,并利用U-Net分割模型和蒙特卡洛滴落技术实现高精度的番茄种植系统映射。
Comments 5 pages, 3 figures, 1 table. Preprint submitted to ASABE 2026 AIM
相同架构,不同容量:优化器诱导的谱缩放定律
发表机构 * New York University(纽约大学)
AI总结 研究探讨了优化器如何影响Transformer架构的谱缩放定律,发现相同架构使用不同优化器时,谱容量的缩放行为存在显著差异,提出了优化器与架构协同设计的重要性。
Comments 31 pages, 10 figures, 30 tables. Project page: https://optimizer-scaling-laws.github.io
为何语义熵失效:面向策略优化的几何感知与校准不确定性
发表机构 * University of Notre Dame(诺丁汉大学)
AI总结 本文提出了一种新的策略优化框架GCPO,通过几何感知措施捕捉语义分歧,并利用基于奖励的校准对齐不确定性与学习信号强度,从而更准确地跟踪梯度变化并提升训练后性能。
stable-worldmodel: 一个用于可重复世界建模研究和评估的平台
发表机构 * Mila & Université de Montréal(Mila与蒙特利尔大学) ; New York University(纽约大学) ; Universidade Federal de Minas Gerais(巴西联邦大学矿务学院) ; Independent Researcher(独立研究者) ; LanceDB ; University of Oxford(牛津大学) ; Brown University(布朗大学)
AI总结 本文提出stable-worldmodel平台,旨在解决世界建模研究中代码库、数据管道和评估协议碎片化的问题,通过提供高性能的数据层、现代世界模型基线和规划求解器的实现,以及扩展的环境和任务,实现标准化和可重复的世界建模研究和评估。
三次成本:神经过程在高斯过程推断中的摊销
发表机构 * University of Cambridge, Cambridge, UK(剑桥大学)
AI总结 本文研究了神经过程在高斯过程推断中的摊销成本,将高斯过程的后验推断从精确的O(n^3)转换为学习的O(n)映射,分析了标签污染、信息瓶颈和摊销误差三个来源,并提出了架构优化建议。
Comments To appear at ProbNum 2026
残差技能优化用于文本到SQL集成
发表机构 * University of California, San Diego(加州大学圣地亚哥分校) ; Snowflake AI Research(Snowflake人工智能研究)
AI总结 本文提出DivSkill-SQL,一种残差技能优化框架,通过在当前技能集成失败的示例上优化新技能,从而构建互补的文本到SQL集成,提升Pass@K性能,在Spider2-Lite上实现了显著的准确性提升,同时在不同方言和任务上表现出一致的改进。
MMD-Balls as Credal Sets: A PAC-Bayesian Framework for Epistemic Uncertainty in Test-Time Adaptation
发表机构 * Ideal School and College(理想学校和学院)
AI总结 本文提出了一种基于PAC-Bayesian框架的测试时间适应方法,通过将MMD球体解释为 credal sets,提供了对epistemic不确定性量化的自然方法,并建立了与MMD相关的泛化界限、有限样本版本、统一最坏情况风险界限以及几何保持界限。
Comments 15 pages, 0 figures. Accepted at the 2nd Workshop on Epistemic Intelligence in Machine Learning (EIML@ICML 2026)
通过微分隐私的对偶视角证明对后门攻击的鲁棒性
发表机构 * Department of Computer Science, Technical University of Munich(慕尼黑技术大学计算机科学系) ; Munich Data Science Institute(慕尼黑数据科学研究所) ; MCML ; Machine Learning Research, Morgan Stanley(摩根大通机器学习研究)
AI总结 本文提出一种基于对偶视角的微分隐私框架,用于证明对抗性扰动下的鲁棒性,通过整合随机平滑与隐私配置文件,提供对训练时间和推理时间攻击的联合鲁棒性保证。
HIDBench: 用于基于主机入侵检测的大型语言模型评估
发表机构 * University of California, Irvine(加州大学洛杉矶分校) ; University of California, Los Angeles(加州大学洛杉矶分校)
AI总结 本文提出HIDBench基准测试,用于评估大型语言模型在支持基于主机的入侵检测系统(HIDS)中的能力,揭示了LLM在复杂系统日志数据中的性能差异和敏感性。
基于流形的注意力引导
发表机构 * University of California, San Diego(加州大学圣地亚哥分校)
AI总结 本文提出了一种基于流形的注意力引导方法,通过在推理过程中监控注意力头与正确性流形的距离,动态纠正偏差,从而提高大语言模型在数学推理、代码生成和分子生成等任务中的表现。
Memory-R2: 长时间 horizon 记忆增强 LLM agent 的公平信用分配
发表机构 * Ludwig Maximilian University of Munich(慕尼黑路德维希-马克西米利安大学) ; Munich Center for Machine Learning(慕尼黑机器学习中心) ; Huawei Heisenberg Research Center (Munich)(华为海森堡研究中心(慕尼黑)) ; Technical University of Munich(慕尼黑技术大学)
AI总结 本文提出 Memory-R2 框架,通过结合局部和全局组相对优化方法,解决长时间 horizon 记忆增强 LLM agent 在多会话环境中训练时由于记忆状态差异导致的信用分配不公平问题,同时联合优化记忆形成与记忆演化。
Position: The Time for Sampling Is Now! Charting a New Course for Bayesian Deep Learning
发表机构 * Department of Statistics, LMU Munich(统计系,慕尼黑大学) ; Munich Center for Machine Learning(慕尼黑机器学习中心)
AI总结 本文探讨了在贝叶斯深度学习中采样推理(SAI)的潜力,指出其在计算效率上已与优化方法相当,并可能成为更有效的推理方法。核心贡献是推动SAI在贝叶斯神经网络中的应用,解决现有误解,以实现更精确的不确定性量化。
Comments In Proceedings of the 43rd International Conference on Machine Learning, PMLR 306, 2026
关于优化确定等价的折扣强化学习样本复杂性
发表机构 * Department of Computer Science, University of Copenhagen(哥本哈根大学计算机科学系)
AI总结 本文研究了有限折扣MDP中的风险敏感强化学习,考虑了优化确定等价(OCE)这一风险度量家族,分析了在递归OCE下学习最优状态-动作价值函数和最优策略的样本复杂性,并给出了PAC可学习的效用函数的精确刻画,同时建立了基于模型的简单方法的PAC样本复杂性界,并展示了当效用函数的域不为全实数时问题不可PAC学习,最后给出了价值和策略学习的下界,证明了在状态-动作空间大小SA上的紧性,并对更受限的效用类推导了有效时间 horizon 1/(1-γ) 的依赖性。
Comments Accepted to RLC 2026. arXiv admin note: substantial text overlap with arXiv:2506.00286
利用CT钙扫描中的机会性冠状动脉钙化和心外膜脂肪评估进行阻塞性冠状动脉疾病的机器学习预测
发表机构 * Department of Biomedical Engineering, Virginia Commonwealth University(弗吉尼亚联邦大学生物医学工程系) ; Department of Biomedical Engineering, Case Western Reserve University(凯斯西储大学生物医学工程系) ; Harrington Heart and Vascular Institute, University Hospitals Cleveland Medical Center(克利夫兰医学中心哈灵顿心脏和血管研究所) ; BHF Centre for Cardiovascular Science, University of Edinburgh(爱丁堡大学BHF心血管科学中心) ; Department of Radiology, Case Western Reserve University(凯斯西储大学放射学系)
AI总结 本研究开发了一种先进的机器学习框架,通过分析CT钙扫描中的冠状动脉钙化和心外膜脂肪数据,预测阻塞性冠状动脉疾病,展示了该方法在提高预测性能和减少对增强CT或侵入性检查依赖方面的潜力。
Comments 16 pages, 4 figures, 3 tables
PEARL:通过对比学习实现工业级直播推荐的无偏百分位估计
发表机构 * TikTok(字节跳动) ; ByteDance(字节跳动)
AI总结 本文提出PEARL框架,通过对比学习方法解决用户行为不平衡问题,通过相对偏好信号建模提升推荐系统的性能和鲁棒性。
模型可以建模,但无法绑定:文本到优化中的结构化 grounding
发表机构 * University of Wisconsin-Madison(威斯康星大学麦迪逊分校) ; United States Military Academy(美国军事学院)
AI总结 本文研究了文本到优化任务中建模与绑定两个关键能力的分离性,发现随着实例数据增长,模型准确性下降,提出BIND方法通过结构化文件外部化数据来提升绑定性能,验证了绑定专精模型在不同优化类别中的优势。
基于非增强CT钙化评分的冠状动脉钙化定量分析用于预测心肌缺血
发表机构 * Virginia Commonwealth University(弗吉尼亚共同市场大学) ; Case Western Reserve University(凯斯西储大学) ; Houston Methodist Hospital(休斯顿 Methodist 医院) ; University Hospitals Cleveland Medical Center(克利夫兰医学中心) ; Department of Radiology, Case Western Reserve University(凯斯西储大学放射科)
AI总结 本文提出了一种新的机器学习框架,利用非增强CT钙化评分扫描中的定量冠状动脉钙化评估来预测心肌缺血,通过XGBoost和SHAP识别相关特征,并在5折交叉验证中训练和评估模型,结果显示钙化组学特征显著提高了预测性能。
Comments 15 pages, 4 figures, 3 tables
修正先验数据拟合网络在表格分类中的类别不平衡
发表机构 * School of Electrical, Computer and Energy Engineering(电气、计算机与能源工程学院)
AI总结 本文研究了如何修正先验数据拟合网络在表格分类中因类别不平衡导致的性能问题,通过分析现有技术发现阈值法因PFNs的校准特性表现优异,下采样因PFNs的有限数据性能表现相当,并具有降低推理计算成本的优势。
Comments 5 pages, 6 figures, Information Theory Workshop (ITW)
面向广告市场的支持感知离线策略选择
发表机构 * Department of Mathematics(数学系) ; Embry-Riddle Aeronautical University(埃姆伯里-瑞德尔航空大学)
AI总结 本文提出了一种支持感知的离线决策框架,用于广告市场的保留策略选择,通过将记录证据转化为保守决策对象,以确保验证的可靠性,而非仅依赖点估计排名。
BEiTScore: 一种基于高效交叉编码器的无参考图像描述评估方法
发表机构 * Instituto Superior Técnico(里斯本大学理工学院) ; INESC-ID ; Instituto de Telecomunicações(电信机构)
AI总结 本文提出了一种无参考图像描述评估方法BEiTScore,通过高效的交叉编码器模型解决传统评估方法在计算成本和敏感性方面的不足,提出了一种新的评估指标,并在多种场景下验证了其优越的性能。
TBP-mHC: 通过运输多面体实现 manifold-constrained 超连接的全表达性
AI总结 本文提出 TBP-mHC,通过运输多面体参数化实现 manifold-constrained 超连接的全表达性,解决了超连接中无约束混合导致的训练不稳定性问题,并在语言模型预训练中展示了竞争性性能和改进的稳定性与可扩展性。
MetaDNS: 通过良好温控元动力学增强离散神经采样器的探索
发表机构 * Massachusetts Institute of Technology(麻省理工学院) ; Georgia Institute of Technology(佐治亚理工学院)
AI总结 本文提出MetaDNS,一种将良好温控元动力学整合到离散扩散或自回归采样器中的通用框架,以解决多模式和能量屏障离散分布采样中的模式崩溃问题,并实现自由能重建。
Comments Accepted at ICML 2026
面向订单簿动态的零样本适应
发表机构 * MBZUAI(穆尔亚人工智能研究院)
AI总结 本文提出了一种适应性市场做市架构,保留了Avellaneda-Stoikov框架的分析结构,同时引入了继任者度量式适应机制,通过分离市场动态与交易目标,实现对变化市场制度和交易目标的适应。
X-Token: 通过投影引导的跨分词器知识蒸馏
发表机构 * NVIDIA
AI总结 本文提出X-Token,一种通过投影引导的跨分词器知识蒸馏方法,解决传统方法在处理不同分词器间知识迁移时的不足,通过两个互补的损失函数改进知识蒸馏效果。
表示差距:从几何视角解释神经网络的不合理有效性
发表机构 * Universidade Federal de Minas Gerais(巴西联邦大学矿务学院) ; Queen Mary University of London(伦敦女王玛丽大学)
AI总结 本文从几何视角出发,研究神经网络的表示差距,提出一个与泛化误差密切相关的度量标准,并展示其在更广泛任务和训练算法中的适用性,通过实验证明该理论在合成数据和现实数据中的准确性。
分层变分策略用于奖励引导的扩散
发表机构 * Department of Computer Science(计算机科学系) ; University of California Irvine(加州大学伊文斯顿分校)
AI总结 本文提出了一种分层变分模型框架,通过将控制信息压缩到轻量级且表达能力强的随机策略中,实现了在降低推理成本的同时生成高质量的奖励对齐样本,该方法在4倍超分辨率任务中实现了比现有最佳基线快5倍的推理速度并具有更好的感知质量。
强化学习中大语言模型的价值-梯度假说
发表机构 * MBZUAI(穆斯林人工智能研究所)
AI总结 本文提出了一种价值-梯度视角来解释无评论强化学习方法在大语言模型后训练中的有效性,并通过分析actor更新和注意力机制中的自适应微分,提出了价值梯度信号和可达奖励空间的分解方法。
放大而非学习:微调的AI文本检测器放大了预训练的方向
发表机构 * University College London(伦敦大学学院)
AI总结 该研究探讨了通过微调AI文本检测器来放大预训练方向而非学习AI与人类边界的问题,发现微调在某些情况下会降低辨别能力,但在非母语写作中表现不同,并展示了闭合形式雅可比预测器在不同架构中的有效性。
EntmaxKV: 基于支持的解码方法用于Entmax注意力
发表机构 * Instituto Superior Técnico, Universidade de Lisboa(里斯本大学理工学院) ; ELLIS Unit Lisbon(里斯本ELLIS单位) ; INESC-ID ; Instituto de Telecomunicações(电信研究所)
AI总结 本文提出EntmaxKV,一种基于支持的解码框架,利用熵最大注意力的稀疏性在KV页面加载前进行稀疏解码,通过查询感知的页面评分、支持感知的候选选择和稀疏熵最大注意力,减少概率质量丢失,提高长上下文语言模型的效率。
相似部分:一种基于特征的局部和全局原型解释方法
发表机构 * Institute of Computing Science(计算科学研究所)
AI总结 本文提出了一种基于特征的局部和全局原型解释方法,通过整合特征重要性来提高解释的粒度,实验表明该方法在保持模型预测精度的同时增强了特征多样性。
Comments Accepted for publication in International Journal of Applied Mathematics and Computer Science (IJAMCS)
ASSEMBLAGE-DEEPHISTORY: 一个具有时间覆盖的跨构建二进制数据集
发表机构 * Syracuse University(Syracuse大学) ; Booz Allen Hamilton ; Independent Researcher(独立研究员) ; CrowdStrike
AI总结 本文提出ASSEMBLAGE-DEEPHISTORY数据集,整合了跨构建多样性、跨版本历史和CVE标签,为二进制分析提供统一框架,通过三个分析验证了其在LLM漏洞检测、版本聚类和二进制相似性分解中的价值。
探索使用LLMs对编程教育中学生自解释进行自动评估的有效性
发表机构 * University of Pittsburgh(匹兹堡大学)
AI总结 本文研究了在编程教育中使用LLMs自动评估学生自解释的有效性,通过比较LLMs与语义相似性方法在二元分类任务中的表现,探讨了自动评分技术的优劣。
UniVL:统一的视觉-语言嵌入用于空间接地的上下文图像生成
发表机构 * Center for Advanced AI(先进人工智能中心)
AI总结 本文提出了一种统一的视觉-语言嵌入方法,通过单一的视觉输入直接将语义绑定到空间位置,从而减少计算并提高图像生成质量。
AgForce 使生成抗体设计具备抗原条件
发表机构 * Georgia State University(佐治亚州立大学) ; Georgia Institute of Technology(佐治亚理工学院)
AI总结 本文提出AgForce方法,通过图神经网络和改进的解码器设计,解决传统抗体设计方法中对抗原输入忽略的问题,提升了抗体序列生成的质量和恢复能力。
何时教师标记可靠?用于推理的基于位置加权的在线自我蒸馏
发表机构 * Johns Hopkins University(约翰霍普金斯大学) ; University of Wisconsin–Madison(威斯康星大学麦迪逊分校) ; Nanyang Technological University(南洋理工大学)
AI总结 本文提出了一种基于位置加权的在线自我蒸馏方法,用于改进推理任务中教师标记的可靠性,通过引入分支可行性诊断来识别教师标记的可靠性,并在不同模型上验证了其有效性。
Comments Pre-print. Code is available at https://github.com/SaFo-Lab/PW-OPSD
ConTact: 通过显式界面推理进行接触优先的抗体CDR设计
发表机构 * Georgia State University, Atlanta, USA(佐治亚州立大学) ; Georgia Institute of Technology, Atlanta, USA(佐治亚理工学院) ; DePauw University, Indiana, USA(德保罗大学) ; University of Engineering(工程大学)
AI总结 本文提出ConTact,一种通过显式界面推理进行抗体CDR设计的方法,通过显式分解CDR设计为三个阶段:学习表面互补性指纹、预测CDR-抗原接触以及注入接触门控抗原特征,从而提高结构质量和表位意识。
扩散 Fitzhugh-Nagumo 模型中的平衡传播与哈密顿推断
发表机构 * Rain Neuromorphics(Rain神经形态实验室)
AI总结 本文扩展了平衡传播框架以应用于偏斜梯度系统,并展示了深度能量模型与哈密顿神经网络之间的等价性。研究重点是扩散耦合的 Fitzhugh-Nagumo 神经网络作为典型示例,证明了由于 Fitzhugh-Nagumo 模型的稳态解由自共轭算子描述,因此可以应用平衡传播方法进行信用分配。此外,对于具有深度残差网络拓扑的 Fitzhugh-Nagumo 网络,稳态解具有(空间)哈密顿量,因此可以应用哈密顿回传方法。最后,推导出一个显式的层间哈密顿递推关系,用于指导深度 Fitzhugh-Nagumo 网络和深度能量模型的稳态解推断。
CKD风险预测中的校准、不确定性沟通与部署准备性:一个框架评估研究
发表机构 * University of the Cumberlands(卡默尔兰兹大学)
AI总结 本文评估了在慢性肾病风险预测中,校准、不确定性量化和部署准备性的重要性,通过五个分类器在UCI CKD数据集上的表现,发现内部性能优异但外部转移性差,强调了校准稳定性和外部数据验证的必要性。
Comments 27 pages, 6 figures, 4 tables. Supplementary materials (S1-S4) included as ancillary file
通过自适应课程学习提升多模态对话情感识别的模态平衡
发表机构 * VNU University of Engineering and Technology(越南工程大学)
AI总结 本文提出基于自适应课程学习的框架,通过双层难度评估器解决多模态对话情感识别中的模态不均衡问题,实验表明该方法在IEMOCAP和MELD数据集上显著提升了模型性能。
Comments Accepted at Neural Computing and Applications (Springer), 2026
基于运行时治理的嵌入式联邦学习用于缺铁预测
发表机构 * Theoretical Physics University of Cambridge Cambridge, UK ; Translational AI Laboratory, Dept. of Laboratory Medicine Amsterdam UMC Amsterdam, The Netherlands ; Precision Health University Research Institute Queen Mary Univ. of London London, UK ; Department of Medicine University of Cambridge Cambridge Biomedical Campus Cambridge, UK ; Transplant Cambridge Biomedical Campus Cambridge, UK ; Dept. of Cardiology Amsterdam Cardiovascular Sciences Amsterdam UMC Amsterdam, The Netherlands
AI总结 本文提出了一种基于嵌入的联邦学习框架,用于从常规全血计数数据中预测缺铁,并在两个临床环境中部署,展示了个性化聚合方法在处理不同样本量和任务相关性时的优越性。
目标诱导偏差与多目标无监督特征选择中的搜索动态
发表机构 * LIACS, Leiden University(莱顿大学LIACS) ; LUMC, Leiden University(莱顿大学LUMC)
AI总结 本研究探讨了多目标无监督特征选择中评价目标对搜索动态和Pareto前沿质量的影响,发现基于轮廓系数的评价目标倾向于产生低基数的平凡解,而提出的PCA损失目标能生成测试准确度与监督优化相似的紧凑子集。
AutoMCU: 通过基于LLM的多智能体系统实现面向MCU的神经网络定制化
发表机构 * School of Computing and Artificial Intelligence, Southwest Jiaotong University(计算机与人工智能学院,西南交通大学) ; Shenzhen Institute for Advanced Study, University of Electronic Science and Technology of China(深圳先进研究院,电子科技大学) ; School of Computer Science and Engineering, Northeastern University(计算机科学与工程学院,东北大学)
AI总结 本文提出AutoMCU,一种基于LLM的多智能体系统,用于在MCU约束下实现神经网络的自动化定制化。通过自然语言任务需求和硬件规格,AutoMCU迭代生成结构化架构候选方案,通过供应商工具链反馈过滤不可行设计,在训练前进行筛选,评估可行模型并在受控协议下验证部署可行性。
从参数到数据:一种任务参数引导的微调流水线用于高效的LLM对齐
发表机构 * Zhejiang University(浙江大学) ; Eastern Institute of Technology(东部技术研究所)
AI总结 本研究提出了一种任务参数引导的微调流水线,通过任务敏感的注意力头作为双指南,实现样本挖掘和结构剪枝,从而提高LLM对齐的效率。
Comments Accepted@ICML26, 28 pages, 11 figures, 26 tables
超越单一广告位:多广告位保障型显示广告的联合优化
发表机构 * Nanyang Technological University(南洋理工大学) ; China Agricultural University(中国农业大学)
AI总结 本文提出了一种多广告位保障型显示广告的联合优化框架,解决了广告位冗余、合同不平衡和曝光集中等关键问题,通过离线 bipartite 匹配问题和合同轮盘机制,提升了广告商 ROI、平台收入效率和合同履行的鲁棒性。
Comments Accepted at SIGIR Industry Track 2026
TONIC:面向任务的无线系统中的基于标记的语义通信
发表机构 * Department of Computer Science, Brunel University London(布鲁内尔大学伦敦计算机科学系)
AI总结 本文提出TONIC框架,通过在发送端进行语义感知保护和接收端置信度感知门控,实现任务导向无线系统中基于标记的语义通信,优于传统方法。
Comments 15 pages, 10 figures
期望一致性损失:在协变量偏移下重新思考置信度校准
发表机构 * School of Automation, Central South University, Changsha, China(中南大学自动化学院,长沙,中国)
AI总结 本文针对协变量偏移下的置信度校准问题,提出了一种无监督域适应损失(ECL),该方法在理论和实践中均表现出色,能够有效校准目标域的置信度。
Comments Accepted by ICML 2026
PeakFocus: 通过统一的多尺度框架桥接峰值定位与强度回归以实现电力负荷预测
发表机构 * School of Computer Science and Technology, Tongji University(同济大学计算机科学与技术学院) ; Big Data Center, State Grid Corporation of China(国家电网公司大数据中心)
AI总结 本文提出PeakFocus框架,通过统一的多尺度框架解决电力负荷峰值预测中的峰值定位与强度回归问题,改进多尺度表示冲突和强度平滑问题,提升预测精度。
局部协变量选择用于无预处理和因果充分性假设下的平均因果效应估计
发表机构 * Department of Applied Statistics, Beijing Technology and Business University(北京技术与商业大学应用统计系) ; Shenzhen Institute of Advanced Technology, Chinese Academy of Sciences(深圳先进技术研究院) ; College of Computer Science and Artificial Intelligence, Fudan University(复旦大学计算机科学与人工智能学院) ; Department of Machine Learning, Mohamed bin Zayed University of Artificial Intelligence(Mohamed bin Zayed人工智能大学机器学习系) ; Carnegie Mellon University(卡内基梅隆大学)
AI总结 本文提出了一种局部学习方法,用于非参数因果效应估计中的协变量选择,避免了预处理和因果充分性假设,提高了计算效率和估计准确性。
用于近红外化学传感数据稳健校准的表格基础模型
发表机构 * CIRAD(国际热带农业中心) ; UMR AGAP Institut(AGAP研究所) ; Université de Montpellier(蒙彼利埃大学) ; INRAE(国家农业食品与环境研究机构) ; Institut Agro(农业研究所) ; LIRMM(蒙彼利埃大学LIRMM实验室)
AI总结 本文研究了表格基础模型在近红外化学传感数据校准中的应用,通过对比不同模型在回归和分类任务中的表现,发现预处理优化的TabPFN在回归任务中表现最佳,而在分类任务中直接使用原始光谱的数据表现最优,同时指出在存在光谱异常值和外推样本时,传统化学计量学模型仍具竞争力。
Comments 56 pages, 17 figures, including supplementary material
可证明的多语言模型基准测试去污染
发表机构 * Department of Statistics and Data Science, Southern University of Science and Technology Shanghai Innovation Institute(统计与数据科学系,南方科技大学上海创新研究院)
AI总结 本文提出了一种可证明的多语言模型基准测试去污染方法,通过联合选择过程实现全局污染率控制,提升跨模型比较的可靠性。
发现实体-条件滞后异质性:一种用于面板时间序列的滞后门神经审计框架
发表机构 * School of Engineering Jönköping University(工程学院 琼斯科普инг大学)
AI总结 本文提出了一种用于面板时间序列的滞后门神经审计框架AC-GATE,旨在解决不同实体在不同时间跨度上对历史信号的响应问题,通过引入适应性编码器和尺度不变滞后门,实现对滞后异质性的发现和结构化输出。
Comments Preprint/technical paper. An interpretable neural audit framework for entity-conditioned lag discovery in panel time series. 10 pages, 5 figures, 16 tables. Code available at the GitHub repository
频域正则化对抗对齐用于针对闭源大语言模型的可转移攻击
发表机构 * Shanghai Artificial Intelligence Laboratory(上海人工智能实验室) ; Zhejiang University(浙江大学) ; Shanghai Jiao Tong University(上海交通大学) ; Wuhan University(武汉大学) ; Nanyang Technological University(南洋理工大学) ; University of Science and Technology of China(中国科学技术大学)
AI总结 本文提出FRA-Attack,通过频域正则化方法解决对抗转移性问题,通过高通DCT目标和频率域梯度正则化提升跨模型的对抗转移能力。
DualOptim+: 联合与解耦优化器状态的桥梁以提升大语言模型中的机器反遗忘
发表机构 * Department of Computer Science, City University of Hong Kong(香港城市大学计算机科学系) ; Independent Researcher(独立研究者)
AI总结 本文提出DualOptim+,一种改进大语言模型中机器反遗忘的新优化框架,通过引入基础状态和delta状态,有效平衡遗忘与保留目标,同时提出8位量化变体以减少内存开销,实验表明其在多个任务中均表现出色。
Comments Accepted by ICML 2026
自适应RBF-KAN:动态形状参数在Kolmogorov-Arnold网络中的比较评估
发表机构 * Member of the INdAM Research Group GNCS(INdAM GNCS研究组成员) ; Department of Mathematics, Hong Kong Baptist University(香港 Baptist大学数学系)
AI总结 本文研究了Kolmogorov-Arnold网络中动态形状参数的选择问题,通过引入更广泛的径向基核和基于留一验证的核尺度估计,改进了RBF-KAN模型,提升了对不同函数类型的适应能力。
CryoNet:一种用于多模态冰川覆盖区制图的深度学习框架。帕iqu盆地,中央喜马拉雅地区案例研究
发表机构 * University of Sannio(萨恩尼奥大学) ; Graz University of Technology(格拉茨技术大学)
AI总结 本研究提出CryoNet,一种利用多模态数据集的深度学习框架,用于区分干净冰川、覆盖冰川和冰湖,通过在喜马拉雅中央帕iqu盆地的案例研究展示了其在复杂高山环境中的有效性。
Comments 15 pages, 10 figures, 5 tables. Preprint submitted to IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing (JSTARS); currently under review
蛋白质思想:基于树 of 思维和嵌入空间流匹配的可解释推理用于蛋白质-蛋白质相互作用发现
发表机构 * Department of Statistics and CCAM University of Chicago(统计学系和CCAM大学芝加哥分校) ; School of Medicine Stanford University(医学学院斯坦福大学) ; Department of Statistics University of Chicago(统计学系芝加哥大学)
AI总结 本文提出了一种可解释的蛋白质-蛋白质相互作用发现框架,通过显式推理将PPI发现转化为可解释的搜索问题,利用嵌入空间流匹配和树 of 思维搜索方法提升预测精度和可解释性。
图划分的神经加速
发表机构 * Department of Computer Science University of Alabama in Huntsville(计算机科学系阿拉巴马大学亨茨维尔分校)
AI总结 本文提出利用神经网络模型替代传统特征值计算,以加速图划分过程,从而在保持划分质量的同时显著降低计算开销,提升大规模问题的可扩展性和效率。
在执行轨迹上进行推理时间对齐的工具
发表机构 * GitHub
AI总结 本文研究了在执行轨迹上进行推理时间对齐的工具设计,通过任务分解和引导执行机制来提高长期性能,发现工具设计中分解和引导的复杂性并不总是带来更好的结果,提出了任务分解和引导执行的两种机制,并通过合成实验和实际终端代理基准验证了这些发现。
通过示例预测符号程序和提示程序的性能
发表机构 * Nanayang Technological University, Singapore(南洋理工大学,新加坡) ; Massachusetts Institute of Technology, USA(麻省理工学院,美国) ; Cornell University, USA(康奈尔大学,美国)
AI总结 本文研究了通过示例预测程序性能的问题,提出了一种基于简单硬币翻转模型的方法,利用观察到的执行结果和性能先验知识来预测程序性能,并开发了RAP方法来构建代理先验以提高预测效果。
时间网络上热扩散的条件熵
发表机构 * Department of Mathematical Modeling and Machine Learning(数学建模与机器学习系)
AI总结 本文研究了时间网络上热扩散的条件熵,提出了一种新的方法来检测时间网络中的相变点,并展示了其在信息论中的意义,类似于热力学第二定律。
面向社区的顶点排序用于基于参考的图压缩:一种交叉编码实证研究
发表机构 * Vantino Geneva Switzerland(瓦宁托日内瓦瑞士)
AI总结 本文提出了一种两阶段的Leiden+LLP顶点排序方法,并研究其与基于参考的压缩的交互作用,结果显示在初始顶点排序较差的图中,重新排序能显著节省比特数,且不同编码器对排序的响应具有高度一致性。
Comments 26 pages, 7 figures, 9 tables. Full reproducibility package at https://github.com/jimbotonic/Adjacently.jl. Preprint; comments welcome
韩国可见度现在预测:一种处理数据不平衡和分布偏移的机器学习方法
发表机构 * Department of AI Big Data(人工智能大数据系) ; Daejin University(大 Jain 大学) ; Department of Statistics and Actuarial Science(统计与精算科学系) ; Soongsil University(顺斯大学) ; College of Artificial Intelligence Convergence(人工智能融合学院)
AI总结 本文提出了一种机器学习方法,用于预测韩国六个主要城市的大气可见度,通过SMOTENC和CTGAN处理数据不平衡,并结合机器学习和深度学习模型进行评估,发现训练与测试期间的分布偏移导致预测性能下降,强调了在时间序列数据上实施现在预测模型时考虑外部环境因素的重要性。
Comments Published in Theoretical and Applied Climatology
图神经网络解释揭示了生物网络中与疾病相关的枢纽的拓扑特征
发表机构 * Division of Cancer, Department of Surgery and Cancer, Faculty of Medicine, Imperial College London(癌症部、外科与癌症部门、医学学院、伦敦帝国学院) ; Department of Computing, Imperial College London(计算部门、伦敦帝国学院) ; Department of Environmental Health Sciences, Yale University(环境健康科学部门、耶鲁大学)
AI总结 本文研究了图神经网络在生物网络中识别疾病相关结构的方法,发现不同解释方法在稀疏单节点驱动和分布式路径信号中有不同的表现,并提出了一种结合壳层枢纽评分和解释器共识排名的框架,提升了对癌症基因的优先级排序和生物学相关分子的恢复能力。
Comments 25 pages (excluding supplement), 7 figures, 7 supplementary tables
基于条件神经场的降阶模型用于动态倾倒载荷预测
发表机构 * Institute for Fluid Dynamics and Ship Theory, Hamburg University of Technology, Am Schwarzenberg-Campus 4, D-21073 Hamburg, Germany(流体动力学与船舶理论研究所,汉堡技术大学,Schwarzenberg Campus 4,德国汉堡,D-21073) ; Institute of Mathematics, Hamburg University of Technology, Am Schwarzenberg-Campus 3, D-21073 Hamburg, Germany(数学研究所,汉堡技术大学,Schwarzenberg Campus 3,德国汉堡,D-21073)
AI总结 本文提出一种基于条件神经场的降阶模型,用于预测飞机倾倒载荷,该模型在不依赖空间离散化的情况下,通过结合LSTM网络实现了高精度的时空预测,并在不同空间离散化条件下展示了良好的重建能力。
HealthCraft: 一种用于急救医学的强化学习安全环境
发表机构 * GOATnote Inc.(GOATnote公司)
AI总结 本文提出HealthCraft,首个公开的强化学习环境,用于在真实急救医学条件下奖励轨迹级安全,通过FHIR R4世界状态、24个MCP工具和双层评估标准,评估模型在急救任务中的安全性和性能,揭示了模型在多步骤工作流中的安全失败问题。
Comments 16 pages, 5 figures, 6 tables. Code, task suite, and Docker bundle: https://github.com/GOATnote-Inc/healthcraft
过拟合模型的最小二乘插值在受污染数据中的双下降现象:一项模拟研究
发表机构 * Institute for Mathematics, Carl von Ossietzky University Oldenburg(奥尔登堡卡尔·冯·奥西特齐克大学数学研究所)
AI总结 本文研究了在受污染数据下线性回归中是否会出现双下降现象,比较了最小二乘插值估计器与几种鲁棒替代方法的性能,发现大规模过拟合确实导致双下降现象,使最小二乘插值器的泛化性能优于鲁棒替代方法。
不要压缩你的特征:为什么CenterLoss伤害OOD检测和多尺度Mahalanobis获胜
发表机构 * Department of Electronics and Electrical Engineering(电子与电气工程系)
AI总结 本文提出GOEN方法,通过多尺度特征、L2归一化、Mahalanobis距离和校准头来提升OOD检测性能,发现CenterLoss会降低OOD检测性能,而GOEN-NoCenterLoss在CIFAR-10基准上表现优于其他基线方法。
特征归因不可能性:在共线性下,没有任何特征排名是忠实、稳定和完整的
发表机构 * Independent Researchers(独立研究人员)
AI总结 本文研究了在共线性情况下特征排名的不可能性,证明了无法同时满足忠实、稳定和完整性的条件,并提出了DASH方法作为解决途径,同时通过形式化验证展示了其理论基础和实际应用影响。
Comments 66 pages, 12 figures, 305 Lean 4 theorems. Code at https://github.com/DrakeCaraker/dash-impossibility-lean
通过比较想法评估教授语言模型预测研究成功的技巧
发表机构 * IISER Pune(印度理工学院帕内尔)
AI总结 本研究探讨了语言模型能否在无需实验的情况下预测研究想法的实证成功,通过构建基于PapersWithCode客观结果的11488对想法数据集,发现通过强化学习可提升模型性能至71.35%,证明小型语言模型可以作为有效的客观验证器,为自主科学发现提供可扩展路径。
Comments ACL 2026 Findings
基于时间对比的变压器用于金融犯罪检测:通过预测对比编码实现自监督序列嵌入
发表机构 * NICE Actimize
AI总结 本文提出了一种名为时间对比变压器(TCT)的表示学习框架,旨在捕捉金融交易序列中的时间动态。通过自监督对比目标训练模型,生成编码时间行为模式的嵌入,以支持下游的欺诈检测任务。实验结果显示,嵌入本身能实现有意义的预测性能(AUC 0.8644),但结合领域工程特征时,性能提升不显著(AUC 0.9205 vs. 0.9245),表明学习到的表示与现有特征抽象有较大重叠。这些发现表明TCT是一种有前景的表示学习方法,能够捕捉相关的行为信号,同时凸显了在强领域特征上实现加性价值的挑战。
Comments 10 pages, 4 figures, one table
随机均值流策略:带有熵镜降的一步生成控制
发表机构 * Laboratory for Big Data and Decision(大数据与决策实验室) ; National University of Defense Technology(国防科技大学) ; Samsung AI Center Cambridge(三星AI研究中心) ; Queen Mary University of London(伦敦玛丽女王大学) ; Fudan University(复旦大学) ; ShanghaiTech University(上海科技大学) ; Shanghai Innovation Institute(上海创新研究院)
AI总结 本文提出了一种随机均值流策略(SMFP),通过均值流变换将高斯噪声映射到动作,以实现可训练的生成策略,从而在离线策略镜降框架下实现探索性且稳定的改进。
从稀疏数据快速重建精确的Maxwell动力学
发表机构 * Department of Computer Science, Georgetown University(乔治城大学计算机科学系) ; Department of Mathematics, Georgetown University(乔治城大学数学系) ; Department of Mathematics and Statistics, Old Dominion University(老 Dominion 大学数学与统计学系) ; School of Data Science, Old Dominion University(老 Dominion 大学数据科学学院) ; Institute Industrial IT, Department of Computer Science and Automation, OWL University of Applied Sciences and Arts(OWL 应用科学与艺术大学工业IT研究所)
AI总结 本文提出FLASH-MAX神经网络架构,通过稀疏点观测预测均匀电磁场,该架构通过符号构造满足Maxwell方程,实现从稀疏数据快速训练,且保持零PDE残差,提升了科学机器学习中精度与优化速度的平衡。
Comments 31 pages, 8 figures
AirfoilGen: 一种用于翼型生成的可构造且性能感知的潜在扩散模型
发表机构 * State Key Laboratory of CAD \& CG, Zhejiang University, Hangzhou, 310027, China
AI总结 本文提出了一种新的翼型生成模型AirfoilGen,通过引入圆扫表示法约束生成过程,确保生成的翼型符合基本特性,并通过在学习的潜在空间中操作实现对气动性能的显式控制,同时提供了一个包含超过20万翼型的新数据集。
Comments 15 pages
按设计实现神经崩溃:在超球面上学习类别原型
发表机构 * The Cyprus Institute(塞浦路斯研究所) ; University of Athens(雅典大学) ; Archimedes AI/Athena Research Center(阿基米德AI/阿泰纳研究中心) ; University of Cyprus(塞浦路斯大学)
AI总结 本文研究了监督分类的理论最优解神经崩溃(NC),指出交叉熵(CE)和监督对比学习(SCL)两种主流范式在实践中无法达到该最优解。作者提出通过在超球面上对比原型的方法,改进了CE和SCL,从而在多个基准测试中实现了更接近NC的性能。
Comments 43rd International Conference on Machine Learning (ICML 2026); Code: https://github.com/pakoromilas/nc_by_design
GROW: 将GRPO与状态-动作建模对齐以适用于开放世界VLM智能体
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; Shanghai Artificial Intelligence Laboratory(上海人工智能实验室) ; East China Normal University(华东师范大学) ; Zhejiang Normal University(浙江师范大学) ; Shandong Normal University(山东省师范大学)
AI总结 本文提出GROW框架,通过将收集的轨迹分解为状态-动作样本,并在样本间计算优势,解决了标准GRPO在多轮RL中因需要完整轨迹导致上下文过长和噪声的问题,实验表明其在超过800个Minecraft任务中取得SOTA性能。
位置:图压缩需要重新开始——超越全数据集训练和模型依赖
发表机构 * Yardi School of Artificial Intelligence, IIT Delhi, India(印度德里理工学院Yardi人工智能学院) ; Department of Computer Science and Engineering, IIT Delhi, India(印度德里理工学院计算机科学与工程系) ; Department of Chemical Engineering, IIT Delhi, India(印度德里理工学院化学工程系) ; Indian Institute of Technology Delhi, Abu Dhabi, Zayed City, Abu Dhabi, UAE(印度德里理工学院阿布扎赫德分校,扎耶德城,阿布扎赫德,阿联酋)
AI总结 本文指出当前图压缩方法存在系统性缺陷,呼吁转向轻量、架构无关且可部署的方法,以实现高效、通用和可扩展的图神经网络训练。
通用偏好强化学习
发表机构 * Stanford University(斯坦福大学) ; The University of Oklahoma(俄克拉荷马大学)
AI总结 本文提出通用偏好强化学习(GPRL),通过引入通用偏好模型(GPM)解决传统强化学习在开放任务中连续探索不足的问题,通过多维偏好比较提升模型性能。
Bug or Feature²:权重漂移、激活稀疏性与尖峰
发表机构 * GitHub
AI总结 本文研究了现代神经网络架构中由于标准损失与正偏激活函数相互作用导致的负权重漂移现象,分析了其对激活稀疏性和模型性能的影响,并提出通过剪枝解决尖峰问题的方法。
AutoRubric-T2I: 一种用于文本到图像对齐的鲁棒基于规则的奖励模型
发表机构 * University of California, Los Angeles(加州大学洛杉矶分校)
AI总结 本文提出AutoRubric-T2I,一种首个用于文本到图像生成的规则学习框架,通过自动合成和选择显式规则来指导视觉语言模型(VLM)法官。该方法通过合成偏好对的推理轨迹生成候选规则,并利用VLM法官在每种规则下对配对图像进行评分,产生配对规则评分差异用于偏好学习。通过ℓ1正则化逻辑回归精简器去除噪声和冗余规则,从而在少量标注偏好数据下生成高质量、可解释的奖励信号,并在多个图像奖励基准测试中优于现有奖励模型基线。
Comments 27 pages
稀疏Mamba解码器用于量子纠错:高效处理表面码syndrome的缺陷中心处理
发表机构 * Department of Electrical Engineering and Computer Science(电气工程与计算机科学系)
AI总结 本文提出了一种基于缺陷中心的稀疏Mamba解码器,通过仅处理活跃的检测事件,提高了量子纠错中表面码syndrome处理的效率和准确性,同时在多个基准测试中展示了显著的性能提升。
Comments 22 pages, 7 figures, 10 tables. Neural decoder for surface code quantum error correction. Submitted to Quantum
局部关注,线性记忆:线性注意力作为跨帧记忆用于自回归视频扩散
发表机构 * Institute of Artificial Intelligence, University of Central Florida(中央佛罗里达大学人工智能研究所)
AI总结 本文提出了一种名为ARL2的混合注意力模块,通过将二次跨帧注意力替换为固定大小的递归状态,解决了自回归视频扩散模型在长视频生成中的可扩展性瓶颈问题,实现了线性时间复杂度和常数内存消耗,同时提升了时间一致性。
当秩-1引导廉价时是什么情况?几何学、粒度和预算化搜索
发表机构 * The University of Texas at Austin(德克萨斯大学奥斯汀分校)
AI总结 本文研究了秩-1引导在不同概念上的有效性差异,提出粒度和几何学是影响引导成本的关键因素,并介绍了GRACE框架来高效优化引导过程。
Comments Updated Abstract metadata
通过语义层面奖励校准大型语言模型
发表机构 * Department of Computer Science and Engineering, University of California San Diego, La Jolla, California, USA(加州大学圣地亚哥分校计算机科学与工程系,拉贾尔,加利福尼亚州,美国) ; Halıcıoğlu Data Science Institute, University of California San Diego, La Jolla, California, USA(加州大学圣地亚哥分校Halıcıoğlu数据科学研究所,拉贾尔,加利福尼亚州,美国) ; Department of Statistics, Stanford University, Stanford, California, USA(斯坦福大学统计学系,斯坦福,加利福尼亚州,美国)
AI总结 本文提出了一种新的校准框架CSR,通过在语义空间中直接校准语言模型,避免了传统方法中因词汇化置信度导致的不一致问题,实验显示CSR在多个数据集上均能有效降低ECE并提高AUROC。
X-SYNTH:超越检索——从观察到的数字人类注意力中提取企业上下文
发表机构 * Workfabric AI
AI总结 本文提出X-SYNTH框架,通过分析数字人类注意力行为模式,解决企业上下文合成问题,其核心方法是基于行为模式的上下文合成,而非传统检索,从而显著提升有效线索率并降低误报率。
Comments 11 pages, 7 figures, 5 tables
非自回归生成的离散随机定位
AI总结 本文提出了一种连续状态框架,通过单位球体令牌嵌入实现离散随机定位,以提高离散序列生成的分布忠实度,并展示了在OpenWebText上改进MAUVE指标的效果。
Comments This work was intended as a replacement of arXiv:2602.16169 and any subsequent updates will appear there
DocAtlas: 跨80多种语言的多语言文档理解
发表机构 * MBZUAI(穆罕默德·本·拉谢德人工智能研究所) ; IBM Research(IBM研究院)
AI总结 本文提出DocAtlas框架,通过构建高保真的OCR数据集和基准测试,覆盖82种语言和9个评估任务,利用双重管道生成精确的结构注解,展示了直接偏好优化在多语言适应中的有效性,提升了领域内和领域外的准确率。
Comments Under submission
Metis: 通过自进化元认知策略优化学习 jailbreak LLMs
发表机构 * University of Science and Technology of China(中国科学技术大学) ; Institute of Artificial Intelligence (TeleAI), China Telecom(人工智能研究院(TeleAI),中国电信)
AI总结 本文提出Metis框架,通过将jailbreaking重新表述为对抗性部分可观测马尔可夫决策过程中的推理时间策略优化,以提高对抗性测试的效率和效果,同时通过结构化反馈和透明推理轨迹提升可解释性,实验表明Metis在多种模型上均表现出更高的攻击成功率和更低的token成本。
Comments Accepted to the 43rd International Conference on Machine Learning (ICML 2026)
实例自适应在线多校准
发表机构 * Paul G. Allen School of Computer Science and Engineering, University of Washington(华盛顿大学保罗·G·阿伦计算机科学与工程学院) ; Department of Computer and Information Sciences, University of Pennsylvania(宾夕法尼亚大学计算机与信息科学系)
AI总结 本文提出了一种高效的实例自适应在线多校准算法,通过动态调整预测值的二进制网格来平衡最坏情况和易处理情况,实现了在不同实例下的最优误差控制。
Comments We tightened the analysis and added a comparison to the concurrent work of Liu et al. (arXiv:2605.11490)
SplAttN: 通过高斯软溅射和注意力在2D和3D之间架桥以实现点云补全
发表机构 * School of Computing and Artificial Intelligence(计算与人工智能学院) ; Southwest Jiaotong University(西南交通大学) ; Chengdu, China(中国成都)
AI总结 本文提出SplAttN方法,通过高斯软溅射和注意力机制解决点云补全中2D和3D模态连接问题,改进了传统硬投影导致的跨模态熵塌陷问题,实现了更有效的跨模态连接学习。
Comments Accepted as a Spotlight paper at ICML 2026; camera-ready version
树到流及回归:统一决策树和扩散模型
发表机构 * School of Computation, Information and Technology, Technical University of Munich, Germany(慕尼黑技术大学计算、信息与技术学院,德国) ; Munich center for machine learning (MCML)(慕尼黑机器学习中心(MCML))
AI总结 本文通过建立层次决策树与扩散过程之间的数学对应关系,统一了决策树和扩散模型,揭示了共同的优化原则'全局轨迹得分匹配',并提出了两种实用应用:treeflow在表格数据生成中表现优异,且计算速度更快;dsmtree将层次决策逻辑转移到神经网络中,在多个基准上与教师模型表现相近。
Comments 12 pages (main), 68 pages (inclusive of appendix), Accepted in the Forty-Third International Conference on Machine Learning (ICML) 2026
通过跨组重心对齐实现公平的数据集蒸馏
发表机构 * Western University(温莎大学) ; Vector Institute(向量研究所) ; IE University(IE大学) ; Ivey Business School(Ivey商学院)
AI总结 本文研究了数据集蒸馏中因不同群体预测模式差异导致的公平性问题,提出通过跨组重心对齐方法来减少群体间的预测偏差,从而提升模型的公平性。
Comments Accepted by ICML 2026
SceneSelect: 用于轨迹场景分类和专家调度的选择性学习
发表机构 * School of Computer Science, China University of Geosciences (Wuhan)(中国地质大学(武汉)计算机科学学院) ; School of Information Engineering, Wuhan University of Technology(武汉理工大学信息工程学院) ; School of Mathematics and Statistics, Wuhan University of Technology(武汉理工大学数学与统计学学院)
AI总结 本文提出SceneSelect,一种基于场景的选择性学习方法,通过动态路由输入到最合适的专家模型,提升轨迹预测的准确性和效率。
Comments This paper has been accepted by ICIC 2026
TIP: on-policy distillation 中的 token 重要性
AI总结 本研究探讨了在 on-policy 知识蒸馏中哪些 token 对学习信号最有用,提出了一种基于学生熵和教师-学生分歧的双轴分类方法,并通过实验验证了在有限内存条件下使用少量 token 进行蒸馏的有效性。
通过合成任务进行元学习的黑盒优化
发表机构 * School of EECS, Washington State University, Pullman, WA, USA(华盛顿州立大学电子工程与计算机科学学院,普拉默,华盛顿州,美国)
AI总结 本文提出了一种通过生成合成任务进行元学习的框架OptBias,用于解决小规模离线数据下的黑盒优化问题,通过学习可重用的优化偏差来提升小数据场景下的性能。
Comments Accepted for Publication at International Conference on Artificial Intelligence and Statistics (AISTATS)
链式思维如何分解复杂任务?
发表机构 * University of Pennsylvania(宾夕法尼亚大学)
AI总结 本文研究了链式思维在复杂任务分解中的作用,发现通过将任务分解为多个小分类问题可以显著降低预测误差,并确定了分解深度的最优阈值。
鲁棒推理基准
发表机构 * University of Toronto(多伦多大学) ; Vector Institute(向量研究所)
AI总结 本研究提出鲁棒推理基准(RRB),通过13种确定性文本扰动评估8种前沿模型,发现Claude在面对变换提示时表现出异常拒绝行为,而开放权重模型在结构噪声下出现多种失败模式,如认知冲刷、分词崩溃和推理崩溃,导致平均准确率下降高达54%。研究进一步发现由模型自身推理链引起的注意力稀释问题,并提出Intra-Query Attention Dilution概念,表明中间推理步骤会污染标准密集注意力机制,未来架构需整合显式上下文重置以实现可靠推理。
CellFluxRL: 通过强化学习实现生物约束的虚拟细胞建模
发表机构 * Stanford University(斯坦福大学)
AI总结 本文提出CellFluxRL,通过强化学习约束虚拟细胞模型,使其在生物功能、结构有效性及形态正确性方面更符合生物学规律,从而提升虚拟细胞建模的生物意义。
面向科学成像的不确定性感知分布到分布流匹配
发表机构 * Stanford University(斯坦福大学)
AI总结 本文提出了一种面向科学成像的不确定性感知分布到分布流匹配方法,通过引入贝叶斯随机流匹配和抗变异不确定性量化技术,提升模型在分布偏移下的泛化能力,并有效估计epistemic和aleatoric不确定性,从而检测不可靠的生成结果。
规则状态推断(RSI):一种用于规则治理领域合规监控的贝叶斯框架
发表机构 * Institut National des Postes et Télécommunications(摩洛哥邮政和电信国家研究院) ; Togo DataLab(多哥数据实验室) ; Ministry of Digital Economy(数字经济部)
AI总结 本文提出了一种名为规则状态推断(RSI)的贝叶斯框架,用于解决规则治理领域中合规监控的三大结构性挑战:部署时缺乏标记结果、非合规实体战略性缺失观察以及监管环境变化速度超过任何监督模型的重新训练速度。RSI通过将权威、形式化的规则集作为结构化的贝叶斯先验,利用变分推断和精确坐标上升更新来推断人口的潜在合规状态。
Comments 18 pages. Experimental validation forthcoming
紧凑的提升松弛方法用于低秩优化
发表机构 * Department of Analytics, Marketing and Operations, Imperial Business School(分析、营销与运营部,帝国商业学院) ; Management Science and Operations, London Business School(管理科学与运营,伦敦商业学院)
AI总结 本文提出了一种可处理秩约束二次优化问题的紧凑凸松弛方法,通过引入提升半正定松弛,避免了传统方法中所需的谱结构项,并通过冗余块的分析得到更紧凑的松弛形式,同时引入了新的有效不等式(投影割)以增强低秩松弛效果,适用于矩阵补全和降维回归等问题。
Comments Part of this material previously appeared in arXiv:2501.02942v2, which was split into this paper and arXiv:2501.02942v3
MDM-Prime-v2:二进制编码和索引洗牌使扩散语言模型能够扩展
发表机构 * University of Toronto(多伦多大学) ; Vector Institute(向量研究所) ; NVIDIA AI Technology Center(NVIDIA AI技术中心) ; National Taiwan University(国立台湾大学)
AI总结 本文提出MDM-Prime-v2,通过二进制编码和索引洗牌技术改进扩散语言模型,解决了子分词器功能形式与BPE分词器结合导致的交叉熵损失增加以及子分词器粒度超参数选择缺乏工具的问题,从而提升了模型在常识推理基准上的零样本准确率。
异质智能体协作强化学习
发表机构 * Beihang University(北航) ; Bytedance China(字节跳动中国) ; Tsinghua University(清华大学) ; Peking University(北京大学) ; Apple(苹果公司)
AI总结 本文提出了一种新的强化学习从可验证奖励(RLVR)问题HACRL,通过异质智能体共享验证的轨迹实现协同优化,解决了孤立多智能体在线优化的效率问题,并提出HACPO算法以最大化样本利用率和跨智能体知识转移。
InnerQ: 一种面向硬件的无需调优的KV缓存量化方法用于大语言模型
发表机构 * Department of Electrical and Computer Engineering(电气与计算机工程系)
AI总结 本文提出InnerQ,一种面向硬件的KV缓存量化方法,旨在减少解码延迟而不影响评估性能,通过分组量化策略提高数据重用率,从而在Llama和Mistral模型上提升了少样本评估得分。
Comments 18 pages, 5 figures, 7 tables
MapTab: MLLMs 是否已准备好在异构图中进行多标准路线规划?
发表机构 * National Key Laboratory for Novel Software Technology, Nanjing University(南京大学新型软件技术国家重点实验室) ; School of Intelligence Science and Technology, Nanjing University(南京大学智能科学与技术学院) ; AMAP, Alibaba Group(阿里集团AMAP) ; School of Computing and Artificial Intelligence, Southwest Jiaotong University(西南交通大学计算机与人工智能学院)
AI总结 本文提出MapTab基准测试,用于评估多模态大语言模型在多标准路线规划任务中的综合推理能力,发现当前模型在多模态推理方面存在显著挑战。
非自回归生成的离散随机定位
发表机构 * University of California Riverside(加州大学河滨分校) ; New York University(纽约大学)
AI总结 本文提出了一种名为离散随机定位(DSL)的连续状态框架,通过单位球体令牌嵌入实现最优去噪,从而在离散序列生成中提升分布忠实度,并展示了其在OpenWebText上的有效性。
发现隐式大语言模型对齐目标
发表机构 * Stanford University(斯坦福大学)
AI总结 本文提出Obj-Disco框架,通过自动分解对齐奖励信号为可解释的目标,解决现有方法的不足,验证了框架在多种任务和模型上的鲁棒性,并发现潜在的对齐偏差。
Comments ICML 2026
端到端语义ID生成用于生成式广告推荐
发表机构 * Tencent Inc.(腾讯公司) ; Wuhan University(武汉大学)
AI总结 本文提出UniSID框架,通过端到端优化广告数据中的嵌入和ID,直接将语义信息传递到ID空间,解决传统两阶段压缩方法的不足,并通过多粒度对比学习和基于摘要的广告重建机制提升ID的语义表达能力。
Comments Add the emails
Vendi Novelty Scores for Out-of-Distribution Detection
发表机构 * Lewis-Sigler Institute For Integrative Genomics, Princeton University(普林斯顿大学整合基因组学研究所) ; Department of Computer Science, Princeton University(普林斯顿大学计算机科学系)
AI总结 本文提出了一种基于Vendi Scores的Vendi Novelty Score(VNS)方法,从多样性角度解决分布外检测问题,该方法无需密度建模,具有线性时间复杂度和非参数特性,并在多个图像分类基准上实现了最先进的OOD检测性能。
通过响应方法实现交换遗憾最小化
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; Massachusetts Institute of Technology(麻省理工学院) ; University of Southern California(南加州大学) ; Google Research(谷歌研究)
AI总结 本文提出了一种更简单高效的算法,通过预处理后的约翰椭球,保证了线性交换遗憾为O(d√T),并建立了信息论下限,证明了经典算法在减少线性交换遗憾方面的最优性,同时扩展了该方法以处理多项式维度的交换偏差集。
Comments V3 makes certain clarifications and improves the upper bound for general sets via symmetrization
HealthMamba: 一种考虑不确定性的时空图状态空间模型用于有效可靠的医疗设施访问预测
发表机构 * Department of Computer Science, Florida State University(佛罗里达州立大学计算机科学系)
AI总结 本文提出HealthMamba,一种考虑不确定性的时空图状态空间模型,用于有效可靠的医疗设施访问预测。该模型包含三个关键组件:统一的时空上下文编码器、新的图状态空间模型GraphMamba以及综合的不确定性量化模块。实验结果显示,HealthMamba在预测准确性和不确定性量化方面分别比现有最佳基线提高了6.0%和3.5%。
Comments IJCAI 2026
FlashSinkhorn: GPU上的IO感知熵最优传输
发表机构 * Department of Mathematics \& Statistics, University at Albany, Albany, NY, USA ; Department of Mathematics ; Statistics, University of North Carolina at Charlotte, Charlotte, NC, USA ; Department of Computer Science, University at Albany, Albany, NY, USA ; IBM T.\ J.\ Watson Research Center, Yorktown Heights, NY, USA
AI总结 本文提出FlashSinkhorn,一种基于GPU的熵最优传输求解器,通过将稳定化的对数域Sinkhorn更新转换为行-wise的LogSumExp归一化,实现了与Transformer注意力相同的归一化方式,从而实现了FlashAttention风格的融合和分块处理,显著降低了HBMIO并保持线性内存操作。
LiteCoOp: 轻量级多语言模型共享树推理用于模型服务编译器优化
发表机构 * A lternative C omputing T echnologies ( ACT ) Lab(替代计算技术实验室) ; University of California San Diego(加州大学圣地亚哥分校)
AI总结 本文提出LiteCoOp,一种轻量级框架,通过将优化搜索树本身作为多语言模型协作机制,实现编译器优化过程中异构语言模型的协作,从而在降低编译成本的同时提升性能。
更丰富的贝叶斯最后层与子采样NTK特征
发表机构 * Mathematical Institute, University of Oxford(牛津大学数学研究所) ; Oxford-Man Institute, University of Oxford(牛津大学奥克斯曼研究所) ; OATML, University of Oxford(牛津大学OATML研究所) ; Department of Engineering, University of Cambridge(剑桥大学工程系)
AI总结 本文提出了一种改进贝叶斯最后层的方法,通过将神经切线核特征投影到由最后层特征张成的空间中,以更准确地估计不确定性,同时保持计算效率。
Comments Appearing in the Proceedings of the 43rd International Conference on Machine Learning, Seoul, South Korea. PMLR 306, 2026
通过大语言模型解决吉尔伯特-波拉克猜想
发表机构 * School of EECS, Peking University(北京大学电子工程学院) ; School of Mathematical Sciences, Peking University(北京大学数学科学学院) ; Center for Machine Learning Research, Peking University(北京大学机器学习研究中心) ; State Key Laboratory of General Artificial Intelligence, Peking University, Beijing, China(北京大学通用人工智能国家重点实验室) ; Carnegie Mellon University, Machine Learning Department(卡内基梅隆大学机器学习系)
AI总结 本文提出一种新的AI系统,通过生成受规则约束的几何引理并构建专用函数,以获得更紧的Steiner比下界,展示了大语言模型在高级数学研究中的强大潜力。
Comments 44 pages, 11 figures
一种用于学习基于能量的生成模型的扩散分类损失
发表机构 * CMAP, CNRS, École polytechnique, Institut Polytechnique de Paris, Palaiseau, France(CMAP、法国国家科学研究中心、巴黎高等理工学院、巴黎理工 institute、法国巴黎帕莱苏实验室) ; Center for Computational Mathematics, Flatiron Institute, New York, NY, USA(计算数学中心、Flatiron 机构、美国纽约纽约州) ; Department of Engineering, University of Cambridge, Cambridge, United Kingdom(工程系、剑桥大学、英国剑桥)
AI总结 本文提出了一种名为DiffCLF的扩散分类损失,用于学习基于能量的生成模型,通过将能量模型学习重新表述为跨噪声级别的监督分类问题,从而在保持计算效率的同时避免了模式盲区,提高了模型的保真度和应用范围。
Comments Accepted at ICML 2026
针对实值时间序列的软贝叶斯上下文树模型
发表机构 * Gunma University(群马大学) ; Waseda University(早稻田大学)
AI总结 本文提出了一种新的软贝叶斯上下文树模型(Soft-BCT),用于实值时间序列。该模型采用概率性分裂上下文空间,而非传统上下文树模型中确定性的上下文空间分裂。基于变分推断提出学习算法,实验结果表明Soft-BCT在某些数据集上优于传统上下文树模型。
基于训练轨迹的token选择
发表机构 * Zhejiang University(浙江大学) ; Hong Kong University of Science and Technology(香港科技大学)
AI总结 本文提出T3S方法,通过在token层面重构训练目标,清除未学习token的优化路径,从而在连续蒸馏中提升性能,实验表明在AR和dLLM设置中均取得显著效果。
Comments Accepted by ICML 2026
通过高效的高维稀疏傅里叶变换学习混合模型
发表机构 * Yale University(耶鲁大学) ; Princeton University(普林斯顿大学)
AI总结 本文提出了一种在高维空间中以多项式时间复杂度学习混合模型参数的方法,适用于具有重尾分布的混合模型,包括那些协方差有限的分布,且无需集群均值的最小分离。
基于证据的信任感知模型个性化在可穿戴物联网的去中心化联邦学习中
发表机构 * Quantum Cloud Computing and Distributed Systems (qCLOUDS) Lab(量子云计算与分布式系统实验室) ; School of Computing and Information Systems(计算与信息系统学院) ; The University of Melbourne, Australia(墨尔本大学)
AI总结 本文提出Murmura框架,利用证据深度学习实现去中心化联邦学习中的信任感知模型个性化,通过Dirichlet基于的证据模型中的epistemic不确定性直接指示节点兼容性,从而减少非IID条件下的性能下降并加快收敛速度。
Comments v2. Addressed minor reviewer concerns
静息神经元,主动洞察:通过自发性增强LLM中的激活稀疏性
发表机构 * IBM Thomas J. Watson Research Center, Yorktown Heights, USA(IBM 托马斯·J·沃森研究中心,美国Yorktown Heights) ; Halıcıoğlu Data Science Institute, UC San Diego, La Jolla, USA(哈利奇欧数据科学研究所,美国UC圣地亚哥La Jolla) ; Stony Brook University, Stony Brook, USA(史泰文·布鲁克大学,美国Stony Brook)
AI总结 本文提出了一种通过引入自发神经元(SPON)来增强LLM中激活稀疏性的方法,解决了高稀疏率下模型精度下降的问题,通过分布匹配训练SPON,使模型在稀疏计算中保持稳定和泛化能力。
Comments ICML 2026
梯度下降作为感知机算法:理解动态与隐式加速
发表机构 * Applied AI Institute, Moscow, Russia(应用人工智能研究所,莫斯科,俄罗斯)
AI总结 本文研究了梯度下降在神经网络训练中的优化动态和隐式加速现象,通过非线性模型分析显示梯度下降步骤等价于广义感知机算法,揭示了非线性模型在迭代复杂度上的优势。
WarmServe: 为多LLM服务实现一种多GPU预热
发表机构 * School of Computer Science, Peking University(北京大学计算机科学学院) ; Huawei Technologies Co., Ltd(华为技术有限公司)
AI总结 本文提出WarmServe系统,通过基于工作负载预测的多GPU预热技术,减少LLM服务中的尾部时间到第一个令牌(TTFT)并提高请求吞吐量。
Comments Accepted at ICML 2026
为扩散模型带来稳定性:分解和减少训练掩码扩散模型的方差
发表机构 * University of Cambridge(剑桥大学) ; Peking University(北京大学) ; Qwen Large Model Application Team, Alibaba(阿里巴巴通义大模型应用团队)
AI总结 本文研究了掩码扩散模型(MDMs)训练方差高导致不稳定的问题,通过分解方差来源并提出六种方差减少方法,显著提升了模型在复杂推理任务中的准确率,并将运行间变异性降低至自回归模型(ARMs)水平。
改进多臂老虎机问题的算法设计及更强的保证
发表机构 * Toyota Technological Institute at Chicago(芝加哥丰田技术研究所) ; University of Chicago(芝加哥大学) ; IDEAL Institute, Toyota Technological Institute at Chicago(IDEAL研究所,芝加哥丰田技术研究所)
AI总结 本文提出两种新的参数化老虎机算法家族,通过离线数据界定了学习近最优算法的样本复杂度,并在标准超参数调优基准上进行了实证评估。第一家族包含先前工作的最优随机算法,展示在满足额外凹性性质的臂奖励曲线下,可以实现更强的保证。第二家族算法在良好行为实例上保证最佳臂识别,在不良行为实例上退化为最坏情况保证。
Comments 36 pages
每瓦智能:衡量本地AI的智能效率
发表机构 * Stanford University(斯坦福大学) ; Together AI
AI总结 本文研究了本地AI在能源效率和性能上的表现,提出了一种统一的衡量指标IPW,展示了本地推理在重新分配需求方面的能力,并揭示了本地加速器的优化潜力。
SPECTRA: 用于不平衡分子属性回归的谱域感知图生成
发表机构 * University of Notre Dame, Dept. of Computer Science ; University of Notre Dame, Dept. of Chemistry ; University of Notre Dame, Lucy Family Institute for Data \& Society Notre Dame Indiana USA ; University of Notre Dame, Lucy Family Institute for Data \& Society
AI总结 本文提出SPECTRA方法,通过结合稀缺性感知预算方案、目标邻居图对齐和拉普拉斯谱插值,提升对相关但数据稀缺的分子属性值的预测能力,同时在相关目标范围内优于现有最先进方法,计算时间减少约4倍。
Flashlight: PyTorch 编译器扩展以加速注意力变种
发表机构 * Anonymous Institution, Anonymous City, Anonymous Region, Anonymous Country(匿名机构,匿名城市,匿名地区,匿名国家)
AI总结 本文提出Flashlight,一种基于PyTorch的编译器框架,能够自动生成融合的FlashAttention风格内核,支持任意注意力程序,无需静态模板或预定义内核专有化,从而在保持性能的同时提供灵活性。
一种基于KL正则化的学习规划框架:具有自适应先验的规划
发表机构 * LIACS, Leiden University, Leiden, The Netherlands(莱顿大学莱顿分校,荷兰) ; Google Deepmind, London, United Kingdom(谷歌DeepMind,英国伦敦) ; University of Oxford, Oxford, United Kingdom(牛津大学,英国牛津)
AI总结 本文提出了一种基于KL正则化的学习规划框架,通过将规划器的动作分布作为先验整合到策略优化中,提升了在高维连续控制任务中模型驱动强化学习的样本效率和长期性能。
Comments Published at ICML2026
ScaleDoc: 通过大规模文档集合进行基于大语言模型的谓词扩展
发表机构 * Tsinghua University(清华大学)
AI总结 本文提出ScaleDoc系统,通过将谓词执行分为离线表示阶段和优化的在线过滤阶段,解决了大规模文档分析中大语言模型高推理成本的问题,实现了端到端速度提升和LLM调用成本降低。
深度线性网络的熵公式
发表机构 * Division of Applied Mathematics, Brown University(布朗大学应用数学系) ; School of Mathematics, Institute for Advanced Study(高级研究院数学系) ; Department of Mathematics, Northwestern University(西北大学数学系)
AI总结 本文研究深度线性网络的黎曼几何,以建立学习过程的热力学描述。通过群作用分析过参数化,并利用参数空间到可观测空间的黎曼子流形,定义并计算玻尔兹曼熵。主要技术步骤是利用雅可比矩阵理论显式构造平衡流形的切空间正交基。
Comments Final version of accepted paper in SIAM Journal on Mathematical Analysis. Includes fixes of minor typos (especially equation (3.13), (6.35) and (6.36)
在一般化和$(L_0, L_1)$-光滑条件下加速梯度方法的近最优收敛性
发表机构 * Applied AI Institute, Moscow, Russia(应用人工智能研究所,莫斯科,俄罗斯)
AI总结 本文研究了在满足最近提出的$\ell$-光滑性条件的凸优化问题中的一阶方法。虽然加速梯度下降法(AGD)在$L$-光滑性下能达到最优复杂度$O(\sqrt{L} R / \sqrt{\varepsilon})$,但现有方法在$\ell$-光滑性下的扩展要么引入额外的初始梯度依赖,要么有指数因子$ L_1 R $,或者需要昂贵的辅助子程序。本文解决了这一开放问题,通过新的Lyapunov函数和设计新的算法,实现了$O(\sqrt{\ell(0)} R / \sqrt{\varepsilon})$的oracle复杂度,对于小$\varepsilon$和几乎任何$\ell$。例如,在$(L_0, L_1)$-光滑性下,我们的界$O(\sqrt{L_0} R / \sqrt{\varepsilon})$在小$\varepsilon$范围内被证明是最佳的,并去除了先前加速算法中所有非常数的乘法因子。
通过交叉验证的预测驱动校准实现可靠的无线室内定位
发表机构 * School of Electrical Engineering, Korea Advanced Institute of Science and Technology(韩国科学技术院电子工程学院) ; King’s Communications, Learning & Information Processing (KCLIP) Lab, Centre for Intelligent Information Processing Systems (CIIPS), Department of Engineering, King’s College London(伦敦国王学院信息与通信实验室,智能信息处理系统中心,工程系) ; Institute for Intelligent Networked Systems, Northeastern University London(伦敦东北大学智能网络系统研究所)
AI总结 本文提出一种利用有限校准数据同时优化预测器和估计合成标签偏差的方法,通过交叉验证预测驱动校准提高无线室内定位的可靠性。
NaviAgent: 一种基于图的双层规划用于可扩展的工具编排
发表机构 * Department of Electrical and Computer Engineering, The Ohio State University, USA(电气与计算机工程系,俄亥俄州立大学,美国)
AI总结 本文提出NaviAgent,一种基于图的双层规划框架,通过解耦任务规划与工具执行,提升大规模工具编排的可扩展性和鲁棒性,实验表明其在任务成功率和实际应用中表现优异。
Comments Accepted to ICML 2026
通过最小化优化器设计实现内存高效的LLM预训练
发表机构 * Department of Electrical and Computer Engineering, University of Minnesota, USA(电气与计算机工程系,明尼苏达大学,美国) ; School of Mathematics and Statistics, University of Sydney, Australia(数学与统计学学院,悉尼大学,澳大利亚)
AI总结 本文研究了如何通过简单的优化器设计改进,使SGD在预训练中达到最先进的性能,提出了SCALE优化器,在内存使用上比Adam更高效,并在多个模型上表现优于现有内存高效的优化器。
Comments Accepted at ICML 2026
深度变换器的两种失效模式及如何避免它们:初始化下信号传播的统一理论
发表机构 * International School of Advanced Studies (SISSA)(国际先进研究学校(SISSA))
AI总结 本文研究了深度变换器中自注意力层的两种失效模式——秩坍缩和熵坍缩,并提出了一种统一的信号传播理论,通过分析初始化对训练稳定性的影响,提供了一种计算训练性图的简单算法,以确定正确初始化超参数的选择。
FD-Bench: 一种模块化且公平的用于数据驱动流体模拟的基准测试
发表机构 * University of California, Los Angeles(加州大学洛杉矶分校) ; Meta ; University of Wisconsin–Madison(威斯康星大学麦迪逊分校)
AI总结 本文提出FD-Bench,一个模块化、公平、全面且可重复的数据驱动流体模拟基准测试,通过统一的实验设置评估85个基线模型,解决可重复性和可比性问题,为未来数据驱动流体模型的稳健评估奠定基础。
Comments 32 pages, 20 figures, paper accepted by KDD 2026
通过一种新型混合架构和特征选择协同效应推进表格性中风建模
发表机构 * Department of Computer Science and Engineering, Leading University, Sylhet 3112, Bangladesh(计算机科学与工程系,领先大学,锡尔het 3112,孟加拉国) ; DeepNet Research and Development Lab, Sylhet 3100, Bangladesh(深网研究与发展实验室,锡尔het 3100,孟加拉国)
AI总结 本文提出了一种数据驱动且可解释的机器学习框架,利用十种常规获取的 demographics、生活方式和临床变量,通过详尽的探索性数据分析、数据预处理和特征选择,构建出一个准确率达到97.2%的中风风险评估模型,显著优于现有模型。
关于边缘增强随机游走的统计估计
发表机构 * Department of Electrical Engineering and Computer Sciences(电气工程与计算机科学系) ; University of California at Berkeley(加州大学伯克利分校)
AI总结 本文研究了边缘增强随机游走初始边权重的统计估计问题,利用随机环境中的超几何高斯结构来分析估计器的样本复杂性。
Comments This is the full version of the conference paper in submission to ISIT 2025
通过核嵌入视角对正样本无标签数据的先验偏移估计
发表机构 * Polish Academy of Sciences(波兰科学院) ; Nicolaus Copernicus University(尼古拉·哥白尼大学) ; Warsaw University of Technology(华沙理工大学)
AI总结 本文研究了在目标无标签样本的先验分布估计问题,假设其可能与源群体不同,并且源数据部分可观察:只有正类样本和整个群体的样本可用(PU学习场景)。提出了一种新的直接估计先验分布的方法,避免了对两个群体后验概率的估计,并具有简单的几何解释。该方法基于分布匹配技术与再生核希尔伯特空间中的核嵌入,并作为优化任务的显式解获得。建立了其渐近一致性以及对其与未知先验偏差的显式非渐近界,该界在实践中可计算。通过合成和实际数据研究有限样本行为,证明该方法在性能上与竞争对手相当或更优。
内部叙事参数化情感状态
发表机构 * Applied Computational Psychiatry Lab(应用计算精神病学实验室) ; Max Planck UCL Centre for Computational Psychiatry and Ageing Research(马克斯·普朗克UCL计算精神病学与衰老研究中心) ; Queen Square Institute of Neurology and Mental Health(圣夸克广场神经病学与心理健康研究所) ; Neuroscience Department(神经科学系) ; Division of Psychiatry(精神病学系)
AI总结 本文通过量化参与者内部叙事的大语言模型表示及其子空间,研究了叙事与情感状态之间的关系,发现特定症状的描述性思维能够预测标准化的抑郁评分,并强调保持症状间的协方差对构建效度至关重要。
深度学习鲁棒矩阵补全用于大规模低秩数据恢复
发表机构 * School of Data, Mathematical, and Statistical Sciences and the Department of Computer Science, University of Central Florida(数据、数学与统计科学学院和计算机科学系,中央佛罗里达大学) ; School of Data, Mathematical, and Statistical Sciences, University of Central Florida(数据、数学与统计科学学院,中央佛罗里达大学) ; Damo Academy, Alibaba US(阿里云美国研究院)
AI总结 本文提出了一种可扩展且可学习的非凸方法,即学得鲁棒矩阵补全(LRMC),用于大规模鲁棒矩阵补全问题,该方法具有低计算复杂度和线性收敛性,并通过深度展开有效学习自由参数以实现最优性能,同时在合成数据集和实际应用中验证了其优越的实验性能。
稀疏正交参数调优用于持续学习
AI总结 本文提出了一种名为SoTU的新型方法,通过稀疏正交参数调优来解决持续学习中的灾难性遗忘问题,实现了对流数据的最优特征表示。
基于深度学习的模块化加载协议用于Bouc-Wen类模型参数估计
发表机构 * Department of Civil and Environmental Engineering, University of California, Berkeley, CA, United States(加州大学伯克利分校土木与环境工程系) ; Department of Civil Systems Engineering, Ajou University, Suwon, Republic of Korea(全州大学土木系统工程系)
AI总结 本文提出了一种基于深度学习的模块化加载协议,用于优化Bouc-Wen类模型的参数估计。该协议包含两个关键部分:最优加载历史构建和基于CNN的快速参数估计。每个部分被分解为独立的子模块,针对不同的滞回行为(基本滞回、结构退化和咬合效应),使协议能够适应多种滞回模型。三种独立的CNN架构被开发出来以捕捉这些滞回行为的路径依赖性。通过在多样化的加载历史上训练这些CNN架构,识别出最小的加载序列,称为加载历史模块,并将其组合以构建最优的加载历史。三种训练好的CNN模型用作快速参数估计器。协议的数值评估,包括三栋钢结构框架的非线性时间历史分析和三栋钢筋混凝土框架的脆弱性曲线构建,表明该协议显著减少了总分析时间,同时保持或提高了估计精度。该协议可扩展到其他滞回模型,表明了一种系统的方法来识别通用滞回模型。
为XAI的解释性策略机制
发表机构 * Institute of Philosophy and Sociology, Polish Academy of Sciences(哲学与社会学院,波兰科学院) ; Institute for Philosophy, Leiden University(哲学研究所,莱顿大学)
AI总结 本文提出了一种基于机制的解释性策略,旨在通过分解、定位和重组来揭示深度学习系统功能组织的机制,从而改进可解释人工智能的理论基础和实践应用。
ImProver:基于代理的自动证明优化
发表机构 * Carnegie Mellon University(卡内基梅隆大学)
AI总结 本文研究了自动证明优化问题,提出ImProver这一基于大语言模型的代理,用于重写证明以优化长度、可读性等任意标准,实验表明其能显著缩短证明并提高其模块化和可读性。
Comments Published as a conference paper at ICLR 2025
增强大语言模型中的因果推理:一种用于精确微调的因果归因模型
发表机构 * University of California, Irvine(加州大学尔湾分校) ; North Carolina State University(北卡罗来纳州立大学) ; Amazon(亚马逊公司)
AI总结 本文提出一种因果归因模型,通过精确微调提升大语言模型的可解释性和因果推理能力,展示了模型在不同领域中的因果发现任务中的有效性。
Comments A Python implementation of our proposed method is available at https://github.com/ncsulsj/Causal_LLM
改进的DDIM采样与矩匹配高斯混合模型
发表机构 * Independent Researcher(独立研究者) ; Apple(苹果公司)
AI总结 本文提出在DDIM框架中使用高斯混合模型作为反向转换操作符,通过约束GMM参数匹配DDPM前向边缘的矩,从而在少量采样步骤下提升生成样本质量,实验表明GMM核在FID和IS指标上优于传统高斯核。
Comments 34 pages, 12 figures; Accepted to TMLR; Code open sourced
TreeDQN: 一种用于组合优化的高效离策略强化学习方法
发表机构 * Sber AI Lab(Sber AI实验室) ; Laboratory for Theoretical Foundations of AI Models, HSE University(人工智能模型理论基础实验室,HSE大学)
AI总结 TreeDQN通过优化几何平均预期回报,提高了离策略强化学习在组合优化任务中的样本效率,并在合成任务和ML4CO竞赛中表现优异。
Comments Accepted in Knowledge-Based Systems