From Model Scaling to System Scaling: Scaling the Harness in Agentic AI
从模型扩展到系统扩展:扩展智能体AI中的“缰绳”
发表机构 * UC Berkeley(伯克利大学)
AI总结 本文提出智能体AI的下一个瓶颈是系统扩展而非仅模型扩展,通过设计可审计、持久、模块化和可验证的架构(称为“缰绳”),并研究上下文治理、可信记忆和动态技能路由三大瓶颈,以推动智能体行为从模型能力向长期任务执行转化。
从模型扩展到系统扩展:扩展智能体AI中的“缰绳”
发表机构 * UC Berkeley(伯克利大学)
AI总结 本文提出智能体AI的下一个瓶颈是系统扩展而非仅模型扩展,通过设计可审计、持久、模块化和可验证的架构(称为“缰绳”),并研究上下文治理、可信记忆和动态技能路由三大瓶颈,以推动智能体行为从模型能力向长期任务执行转化。
从多模态大语言模型中榨取能力用于主题驱动生成
发表机构 * University of Toronto & Vector Institute(多伦多大学及向量研究所) ; Adobe(Adobe公司) ; Google(谷歌公司)
AI总结 提出一种结合多模态大语言模型和VAE身份条件的方法,通过双层级聚合模块和多阶段去噪策略,在主题驱动图像生成中实现多模态理解与身份保持的平衡,优于现有方法。
Comments 33 pages, 18 figures, Project Page: https://zsh2000.github.io/squeeze-mllm-subject-gen/
Prism:面向可扩展多模态持续指令微调的插件式可复现基础设施
发表机构 * School of Artificial Intelligence, Nanjing University, China(南京大学人工智能学院) ; National Key Laboratory for Novel Software Technology, Nanjing University, China(南京大学新型软件技术国家重点实验室)
AI总结 针对多模态持续指令微调中工程瓶颈问题,提出Prism插件式代码库,通过轻量级插件注册机制分离算法开发与骨干实现,支持大规模训练流水线,实现可复现、可扩展的实验。
Comments Code is available at https://github.com/LAMDA-CL/Prism
循环扩散语言模型
发表机构 * KAIST(韩国科学技术院) ; KRAFTON(KRAFTON公司) ; University of California, Berkeley(加州大学伯克利分校)
AI总结 提出LoopMDM,通过选择性循环早期-中间Transformer层,在训练时实现深度缩放效果而不增加参数,在推理时通过调整循环次数灵活扩展计算量,从而提升掩码扩散模型的训练效率和性能。
Comments 23 pages
语言模型中的遗忘:容量、优化与自生成回放
发表机构 * New York University(纽约大学)
AI总结 本文研究了语言模型中的遗忘问题,发现自生成样本可作为有效的回放数据几乎消除遗忘,并揭示了容量限制和低学习率对遗忘的影响。
面向模型不确定性下鲁棒决策的目标驱动贝叶斯最优实验设计
发表机构 * Computing & Data Sciences, Brookhaven National Laboratory(布鲁海文国家实验室计算与数据科学部) ; Department of Electrical & Computer Engineering, Texas A&M University(德克萨斯农工大学电气与计算机工程系) ; Department of Computer Science & Engineering, Texas A&M University(德克萨斯农工大学计算机科学与工程系)
AI总结 提出GoBOED框架,通过结合变分后验代理与可微凸决策层,直接优化实验设计以提升下游决策质量,并理论证明其对决策无关参数方向不敏感。
DiscoverPhysics: 基准测试LLMs的即用型科学思维
发表机构 * Princeton University(普林斯顿大学) ; Boston University(波士顿大学) ; New York University(纽约大学) ; Flatiron Institute(Flatiron研究所) ; Institute for Advanced Studies(高级研究研究所)
AI总结 提出DiscoverPhysics交互式基准,通过让LLM代理探索物理定律偏离现实的模拟世界,评估其设计实验、修正假设和发现物理规律的能力。
用于偏好学习的主动查询合成
发表机构 * Georgia Institute of Technology(佐治亚理工学院) ; Gauss Labs(Gauss实验室)
AI总结 针对偏好学习中的查询反馈可靠性问题和池评估计算瓶颈,提出基于互信息最大化的连续空间主动查询合成框架Info-Synth,并扩展出两种有限池查询策略,在合成数据、文本摘要和机器人控制任务上验证了有效性。
Comments 27 pages, 12 figures
条件KRR:将无惩罚特征注入核方法及其在核阈值处理中的应用
发表机构 * Department of Mathematics, Nazarbayev University, Astana, Kazakhstan(纳扎尔巴耶夫大学数学系) ; Nazarbayev University Research Administration, Astana, Kazakhstan(纳扎尔巴耶夫大学研究行政部) ; Purdue University Fort Wayne, Indiana, USA(普渡大学枫林分校)
AI总结 本文通过将条件KRR简化为带残差核的KRR,理论分析了其统计性质,并展示了在核主成分和随机特征场景下优于标准KRR的条件。
Comments Accepted to ICML 2026
神经元随机注意力电路(NSAC)用于概率表示学习
发表机构 * Department of Automation, University of Science \& Technology of China, Hefei, China ; Institute of Artificial Intelligence, Hefei Comprehensive National Science Center
AI总结 提出一种受生物学启发的连续时间注意力架构NSAC,通过Ornstein-Uhlenbeck随机微分方程和NCP门控机制在logits上诱导高斯分布,实现概率输出与不确定性量化。
利用神经算子加速计算流体力学中的贝叶斯逆向设计
发表机构 * Department of Mechanical and Aerospace Engineering, University of Tennessee, Knoxville(机械与航空航天工程系,田纳西大学,诺克斯维尔)
AI总结 本文提出将神经算子代理模型嵌入MCMC采样循环,在保持后验结构的同时实现超过三个数量级的加速,用于计算流体力学中的贝叶斯逆向设计。
CITYREP:跨城市、任务和模态的城市表示统一基准
发表机构 * SpaceTimeLab, University College London, UK(伦敦大学空间时间实验室) ; DIMPact, University College London, UK(伦敦大学3DIMPact实验室) ; School of Resource and Environmental Sciences, Wuhan University, China(武汉大学资源与环境科学学院) ; State Key Laboratory of Information Engineering in Surveying, Mapping and Remote Sensing, Wuhan University, China(武汉大学测绘遥感信息工程国家重点实验室)
AI总结 提出CityRep基准,通过空间结构划分评估城市表示在不同模态、城市和任务上的性能,解决随机划分导致的空间泄漏和性能膨胀问题。
对数深度循环单元的长度泛化
发表机构 * Department of Computing(计算系) ; Imperial College London(帝国理工学院伦敦分校)
AI总结 提出MLP-LDRU(对数深度循环单元),通过并行约简近似循环,在21个正则语言任务中实现长度泛化,18个任务达到100%分布外准确率。
Comments 39 pages, 11 figures
一切尺度:具有连续超分辨率的尺度不变扩散
发表机构 * Department of Physics, Massachusetts Institute of Technology(麻省理工学院物理系) ; Department of EECS, Massachusetts Institute of Technology(麻省理工学院电子工程与计算机科学系) ; NSF AI Institute for Artificial Intelligence and Fundamental Interactions(国家科学基金会人工智能与基础相互作用研究所) ; Institute for Data, Systems and Society, Massachusetts Institute of Technology(麻省理工学院数据、系统与社会研究所)
AI总结 提出SKILD模型,通过尺度不变扩散统一图像生成与连续超分辨率,仅改变起始时间步即可实现不同任务。
Comments 29 pages, 17 figures
一种用于光片荧光显微镜的多模态3D基础模型实现少样本分割、分类和去模糊
发表机构 * Tri-Institutional Program in Computational Biology \& Medicine, Weill Cornell Medicine, New York, NY, USA Department of Radiology, Weill Cornell Medicine, New York, NY, USA Helen ; Robert Appel Alzheimers Disease Research Institute, Feil Family Brain ; Mind Research Institute, Weill Cornell Medicine, New York, NY, USA Graduate Program in Physiology, Biophysics ; Systems Biology, Weill Cornell Medicine, New York, NY, USA Cornell Tech, New York, NY, USA Institute for Intelligent Biotechnologies (iBIO), Helmholtz Center Munich, Neuherberg, Germany Institute for Stroke ; Dementia Research, Klinikum der Universität München, Ludwig-Maximilians University Munich, Munich, Germany
AI总结 提出一种基于掩码重建与图像-文本对齐联合优化的3D基础模型,在光片荧光显微镜数据上预训练,通过少样本适应显著降低标注成本并提升分割、分类和去模糊性能。
Comments 11 pages, 3 figures
智利服务条款中潜在滥用条款的检索增强检测
发表机构 * School of Computer Engineering, Pontificia Universidad Católica de Valparaíso(Pontificia Universidad Católica de Valparaíso计算机工程学院) ; Faculty of Law, Universidad Adolfo Ibáñez(Adolfo Ibáñez大学法学院)
AI总结 提出检索增强生成框架,结合混合稠密-稀疏检索与提示增强,用于自动检测和分类智利服务条款中的潜在滥用条款,并引入包含100份合同和10,029条标注条款的语料库,实验表明该方法显著提升性能,使本地模型接近云端系统。
Comments 42 pages, 6 figures, 9 tables
AdvantageFlow: 流模型中基于优势加权的强化学习最小二乘法
发表机构 * Adobe Research(Adobe研究)
AI总结 提出AdvantageFlow算法,通过优势加权前向过程预测损失和 rollout 策略正则化,在图像生成任务中优于Flow-GRPO和负感知微调基线。
低维子空间中的学习:强化学习的正交瓶颈
AI总结 提出一种在强化学习编码器特征中插入固定正交投影以约束低维子空间的简单先验,证明其在线性可实现性假设下保持表达能力,并在实验中显示价值表示可压缩至极低维度而不损失性能。
超越有限方差的随机梯度下降统计推断
发表机构 * Management Science and Engineering, Stanford University(斯坦福大学管理科学与工程系)
AI总结 针对随机梯度下降中梯度方差可能无限的问题,提出一种基于联合弱收敛和自正则化统计量的模型无关置信域构建方法,并通过子采样校准实现渐近有效推断。
因果方法在LLM开发与评估中的应用
发表机构 * Imperial College London(帝国理工学院伦敦分校) ; University of Toronto(多伦多大学)
AI总结 本文提出因果方法可解决LLM开发与评估中的关键因果问题,并系统梳理其在预训练、对齐、路由等环节的应用机会。
Comments Published in KDD 2026
部署完备的基准测试
发表机构 * School of Engineering, Institute of Science Tokyo(东京科学研究所工程学院)
AI总结 提出部署完备的基准测试框架,通过证据纤维和完成曲线量化基准证据是否足以确定部署行动,并证明仅靠分数不足以支持部署决策。
Comments 33 pages, 5 figures, 1 table; supplementary tables and code available
KAPLAN: 用于生存分析的Kolmogorov-Arnold可预测可学习激活网络
发表机构 * University of Cambridge(剑桥大学)
AI总结 提出KAPLAN-HR模型,利用B样条Kolmogorov-Arnold网络非参数估计条件风险函数,通过深层架构自动捕捉交互和时变效应,并证明其收敛速率仅依赖于表示平滑性,从而缓解维度灾难,在六个临床数据集上达到或超越现有方法。
Comments 9 pages, 3 figures, 13 supplementary pages. Submitted to NeurIPS 2026
一种用于认证点云和图分类的闭式持久性-地标管道
发表机构 * Data Science, George Washington University, USA(乔治华盛顿大学数据科学系) ; Department of Mathematical Sciences, Montana Technological University, USA(蒙塔纳技术大学数学科学系) ; Faculty of Computer and Information Science, University of Ljubljana, Institute IMFM, Slovenia(卢布尔雅那大学计算机与信息科学系,IMFM研究所,斯洛文尼亚) ; Biostatistics and Bioinformatics, George Washington University, USA(乔治华盛顿大学生物统计学与生物信息学系)
AI总结 提出PLACE管道,通过闭式公式从持久同调签名中分类点云和图,无需学习权重或校准,提供基于间隔的过量风险率、描述符选择规则和每个预测的认证。
Comments TMLR submission, https://openreview.net/forum?id=4kZxNlE5Ve. v2: variance-aware Pinelis-Bernstein certificate (radius iii) fires on 8/12 benchmarks (v1: not operational); MUTAG: empirical and population NC rules agree on 940/940 predictions. Matching-free nu-coherence replaces non-interference. Le Cam lower bound (Thm 3.2) recast PD-native, matching regime m<~R/D explicit
Fuzzy PyTorch: 深度学习模型的快速数值变异性评估
发表机构 * Department of Computer Science and Software Engineering(计算机科学与软件工程系) ; Concordia University(康科迪亚大学) ; Krembil Centre for Neuroinformatics(神经信息学克雷姆布里中心) ; Centre for Addiction and Mental Health(成瘾与心理健康中心) ; Camh
AI总结 提出Fuzzy PyTorch框架,通过集成随机算术和概率舍入实现深度学习模型数值变异性的快速评估,相比现有工具Verrou实现5至60倍加速,并支持从1到3.41亿参数的模型规模。
Comments 19 pages, 8 figures, Published in Transactions on Machine Learning Research (01/2026)
创意质量对齐:通过思维链微调实现专家隐性知识迁移
AI总结 本文通过低数据成本和小基模型的严格工程条件,实证验证了校准惊喜中的创意质量度量,并发现数据偏差,提出创意质量对齐方法及理论解释。
隐藏在明文令牌中:简单、鲁棒、无梯度的合成音频水印
发表机构 * Department of Computer Science, University of Maryland, College Park, USA(大学马里兰大学计算机科学系)
AI总结 本文利用离散化中的词汇冗余,提出一种无需微调或梯度的合成音频水印方法,通过社区检测缩减词汇表提升检测鲁棒性,在音频修改下仍保持高性能。
Comments Accepted to ICML 2026
在小于100M参数量化感知训练中映射调度策略与位宽边界
发表机构 * Dwarf A/S(Dwarf公司)
AI总结 通过大规模实验研究子100M参数解码器语言模型中,量化感知训练的最佳学习率调度是否依赖于位宽,发现INT6 QAT无需不同调度,INT4在50M以上需wd33调度,以下则噪声主导。
Comments 20 pages, 6 figures, 4 tables. 1345 training runs total (720 + 625). Submitted for review at TMLR
QUIET: 面向LLM创意生成能力的多空白级联故事完形填空基准
AI总结 提出QUIET基准,通过多空白级联故事完形填空和基于信息论的自动评分协议,客观评估大语言模型的创意生成能力。
Step-TP: 一个基于步骤级、带有思维链推理的 LLM 引导张量程序优化数据集
发表机构 * The University of Hong Kong(香港大学) ; University of Science and Technology of China(中国科学技术大学)
AI总结 为解决 LLM 在张量程序优化中缺乏可验证步骤级监督的问题,提出 Step-TP 数据集,通过结构化思维链推理和原子步骤监督实现可靠的多步优化。
小模型,强先验:参数高效神经PDE求解器的架构归纳偏置
发表机构 * Department of Mechanical Engineering and Applied Mechanics, University of Pennsylvania(宾夕法尼亚大学机械工程与应用力学系)
AI总结 提出WaveLiT架构,通过小模型(1-10M参数)利用小波多尺度先验实现参数高效,在多个PDE基准上媲美大100-1000倍的基础模型,并揭示先验失败模式可提供有用信号。
STaT: 通过三模态协同解决非平稳时间序列中的形状失真
发表机构 * Hefei University of Technology(合肥工业大学)
AI总结 提出STaT多模态架构,通过符号-时间-文本三模态对齐,在降低平均误差的同时减少形状失真,在8个基准上提升幅度指标达8.9%并降低形状失真达8.5%。
从潜在空间到训练数据:最小MLP中的可解释特化
发表机构 * ITIS Software, University of Malaga(马德里大学ITIS软件)
AI总结 研究最小单隐藏层MLP中隐藏神经元是否因训练偏差而特化,以及这种特化是否改善基于原型的训练数据重构,发现覆盖正则化能提高特化比并降低重构误差,而重叠惩罚会导致原型中心被推出凸包。
构建按家族和类型分类的对抗性恶意软件数据集:生成、逃避和投毒评估
发表机构 * Department of Information Security, Faculty of Information Technology, Czech Technical University in Prague(信息安全系,信息技术学院,布拉格捷克技术大学)
AI总结 基于RawMal-TF真实恶意软件数据集,使用对抗性生成器构建家族和类型标记的对抗性PE文件,评估逃避率和投毒攻击影响。
通过特定恐惧症数据迁移学习定量评估创伤后应激障碍的严重程度
发表机构 * MyndBlue ; DCS Corporation ; Human in Complex Systems Division, DEVCOM Army Research Laboratory(复杂系统人类研究部,DEVCOM陆军研究实验室)
AI总结 提出基于多元核密度估计的机器学习方法,利用心率与皮肤电导信号从特定恐惧症数据迁移学习,客观评估PTSD严重程度,分类准确率86%,平均绝对误差5.6。
Comments Submitted to a peer-reviewed journal, comments welcome
在学习者语料库上继续预训练是否能提高英语水平测试的自动作文评分?来自EFCAMDAT的证据
发表机构 * University of Greenwich(格林威治大学)
AI总结 研究通过在EFCAMDAT学习者语料库上进行领域自适应继续预训练(DAPT),探究其对基于Transformer的自动作文评分(AES)在英语水平测试中的影响,发现全语料库DAPT效果不一,而基于CEFR分级的针对性DAPT能更可靠地提升领域内评分性能。
Comments 16 pages, 3 figures, 10 tables, including references and appendices
通过约束多目标深度强化学习联合优化联邦边缘学习中的训练与推理
发表机构 * Department of Electrical and Computer Engineering, Concordia University(康科迪亚大学电气与计算机工程系) ; School of Automation, Guangdong University of Technology(广东工业大学自动化学院)
AI总结 提出一种在线优化框架,通过约束多目标深度强化学习算法C-MOPPO联合管理资源受限边缘设备上的联邦训练和推理,以在最小化延迟和能耗的同时最大化推理精度。
通用激活词化器:跨模型激活解释的统一框架
发表机构 * New Jersey Institute of Technology(新泽西理工学院) ; University of North Carolina at Charlotte(北卡罗来纳大学夏洛特分校) ; Cisco Research(思科研究) ; The Chinese University of Hong Kong, Shenzhen(香港中文大学(深圳))
AI总结 提出通用激活词化器(UAV)框架,通过共享解码器和轻量适配器将异构模型的隐藏表示转化为自然语言解释,支持跨模型家族和规模的激活词化,在分类、事实检索和要点总结任务中与强基线竞争。
Comments 23 pages, 11 figures, 11 tables
使用多模态深度学习预测盈利公告日的股价方向
发表机构 * ETH Zürich(苏黎世联邦理工学院)
AI总结 本研究结合基本面指标、技术指标和新闻情感,利用LSTM和Transformer模型预测盈利公告日的股价方向,发现Transformer在识别波动方面更敏感,且新闻情感有助于提升性能。
Merge-Bench: 使用大型语言模型解决合并冲突
发表机构 * Amazon(亚马逊) ; University of Washington(华盛顿大学)
AI总结 本文构建了包含7938个真实合并冲突的数据集Merge-Bench,并利用组相对策略优化(GRPO)训练LLMergeJ模型,在Java程序上以14B参数超越多数商业LLM,但最佳模型正确解决率仍低于60%。
Comments 14 pages, 7 figures
两层多物品订单履约的最优和阶最优门控优先级贪婪策略
发表机构 * Leonard N. Stern School of Business, New York University(纽约大学 Leonard N. Stern 商学院) ; Qiuzhen College, Tsinghua University(清华大学邱泽学院) ; Yau Mathematical Sciences Center & Department of Mathematical Sciences, Tsinghua University(清华大学姚数学科学中心及数学科学系)
AI总结 针对电商在两层分销网络中实时履约决策问题,提出门控优先级贪婪策略,证明其竞争比最优性,并通过数值实验验证性能。
基于共形化的不精确推断在有限数据下的鲁棒外推
发表机构 * Institute for Risk and Uncertainty(风险与不确定性研究所) ; University of Liverpool(利物浦大学)
AI总结 提出一种模型无关的共形化不精确推断框架,通过引入不精确性和距离感知,在分布偏移下保持覆盖并自适应扩展不确定性,实现有限数据下的鲁棒外推。
Comments 10 pages, 5 figures
无残差Transformer的量化优势
发表机构 * Australian Institute for Machine Learning, Adelaide University(澳大利亚机器学习研究所,阿德莱德大学) ; DATA61, CSIRO(DATA61,CSIRO)
AI总结 本文通过对比残差与无残差Transformer,发现残差连接导致激活值非高斯性增强,从而增加量化误差;而无残差Transformer通过正交初始化等技术保持近高斯激活值,显著提升低比特量化鲁棒性,揭示了精度与可压缩性之间的权衡。
Comments Under review
信任的时间依赖性:人机团队中的速度、准确性与cBCI神经解耦
发表机构 * School of Electronics, Electrical Engineering and Computer Science(电子工程与计算机科学学院) ; Queen's University Belfast(贝尔法斯特女王大学) ; School of Psychology(心理学学院) ; Liverpool John Moores University(利物浦约翰摩尔斯大学) ; School of Computer Science and Electronic Engineering(计算机科学与电子工程学院) ; University of Essex(埃塞克斯大学) ; Defence Science Technology Laboratory(国防科学技术实验室)
AI总结 本研究通过比较快速低准确率(FLA-AI)与慢速高准确率(SA-AI)两种AI助手,利用协作脑机接口(cBCI)和自适应黎曼Oracle,揭示了AI响应时间决定了团队失败机制:快速AI引发盲目服从,慢速AI导致延迟认知冲突,并通过混合融合方法有效提升了团队性能。
UNATE:用于晶体结构性质预测的无监督原子嵌入
发表机构 * GitHub
AI总结 提出UNATE框架,通过无监督去噪自编码器和自监督对比学习从无标签晶体结构中学习鲁棒原子表示,用于下游性质预测,在有限标签数据下提升高达10%。
当自我信念误导:面向可验证奖励的强化学习的主动标签获取
发表机构 * Meituan(美团) ; Beihang University(北京航空航天大学) ; Nanyang Technological University(新加坡国立大学)
AI总结 提出RLAVR框架,通过主动获取少量真实标签并与伪标签结合,利用CAG指标和CARE策略稳定训练并提升有限标注预算下的性能。
k折交叉验证的极小极大极限:多数投票算法
发表机构 * University of Haifa(海法大学) ; EPFL(苏黎世联邦理工学院)
AI总结 本文通过分析二元分类中多数投票算法的交叉验证均方误差,揭示了k折交叉验证的极小极大极限,证明当折数k随样本数n增长时,任何经验风险最小化算法的均方误差下界为Ω(√k/n)。
TIAR:基于轨迹信息的优势重加权用于大语言模型弃权学习
发表机构 * Department of Computer Science, The Pennsylvania State University(宾夕法尼亚州立大学计算机科学系)
AI总结 本文提出TIAR方法,利用GRPO中的多条轨迹作为自然弃权信号,动态重加权弃权奖励,在六个评估类别中的五个上取得最优弃权F1分数,同时保持基线准确率。
Comments 10 pages, 1 figure, 4 tables
几何演化图:从Transformer残差流中提取稳定概念探针
发表机构 * Independent Researcher(独立研究者)
AI总结 提出几何演化图(GEM)方法,通过追踪残差流中概念的方向轨迹并识别旋转停止的交接层,提取稳定的概念探针,在391个概念×模型对中优于峰值层探针的比例达66.2%。
Comments 24 pages, 3 figures. Reference implementation: rosetta_tools v1.3.1 (doi:10.5281/zenodo.20361433)
面向Kubernetes清单生成的上下文-工具数据蒸馏方法及实验评估
发表机构 * RTU MIREA(俄罗斯莫斯科RTU MIREA)
AI总结 提出上下文-工具数据蒸馏方法,通过合成生成和反向指令生成构建语料库,结合外部验证器过滤,在资源受限条件下微调1.5B参数小语言模型生成Kubernetes清单,实验表明严格输出格式比增加训练样本更关键。
Comments 15 pages, 4 figures, 2 tables
澄清、弃权或回答?基于信念增强生成的对话策略
发表机构 * University of Amsterdam(阿姆斯特丹大学) ; MCML Munich(慕尼黑MCML) ; LMU Munich(慕尼黑莱茵-魏尔堡大学)
AI总结 提出信念增强生成(BAG)方法,通过将大语言模型自身的信念状态注入提示,使其推理多个采样响应并决定对话策略(回答、澄清或弃权),从而提升多轮模糊问答的准确性和策略决策的忠实度。
带粗糙单轨迹信号的常微分方程的分支签名核求解器
发表机构 * Department of Mathematics, Florida State University(佛罗里达州立大学数学系) ; Department of Mathematics, Texas A&M University(德克萨斯大学阿姆斯特朗分校数学系) ; Department of Mathematics, Rutgers University(罗格斯大学数学系)
AI总结 针对由单个粗糙信号驱动的ODE,提出基于计数采样和核配置的分支签名核求解器,实现准确稳定的预测。
Comments 39 pages, 12 figures
关于高效成员推断脆弱性评估的可靠性
发表机构 * University of Helsinki(赫尔辛基大学) ; CISPA Helmholtz Center for Information Security(信息安全赫尔姆霍兹中心)
AI总结 本文揭示了高效成员推断攻击评估中两个关键缺陷:跨样本FPR未校准导致差分隐私审计不可靠,以及有限总体偏差导致样本脆弱性高估,并提出了后处理校准方法。
Comments 14 pages, 10 figures
几何自适应反事实分布学习与扩散引导平滑
发表机构 * Department of Statistics, Korea University(韩国大学统计系)
AI总结 针对高维反事实分布学习,提出两种基于扩散引导的几何自适应平滑估计器,通过有效维度降低误差,并在CelebA实验验证。
关于自由探索对多臂老虎机遗憾最小化的益处
发表机构 * Department of Mathematics, National University of Singapore(新加坡国立大学数学系) ; Department of Mathematics, Department of Electrical and Computer Engineering, National University of Singapore(新加坡国立大学数学系、电子与计算机工程系)
AI总结 本文研究在初始自由探索阶段后最小化累积遗憾的多臂老虎机问题,提出一种两阶段算法UFE-KLUCB-H,并证明其相比无自由探索的策略能严格减少遗憾。
Comments 55 pages
NPSolver: 具有迭代物理监督的神经泊松求解器
发表机构 * Gaoling School of Artificial Intelligence(高岭人工智能学院) ; Renmin University of China(中国人民大学) ; School of Mechanics and Engineering Science(力学与工程科学学院) ; Peking University(北京大学) ; AI for Science Institute(AI for Science研究院) ; University of Chinese Academy of Sciences(中国科学院大学)
AI总结 提出NPSolver,通过迭代物理监督(利用少量PCG步骤)训练无标签的神经泊松求解器,并引入边界感知Transolver架构,在2D/3D不规则几何上优于物理信息和数据驱动基线。
Comments kdd 2026
MDGMIX: 边界感知的子图混合用于多域图预训练
发表机构 * School of Computer Science(计算机科学学院) ; Technology, Xidian University, Xi’an, China(技术学院,西安电子科技大学) ; School of Artificial Intelligence, Xidian University, Xi’an, China(人工智能学院,西安电子科技大学)
AI总结 针对多域图预训练中的数据冗余问题,提出MDGMIX框架,通过边界感知子图混合与层次判别学习解耦共享和域特定模式,并在适配时使用轻量级提示加权机制,在少样本分类任务中优于强基线且效率更高。
Comments Accepted by ICML2026
通过交叉注意力激活投影实现扩散模型的概念遗忘
发表机构 * CSE, POSTECH(POSTECH计算机科学系) ; GSAI, POSTECH(POSTECH通用人工智能实验室)
AI总结 提出PURE方法,利用交叉注意力激活空间构建遗忘和保留基,通过线性投影编辑权重,在保持保留概念的同时有效消除目标概念。
基于不变量的消息传递权重共享
发表机构 * University of Bonn(波恩大学) ; Lamarr Institute for Machine Learning and Artificial Intelligence(拉马尔人工智能与机器学习研究院)
AI总结 提出一种基于图不变量的权重共享原则,通过直接根据图不变量索引权重,增强消息传递神经网络的结构感知能力,并在合成与真实数据上取得优于标准MPNN的效果。
Comments 13 pages main paper + 30 pages references and appendix
DeGRe: 密集监督的生成式重排序用于推荐
发表机构 * College of Software, Zhejiang University Hangzhou China ; Rajax Network Technology, Taobao Shangou of Alibaba Hangzhou China ; Rajax Network Technology, Taobao Shangou of Alibaba Beijing China ; State Key Lab of CAD\&CG, Zhejiang University Hangzhou China ; Rajax Network Technology, Taobao Shangou of Alibaba Shanghai China ; College of Software, Zhejiang University ; Rajax Network Technology, Taobao Shangou of Alibaba ; State Key Lab of CAD\&CG, Zhejiang University
AI总结 提出DeGRe框架,通过离线探索中的密集监督信号(Lookahead Evaluator)指导在线生成器(Online Generator)进行单步贪婪解码,解决重排序中的启发式标签偏差和信用分配问题。
Comments Accepted to KDD 2026 (ADS Track)
离线目标条件强化学习中的潜在表示对齐
发表机构 * Seoul National University(首尔国立大学)
AI总结 针对离线目标条件强化学习中价值函数错误泛化的瓶颈,提出潜在对齐价值学习(LAVL)算法,通过潜在表示价值泛化与分层规划的统一框架,在OGBench的22个数据集上20个取得最优性能。
Comments Accepted in ICML 2026
行为可信度三难困境:当校准自主性变得不可能
发表机构 * Future Computing Group University of Oulu(奥卢大学未来计算组) ; Department of Computer Science University of Helsinki(赫尔辛基大学计算机科学系)
AI总结 本文证明,在理性监督下,当某些任务超出智能体的可靠能力时,任何具有置信门控自主性的强化学习策略都无法同时实现最大帮助性、最优校准和完全自主性,即行为可信度三难困境。
Comments 48 pages, 3 figures
FLOATBench:浮式海上风力发电机塔架疲劳数据集与基准
发表机构 * Department of Mechanical Engineering(机械工程系) ; Massachusetts Institute of Technology(麻省理工学院) ; School of Engineering(工程学院) ; Brown University(布朗大学) ; CONSTRUCT, Faculty of Engineering University of Porto(CONSTRUCT,工程学院,葡萄牙波尔图大学) ; University of Aveiro(阿维罗大学)
AI总结 提出FLOATBench,一个包含582,120个疲劳损伤标签的表格基准,基于22 MW浮式风机塔架的高保真仿真,并引入工况感知的评估协议以检测随机划分无法发现的性能排名变化。
机器学习多尺度相互作用
发表机构 * Image Processing Group – Signal Theory and Communications Department(图像处理组——信号理论与通信系) ; Inorganic and Organic Chemistry Department and Institute of Theoretical and Computational Chemistry(无机和有机化学系及理论与计算化学研究所) ; Department of Physics and Materials Science(物理与材料科学系)
AI总结 提出多尺度结构集成(MuSE)层次模型,通过软粗粒化池化构建多尺度表示,与多种机器学习力场耦合,准确捕获跨尺度的量子力学相互作用。
PowLU: 一种用于LLM稳定预训练的激活函数
发表机构 * Ant Group(蚂蚁集团)
AI总结 提出PowLU激活函数,通过有理幂函数实现自适应非线性,解决SwiGLU在低精度LLM训练中的数值不稳定问题,在大规模训练中取得与SwiGLU和SwiGLU-Clip相当的性能并提升可扩展性。
Comments 17 pages, 7 figures, techreport
LLM应如何消费高质量数据?通过质量感知的功能缩放定律实现最优数据调度
发表机构 * Peking University(北京大学) ; Meituan(美团)
AI总结 本文通过引入数据质量维度扩展功能缩放定律,解析求解了联合数据质量和批次大小调度问题,揭示了高质量数据的双重角色,并提出了Drop-Stable-Rampup调度策略,在15B MoE模型上相比WSD和余弦衰减分别提升平均准确率+1.70和+2.98。
评估职业足球中的传球决策:一种增强的MPNN方法用于接球者选择
发表机构 * Department of Mathematics, Informatics and Geoscience(数学、信息学与地质科学系) ; University of Trieste(特里斯特大学) ; MathLab(数学实验室) ; International School for Advanced Studies (SISSA)(国际高级研究学校(SISSA)) ; Royal Belgium Football Association(比利时皇家足球协会)
AI总结 提出一种图神经网络框架,通过将场上交互建模为动态图来预测最佳传球目标,在接球者选择任务上达到竞争性准确率,并能在数秒内评估超过1000次传球。
不要重新训练,只需重用:从单目标扩散模型中恢复双目标分子
发表机构 * The Hong Kong University of Science and Technology (Guangzhou)(香港科技大学(广州)) ; Guangzhou University of Chinese Medicine(广州中医药大学)
AI总结 提出REUSE框架,通过层次化进化输入空间搜索,从冻结的单目标扩散模型中恢复双目标分子,无需重新训练或修改扩散过程,在双目标亲和力上提升20.9个百分点。
逐层Hessian迹的随机估计用于监测神经网络训练
发表机构 * ITMO University, St. Petersburg, Russia(圣彼得堡ITMO大学)
AI总结 提出一种随机估计器,通过Hutchinson迹估计与单次Hessian-向量积结合,在单次反向传播中无偏估计神经网络每层Hessian矩阵对角块的迹,并应用于检测标签记忆化阶段。
Comments 9 pages, 1 table
机会目标选择:面向查询高效黑盒对抗攻击的早期定向承诺
发表机构 * INSA Rouen Normandy(里昂-诺曼底理工学院) ; LITIS
AI总结 提出一种轻量级方法OTS,通过早期将无目标攻击切换为有目标攻击,锁定当前领先的非真实类,从而减少查询次数并提高成功率。
Comments 13 pages, 10 figures, 3 tables; code available at https://github.com/Tariolle/opportunistic-target-selection
具有精确图遗忘的闭式节点分类
发表机构 * Machine Learning Lab IIIT Hyderabad(IIIT Hyderabad 机器学习实验室)
AI总结 提出一种基于调整同配性的路由闭式框架,通过闭式求解器(SGC+Ridge回归或LCF-Net)匹配或超越图神经网络性能,并实现精确图遗忘的快速更新与隐私分析。
Comments 19 pages, 5 figures, 12 tables (7 main + 5 appendix)
StrTransformer: 面向无监督盲源恢复的源向结构化Transformer
发表机构 * PolyU
AI总结 提出StrTransformer框架,通过源向结构化Transformer分支和观测空间混合器直接优化潜在源矩阵,实现盲源恢复和分支潜在建模。
基于物理信息神经网络的3D磁场重建与映射
发表机构 * Xinxiang Medical University(新乡医学院) ; Institute of Particle and Nuclear Physics(粒子与核物理研究所) ; Henan Normal University(河南师范大学) ; Henan University of Urban Construction(河南城市学院) ; Shanghai Institute of Applied Physics(上海应用物理研究所) ; Chinese Academy of Sciences(中国科学院) ; State Key Laboratory of Dark Matter Physics(暗物质物理国家重点实验室) ; School of Physics and Astronomy(物理与天文学院) ; Key Laboratory for Particle Astrophysics and Cosmology (Ministry of Education)(粒子天体物理与宇宙学重点实验室(教育部)) ; Shanghai Key Laboratory for Particle Physics and Cosmology(上海粒子物理与宇宙学重点实验室) ; Scientific Model Research Group(科学模型研究组)
AI总结 提出一种物理信息神经网络(PINN)框架,通过将麦克斯韦方程直接融入损失函数并引入测量点物理残差损失,实现高精度3D磁场重建,仿真精度达10^{-4},实验精度达10^{-3}水平。
为每个行动投保:自主AI代理运行时精算控制的权威边界框架
发表机构 * Department of Risk Management and Insurance(风险管理与保险系)
AI总结 提出精算行动接口(AAI)和权威边界框架,通过确定性运行时合约对自主AI代理的副作用行动进行定价、门控和评估,实现跨领域的精算控制与基准测试。
Comments 35 pages, 4 figures, 11 tables. Companion paper on the mathematical foundations: SSRN 6761960
Transformer层与幂法之间的类比
AI总结 本文揭示了Transformer层中的操作(投影和层归一化,忽略前馈神经网络)与幂法步骤之间的类比,并证明通过层后token倾向于与该层输出权重矩阵和值权重矩阵乘积的主特征向量对齐,同时提出了一种将Transformer输出导向任意期望方向的方法。
法庭类比:不确定性感知分类的新视角
发表机构 * Department of Industrial and Systems Engineering, Korea Advanced Institute of Science and Technology(工业与系统工程系,韩国科学技术院)
AI总结 提出法庭类比框架,通过结构化混合狄利克雷分布建模分类中的不确定性聚合,并设计单次前馈神经网络MoDEX实现高效、可解释的不确定性量化。
Comments ICML 2026
激活稀疏性与平坦极小值之间的联系
发表机构 * State Key Laboratory for Novel Software Technology, Nanjing University(南京大学新型软件技术国家重点实验室) ; Institute of Brain-Machine Interface, Nanjing University(南京大学脑机接口研究院) ; School of Computer Science and Engineering, Southeast University(东南大学计算机科学与工程学院)
AI总结 本文发现损失景观的平坦性与Transformer中MLP激活稀疏性密切相关,通过理论推导和三种实用方法增强稀疏性,显著降低推理和训练成本。
学习具有范数约束神经网络的稀疏组合函数
发表机构 * Istituto Italiano di Tecnologia(意大利技术研究院) ; Università degli Studi di Genova(热那亚大学) ; MaLGa(MaLGa实验室) ; DIBRIS(迪布里兹实验室) ; CBMM(生物医学工程与机器人实验室) ; Massachusetts Institute of Technology(麻省理工学院)
AI总结 本文通过范数约束的深度神经网络,建立了学习稀疏组合函数的逼近率和过风险界,证明了深度网络能够利用层次表示避免维数灾难。
在不平衡EEG数据集中基于刺激重建的听觉注意力鲁棒解码
发表机构 * Key Lab of Modern Acoustics, Nanjing University(南京大学现代声学国家重点实验室) ; Horizon Robotics
AI总结 研究不平衡数据集对基于刺激重建的听觉注意力解码性能的影响,提出留一对包交叉验证协议以防止解码准确率膨胀。
DVAO: 面向多奖励强化学习的动态方差自适应优势优化
发表机构 * Alibaba Cloud Computing(阿里巴巴云 computing)
AI总结 针对多奖励强化学习中奖励组合导致训练不稳定、优势组合依赖静态超参数的问题,提出动态方差自适应优势优化方法,通过基于经验奖励方差动态调整组合权重,实现稳定训练与多目标帕累托前沿优化。
广义证据深度学习:从贝叶斯视角
发表机构 * School of Data Science, Fudan University, Shanghai, China(复旦大学数据科学学院,上海,中国)
AI总结 本文从广义贝叶斯框架出发,为证据深度学习建立理论基础,并提出统一可扩展的广义证据深度学习框架,在分类、不确定性估计和OOD检测上取得可比结果。
Comments Submitted to ICML2026
多项Logit模型的最优设计及其在最佳组合识别中的应用
发表机构 * Seoul National University, Seoul, Korea(首尔国立大学)
AI总结 针对多项Logit(MNL)模型,提出计算高效的最优实验设计框架,通过混合整数线性规划和多项式时间松弛方法实现统计效率与可扩展性,并应用于线性效用和非均匀收益下的最佳组合识别。
Comments Accepted at ICML 2026
基于折扣在线镜像梯度的非平稳广义线性老虎机
发表机构 * Seoul National University(首尔国立大学)
AI总结 提出DOMD-GLB算法,利用折扣在线镜像梯度处理非平稳广义线性老虎机,在保持O(1)每轮计算和内存成本的同时,实现动态遗憾界。
学习单细胞扰动预测的潜在动态因果过程
发表机构 * AIML, Adelaide University(AIML,阿德莱德大学) ; Responsible AI Research Centre(负责任人工智能研究中心) ; Monash University(莫纳什大学) ; University of New South Wales(新南威尔士大学)
AI总结 提出一种潜在动态因果生成模型(CITE-VAE),联合捕获潜在细胞程序、扰动条件机制和时间演化,实现单细胞扰动预测的分布外泛化。
Comments Accepted to SIGKDD 2026 AI4Science Track
基于流形分解的几何流匹配分子构象生成
发表机构 * The Hong Kong Polytechnic University(香港理工大学)
AI总结 提出GO-Flow方法,通过将生成过程分解为平移、旋转和构象三个物理子空间,利用流形上的最优传输和测地流,解决现有方法忽略分子几何层次结构的问题,实现高质量、高效率的分子构象生成。
RotMoLE:通过旋转门控机制增强混合低秩专家
发表机构 * Tsinghua University(清华大学) ; Beijing Information Science and Technology University(北京信息科技大学) ; National University of Singapore(新加坡国立大学) ; Hong Kong University of Science and Technology (Guangzhou)(香港科技大学(广州)) ; Beijing University of Posts and Telecommunications(北京邮电大学)
AI总结 针对MoE-LoRA中传统门控仅标量加权限制表示能力的问题,提出RotMoLE框架,通过引入旋转门控机制对每个专家进行旋转操作,提升专家利用率和专业化程度,在多任务和多语言训练中验证有效性。
从结构中无监督学习排列
发表机构 * Faculty of Engineering, Bar-Ilan University, Ramat Gan, Israel(巴伊兰大学工程学院,拉马特甘,以色列)
AI总结 提出熵自适应Gumbel-Sinkhorn方法,通过局部调节温度改善无监督排列学习的稳定性和质量。
BC协议:结构化双专家对话用于生成高质量思维链后训练数据
AI总结 针对大语言模型后训练中高质量专家思维链数据生产瓶颈,提出BC协议——一种结构化双专家引出方法,通过配对领域专家与知识工程师,系统外化专家隐性判断为自然语言推理链,实验证明其在推理过程自然性上具有压倒性优势。
Si'multaneous 'S'patial-'T'emporal Message Passing for Dynamic Graph Representation Learning
发表机构 * Department of Computer Science and Engineering(计算机科学与工程系) ; Indian Institute of Technology Gandhinagar(印度理工学院甘地纳加尔)
AI总结 提出SiST-GNN,通过在一个消息传递操作中融合空间和时间信号,实现动态图表示学习的联合推理,在链接预测任务上超越先前方法109%-277%。
TopoAlign:拓扑感知的视觉表示对齐
发表机构 * University of Utah(犹他大学) ; ETH Zürich(苏黎世联邦理工学院)
AI总结 提出TopoAlign框架,利用拓扑数据分析中的mapper图,通过联合力导向优化、自动结构匹配区域检测和基序查询,从拓扑角度比较不同模型或层的表示结构对齐。
基于语言和声学表征学习的多模态痴呆检测框架
发表机构 * Decision Support Systems Laboratory, School of Electrical and Computer Engineering, National Technical University of Athens(决策支持系统实验室,电气与计算机工程学院,国家技术大学雅典)
AI总结 提出一个端到端可训练的多模态深度学习框架,通过预训练模型提取声学和文本特征,结合注意力融合与互信息最大化,实现自动痴呆检测。
DeepSeekMath 遇见订单簿:面向高频方向性交易的组感知策略优化
发表机构 * Department of Computer Science(计算机科学系) ; Northwestern University(西北大学) ; School of Electrical and Computer Engineering(电气与计算机工程学院) ; Purdue University(普渡大学)
AI总结 本文通过将基于订单流的状态模型与策略梯度方法结合,研究限价订单簿上的高频交易强化学习,提出组感知策略优化方法,在回测中优于基于价值的 Q-learning 基线。
Comments 9 pages, 3 figures
从DPP到$k$-DPP:通过谱分解的可识别性分析
发表机构 * The Institute of Statistical Mathematics(统计数学研究所)
AI总结 通过谱分解研究行列式点过程(DPP)及其条件版本$k$-DPP的几何结构,揭示了$k$-DPP中谱参数和特征空间旋转参数的可识别性变化,并刻画了可识别性差距。
Comments 10 pages
SAE-FD: 面向大语言模型持续学习的稀疏自编码器特征蒸馏
发表机构 * The Hong Kong University of Science and Technology (Guangzhou)(香港科技大学(广州)) ; Nanjing University of Aeronautics and Astronautics(南京航空航天大学) ; The 63rd Research Institute, National University of Defense Technology, Nanjing(国防科技大学第六十三研究所,南京)
AI总结 针对持续学习中的灾难性遗忘问题,提出基于稀疏自编码器特征蒸馏的方法,通过将模型表示锚定在稀疏特征空间以减少表征纠缠,实现更精准的正则化,在多个基准上优于现有方法。
面向稀疏观测的正反PDE问题的引导流匹配:算法与理论
发表机构 * School of Mathematical Science(数学科学学院) ; Academy for Multidisciplinary Studies(多学科研究学院)
AI总结 提出FM4PDE流匹配生成框架,通过引导采样联合学习PDE系数与解分布,实现稀疏观测下的正向模拟与逆问题恢复,并提供误差保证。
Comments 50 pages, 8 figures, 4 tables
相对可修复性:一种基于校准的高稀疏度剪枝后分配诊断方法
发表机构 * Marquette University(马凯特大学) ; Tongji University(同济大学) ; Cornell University(康奈尔大学) ; UT Austin(得克萨斯大学奥斯汀分校)
AI总结 提出相对可修复性(RR)指标,通过校准数据比较层剪枝引起的原始激活失真与通道方差匹配修复后的残余失真,用于诊断高稀疏度下剪枝损伤的可修复性,实验表明其在架构依赖的可恢复性转变区域优于现有分配规则。
加速动态重要性加权与通用散度最小化估计器
发表机构 * The Institute of Statistical Mathematics(统计数学研究所) ; University of Bristol(布里斯托大学) ; RIKEN Center for Advanced Intelligence Project(RIKEN高级智能项目中心) ; The University of Tokyo(东京大学)
AI总结 针对联合分布偏移问题,提出加速动态重要性加权(ADIW)框架,通过轻量投影梯度下降和通用散度最小化,在提升效率的同时实现最优性能。
SafetyRepro: 对齐基准上的配置条件排名不稳定性
发表机构 * Northeastern University, Boston, MA, USA(东北大学) ; University of Illinois Urbana-Champaign, Urbana, IL, USA(伊利诺伊大学厄巴纳-香槟分校) ; Southern Methodist University, Dallas, TX, USA(南方 Methodist 大学)
AI总结 本文通过理论命题和提交戳评估协议,证明对齐基准上的成对模型比较结果(如“A比B更安全”)会因未指定的配置选择而发生严格反转。
JacQuant: 通过学习的雅可比替代实现无STE的量化感知训练
发表机构 * Meta AI
AI总结 提出JacQuant框架,通过学习模型对参数变化的局部敏感性的轻量级替代,在不使用直通估计器的情况下稳定和加速量化感知训练,在低比特大语言模型上达到更高精度。
通过Knockoff均值的Mean-Shift PCA
发表机构 * Department of Statistics and Data Science, Southern University of Science and Technology(统计与数据科学系,南方科技大学) ; Data Science, Southern University of Science(数据科学,南方科技大学) ; School of Data Science, The Chinese University of Hong Kong, Shenzhen, China(数据科学学院,香港中文大学(深圳))
AI总结 提出一种通过故意引入knockoff均值扰动来消除PCA中均值偏移噪声的方法,利用随机矩阵理论证明均值偏移尖峰与原始协方差特征值谱可分离,并设计了两阶段PCA算法。
Comments ICML 2026
从模拟到行动:后训练语言模型识别并回应自身生成
发表机构 * Institute for Advanced Study, Princeton(普林斯顿高级研究院) ; Anthropic
AI总结 本文发现后训练语言模型能够识别自身生成(on-policy)并降低输出熵,通过内部表示输入意外性来调节,且显式识别与隐式识别机制不同。
Comments Anthropic fellows project mentored by Jack Lindsey
理解图神经网络泛化能力的不同统计视角
发表机构 * Technical University of Munich(慕尼黑技术大学) ; Australian Institute for Machine Learning(澳大利亚机器学习研究所) ; Adelaide University(阿德莱德大学)
AI总结 本文从学习理论、无限参数/图渐近和随机图模型三个统计框架综述图神经网络泛化性的理论进展。
Comments 15 pages, 4 figures, submission for Special Issue in AStA Advances in Statistical Analysis
面向常规心电图广谱心血管评估的信号-语言基础模型
发表机构 * Department of Cardiology, Zhongshan Hospital of Fudan University(复旦大学中山医院心内科) ; Shanghai Institute of Cardiovascular Diseases, National Clinical Research Centre for Interventional Medicine(上海心血管病研究所,国家介入医学临床研究中心) ; Digital Medical Research Center, School of Basic Medical Sciences, Fudan University(复旦大学基础医学研究院数字医疗研究中心) ; Shanghai Key Laboratory of Medical Imaging Computing and Computer Assisted Intervention(上海医学影像计算与计算机辅助手术重点实验室) ; National Heart and Lung Institute, Imperial College London, Hammersmith Hospital, Du Cane Road(伦敦帝国学院国家心肺研究所,哈马舍姆医院,杜肯路) ; Department of Cardiology, Shanghai Geriatric Medical Center(上海老年医学中心心内科) ; Cardiac Rhythm Management, Medtronic Technology Center, Medtronic (Shanghai) Ltd.(美敦力技术中心,美敦力(上海)有限公司,心律管理部) ; Richard A. and Susan F. Smith Center for Outcomes Research in Cardiology, Beth Israel Deaconess Medical Center, Harvard Medical School(哈佛医学院比尔·德·阿克谢心脏结局研究中心,贝斯以色列·德aconess医疗中心) ; Harvard-Thorndike Electrophysiology Institute, Beth Israel Deaconess Medical Center, Harvard Medical School(哈佛-托尔恩迪克电生理研究所,贝斯以色列·德aconess医疗中心,哈佛医学院) ; Department of Cardiology, Imperial College Healthcare NHS Trust(伦敦帝国学院医疗信托心内科部) ; Department of Cardiology, Chelsea and Westminster NHS Foundation Trust(切尔西和温斯洛医院 NHS 基础信托心内科部) ; Department of Computer Science and Technology, University of Cambridge(剑桥大学计算机科学与技术系)
AI总结 提出ECGCLIP信号-语言对比学习框架,通过大规模心电图-报告预训练,在89项下游任务中超越基线,实现对常见心律失常、超声心动图靶标及罕见心脏病的广谱评估。
缺失非随机识别的扩散插补模型
发表机构 * KAIST(韩国科学技术院) ; Seoul National University(首尔国立大学)
AI总结 针对缺失非随机(MNAR)问题,提出缺失模式识别扩散插补模型(PRDIM),通过模式识别器和EM算法最大化联合分布似然,实现精确插补。
重新思考通用图异常检测中的特征对齐:一种基于关系指纹的方法
发表机构 * Griffith University, Gold Coast, Australia(格里菲斯大学,澳大利亚黄金海岸) ; Tongji University, Shanghai, China(同济大学,上海,中国)
AI总结 针对通用图异常检测中特征对齐忽略语义导致负迁移的问题,提出基于关系指纹的通用方法ReFi-GAD,通过编码上下文和结构异常指示线索的语义感知指纹,结合Transformer编码器和SNR引导的领域自适应模块,在14个数据集上显著超越现有方法。
Comments 9 pages, 7 figures. Accepted by ICML 2026
SeqRoute: 通过离线强化学习实现全局预算感知的顺序LLM路由
发表机构 * Department of Operations Research and Industrial Engineering(运筹学与工业工程系)
AI总结 提出SeqRoute框架,将多轮LLM路由建模为有限时域马尔可夫决策过程,通过离线强化学习(CQL)和事后预算重标记(HBR)学习延迟满足,在全局预算约束下优化成本与质量,降低破产率至1%以下。
捕获-校准-指导:基于图的知识监控估计与自适应反馈框架
发表机构 * Kyushu University(九州大学) ; Osaka Kyoiku University(大阪京都大学) ; South China Normal University(华南师范大学) ; Nagoya University(名古屋大学) ; Chubu University(楚博大学)
AI总结 提出Capture-Calibrate-Coach框架,通过异构图神经网络推断学习者未明确提及概念的知识状态,并基于元认知模式提供个性化反馈,在684名学生中预测潜在感知状态AUC达85.21%。
Comments To be published in Proceedings of the 27th International Conference on Artificial Intelligence in Education (AIED 2026)
利用卷积神经网络、程序化建模和轮廓映射的联合方法从人脸素描生成3D模型
发表机构 * Behaviour Digital
AI总结 提出一种结合卷积神经网络、参数化3D人脸模型和主动蛇形轮廓的新方法,首次通过训练CNN检测素描中的表情并生成对应3D模型。
Comments A thesis submitted in conformity with the requirements for the degree of Master of Science in Computer Science Graduate Department of Computer Science University of Toronto
EMA-Nesterov:稳定Nesterov前瞻以加速深度学习优化
发表机构 * University of Minnesota(明尼苏达大学) ; Amazon AGI(亚马逊人工智能实验室) ; The Chinese University of Hong Kong(香港中文大学)
AI总结 针对深度学习优化中Nesterov动量因随机梯度噪声和非凸损失导致的不稳定性,提出EMA-Nesterov方法,用参数更新的指数移动平均替代标准前瞻方向,通过低通滤波捕捉训练轨迹的低频趋势,在凸问题中保持理论加速收敛率,并在语言模型预训练中验证了其广泛适用性和优于现有前瞻方法的性能。
Comments 25 page, 10 figures
一种用于机会频谱接入中快速信道分配的上下文增强多玩多臂老虎机算法
发表机构 * School of Computer Science and Technology(计算机科学与技术学院) ; Xidian University(西安电子科技大学) ; Research and Development(研发) ; Hainayun IoT Technology Co., Ltd(海纳云物联网科技有限公司) ; Hainayun IoT Technology Ltd(海纳云物联网科技有限公司)
AI总结 针对机会频谱接入中的信道分配问题,提出一种上下文增强的多玩多臂老虎机算法,通过将信道噪声建模为奖励函数的扰动并利用信道状态信息作为上下文,分别针对线性和非线性相关性推导出两种索引策略,实现低遗憾和更合理的次优臂选择。
Comments Accepted by ISCC'24
ViroBench:病毒基因组学任务中的核苷酸基础模型基准测试
发表机构 * Shanghai Innovation Institute Shanghai China ; University of Electronic Science ; Fudan University Shanghai China ; Shanghai Artificial Intelligence Laboratory Shanghai China ; Institute of Infection ; Health Fudan University Shanghai China ; Shanghai Sci-Tech Inno Center for Infection \& Immunity Shanghai China ; Shanghai Jiao Tong University Shanghai China ; Shenzhen Loop Area Institute Shenzhen China ; Chinese University of Hong Kong Hong Kong China ; Westlake University Hangzhou China ; Shanghai Innovation Institute ; Fudan University ; Shanghai Artificial Intelligence Laboratory ; Shanghai Sci-Tech Inno Center for Infection \& Immunity ; Shanghai Jiao Tong University ; Shenzhen Loop Area Institute ; Chinese University of Hong Kong ; Westlake University
AI总结 提出首个针对病毒基因组学的综合基准ViroBench,评估66个核苷酸基础模型在生物学理解和潜在生物安全风险上的表现,发现模型在系统发育和时间偏移下性能下降,生成任务中统计似然与生物功能有效性脱钩,且预训练数据的分类多样性比参数规模更重要。
Comments 42 pages,15 figures
从图转移矩阵学习流形扩散半群
发表机构 * Department of Mathematics, Duke University(杜克大学数学系) ; Department of Mathematical Sciences, The University of Texas at Dallas(德克萨斯大学达拉斯分校数学科学系)
AI总结 本文提出通过迭代图转移矩阵直接逼近流形热半群,在低正则性假设下给出了无穷范数误差界,并实现了与图拉普拉斯方法相当的收敛速率。
不仅在哪里,而且何时:RLVR 的时间调度
发表机构 * University of Science and Technology of China(中国科学技术大学) ; Shanghai Innovation Institute(上海创新研究院) ; Wuhan University(武汉大学)
AI总结 针对强化学习可验证奖励(RLVR)中忽略策略行为异质性的问题,提出时间调度方法,通过动态调整信用分配标准来优化学习动态,实验表明该方法能提升训练稳定性和效率。
Comments Github: https://github.com/Jinghaoleven/RLVR-Schedule
基于预训练潜在空间中近似高斯混合结构的认证鲁棒性
发表机构 * CS & MINDS Johns Hopkins University(计算机科学与MINDS约翰霍普金斯大学) ; CIS University of Pennsylvania(计算机与信息科学宾夕法尼亚大学) ; AMS & MINDS Johns Hopkins University(人工智能与机器学习系约翰霍普金斯大学) ; ESE, Radiology & IDEAS University of Pennsylvania(工程科学与放射学系及IDEAS宾夕法尼亚大学)
AI总结 本文提出一个框架,利用预训练编码器将输入映射到近似高斯混合的潜在分布,通过理论分析证明鲁棒性退化有界,从而实现可认证鲁棒分类器,在CIFAR-10和ImageNet上达到最优或竞争性的认证准确率。
基于深度图拉普拉斯正则化的参数高效CT重建
发表机构 * Mechanical and Industrial Engineering Department(机械与工业工程系)
AI总结 提出深度图拉普拉斯正则化(Deep GLR)方法,通过将二次图正则化集成到近端前向-后向分裂优化框架中,仅用少量参数和数据即可实现低剂量CT重建的噪声抑制,在参数效率和数据效率上显著优于现有方法。
Comments 7 pages, 3 figures, conference
ERNIE-Image 技术报告
发表机构 * ERNIE Team, Baidu(百度ERNIE团队)
AI总结 提出基于8B单流DiT架构的开源文本到图像生成模型ERNIE-Image,通过自底向上的预训练数据构建和自顶向下的后训练数据构建,结合稳定DPO策略和MT-DMD蒸馏方法,在指令遵循、文本渲染和美学质量上接近顶级商业模型。
用于学习和规划的并行可微可达性:带认证的神经动力学与控制器
发表机构 * MIT(麻省理工学院)
AI总结 提出一种基于JAX的并行可微可达性框架,结合泰勒模型流形构建与CROWN线性界传播,支持GPU批处理和自动微分,并用于认证训练和可达性感知的MPC,在非抓取操作和四旋翼任务中实现在线规划与有界不确定性下的认证可达集过近似。
Comments Robotics: Science and Systems XXII (RSS 2026)
一种用于高效大语言模型的通用张量结构压缩方案
发表机构 * School of Physical Sciences, University of Chinese Academy of Sciences(中国科学院大学物理科学学院) ; Kavli Institute for Theoretical Sciences, University of Chinese Academy of Sciences(中国科学院大学理论科学研究院) ; Center for Quantum Physics and Intelligent Sciences, Department of Physics, Capital Normal University(首都师范大学量子物理与智能科学中心) ; Institute of Theoretical Physics, Chinese Academy of Sciences(中国科学院理论物理研究所)
AI总结 提出张量混合(MixT)方案,通过将密集线性层替换为张量算子混合体,在保持MMLU准确率的同时大幅减少参数、FLOPs和内存。
Comments 12 pages, 4 figures
CausalFlow: LLM Agent 失败的因果归因与反事实修复
发表机构 * Department of Computer Science University of California, Davis(计算机科学系加州大学戴维斯分校)
AI总结 提出CausalFlow框架,通过反事实干预计算步骤级因果责任分数,识别失败步骤并生成最小编辑修复,用于测试时修复和训练时监督,在多个基准上优于启发式方法。
UWM-JEPA:在信念空间中进行想象的世界预测模型
发表机构 * AgentField AI
AI总结 针对部分可观测环境,提出UWM-JEPA模型,通过密度矩阵潜变量和酉预测器在信念空间中保持联合状态谱,实现长时域盲推演下的不确定性保持,显著优于向量潜变量基线。
Comments 14 pages, 6 figures, 7 tables. Code and data: https://github.com/santoshkumarradha/uwm-jepa
电力消耗预测:一种使用SHapley加法解释的协作集成学习方法
发表机构 * Industrial & Systems Engineering Graduate Program (PPGEPS), Federal University of Technology-Parana (UTFPR)(工业与系统工程研究生项目(PPGEPS),联邦技术大学-巴兰(UTFPR))
AI总结 提出一种名为弱分离器增强器(WSB)的协作集成学习方法,结合LSTM、RF、SVR和XGBoost模型,利用SHAP进行特征选择,遗传算法和粒子群优化超参数,对巴西联邦学院两个校区未来12个月的电力消耗进行预测,取得较低误差。
当可解释性成为负担:针对CBM概念层的对抗攻击
发表机构 * Independent Researcher(独立研究者)
AI总结 本文系统研究了概念瓶颈模型(CBM)中概念层的对抗性脆弱性,提出了一种基于语义扰动的稳定性正则化防御方法SPECTRA,显著提高了攻击所需的最小扰动范数,同时保持了分类精度。
Comments Accepted to CVPR 2026 (Findings). 9 pages, 6 figures
广告、推荐和会员体验系统中存在干扰时的在线实验设计选择
发表机构 * Department of Mathematics(数学系) ; Embry-Riddle Aeronautical University(埃姆布里-瑞德尔航空航天大学)
AI总结 针对广告、推荐和会员体验系统中干扰机制未知的问题,提出一种基于鲁棒设计选择的框架,通过最坏情况规划风险比较六种可实施设计,并给出几何感知保证和有限目录近似定理。
标签-NTK 对齐与 NTK 区域中更紧的收敛界
发表机构 * Elmore Family School of Electrical and Computer Engineering(埃洛姆家族电气与计算机工程学院)
AI总结 通过标签与NTK特征谱的对齐特性,提出更紧的收敛界,显著改进经典最坏情况结果。
潜在Q-屏障屏蔽用于安全上下文强化学习
发表机构 * University of Virginia(弗吉尼亚大学)
AI总结 提出一种潜在Q-屏障屏蔽方法,通过学习上下文表示、潜在动力学和集成成本评论家,在部署时无需参数更新即可根据剩余预算和预测未来成本过滤或软重加权候选动作,从而改善安全上下文强化学习在分布外转移下的奖励-安全权衡。
首先,不伤害:打破媒体推荐中的自杀性回音室
发表机构 * E.T.S.I. Sistemas Informáticos (Universidad Politécnica de Madrid)(马德里理工大学信息系统工程系)
AI总结 针对推荐系统在心理健康场景中可能加剧用户自杀倾向的问题,提出RankAid重排序方法,通过惩罚有害内容并提升治疗性内容,在保持推荐准确性的同时确保临床安全。
Comments 10 pages, 5 figures. Research on safety-aware recommender systems and algorithmic ethics
从片段偏好反馈中学习基于核的MDP
发表机构 * Cornell University(康奈尔大学) ; MediaTek Research(联发科研究)
AI总结 本文研究片段核MDP中的偏好学习,提出基于偏好比较的价值估计和置信集方法,并证明亚线性遗憾界。
CoSPlay: 测试时协作自我博弈与自生成代码和单元测试
发表机构 * The Hong Kong University of Science and Technology (Guangzhou)(香港科技大学(广州)) ; Institute of Deep Perception Technology, JITRI, Wuxi, China(深度感知技术研究院,无锡,中国)
AI总结 提出CoSPlay框架,通过代码与单元测试的协作自我博弈,在无真实单元测试的情况下迭代优化两者,显著提升代码生成性能。
Comments Code is available at: https://github.com/sanae-ai/CosPlay | Data & log is available at: https://huggingface.co/datasets/yomi017/CosPlay
面向未知有效维度的实用贝叶斯优化的自动随机嵌入
发表机构 * Shanghai Institute of AI for Education, and School of Computer Science and Technology, East China Normal University(上海人工智能教育研究院,东华大学计算机科学与技术学院) ; Ant Group(蚂蚁集团) ; Nanjing University(南京大学)
AI总结 提出动态共享嵌入贝叶斯优化(DSEBO)方法,通过自动调整子空间维度并共享查询解,平衡近似与优化误差,在高维优化中显著降低遗憾和时间成本。
Comments This paper has been accepted by IJCAI 2026
凸组合推理模型
发表机构 * Mohamed bin Zayed University of Artificial Intelligence(莫扎德·本·扎耶德人工智能大学) ; Applied AI Institute(应用人工智能研究所) ; Computational Imaging Lab(计算成像实验室)
AI总结 针对组合推理中能量景观的非凸几何瓶颈,提出凸组合能量最小化框架,通过输入凸神经网络参数化因子并优化紧凸松弛,实现确定性投影一阶优化,在小问题上训练后可零样本迁移到大实例。
SCRIPT: 面向语言驱动的物理仿真人体控制的可扩展扩散策略与多阶段训练
发表机构 * ShanghaiTech University(上海科技大学) ; University of Pennsylvania(宾夕法尼亚大学) ; Stanford University(斯坦福大学)
AI总结 提出SCRIPT框架,通过联合动作-状态-文本扩散Transformer和多阶段训练(监督模仿预训练+混合奖励强化学习后训练),实现语言指令驱动的物理仿真人体控制,在文本对齐、运动质量和物理真实性上超越现有方法。
Comments Project page: https://zhanglele12138.github.io/SCRIPT/
TabPFN 是保险定价的银弹吗?
发表机构 * KU Leuven University of Antwerp-imec(根特大学安特卫普-imec) ; KU Leuven(根特大学) ; University of Antwerp-imec(安特卫普大学-imec)
AI总结 本文首次实证评估 TabPFN 在车险定价中的表现,与 GLM 和 XGBoost 对比,发现其性能不稳定、推理时间长且对上下文训练集大小敏感,目前无法替代传统精算方法。
PilotWiMAE:面向无线信道的导频原生表示学习
发表机构 * Center for Pervasive Communications and Computing, University of California, Irvine(加州大学尔湾分校普及通信与计算中心) ; Nokia and Universitat Pompeu Fabra(诺基亚与庞培法布拉大学)
AI总结 提出PilotWiMAE自监督框架,直接处理噪声导频观测,通过分解注意力机制和补丁归一化重构,在缩小观测空间的同时实现跨频段波束选择和信道表征,优于监督基线。
保守与非保守漂移模型的有限粒子收敛速率
发表机构 * Department of Statistics, University of California, Davis(加州大学戴维斯分校统计系)
AI总结 针对一步生成建模,提出保守漂移方法(用核密度估计梯度速度替代位移速度)并证明连续时间有限粒子收敛界,同时分析非保守方法(Laplace核)的对应速率。
TimeGuard: 面向时间序列预测中后门防御的通道式池化训练
发表机构 * College of Computing(计算学院) ; Data Science, Nanyang Technological University, Singapore(数据科学,新加坡南洋理工大学)
AI总结 针对时间序列预测中后门攻击防御难题,提出基于通道式池化训练的TimeGuard方法,通过时间感知池初始化与距离正则化损失选择缓解信号稀释与损失退化,显著提升鲁棒性。
Comments 44 pages, 30 figures. ICML 2026
ARC-STAR: 面向PDE基础模型的可审计事后修正
发表机构 * University of Illinois Chicago(伊利诺伊大学芝加哥分校) ; Beijing University of Posts and Telecommunications(北京邮电大学) ; North China Electric Power University(华北电力大学)
AI总结 针对PDE基础模型预测漂移且误差空间集中的问题,提出冻结求解器的事后修正框架ARC-STAR,通过全局修正、局部精炼和预算感知路由三阶段实现可审计、低误差的修正。
Comments 40 pages, including appendices
魔鬼在于条件数:为什么GLU优于非GLU结构?
发表机构 * State Key Laboratory of AI Safety, Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100190, China(人工智能安全国家重点实验室,计算技术研究所,中国科学院,北京100190,中国) ; School of Computer Science and Technology, University of Chinese Academy of Sciences, Beijing 101408, China(中国科学院大学计算机科学与技术学院,北京101408,中国) ; Beijing Academy of Artificial Intelligence (BAAI), Beijing, China(北京人工智能研究院(BAAI),北京,中国)
AI总结 通过神经正切核分析,发现门控线性单元(GLU)通过重塑核谱、减小条件数来加速优化收敛,而非主要降低泛化差距。
Comments Accepted by ICML 2026
通过全循环Transformer简单稳定循环
发表机构 * Hong Kong Baptist University(香港 Baptist 大学) ; Jilin University(吉林大学)
AI总结 针对循环Transformer在迭代次数增加时出现的训练不稳定性,提出全循环Transformer,通过全循环架构和注意力注入两种无参数修改,稳定训练至12次循环,下游任务性能提升最高13.2%。
ESI-Bench: 迈向闭环感知-动作的具身空间智能
发表机构 * Stanford University(斯坦福大学) ; UCLA(加州大学洛杉矶分校) ; Northwestern University(西北大学)
AI总结 提出ESI-BENCH基准,通过主动探索(感知、移动、操作)在OmniGibson环境中评估具身空间智能,发现主动探索显著优于被动方法,失败主因是动作盲视而非感知弱,且模型存在元认知差距。
Comments https://esi-bench.github.io/
SURGE: 扩散替代模型的近似与免训练粒子滤波
发表机构 * Department of Mechanical Engineering, Northwestern University, Evanston, IL, United States ; Institute for Computational \& Mathematical Engineering, Stanford University, Stanford, CA, United States ; Department of Industrial Engineering \& Management Sciences, Northwestern University, Evanston, IL, United States
AI总结 提出一种基于扩散模型的无偏粒子滤波方法,通过序列蒙特卡洛对扩散轨迹进行重加权和重采样,融合观测数据与模型模拟,实现状态估计的连续校正。
Comments accepted by ICML 2026
低活跃用户的不确定性校准推荐
发表机构 * Stanford University(斯坦福大学) ; ByteDance Inc.(字节跳动公司)
AI总结 提出一个生产就绪的框架,通过校准模型不确定性来为低活跃用户实施风险规避的去增强策略,为高活跃用户采用风险寻求的UCB策略,从而平衡推荐可靠性与多样性。
Comments Accepted to the Applied Data Science (ADS) track at the 32nd ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD 2026)
L-Drive:超越单一映射——潜在上下文驱动时间序列预测
发表机构 * Business University, Yantai, Shandong, China(山东商业大学) ; Ludong University, Yantai, Shandong, China(鲁东大学)
AI总结 针对分布偏移和机制变化导致直接映射范式在转折点响应滞后的问题,提出L-Drive框架,通过引入潜在上下文表征高层动态并利用门控调制增量表示,提升对变化段的适应能力,同时采用补丁共享相对位置基函数增强段内结构建模,实现预测精度与计算效率的更好平衡。
通过代理引导剪枝实现高效缩放定律估计的主动预算分配
发表机构 * The School of Computing and Information Systems, the University of Melbourne, Melbourne, Australia(墨尔本大学计算与信息系统学院) ; Royal Melbourne Institute of Technology, Melbourne, Australia(皇家墨尔本理工学院) ; Now at Google Australia(现就职于谷歌澳大利亚)
AI总结 提出结合连续减半与参数/非参数代理模型的主动预算分配方法,在显著降低计算成本(节省高达98.7%)的同时获得更优的损失-计算量前沿,实现精确的缩放定律估计。
Comments Accepted at ICML 2026
通用图后门防御:基于特征同质性的视角
发表机构 * The University of New South Wales(新南威尔士大学) ; University of Wollongong(沃林戈大学)
AI总结 针对图后门攻击,提出基于特征同质性视角的通用防御框架,通过邻居感知重构损失区分后门节点并采用鲁棒训练消除触发器影响。
Comments 17 pages, 6 figures
Judge Circuits
发表机构 * Technische Universität Berlin(柏林技术大学) ; BIFOLD – Berlin Institute for the Foundations of Learning and Data(柏林学习与数据基础研究院) ; German Research Center for Artificial Intelligence (DFKI)(德国人工智能研究中心) ; Fraunhofer Heinrich Hertz Institute(弗劳恩霍夫海因里希·赫茨研究所) ; Marburg University(马尔堡大学) ; Centre for European Research in Trusted AI (CERTAIN)(欧洲可信人工智能研究中心)
AI总结 本研究利用位置感知边归因修补(PEAP)因果分析Gemma-3、Qwen2.5和Llama-3的内部机制,发现结构化理解和开放式偏好任务中的判断共享一个稀疏、泛化的潜在评估子图,并通过解耦抽象判断与输出格式,揭示了格式诱导不一致性的机制原因。
Comments 39 pages
可组合晶体:通过概念学习实现可控材料发现
发表机构 * National University of Singapore(新加坡国立大学) ; Loyola Marymount University(洛桑玛丽蒙大学)
AI总结 提出基于概念组合的晶体生成框架,利用向量量化变分自编码器自动发现可重用晶体概念,通过概念重组实现可控的新晶体探索,在MP-20和Alex-MP-20上V.S.U.N指标提升最高53.2%和51.7%。
Crys-JEPA:通过嵌入筛选和生成精炼加速晶体发现
发表机构 * National University of Singapore(国立新加坡大学) ; Loyola Marymount University(洛约拉玛丽蒙特大学) ; New York University(纽约大学) ; AMI
AI总结 提出Crys-JEPA联合嵌入预测架构,通过能量感知的潜在空间和筛选-精炼流程,解决晶体生成中稳定性和新颖性的冲突,在MP-20和Alex-MP-20数据集上V.S.U.N.指标分别提升53.8%和72.7%。
数据难度与LLM微调中的泛化-外推权衡
发表机构 * IIIS, Tsinghua University(清华大学人工智能学院) ; College of AI, Tsinghua University(清华大学人工智能学院) ; Shanghai Qi Zhi Institute(上海启智研究院) ; Amazon AGI SF Lab(亚马逊AGI旧金山实验室)
AI总结 本文通过实证和理论分析,研究了监督微调中数据难度对模型行为的影响,发现数据难度与数据量共同决定泛化与外推之间的权衡,并存在最优难度随数据量增加而向更难数据偏移的规律。
Comments Accepted to ICML 2026
填补GAP:多模态大语言模型中视觉推理的粒度对齐范式
发表机构 * Qwen Large Model Application Team, Alibaba(阿里云大模型应用团队) ; Alibaba University of Waterloo(阿里大学水力学院) ; Vector Institute(向量研究所) ; Zhejiang University(浙江大学)
AI总结 提出GAP(粒度对齐范式),通过特征级、上下文级和能力引导级对齐,解决多模态大语言模型中视觉潜在推理的特征空间不匹配问题,提升感知与推理性能。
记忆定理而非实例:通过数学推理探究SFT泛化
发表机构 * Tsinghua Shenzhen International Graduate School(清华大学深圳国际研究生院) ; Huawei Technologies(华为技术)
AI总结 针对监督微调(SFT)损害推理泛化的问题,提出Theorem-SFT方法,通过显式定理应用训练,在多个基准上取得显著提升,并揭示前馈层是推理规则的主要存储位置。
基于全身毫米波扫描的非侵入性身体成分评估
发表机构 * Chair for Computer Aided Medical Procedures(计算机辅助医疗程序研究所) ; Technical University of Munich(慕尼黑技术大学) ; Munich Center for Machine Learning(慕尼黑机器学习中心)
AI总结 提出一种利用毫米波雷达扫描通过多任务学习回归身体成分指标的方法,在真实扫描中实现了内脏脂肪体积和体脂百分比的预测。
调制学习:每个客户端设备仅有一个样本的私有分布式回归
发表机构 * MIT(麻省理工学院)
AI总结 针对每个客户端仅有一个样本的分布式学习场景,提出一种通过注入校准噪声并共享后处理表示来实现隐私保护的全局模型学习方法,在期望上匹配非私有中心化梯度更新。
Comments 30 pages
稀疏令牌足矣:通过令牌感知梯度优化越狱音频语言模型
发表机构 * Wuhan University ; Institute for Math \& AI, Wuhan University ; Huazhong University of Science ; Shanghai Jiao Tong University ; Xidian University
AI总结 本文提出令牌感知梯度优化(TAGO)方法,通过仅保留高梯度能量的音频令牌对应的波形梯度,实现稀疏越狱攻击,在保持高成功率的同时大幅减少优化量。
Comments To appear in the 43rd International Conference on Machine Learning (ICML 2026)
高效偏好投毒攻击离线RLHF
发表机构 * Department of Electrical and Computer Engineering, University of California, Davis, Davis, CA, USA(加州大学戴维斯分校电气与计算机工程系) ; Department of Electrical and Computer Engineering, University of Iowa, Iowa City, IA, USA(爱荷华大学电气与计算机工程系)
AI总结 针对离线RLHF中的偏好投毒攻击,提出基于梯度字典的二进制稀疏近似方法(BAL-A和BMP-A),实现高效标签翻转攻击。
Comments Accepted to ICML 2026
从混合模型的角度重新思考大语言模型集成
发表机构 * Key Laboratory of New Generation Artificial Intelligence Technology(新一代人工智能技术关键实验室) ; Its Interdisciplinary Applications (Southeast University), Ministry of Education(交叉应用(东南大学),教育部) ; Southeast University(东南大学) ; Centre for Frontier AI Research (CFAR), Agency for Science, Technology(前沿人工智能研究(CFAR),科技研究局) ; Research (A STAR), Singapore(研究(A STAR),新加坡) ; Institute of High Performance Computing (IHPC), Agency for Science, Technology(高性能计算(IHPC),科技研究局)
AI总结 本文提出混合模型式集成(ME),通过将集成重新解释为混合模型,随机选择单个模型生成下一个token,避免显式计算完整集成分布,实现1.78x-2.68x加速,并揭示了集成与token级路由方法的联系。
Comments ICML 2026 Spotlight
复随机梯度下降与再生核希尔伯特空间中的方向偏差
发表机构 * Department of Mathematics University of California, Irvine, Irvine, CA 92697 USA(数学系,加州大学伊文斯顿分校,伊文斯顿,CA 92697,美国)
AI总结 本文提出复随机梯度下降(Complex SGD)方法,在无解析性约束下证明其收敛性,并验证方向偏差从实域扩展到复域,在复再生核希尔伯特空间中通过核回归有效恢复超振荡函数和Blaschke乘积。
通过功能归因的机制性异常检测
发表机构 * School of Computing and Information Systems, The University of Melbourne, Victoria, Australia(计算与信息系统学院,墨尔本大学,维多利亚,澳大利亚)
AI总结 将机制性异常检测重新定义为功能归因问题,利用影响函数测量测试样本与参考集之间的功能耦合,在视觉模型后门检测、大语言模型后门检测以及对抗样本和分布外样本检测中取得最优或显著改进。
Comments ICML '26 Camera Ready
$\pi$-Play: 通过特权自蒸馏实现的多智能体自对弈,无需外部数据
发表机构 * Institute of Automation, Chinese Academy of Sciences(中国科学院自动化研究所) ; School of Advanced Interdisciplinary Sciences, University of Chinese Academy of Sciences(中国科学院大学先进交叉学科学院) ; Meituan(美团) ; School of Artificial Intelligence, University of Chinese Academy of Sciences(中国科学院大学人工智能学院)
AI总结 提出$\pi$-Play框架,利用自对弈中生成的问答构建路径作为特权信息,结合自蒸馏实现密集反馈的多智能体协同进化,无需外部数据即可超越全监督搜索代理。
Comments 23 pages, 11 figures
从临床叙述中学习基于偏好的目标用于动态脓毒症治疗
发表机构 * Institute of Data Science, National University of Singapore, Singapore(新加坡国立大学数据科学研究所) ; National University Hospital, Singapore(新加坡国立大学医院) ; Saw Swee Hock School of Public Health, National University of Singapore, Singapore(新加坡国立大学 Saw Swee Hock 公共卫生学院)
AI总结 提出CN-PR框架,利用大语言模型从出院小结中提取轨迹级偏好,通过偏好优化学习奖励函数,在离线强化学习中改善脓毒症治疗结果。
学习分析中的时间辍学风险:跨动态与早期窗口表示的协调生存基准
发表机构 * Applied Data Science Program(应用数据科学项目) ; Eastern University(东部大学)
AI总结 本研究使用OULAD数据集,通过协调的生存分析基准(包括动态周表示和连续时间表示)评估辍学风险模型,发现时间行为特征比静态背景属性更具预测力。
Comments 34 pages, 14 figures, 18 tables. Includes appendix with reliability diagrams, sensitivity analyses, and dataset audit tables
具有不确定性感知输出长度预测的LLM推理调度
发表机构 * School of Computer Science, Wuhan University, Wuhan, China(武汉大学计算机学院) ; School of Computer Science, Central China Normal University, Wuhan, China(中央财经大学计算机学院) ; Dameng Database Co., Ltd., Wuhan, China(达梦数据库有限公司) ; School of Artificial Intelligence, Shanghai Jiao Tong University, Shanghai, China(上海交通大学人工智能学院) ; Institute for Math and AI, Wuhan University, Wuhan, China(武汉大学数学与人工智能研究院)
AI总结 针对LLM推理调度,提出基于对数t分布的输出长度分布模型,并设计Tail Inflated Expectation (TIE)指标替代点估计,以降低在线推理延迟并提高离线吞吐量。
Comments Accepted at ICML 2026
理解Adam在高度退化多项式上的收敛性
发表机构 * Institute of Natural Sciences, MOE-LSC, Shanghai Jiao Tong University(上海交通大学理论科学研究院) ; School of Mathematical Sciences, Shanghai Jiao Tong University(上海交通大学数学科学学院) ; Shanghai Seres Information Technology Co., Ltd, Shanghai 200040, China(上海塞瑞斯信息技术有限公司)
AI总结 本文研究Adam优化器在高度退化多项式上的自动收敛性质,推导局部渐近稳定性条件,证明其线性收敛速度优于梯度下降和动量法,并刻画超参数相图。
Comments Accepted to ICML 2026
混合量子神经网络用于多变量临床时间序列预测
发表机构 * Department of Diagnostics and Intervention, Radiation Physics, Biomedical Engineering, Umeå University, Sweden(诊断与介入部门,辐射物理,生物医学工程,乌梅大学,瑞典) ; Department of Naval, Electrical, Electronics and Telecommunications Engineering, University of Genoa, Italy(海军、电气、电子与电信工程部门,热那亚大学,意大利)
AI总结 提出一种混合量子-经典架构,将变分量子电路集成到循环神经网络中,用于多变量生理时间序列的多步预测,在BIDMC数据集上表现出与基线相当的精度和更强的鲁棒性。
NEST: 面向分布式深度学习的网络与内存感知设备放置
发表机构 * Georgia Institute of Technology(佐治亚理工学院) ; University of Washington(华盛顿大学)
AI总结 提出NEST框架,通过结构化动态规划统一模型并行、拓扑建模和内存可行性,在多种硬件和网络上实现高达2.43倍的吞吐量提升。
Comments Accepted to MLSys 2026
特征相似性:迈向对Transformer中类比推理的理论理解
发表机构 * Department of Information Engineering, The Chinese University of Hong Kong, Hong Kong(香港中文大学信息工程系)
AI总结 本文通过最小化Transformer抽象模型,从理论上证明联合训练和特定课程顺序能使实体在表示空间中对齐,从而通过特征相似性实现属性转移,即类比推理。
MultiPUFFIN:用于小分子性质预测的多模态领域约束基础模型
发表机构 * Department of Chemical Engineering, Norwegian University of Science and Technology (NTNU)(挪威科学与技术大学化学工程系) ; Faculty of Industrial Engineering, KU Leuven(鲁文大学工业工程学院) ; University of Surrey(萨里大学)
AI总结 提出多模态基础模型MultiPUFFIN,融合SMILES、2D图、3D构象及实验条件,通过条件感知精炼和热力学约束头,在小样本下优于ChemBERTa-2,预测小分子热物理性质。
从试错中学习:具身大语言模型的反思式测试时规划
发表机构 * Stanford University(斯坦福大学) ; Northwestern University(西北大学)
AI总结 提出反思式测试时规划方法,通过行动中反思和行动后反思两种模式,结合回溯性反思,使具身智能体在测试时进行自我纠正和经验积累,显著提升长程任务性能。
多模态晶体流:面向统一晶体建模的任意模态生成
发表机构 * Graduate School of AI, KAIST, Seoul, South Korea(韩国科学技术院人工智能研究生院,首尔,韩国) ; Materials Intelligence Lab, LG AI Research, Seoul, South Korea(LG AI研究所材料智能实验室,首尔,韩国)
AI总结 提出多模态晶体流(MCFlow),一种统一的多模态流模型,通过原子类型和晶体结构的独立时间变量实现多种晶体生成任务,并在MP-20和MPTS-52基准上达到与任务特定基线竞争的性能。
MARS:面向奖励建模的边界与语义感知数据增强
发表机构 * University of Arizona(亚利桑那大学) ; Northeastern University London(伦敦东北大学)
AI总结 提出MARS框架,通过优先增强低边界偏好对并利用语义距离细化,提升奖励模型质量和对齐性能。
所有泄漏都重要,有些泄漏更重要:LLM回测中可解释的时间污染检测与缓解
发表机构 * Department of Statistics and Data Science, Northwestern University(统计与数据科学系,西北大学) ; Bridgewater AIA Labs(布里奇沃特AIA实验室)
AI总结 提出基于Shapley值的声明级评估框架Shapley-DCLR和推理时架构TimeSPEC,用于检测和缓解LLM回测中的时间污染问题。
Comments 8 pages plus appendix
因子化潜在动作世界模型
发表机构 * University of Texas at Austin(德克萨斯大学奥斯汀分校)
AI总结 提出因子化潜在动作模型(FLAM),通过将场景分解为独立因子并学习各自的潜在动作,提升了无动作视频中多实体动态建模的准确性和视频生成质量。
Krause同步变换器
发表机构 * Shanghai Qi Zhi Institute(上海启智研究院) ; College of AI, Tsinghua University(清华大学人工智能学院) ; Shanghai Jiao Tong University(上海交通大学) ; California Institute of Technology(加州理工学院) ; University of Amsterdam(阿姆斯特丹大学)
AI总结 提出基于有界置信共识动力学的Krause注意力机制,通过局部化稀疏交互替代全局softmax归一化,缓解表示坍缩和注意力汇聚现象,实现线性复杂度并提升性能。
Comments ICML 2026, Project page: https://jingkun-liu.github.io/krause-sync-transformers/
多层级策略分类:通过晋升与降级动态激励改进
发表机构 * Electrical and Computer Engineering Department, University of Michigan, Ann Arbor, MI 48109, USA(密歇根大学电气与计算机工程系,安阿伯,MI 48109,美国)
AI总结 本文提出一种多层级晋升-降级框架,通过设计分类器阈值和难度递进来激励代理人诚实努力,并证明在温和条件下代理人可通过真实改进达到任意高水平。
Comments 9 pages, 4 figures, Accepted at ICML 2026
上下文展开赌博机:面向可验证奖励的强化学习
发表机构 * School of Computer Science and Engineering, Beihang University(北京航空航天大学计算机科学与工程学院) ; School of Artificial Intelligence, Beihang University(北京航空航天大学人工智能学院) ; Huawei(华为)
AI总结 针对RLVR中展开使用无差别、短视导致的问题,提出上下文赌博机框架,自适应选择高价值展开,提升训练效率与性能。
基于可重构非线性处理单元的物理模拟Kolmogorov-Arnold网络
发表机构 * NanoElectronics Group, MESA+ Institute and BRAINS Center for Brain-Inspired Computing, University of Twente(纳米电子组、MESA+研究所和脑启发计算中心、代尔夫特理工大学) ; CAES Group and BRAINS Center for Brain-Inspired Computing, University of Twente(CAES组和脑启发计算中心、代尔夫特理工大学)
AI总结 提出一种基于可重构非线性处理单元(RNPU)的物理模拟KAN架构,通过硬件实现可编程非线性变换,在回归和分类任务中以更少参数达到与MLP相当的精度,并实现约10²-10³倍能效提升和约10倍面积缩减。
F-GRPO: 别让你的策略学到显而易见的而忘记罕见的
发表机构 * T-Tech
AI总结 针对强化学习中有限采样组导致罕见正确轨迹被忽略的问题,提出基于Focal loss的难度感知缩放系数F-GRPO,在不增加组大小和计算成本下提升数学推理性能。
使用TensorGalerkin学习、求解和优化PDE:一种高效的高性能Galerkin组装算法
发表机构 * ETH Zurich, Switzerland(苏黎世联邦理工学院,瑞士) ; Imperial College London, UK(伦敦帝国学院,英国) ; Northeastern University, USA(东北大学,美国) ; Renmin University of China, China(中国人民大学,中国)
AI总结 提出基于Galerkin离散化的统一算法框架,通过张量化元素操作和稀疏矩阵乘法实现O(1)图规模的系统组装,高效求解、约束优化和物理信息学习变分PDE。
通过扩散最后一层的生成式神经算子
发表机构 * Korea University, Seoul, South Korea(韩国大学,首尔,韩国) ; Carnegie Mellon University, Pittsburgh, USA(卡内基梅隆大学,匹兹堡,美国)
AI总结 提出扩散最后一层(DLL)作为神经算子的概率输出头,通过Karhunen-Loéve展开和系数空间的条件扩散模型实现高效分布建模,在随机PDE基准和确定性长时滚动任务中提升了分布保真度和不确定性估计。
Comments ICML 2026, code is available at https://github.com/sungwpark/dll-no
面向边缘AI系统的可扩展可解释性即服务(XaaS)
AI总结 提出可解释性即服务(XaaS)分布式架构,通过解耦推理与解释生成、语义缓存、轻量验证和自适应引擎,在边缘设备上实现低延迟、高保真的可解释性,并在三个实际用例中降低38%延迟。
Comments 8 pages, 5 figures, 2 tables. This version updates metadata after publication in IEEE Xplore and publication by SoutheastCon 2026
CPMobius: 无数据强化学习的迭代式教练-玩家推理
发表机构 * Tsinghua University(清华大学) ; University of Cambridge(剑桥大学) ; Shanghai Jiao Tong University(上海交通大学)
AI总结 提出CPMobius协作式教练-玩家范式,通过无外部数据的合作优化循环提升数学推理能力,在Qwen2.5-Math-7B-Instruct上总体准确率提升4.9%,OOD准确率提升5.4%。
Comments Accepted to the ICML 2026
无奖励的冲突目标对齐
发表机构 * Columbia University(哥伦比亚大学)
AI总结 提出RACO框架,通过冲突规避梯度下降的裁剪变体直接利用成对偏好数据解决多目标冲突,实现帕累托最优对齐。
Comments Accepted to ICML 2026 (Oral)
PolySAE: 通过多项式解码建模稀疏自编码器中的特征交互
发表机构 * The Cyprus Institute(塞浦路斯研究所) ; University of Athens(雅典大学) ; University of Oxford(牛津大学) ; Archimedes AI/Athena Research Center(阿基米德AI/雅典娜研究中心) ; University of Cyprus(塞浦路斯大学)
AI总结 提出PolySAE,在稀疏自编码器解码器中引入高阶项以建模特征交互,通过低秩张量分解在共享投影子空间上捕获成对和三元特征交互,在保持可解释性的同时提升探测F1约8%,并产生与共现频率无关的组合结构。
Comments 43rd International Conference on Machine Learning (ICML 2026); Code: https://github.com/pakoromilas/PolySAE
通过课程选择与反课程促进优化上下文纠缠内容分割
发表机构 * Duke University(杜克大学) ; Adobe(Adobe公司)
AI总结 提出CurriSeg双阶段学习框架,结合课程学习与反课程学习原理,通过动态数据选择与频谱盲性微调提升上下文纠缠内容分割的鲁棒性和泛化能力。
Comments ICML 2026, 8 figures, 11 tables
EvoEGF-Mol:用于基于结构的药物设计的演化指数测地流
发表机构 * Lingang Laboratory(Lingang 实验室) ; School of Information Science(信息科学学院) ; Technology, ShanghaiTech University(技术,上海科技大学)
AI总结 针对基于结构的药物设计中欧几里得空间与概率空间不匹配的问题,提出EvoEGF-Mol模型,通过复合指数族分布和演化指数测地流统一表示分子,实现高几何精度和相互作用保真度。
Comments Accepted to ICML 2026
通过多表示生成增强统一多模态模型的理解能力
发表机构 * Tsinghua Shenzhen International Graduate School, Tsinghua University(清华大学深圳国际研究生院,清华大学) ; AMAP, Alibaba Group(阿里妈妈,阿里巴巴集团) ; Shanghai Jiao Tong University(上海交通大学) ; Southern University of Science and Technology(南方科技大学)
AI总结 提出UniMRG方法,通过辅助生成像素、深度和分割等多重表示,增强统一多模态模型的理解能力,减少幻觉并提升空间理解。
Comments Code: https://github.com/Sugewud/UniMRG
安全强化学习中的分布偏移下的安全泛化:一个糖尿病测试平台
发表机构 * Department of Computer Science, University of Virginia(弗吉尼亚大学计算机科学系)
AI总结 研究安全强化学习算法在分布偏移下训练时安全保证能否迁移到部署中,使用糖尿病管理作为测试平台,发现安全泛化差距并通过测试时屏蔽有效恢复安全性。
Comments Accepted at ICML 2026. Camera-ready version
可解释且无需反向传播的绿色学习用于高效多任务超声心动图分割与分类
AI总结 提出一种无需反向传播的多任务绿色学习框架,通过无监督VoxelHop编码器与多级回归解码器及XG-Boost分类器,在EchoNet-Dynamic数据集上实现左心室分割与射血分数分类,以极低参数量达到高精度。
Comments Accepted for publication in APSIPA Transactions on Signal and Information Processing. Jyun-Ping Kao and Jiaxing Yang contributed equally to this work. C.-C. Jay Kuo and Jonghye Woo are the senior authors
PiXTime: 一种跨节点异构数据联邦时间序列预测模型
发表机构 * University of Science and Technology of China(科学技术大学)
AI总结 提出基于Transformer的PiXTime框架,通过参数解耦架构(局部个性化模块+全局共享骨干)处理异构时间序列,实现联邦学习中的异构数据预测,并在多个基准上达到最优性能。
一种用于快速量热器模拟的通用视觉变换器
发表机构 * Centre for Cosmology, Particle Physics(宇宙学、粒子物理与现象学研究中心) ; Marietta Blau Institute for Particle Physics (MBI Vienna), Austrian Academy of Sciences (ÖAW), Austria(玛丽埃塔·布劳粒子物理研究所(MBI维也纳),奥地利科学院(ÖAW),奥地利)
AI总结 本研究基于CaloDREAM架构,提出使用视觉变换器(ViT)进行快速量热器模拟,在规则和不规则几何结构及多个探测器上均表现出高精度和可扩展性,生成时间在单GPU上为10-100毫秒,并通过预训练和微调降低了训练成本并提高了数据效率。
Comments 44 pages, 17 figures, 8 tables; journal version. Mach. Learn.: Sci. Technol (2026)
极端值森林火灾预测:序数方案中损失函数的研究
AI总结 提出首个序数分类框架预测火灾严重等级,研究损失函数设计对预测极端事件的影响,发现加权卡帕损失在极端类别上IoU提升超过0.1。
Comments Following external reviews, we identified major methodological issues in the manuscript, including insufficient justification of the ordinal clustering strategy, limited statistical validation, ambiguities in dataset splitting, and missing comparisons with standard ordinal approaches. We therefore request withdrawal in order to prepare a substantially revised version
进化物理信息时间融合用于换道意图预测
发表机构 * Tandon School of Engineering(工程学院) ; New York University(纽约大学) ; Khoury College of Computer Science(计算机科学学院) ; Northeastern University(东北大学) ; School of Business(商学院) ; Wake Forest University(威克森林大学) ; Independent Researcher(独立研究者) ; University of Massachusetts Amherst(马萨诸塞大学阿默斯特分校) ; Carnegie Mellon University(卡内基梅隆大学) ; University of Pennsylvania(宾夕法尼亚大学) ; Qualcomm CDMA Technologies(高通CDMA技术) ; University of Michigan(密歇根大学)
AI总结 提出一种进化物理信息时间融合框架,通过融合从传统交通信号导出的时间描述符和从原始轨迹序列学习的时间嵌入,实现三分类换道意图预测,在highD和exiD数据集上取得高F1分数。
多模态功能最大相关用于情感识别
发表机构 * Key Laboratory of Child Development and Learning Science (Ministry of Education), School of Biological Sciences and Medical Engineering, Southeast University(儿童发展与学习科学重点实验室(教育部)、生物科学与医学工程学院、东南大学) ; Department of Artificial Intelligence, Westlake University(人工智能学院、西湖大学) ; Department of Artificial Intelligence, Vrije Universiteit Amsterdam(人工智能学院、阿姆斯特丹自由大学)
AI总结 提出多模态功能最大相关(MFMC)框架,通过双重总相关目标最大化高阶多模态依赖,在情感识别基准上取得最先进性能。
Comments manuscript accepted by IEEE Transactions on Affective Computing. Code is available at https://github.com/DY9910/MFMC
自回归语言模型实际上是能量模型:对下一个词元预测的预见能力的洞察
发表机构 * Google DeepMind(谷歌深Mind)
AI总结 本文通过建立自回归模型与能量模型之间的双射,揭示了自回归模型在下一个词元预测范式下具备预见能力,并提供了理论误差界。
用于端元提取的高光谱图像数据降维
发表机构 * Department of Mathematical and Systems Engineering, Shizuoka University(数学与系统工程系,静冈大学)
AI总结 针对高光谱图像端元提取计算成本高的问题,提出一种基于线性混合模型和纯像元假设的数据降维技术,去除混合像元,保留近端元像元,并结合线性规划自字典方法,在不牺牲提取精度的前提下显著降低计算时间。
Comments 37 pages, code is available at https://github.com/tomohiko-mizutani/REDIC
FuXi-Nowcast:环境条件深度学习用于强对流临近预报
发表机构 * Jiangsu Meteorological Observatory(江苏省气象台) ; Jiangsu Key Laboratory of Severe Storm Disaster Risk / Key Laboratory of Transportation Meteorology of CMA(江苏省 severe storm disaster risk key laboratory / 国家气象局交通运输气象重点实验室) ; FuXi Intelligent Computing Technology Co., Ltd.(FuXi 智能计算技术有限公司)
AI总结 提出环境条件深度学习系统FuXi-Nowcast,结合高分辨率观测与三维大气预报,在12小时内预测复合反射率、降水、阵风及地表变量,优于业务数值、持续性和外推基线。
多对齐对比学习用于酶-反应检索
发表机构 * Renmin University of China(中国人民大学) ; DP Technology(DP科技)
AI总结 提出多对齐对比学习框架,通过联合建模酶-反应跨域兼容性及功能注释驱动的域内关系,并引入Gromov-Wasserstein正则化项,提升酶虚拟筛选和双向检索性能。
通过稀疏后训练实现内在可解释的注意力机制
发表机构 * MPI-IS(马克斯·普朗克研究所) ; University of Oxford(牛津大学) ; ETH Zürich(苏黎世联邦理工学院)
AI总结 提出一种后训练方法,通过约束损失下的灵活稀疏正则化,在不牺牲性能的前提下将Transformer注意力连接稀疏至约0.4%,从而简化全局电路并提升可解释性。
结合领域知识和可行性约束的可操作且多样化的反事实解释
发表机构 * Faculty of Physics, Astronomy and Applied Computer Science, Institute of Applied Computer Science, Jagiellonian Human-Centered AI Lab(物理、天文与应用计算机科学学院,应用计算机科学研究所,雅盖隆人机中心AI实验室)
AI总结 提出DANCE方法,通过建模特征依赖和领域约束生成可操作、多样化的反事实解释,在OpenML数据集和工业邮件营销场景中验证了其有效性和实用性。
理解、加速和改进MeanFlow训练
发表机构 * Yonsei University(延世大学) ; ETH Zurich(苏黎世联邦理工学院) ; University of Zurich(苏黎世大学) ; Max Planck ETH CLS(马克斯·普朗克ETH CLS) ; Google(谷歌)
AI总结 通过分析瞬时速度与平均速度的相互作用,提出一种加速瞬时速度形成并逐步转移训练重点的有效训练方案,实现更快的收敛和更优的少步生成性能。
BackWeak: 使用弱触发器和微调简单后门知识蒸馏
发表机构 * School of Computer Science and Artificial Intelligence(计算机科学与人工智能学院) ; Wuhan University of Technology(武汉科技大学)
AI总结 提出BackWeak方法,通过微调教师模型嵌入弱触发器实现后门攻击,无需替代学生模型或模拟蒸馏,在标准蒸馏过程中可靠转移至不同学生架构。
平坦极小值与泛化:来自随机凸优化的见解
发表机构 * Blavatnik School of Computer Science and AI, Tel Aviv University(塔夫茨大学Blavatnik计算机科学与人工智能学院) ; Google Research(谷歌研究)
AI总结 本文在随机凸优化框架下研究平坦极小值与泛化的关系,发现平坦经验极小值可能产生Ω(1)的总体风险,而尖锐极小值泛化最优,并证明两种锐度感知算法(SA-GD和SAM)也可能泛化不佳。
具有可学习聚合权重的拜占庭鲁棒联邦学习
发表机构 * Uppsala University, Sweden(瑞典乌普萨拉大学) ; KTH, Sweden(瑞典皇家理工学院)
AI总结 提出一种将聚合权重作为可学习参数联合优化的拜占庭鲁棒联邦学习优化问题,并开发了交替最小化算法,在异构数据和恶意客户端场景下优于现有方法。
Comments ICLR 2026
FairJudge: 文本到图像模型中公平性与对齐评估的弃权感知多模态裁判
发表机构 * Queen Mary University of London(伦敦玛丽女王大学) ; Institut Jožef Stefan(乔泽夫·斯蒂芬研究所) ; Imperial College London(伦敦帝国学院)
AI总结 提出FairJudge协议,利用多模态大语言模型作为结构化裁判,通过封闭标签、弃权机制和证据报告,在文本到图像模型中实现社会属性预测、职业定位和提示-图像对齐的公平性评估。
基于排序的置换不变嵌入的定量界
发表机构 * Department of Mathematics, University of Maryland(马里兰大学数学系) ; Institute of Mathematical Sciences, Claremont Graduate University(克莱姆森研究生大学数学科学研究所)
AI总结 研究通过排序独立一维投影得到的置换不变嵌入,改进了注入性所需嵌入维度的上下界,并给出了双Lipschitz常数的估计,其失真度与点数n的平方成正比且与维度d无关。
Comments Minor revision; 37 pages, 1 figure, 2 tables
连接地球与太空:面向非地面网络的HAPS综述
发表机构 * Universitat Politècnica de València(瓦伦西亚理工大学) ; University of Padova(帕多瓦大学) ; Universitat Pompeu Fabra(庞培法华大学) ; Carleton University(卡尔顿大学)
AI总结 本文综述了高空平台站(HAPS)在6G非地面网络中的用例、技术及集成策略,强调了其在扩展覆盖、动态回传、大规模物联网和低延迟通信中的关键作用。
Comments 43 pages. This work has been submitted to IEEE for possible publication (under review)
$Δ\mathrm{Energy}$: 优化视觉-语言对齐过程中的能量变化提升OOD检测与OOD泛化
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; Shanghai Artificial Intelligence Laboratory(上海人工智能实验室)
AI总结 本文提出ΔEnergy分数,通过重新对齐视觉-语言模态时的能量变化来同时提升分布外检测和分布外泛化性能,并基于此开发了统一微调框架EBM。
Comments Accepted by NeurIPS2025
FG-CLIP 2: 一种双语细粒度视觉-语言对齐模型
发表机构 * AI Research(360人工智能研究院)
AI总结 提出FG-CLIP 2双语视觉语言模型,通过区域-文本匹配、长描述建模和文本内模态对比损失等细粒度监督,在英中双语上实现细粒度对齐,在29个数据集上取得最优结果。
Comments Accepted in ICML2026
通过早期经验进行智能体学习
发表机构 * Meta Superintelligence Labs(Meta超智能实验室) ; FAIR at Meta(Meta的FAIR部门) ; The Ohio State University(俄亥俄州立大学)
AI总结 提出早期经验范式,利用智能体自身动作生成的交互数据(无需奖励信号)通过隐式世界建模和自我反思两种策略提升智能体在多样化环境中的效果和跨域泛化能力。
Comments ICML 2026
DeepEN: 一种用于重症监护中个性化肠内营养的深度强化学习框架
发表机构 * Institute of Data Science(数据科学研究所) ; Saw Swee Hock School of Public Health, National University of Singapore, Singapore(Saw Swee Hock公共卫生学院,新加坡国立大学,新加坡) ; National University Hospital, Singapore(新加坡国立医院)
AI总结 提出DeepEN框架,利用深度强化学习从电子健康记录中学习个性化肠内营养方案,在MIMIC-IV数据集上相比临床实践降低绝对死亡率4.0个百分点。
XRPO:通过定向探索与利用突破GRPO极限
发表机构 * University of Illinois Urbana–Champaign(伊利诺伊大学厄巴纳-香槟分校) ; Carnegie Mellon University(卡内基梅隆大学)
AI总结 提出XRPO框架,通过自适应探索分配器、上下文种子策略和新颖性感知优势机制,在数学和编码基准上实现比GRPO最高4% pass@1和6% cons@32的提升,并加速训练收敛达2.7倍。
vAttention: 验证的稀疏注意力
发表机构 * Electrical Engineering and Computer Sciences, University of California, Berkeley(加州大学伯克利分校电气工程与计算机科学系)
AI总结 提出vAttention,通过统一top-k和随机采样,实现首个具有用户指定(ε, δ)近似精度保证的实用稀疏注意力机制,显著提升质量-效率权衡。
基于局部神经算子的分布式参数系统无方程粗粒度控制
发表机构 * Hopkins Extreme Materials Institute and Department of Chemical and Biomolecular Engineering, Johns Hopkins University(霍普金斯极端材料研究所和化学与生物分子工程系,约翰霍普金斯大学) ; Dipartimento di Matematica e Applicazioni ”Renato Caccioppoli”, Università degli studi di Napoli Federico II(Renato Caccioppoli数学与应用系,那不勒斯费德里克二世大学) ; Department of Chemical and Biomolecular Engineering and Department of Applied Mathematics and Statistics, Johns Hopkins University(化学与生物分子工程系和应用数学与统计学系,约翰霍普金斯大学)
AI总结 提出一种数据驱动方法,利用局部神经算子学习短时解算子,结合Krylov子空间方法计算稳态和降阶模型,实现无显式粗粒度方程的高维分布式参数系统控制。
Comments 8 pages, 2 figures
HEAPr: 基于Hessian的输出空间中高效原子专家剪枝
发表机构 * School of Software Technology, Zhejiang University(浙江大学软件学院) ; FABU Inc.(FABU公司) ; Hangzhou Kuaidi Science and Technology Co., Ltd.(杭州快的科学技术有限公司)
AI总结 针对MoE模型粗粒度专家剪枝导致精度下降的问题,提出HEAPr算法,通过将专家分解为原子专家并利用二阶信息(最优脑外科原理)评估重要性,在输出空间简化计算,实现高比例无损压缩。
Comments ICLR 2026
接下来会发生什么?通过生成点轨迹预测未来运动
发表机构 * Visual Geometry Group, University of Oxford(牛津大学视觉几何组)
AI总结 提出一种基于单张图像预测未来运动的方法,通过生成密集轨迹网格来捕捉场景动态和不确定性,相比现有方法更准确多样,并验证其在机器人等下游任务中的有效性。
通过残差量化为预排序阶段配备目标注意力机制
发表机构 * Taobao \& Tmall Group of Alibaba Hangzhou China ; Shanghai Jiao Tong University Shanghai China ; Xidian University Xi'an China ; Taobao \& Tmall Group of Alibaba Beijing China ; Taobao \& Tmall Group of Alibaba ; Shanghai Jiao Tong University ; Xidian University
AI总结 提出TARQ框架,利用残差量化在预排序阶段近似目标注意力架构,首次在延迟关键阶段引入TA建模能力,实现精度与效率的新最优平衡。
Comments 5 pages, 2 figures, accepted by SIGIR 2026 Short Paper Track
介观结构介质中冲击传播的时空多场深度学习
发表机构 * Lawrence Livermore National Laboratory(劳伦斯利弗莫尔国家实验室)
AI总结 提出多场时空模型(MSTM),通过训练多尺度多物理场数据,同时演化七个耦合热力学和动力学场,以高精度预测冲击传播中的异常响应,实现1000倍加速。
Comments 25 pages, 12 figures
朝向认知忠实决策模型以改善AI对齐
发表机构 * Duke University(杜克大学) ; IIT Delhi(德里印度理工学院) ; CMU(卡内基梅隆大学)
AI总结 提出一种基于公理的方法,从成对比较中学习认知忠实的决策过程,以解决标准偏好诱导方法未能捕捉人类决策认知过程的问题,并在肾脏分配任务中验证了模型的有效性。
Comments In ICLR 2026
紧致状态空间上的神经随机微分方程:理论、方法及其在自杀风险建模中的应用
发表机构 * Wellesley College(韦尔斯利学院) ; Harvard University(哈佛大学)
AI总结 针对生态瞬时评估数据中随机微分方程违反域约束和训练不稳定的问题,提出一种新型表达性SDE,通过约束漂移和扩散确保解在紧致多面体状态空间内,并引入参数化映射任意动力学为满足约束的SDE,在真实数据上提升预测和优化性能。
Comments Accepted at the Symposium on Probabilistic Machine Learning (ProbML) 2026, and at the Methods and Opportunities at Small Scale (MOSS), ICML 2025, Vancouver, Canada
DASH:一种用于合成有效且隐蔽的对抗样本的元攻击框架
发表机构 * University of Maine(缅因大学) ; University of Florida(佛罗里达大学) ; University of Tennessee, Knoxville(田纳西大学,基洛纳)
AI总结 提出DASH元攻击框架,通过多阶段自适应组合Lp约束攻击方法,生成有效且感知对齐的对抗样本,在多个数据集上优于现有方法。
Comments Accepted to CVPR 2026
优化代码水印的令牌选择:一种强化学习方法
发表机构 * The Pennsylvania State University(宾夕法尼亚州立大学)
AI总结 提出CodeTracer框架,通过强化学习训练策略模型智能选择令牌嵌入水印,在保持代码功能的同时提高水印可检测性。
Comments ICML 2026, 18 pages, 3 figures
HiTeC: 基于语义感知增强的文本属性超图层次对比学习
发表机构 * The University of New South Wales(新南威尔士大学) ; University of Wollongong(沃拉彭大学)
AI总结 提出HiTeC框架,通过两阶段层次对比学习,结合结构感知文本编码预训练和语义感知增强,解决文本属性超图中文本与拓扑关联不足、随机增强噪声及长程依赖捕获问题。
Comments 16 pages, 8 figures
ToolRegistry: 一个用于函数调用LLM的协议无关工具管理库
发表机构 * University of Chicago(芝加哥大学) ; Argonne National Laboratory(阿贡国家实验室)
AI总结 提出ToolRegistry系统,通过统一工具对象和注册表实现协议无关的工具管理,支持多种传输协议、可插拔后端和高级功能,显著减少集成代码并提升吞吐量。
Comments 16 pages, 4 figures, v3: add co-author, permission system, progressive tool disclosure, think-augmented calling, RPC framing, multi-provider support
MathOptAI.jl: 将训练好的机器学习预测器嵌入JuMP模型
发表机构 * Dowson Farms(多森农场) ; Los Alamos National Laboratory(洛斯阿拉莫斯国家实验室)
AI总结 提出开源Julia库MathOptAI.jl,将多种训练好的机器学习模型(神经网络、决策树、高斯过程)嵌入JuMP优化模型,并支持PyTorch模型的GPU加速。
混合最小二乘法:从高噪声数据中学习函数
发表机构 * Department of Mathematics, Simon Fraser University(Simon Fraser大学数学系) ; Courant Institute of Mathematical Sciences, New York University(纽约大学Courant数学科学研究所) ; Scientific Computing and Imaging Institute, University of Utah(犹他大学科学计算与成像研究所) ; Department of Mathematics, University of Kentucky(肯塔基大学数学系)
AI总结 针对高噪声数据下的最小二乘函数逼近问题,提出结合Christoffel采样与最优实验设计的混合方法,在样本点生成和噪声平滑方面实现最优性,提升计算效率和样本复杂度,并扩展到凸性约束和自适应随机子空间场景。
Comments 30 pages
Norm×Direction:恢复视觉线性注意力中缺失的查询范数
发表机构 * Harbin Institute of Technology, Shenzhen, China(哈尔滨工业大学(深圳)) ; Pengcheng Laboratory, China(鹏城实验室) ; The University of Queensland, Australia(昆士兰大学)
AI总结 针对线性注意力中查询范数丢失和非负性导致信息损失的问题,提出基于范数-方向分解的NaLaFormer,通过注入查询范数恢复注意力分布尖峰性,并采用余弦相似度保证非负性,在多项任务上达到线性注意力新标杆。
速度规划:用于掩码扩散语言模型的膨胀调度
发表机构 * School of Electrical and Computer Engineering, Ben-Gurion University of the Negev, Beersheba, Israel(电气与计算机工程学院,内盖夫本· Gurion大学,贝尔谢巴,以色列)
AI总结 提出膨胀解掩码调度器(DUS),通过将序列位置划分为非相邻的膨胀组并并行解掩码,最小化联合熵增益上界,在不修改去噪器的情况下实现高达5.8倍加速。
Comments Accepted at ICML 2026
CopulaSMOTE:基于Copula的过采样方法用于糖尿病预测中的不平衡分类
发表机构 * Stanford University School of Medicine(斯坦福大学医学院) ; Minnesota State University(明尼苏达州立大学) ; University of Louisiana at Lafayette(路易斯安那大学拉斐特分校) ; Southern Utah University(犹他州南方大学)
AI总结 提出CopulaSMOTE方法,利用截断藤copula建模少数类联合依赖结构生成合成样本,在三个糖尿病数据集上结合多种分类器评估,显示能改善大表格数据集的少数类恢复。
从推理到代码:针对代表性不足语言的GRPO优化
发表机构 * Qwen2.5-Coder
AI总结 提出结合Qwen2.5-Coder小模型与GRPO的强化学习方法,利用执行反馈和奖励机制提升Prolog、Lisp等低资源语言的代码生成准确性与推理质量。
Comments Accepted ICLP 2026
LSTM网络中模型选择的统计框架
发表机构 * School of Mathematical and Natural Sciences, Arizona State University(数学与自然科学院,亚利桑那州立大学)
AI总结 针对LSTM网络模型选择依赖启发式且计算昂贵的问题,提出统一统计框架,通过扩展信息准则和收缩估计到序列神经网络,定义适应时间结构的惩罚似然、广义阈值方法处理隐状态动态,并利用变分贝叶斯和近似边际似然实现高效估计,在生物医学数据上验证了灵活性和性能提升。
LETS Forecast:用于时间序列预测的嵌入学
发表机构 * Department of Biostatistics and Medical Informatics, University of Wisconsin-Madison(生物统计学与医学信息学系,威斯康星大学麦迪逊分校) ; Department of Computer Sciences, University of Wisconsin-Madison(计算机科学系,威斯康星大学麦迪逊分校)
AI总结 提出DeepEDM框架,结合非线性动力系统建模与深度学习,通过延迟嵌入和核回归学习潜在动态,实现高精度时间序列预测。
Comments Accepted at International Conference on Machine Learning (ICML) 2025
Adam中的自适应预处理器引发损失尖峰
发表机构 * Institute of Natural Sciences, MOE-LSC, Shanghai Jiao Tong University(上海交通大学理论科学研究院) ; School of Mathematical Sciences, Shanghai Jiao Tong University(上海交通大学数学科学学院) ; MemTensor (Shanghai) Technology Co., Ltd.(MemTensor(上海)科技有限公司) ; Institute for Advanced Algorithms Research, Shanghai(上海先进算法研究院) ; Shanghai Seres Information Technology Co., Ltd, Shanghai 200040, China(上海塞瑞斯信息技术有限公司,上海200040,中国)
AI总结 通过分析Adam二阶矩估计器的内部动力学,发现自适应预处理器与瞬时平方梯度之间的解耦机制导致损失尖峰,并基于二次近似分析提出尖峰预测方法。
Comments Accepted to ICML 2026
表格扩散模型中记忆化的深入探究:以数据为中心的观点
发表机构 * Department of Computer and Data Sciences(计算机与数据科学系) ; Case Western Reserve University(凯斯西储大学) ; Department of Computer Science & Engineering(计算机科学与工程系) ; Texas A&M University(德克萨斯大学) ; Department of Biochemistry(生物化学系) ; Center for RNA Science and Therapeutics(RNA科学与治疗中心) ; Department of Biomedical Engineering(生物医学工程系)
AI总结 本文首次从数据角度研究表格扩散模型中的记忆化动态,通过量化每个真实样本的记忆化程度,发现少数样本贡献了大部分泄露,并提出两阶段缓解方法DynamicCut。
Comments Published in Transactions on Machine Learning Research (TMLR), 2026
PhySense:面向精确物理感知的传感器布局优化
发表机构 * School of Software, BNRist, Tsinghua University(软件学院,BNRist,清华大学)
AI总结 提出PhySense两阶段框架,通过流生成模型和投影梯度下降联合优化传感器布局与物理场重建,实现高精度物理感知。
基于不确定性感知的机会主义与压缩传输的通信高效混合语言模型
发表机构 * School of Electrical and Electronic Engineering, Yonsei University, South Korea(延世大学电气电子工程学院,韩国) ; Information Systems Technology and Design pillar, Singapore University of Technology and Design, Singapore 487372(新加坡科技设计大学信息系统技术与设计支柱,新加坡487372) ; Department of Smart Mobility Engineering, Inha University, South Korea(Inha大学智能移动工程系,韩国) ; School of Electrical and Mechanical Engineering, The University of Adelaide, Australia(阿德莱德大学电气与机械工程学院,澳大利亚) ; Singapore University of Technology and Design, Singapore 487372(新加坡科技设计大学,新加坡487372)
AI总结 提出通信高效的混合语言模型CU-HLM,通过不确定性感知的机会主义传输和词汇表压缩,在保持97.4%准确率的同时实现高达206倍的令牌吞吐量提升。
Comments 17 pages, 13 figures, 5 tables; This article has been accepted for publication in IEEE Transactions on Communications. This is the author's accepted version; the final published version will be available via IEEE Xplore
结合抽象论证与机器学习高效分析低层过程事件流
发表机构 * University of Calabria(卡拉布里亚大学) ; CNR(国家科研委员会)
AI总结 提出一种数据高效的神经符号方法,通过抽象论证框架(AAF)优化序列标注模型生成的候选事件解释,以解决低层过程事件流中事件到活动映射的不确定性问题。
SURGE: 大型语言模型作为通用代理代码执行器的潜力
发表机构 * Department of Computer Science and Technology, Tsinghua(清华大学计算机科学与技术系) ; Institute for Interdisciplinary Information Sciences (IIIS), Tsinghua(清华大学交叉信息研究院)
AI总结 提出SURGE基准,包含1160个问题覆盖8个关键方面,通过评估21个开源和专有LLM,研究其作为代码执行预测代理模型的可行性、扩展律、数据效率和预测准确性。
ExplainReduce: 从许多局部解释生成全局解释
发表机构 * University of Helsinki(赫尔辛基大学)
AI总结 本文提出 ExplainReduce 方法,通过贪心启发式算法将大量局部解释缩减为少量简单模型,作为生成式全局解释,并证明其有效性和竞争力。
Comments 21 pages with a 36 page appendix, 8 + 39 figures, 1+1 tables. The datasets and source code used in the paper are available at https://github.com/edahelsinki/explainreduce. Accepted for publication in the 4th World Conference on eXplainable Artificial Intelligence (2026)
消息传递GNN无法近似稀疏三角分解
发表机构 * AIC, Skoltech(斯克里普金技术大学人工智能中心) ; Skoltech AI4S Center(斯克里普金技术大学AI4S中心) ; Sberbank of Russia(俄罗斯储蓄银行) ; AIRI
AI总结 本文通过理论和实验证明,消息传递图神经网络在逼近稀疏三角分解时存在根本性局限,需要超越消息传递的架构创新。
Comments Camera-ready version published in Transactions on Machine Learning Research
FragmentNet: 自适应图分片用于图到序列分子表示学习
发表机构 * Department of Electrical and Computer Engineering, University of Toronto, Toronto, Canada(电气与计算机工程系,多伦多大学,多伦多,加拿大) ; Regenerative Biomaterials Laboratory, Stanford Cardiovascular Institute, Palo Alto, USA(再生生物材料实验室,斯坦福心血管研究所,帕洛阿尔托,美国)
AI总结 提出FragmentNet,通过自适应学习的分词器将分子图分解为化学有效的片段,并利用化学感知的空间位置编码保持分子拓扑,在片段级别进行掩码预训练,在多个属性预测任务上提升了性能。
Comments 22 pages, 13 figures, 5 tables
通过增量自适应评估的迭代特征空间优化
发表机构 * University of Kansas(堪萨斯大学) ; Southwestern University of Finance and Economics(西南财经大学) ; Arizona State University(亚利桑那州立大学) ; Portland State University(波特兰州立大学) ; University of California(加州大学)
AI总结 提出EASE框架,通过特征-样本子空间生成器和上下文注意力评估器,实现高效、泛化的特征空间优化,解决评估偏差、过拟合和低效问题。
Comments 18 pages
基于Transformer的少样本学习:以最少数据跨数千个领域建模电力消费曲线
发表机构 * Intelligent Electrical Power Grids (IEPG) Group(智能电力电网组) ; Centrum Wiskunde & Informatica (CWI)(数学与信息学研究中心) ; Alliander N.V(Alliander公司)
AI总结 针对电力消费曲线建模中数据稀缺问题,提出一种结合Transformer和高斯混合模型的免微调少样本学习框架,仅需1.6%数据即可准确恢复复杂分布,优于现有方法。
Hadamard表示:跨无模型强化学习的性能支撑
发表机构 * Vrije Universiteit Amsterdam(阿姆斯特丹自由大学)
AI总结 提出Hadamard表示(HR),通过将标准隐藏层替换为两个独立参数化层的逐元素乘积,减少神经元休眠并增加有效秩,从而在多种强化学习算法和领域中一致提升性能。
Comments 26 pages, 17 figures
带随机协变量的激励探索:推荐系统的两阶段机制设计
发表机构 * Meta Platforms Inc(Meta公司) ; Department of Statistics and Data Science(统计学与数据科学系) ; University of California, Los Angeles, CA(加州大学洛杉矶分校)
AI总结 针对推荐系统中用户自利偏好下的探索-利用权衡问题,提出一种两阶段算法,通过激励相容的探索和逆比例间隙采样策略实现次线性遗憾并满足激励约束。
Comments ICML 2026
Bregman近端类型算法的伪平稳性和困难结果
发表机构 * Department of Systems Engineering and Engineering Management, The Chinese University of Hong Kong(香港中文大学系统工程与工程管理系) ; Sauder School of Business, University of British Columbia(不列颠哥伦比亚大学萨德勒商学院)
AI总结 本文揭示了Bregman近端类型算法(如镜像下降)在非欧几何下可能陷入伪平稳点,即使对于凸问题,若Bregman核的梯度非Lipschitz连续,停滞可无限持续,并指出该现象在非凸多面体约束问题中普遍存在,挑战了现有收敛性理论。
分支缩放表现为隐式架构正则化以改善过参数化ResNet的泛化能力
发表机构 * Huawei Large Model Data Technology Lab, Shenzhen(华为大模型数据技术实验室,深圳) ; Tsinghua University, Beijing(清华大学,北京) ; Kyoto University, Kyoto(京都大学,京都)
AI总结 本文研究残差网络中分支缩放因子对过参数化ResNet泛化性能的影响,通过理论分析证明快速深度衰减的缩放因子结合早停可实现极小极大最优泛化率,并利用神经正切核(NTK)近似解释其机制。
Comments Accepted by ICML. This version incorporates content from the preprint arXiv:2305.18506. The contributors of the relevant content have consented to its inclusion and have been listed as authors
打开黑箱:遥感中可解释人工智能的系统综述
发表机构 * Chair of Data Science in Earth Observation, Technical University of Munich (TUM)(地球观测数据科学教授团,慕尼黑技术大学) ; Munich Center for Machine Learning(慕尼黑机器学习中心) ; Image Processing Laboratory (IPL), Universitat de València (UV)(图像处理实验室(IPL),瓦伦西亚大学) ; University of Kaiserslautern-Landau, Germany(德国凯撒斯劳滕-兰道大学) ; German Research Center for Artificial Intelligence (DFKI)(德国人工智能研究中心(DFKI)) ; School of Applied Mathematics, Getulio Vargas Foundation, Brazil(巴西格洛里奥·瓦格斯基金会应用数学学院) ; Institute for Explainable Machine Learning at Helmholtz Munich(海德堡慕尼黑可解释机器学习研究所) ; Chair of Interpretable and Reliable Machine Learning, Technical University of Munich(可解释和可靠机器学习教授团,慕尼黑技术大学)
AI总结 本文通过系统综述,总结了遥感中可解释AI方法的使用、目标、发现和挑战,揭示了新兴方向并提供了评估方法。
PerSival:基于神经网络的肌肉骨骼生物力学中连续介质力学模拟的普适可视化
发表机构 * Institute for Parallel and Distributed Systems, University of Stuttgart(并行与分布式系统研究所,斯图加特大学) ; Visualization Research Center VISUS, University of Stuttgart(可视化研究中心VISUS,斯图加特大学) ; Biomechatronic Systems, Fraunhofer IPA, Stuttgart(生物机械系统,弗劳恩霍夫IPA研究所,斯图加特)
AI总结 本文提出一种神经网络架构,通过稀疏网格代理捕捉肱二头肌表面变形,实现3D上肢肌肉骨骼系统模型在资源受限设备上的实时可视化,平均误差0.97 mm。
Comments 10 pages, 4 figures, 5 tables, to be submitted to Medical Image Analysis
去中心化随机双层优化的通信复杂度
发表机构 * Temple University(特拉华大学)
AI总结 针对异构环境下现有去中心化随机双层优化算法收敛慢、通信成本高的问题,提出基于同步和交替更新策略的两种新算法,实现了更快的收敛速度和更低的通信成本,并首次在温和假设下揭示了异构设置中Hessian逆向量积的计算与通信对收敛率的影响。
Virchow:百万级数字病理学基础模型
发表机构 * Paige ; Microsoft Research(微软研究院) ; NSW Health Pathology(新南威尔士州卫生病理学) ; St George Hospital(圣乔治医院) ; Memorial Sloan Kettering Cancer Center(纪念斯隆凯特琳癌症中心) ; University of Rochester(罗切斯特大学)
AI总结 提出Virchow,一个基于DINOv2自监督学习、在150万张H&E染色全切片图像上训练的6.32亿参数视觉Transformer模型,用于计算病理学,在泛癌检测和生物标志物预测任务上达到最先进性能。
基于全一阶Oracle的近似最优非凸强凸双层优化
发表机构 * IIIS, Tsinghua University(清华大学人工智能院) ; Shanghai Qi Zhi Institute(上海启智研究院) ; Shanghai AI Lab(上海人工智能实验室)
AI总结 针对下层问题强凸的双层优化,提出一种两时间尺度更新的一阶方法,在确定性设置下达到近最优的$\tilde{\mathcal{O}}(\varepsilon^{-2})$一阶Oracle复杂度,并扩展到随机和高阶光滑场景。
Comments JMLR 2025; fix a bug in the proof in Appendix E compared to the journal version
V3H: 面向不完整多视图聚类的视图变异与视图遗传
发表机构 * School of Computer Science and Technology, Huazhong University of Science and Technology(华中科技大学计算机科学与技术学院) ; Hubei Engineering Research Center on Big Data Security, School of Cyber Science and Engineering, Huazhong University of Science and Technology(华中科技大学大数据安全工程研究中心) ; Department of Electrical and Computer Engineering, University of Florida(佛罗里达大学电子与计算机工程系)
AI总结 提出一种受遗传学启发的视图变异与视图遗传方法(V3H),通过分解子空间为变异矩阵和遗传矩阵分别学习各视图的独特信息和所有视图的一致信息,并利用可调低秩表示恢复底层数据结构,在不完整多视图聚类中同时捕获一致与独特信息,在15个基准数据集上超越现有方法。
Comments Publisheded in IEEE Transactions on Artificial Intelligence
双自加权多视图聚类:通过自适应视图融合
发表机构 * School of Computer Science and Technology, Key Laboratory of Information Storage System Ministry of Education of China, Huazhong University of Science and Technology(计算机科学与技术学院,信息存储系统教育部重点实验室,华中科技大学)
AI总结 提出双自加权多视图聚类框架(DSMC),通过自适应权重矩阵和权重因子分别对特征和图进行加权,去除冗余和噪声,并融合多图进行聚类。
Comments Corresponding author: Xiang Fang
ANIMC: 一种自动加权噪声与不完整多视图聚类的软框架
发表机构 * Hubei Engineering Research Center on Big Data Security, School of Cyber Science and Engineering, Huazhong University of Science and Technology(大数据安全湖北工程研究中心,信息科学与工程学院,华中科技大学) ; School of Computer Science and Technology, Huazhong University of Science and Technology(计算机科学与技术学院,华中科技大学) ; Key Laboratory of Information Storage System Ministry of Education of China, Huazhong University of Science and Technology(信息存储系统教育部重点实验室,华中科技大学) ; Department of Electrical and Computer Engineering, University of Florida(电气与计算机工程系,佛罗里达大学)
AI总结 提出ANIMC框架,通过软自动加权策略和双软正则回归模型,处理多视图聚类中的缺失实例和噪声问题。
Comments Publisheded in IEEE Transactions on Artificial Intelligence
通过视图演化方案的不平衡不完整多视图聚类:弱视图为食,强视图为食
发表机构 * School of Computer Science and Technology, Key Laboratory of Information Storage System Ministry of Education of China, Huazhong University of Science and Technology(计算机科学与技术学院,信息存储系统教育部重点实验室,华中科技大学) ; Hubei Engineering Research Center on Big Data Security, School of Cyber Science and Engineering, Huazhong University of Science and Technology(大数据安全工程研究中心,网络安全学院,华中科技大学) ; Department of Electrical and Computer Engineering, University of Florida(电气与计算机工程系,佛罗里达大学)
AI总结 针对不同视图不完整程度不平衡的问题,受生物进化理论启发,提出基于视图演化的不平衡不完整多视图聚类方法UIMC,通过加权多视图子空间聚类和低秩鲁棒表示恢复数据,显著提升聚类性能。
Comments Accepted by IEEE Transactions on Emerging Topics in Computational Intelligence
约束锚定归因:神经组合优化策略的可行性认证反事实与Bonferroni-PAC充分子集
发表机构 * Univ. Artois, UR 3926, Laboratoire de G\'enie Informatique et d'Automatique de l'Artois (LGI2A) B\'ethune F-62400 France ; Univ. Artois, UR 3926, Laboratoire de G\'enie Informatique et d'Automatique de l'Artois (LGI2A)
AI总结 提出一种神经组合优化策略的归因方法,通过LP松弛对偶分解决策、CSP可行性模型认证反事实,并用Bonferroni校正的Hoeffding充分子集测试界定PAC解释大小。
Comments 4 pages, 1 figure, Reference implementation: https://github.com/sohaibafifi/neuro-co-cax (MIT)
关于过参数化神经网络的认知不确定性
发表机构 * Department of Statistics, LMU Munich(统计系,慕尼黑大学) ; Munich Center for Machine Learning (MCML)(慕尼黑机器学习中心)
AI总结 本文通过非可辨识性视角分析过参数化神经网络的认知不确定性,刻画了离散和连续残余不确定性来源,并以单隐层ReLU网络为例验证理论。
Comments Accepted at ICML 2026 (Main Track)
一种使用朴素贝叶斯实现公平性的混合似然方法
发表机构 * Department of Computer Science and Information Technology, University of Cape Coast(计算机科学与信息技术系,卡普科斯特大学)
AI总结 提出一种公平感知的朴素贝叶斯扩展(BMNB),通过混合似然估计和自适应阈值后处理来平衡公平性与准确性,在多个数据集上实现接近公平的指标。
数据特定超参数设计:储层计算中的范式转变
发表机构 * University of Pretoria. Department of Mathematics and Applied Mathematics(南非大学 Pretoria分校 数学与应用数学系) ; Nanyang Technological University. Division of Mathematical Sciences. School of Physical and Mathematical Sciences(南洋理工大学 数学科学学院 物理与数学科学学院)
AI总结 本文从几何角度提出数据特定的储层设计原则,通过锥形集中约束储层状态增量,减少岭回归训练误差,并给出回声状态网络的构造方法及谱诊断指标。
通过节能无人机通信实现个性化联邦学习
发表机构 * Department of Computer Science, North Carolina State University(计算机科学系,北卡罗来纳州立大学) ; Department of Electrical and Computer Engineering, University of Massachusetts(电气与计算机工程系,马萨诸塞大学)
AI总结 针对无人机辅助联邦学习中数据异构和能耗问题,提出全局共享骨干与本地个性化头部分离的架构,并设计基于梯度范数的调度策略,在降低能耗的同时提升学习精度。
演化因果调控网络(ECR-Net)
AI总结 提出一种受生物启发的自适应因果机制发现框架ECR-Net,通过演化搜索算法动态建模因果图结构,以应对非平稳环境下的分布外泛化问题。
Comments 9 pages, 6 figures. Presents ECR-Net, an evolutionary framework for adaptive causal structure discovery under non-stationarity, with empirical evaluation against NOTEARS, PCMCI+, and related baselines
扩散模型的多目标学习:半监督学习下的统计理论
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 针对扩散模型在多目标学习中因模型容量增大导致统计成本高的问题,提出半监督两阶段训练方法,利用未标记数据通过伪样本蒸馏,证明所需配对样本量仅取决于专家模型复杂度。
基于影响启发的谱旋转用于极端低位LLM量化
发表机构 * Lehigh University(莱斯大学)
AI总结 本文利用伴随理论论文的影响自适应Walsh几何,通过WHT旋转和列缩放结合重构误差量化器,实现极端低位权重量化,在多个模型上降低困惑度15-58%。
Comments 14 pages, no figures. Companion application paper to arXiv:2605.01637 (theory). Code and pinned eval stack: https://github.com/gogipav14/spectral-llm
隐藏以引导:通过语义掩码学习
发表机构 * MIT(麻省理工学院) ; NVIDIA(英伟达)
AI总结 提出语义掩码专家策略优化(SMEPO),通过掩码专家轨迹中与奖励相关的语义片段,将困难问题转化为填空过程,提升强化学习在推理密集型任务中的探索效率。
先定位再中和:梯度引导的令牌抑制对抗视觉提示注入攻击
发表机构 * School of Advanced Interdisciplinary Sciences, UCAS(UCAS交叉学科研究院) ; School of Electronic, Electrical and Communication Engineering, UCAS(UCAS电子电气与通信工程学院) ; State Key Laboratory of AI Safety, Institute of Computing Technology, CAS(中国科学院计算技术研究所人工智能安全国家重点实验室) ; Alibaba Group(阿里巴巴集团) ; School of Computer Science and Technology, UCAS(UCAS计算机科学与技术学院) ; Beijing Academy of Artificial Intelligence(北京人工智能研究院) ; Key Laboratory of Big Data Mining and Knowledge Management, UCAS(UCAS大数据挖掘与知识管理重点实验室)
AI总结 针对多模态大语言模型的视觉提示注入攻击,提出梯度令牌掩码(GTM)方法,通过梯度分析定位关键图像令牌并掩码中和,将攻击成功率降至接近零且计算开销极小。
方向对齐缓解语言模型强化学习中的奖励黑客问题
发表机构 * University of British Columbia(不列颠哥伦比亚大学) ; Vector Institute(向量研究所) ; Amazon(亚马逊)
AI总结 通过分析强化学习更新的几何结构,发现奖励黑客源于优化偏离稳定低维学习轨迹,提出可信方向投影方法约束梯度在干净参考子空间内,延迟捷径利用并保持任务性能。
在广度、深度和时间上生长神经网络
发表机构 * Columbia University(哥伦比亚大学) ; NSF AI Institute for Artificial and Natural Intelligence(国家科学基金会人工智能与自然智能研究院)
AI总结 提出在循环卷积神经网络中定义广度、深度和时间的可微成本,通过反向传播联合优化任务误差和资源成本,发现三者可相互权衡,且模型使用的时间与人类反应时间相关。
Nyström 核 Stein 散度检验
发表机构 * Chair of Information Systems(信息系统系) ; Department of Statistics(统计系) ; London School of Economics(伦敦经济学院) ; The Pennsylvania State University(宾夕法尼亚州立大学)
AI总结 本文提出并理论证明 Nyström 加速的核 Stein 散度检验在保持渐近水平和局部一致性的同时,显著降低计算复杂度。
回复:ICML 2023 排名实验:审视机器学习/人工智能同行评审中的作者自我评估
发表机构 * University of Pennsylvania(宾夕法尼亚大学) ; University of Wisconsin–Madison(威斯康星大学麦迪逊分校) ; University of North Carolina at Chapel Hill(北卡罗来纳大学教堂山分校) ; New York University(纽约大学) ; Princeton University(普林斯顿大学) ; Associate Chair of ICML 2023(ICML 2023 associate chair) ; Program Chair of ICML 2023(ICML 2023 program chair)
AI总结 本文回应了关于ICML 2023排名实验的讨论,将同行评审视为统计估计问题,探讨了等渗机制的公平性与策略问题,并提出了结合审稿人排名和生成式AI时代以人为中心的评审框架。
Comments Rejoinder to the JASA Discussion of "The ICML 2023 Ranking Experiment: Examining Author Self-Assessment in ML/AI Peer Review" (arXiv:2408.13430)
生长-剪枝-冻结网络:用于嗅觉导航的自适应与持续学习技术
AI总结 提出生长-剪枝-冻结(GPF)网络框架,通过动态调整策略网络层数实现持续学习,在湍流羽流导航任务中达到94%成功率,并推广到其他机器学习任务。
资源分配中通过优先级队列随机化学习处理效应
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; Allegheny County Department of Human Services(阿勒格尼县人类服务部)
AI总结 提出优先级队列随机化实验设计框架,在优先服务高需求个体的同时识别因果效应,并优化队列分配以平衡统计效率与优先级。
AME-TS:基于锚定的混合专家模型用于时间序列预测
发表机构 * Amazon Web Services(亚马逊网络服务)
AI总结 提出AME-TS,一种结构引导的稀疏时间序列基础模型,通过轻量级预测器估计序列级描述符并生成专家软结构先验,实现专家路由与可解释时间结构对齐,在GIFT-Eval基准上实现精度-效率权衡,并在M5微调中展现更稳定的专家专业化。
溯因-演绎纠缠:通过表示移植实现领域泛化
发表机构 * Columbia University(哥伦比亚大学)
AI总结 本文提出一种基于表示移植的方法,通过参数化溯因-演绎纠缠中的非可识别性,在源分布约束下搜索目标分布空间,实现领域泛化中的最优目标预测。
ASTRO: 用于信息物理系统中基于GNN的异常检测的自适应时空强化优化
发表机构 * Department of Computer Science, FAST NUCES(计算机科学系,FAST NUCES) ; Department of Information Technology, Riphah International University(信息技术系,Riphah国际大学)
AI总结 提出ASTRO框架,结合深度Q网络与图神经网络、时间建模和多头注意力机制,通过强化学习动态优化阈值,在SWaT和WADI数据集上实现高F1分数,优于现有方法。
分块吉布斯采样遇上扩散Transformer:约束优化的无监督学习
发表机构 * University of Toronto(多伦多大学) ; Vector Institute(向量研究所)
AI总结 提出分块吉布斯扩散Transformer(BloGDiT),通过分块高斯去噪替代标准联合高斯去噪,解决扩散模型在约束优化中变量子集大规模编辑的需求,在数独、图着色、最大独立集和MaxCut任务上匹配或超越现有方法。
PQDT: 伪查询双Transformer用于鲁棒点云修复
发表机构 * Mercedes-Benz AG(梅赛德斯-奔驰集团) ; University of Bonn(波恩大学) ; Fraunhofer SCAI(弗劳恩霍夫SCAI研究所)
AI总结 提出一种基于伪查询模块和Transformer主干网络的统一3D修复网络,通过两阶段几何变换增强结构清晰度和局部细节,在多种退化场景下超越现有方法。
Comments To be published in The IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) 2026
在基尼度量空间中优化多维缩放
发表机构 * GitHub
AI总结 提出基尼多维缩放(Gini MDS)框架,通过基于值和秩的基尼伪距离,在噪声和异常值数据上优于欧几里得MDS,并利用PyTorch实现GPU加速。
扩散模型的推理时对齐:基于信任区域迭代扭曲序贯蒙特卡洛方法
发表机构 * Duke University(杜克大学) ; Morgan Stanley(摩根大通)
AI总结 提出信任区域迭代扭曲序贯蒙特卡洛(TRI-TSMC)框架,通过迭代学习扭曲函数来改进扩散模型推理时的对齐,在文本生成和文本到图像生成任务上优于现有方法。
Comments 34 pages, 6 figures, and 7 tables
信任感知的联合特征-预测差异用于鲁棒域适应
发表机构 * School of Engineering and Built Environment, Griffith University, Australia(工程与环境学院,格里菲斯大学,澳大利亚)
AI总结 提出信任感知域适应框架,通过联合特征-预测差异(JFPD)结合不确定性信任和语义对齐信任,实现可靠性感知的域差异估计,提升域适应性能。
Comments Research report
Courant:一种具有局部支持和可解释场分解的状态自适应感知器神经代理模型
发表机构 * Pasteur Labs(Pasteur实验室) ; Cornell University(康奈尔大学) ; Institute for Simulation Intelligence(模拟智能研究所)
AI总结 提出基于感知器的编码-处理-解码代理模型Courant,通过状态自适应潜在查询和轻量解码器实现类似自适应hp细化的局部支持与可解释场分解,在稳态/瞬态模拟基准上取得竞争性精度。
反事实安全的强化学习
发表机构 * Department of Statistics and Data Science, National University of Singapore(新加坡国立大学统计与数据科学系) ; School of Mathematics and Statistics, Beijing Technology and Business University(北京技术与商业大学数学与统计学学院) ; Department of Statistics, London School of Economics and Political Science(伦敦政治经济学院统计系)
AI总结 针对强化学习策略可能对个体造成伤害的问题,提出基于反事实视角定义个体伤害,并设计两阶段学习过程以最大化期望回报同时控制伤害率,理论证明有限样本性质与次优性上界,实验验证有效性。
重新审视预传播图神经网络:鲁棒扩散算子与隐状态再传播
发表机构 * School of Electrical and Computer Engineering, Cornell University, Ithaca, New York, USA(电气与计算机工程系,康奈尔大学,纽约州伊萨卡市)
AI总结 提出鲁棒图扩散算子和少量隐状态再传播方案,使预传播图神经网络在保持训练效率的同时匹配消息传递图神经网络的精度。
Uncertainty-DTW 用于序列和视觉标记
发表机构 * School of Engineering and Built Environment, Electrical and Electronic Engineering, Griffith University(工程与建筑环境学院,电气与电子工程学院,格里菲斯大学) ; School of Computer Science and Engineering, University of New South Wales(计算机科学与工程学院,新南威尔士大学)
AI总结 提出不确定性感知的动态时间规整(uDTW)框架,通过异方差不确定性建模和最大似然估计实现鲁棒对齐,并推广到视觉标记集,在多个领域取得优于现有方法的结果。
Comments Research report
利用规范自由度学习随机系统的非梯度种群动力学
发表机构 * Courant Institute of Mathematical Sciences, New York University, New York, NY 10012, USA(数学科学学院,纽约大学,纽约,纽约州,10012,美国)
AI总结 针对现有种群动力学推断局限于梯度流的问题,提出非梯度推断流(NGIF)算法,通过连续性方程的弱形式参数化一般向量场并选择非最小动能准则,在低维和高维物理问题中提高了分布精度并更好地捕捉非势输运。
RECTOR: 基于优先级规则的合规感知自动驾驶轨迹选择重排序
发表机构 * TORC Robotics LLC(TORC机器人公司) ; Daimler Truck AG(戴姆勒卡车集团) ; Reynolds & Moore(雷诺兹与摩尔公司) ; MassRobotics(马斯机器人)
AI总结 提出RECTOR,一种后生成重排序层,通过差异化代理和场景条件适用性机制,基于分层规则手册(安全>法律>道路>舒适)对候选轨迹进行评分,并采用确定性ε-词典序规则选择,在无需重新训练预测器的情况下,将安全与法律违规率从28.58%降至20.42%。
大型语言模型微调生命周期中的安全:威胁、防御、评估与未来方向
发表机构 * Hangzhou Normal University(杭州师范大学) ; Zhejiang University(浙江大学) ; China Mobile (Zhejiang) Innovation Research Institute Co., Ltd.(中国移动(浙江)创新研究院有限公司) ; Quantum Cloud Computing and Distributed Systems (qCLOUDS) Lab, School of Computing and Information Systems(量子云计算与分布式系统(qCLOUDS)实验室,计算与信息学院) ; The University of Melbourne(墨尔本大学)
AI总结 本文系统综述了大型语言模型微调过程中的安全威胁与防御,提出了基于生命周期的三阶段框架,并通过统一实验评估了攻击与防御的有效性及跨阶段局限性。
Comments 39 pages, 7 figures, 22 tables
QML-PipeGuard:面向量子机器学习管道完整性的漂移感知行为指纹识别
发表机构 * Quantum Security and Post-Quantum Cryptography Researcher(量子安全与后量子密码学研究员)
AI总结 提出QML-PipeGuard框架,通过行为指纹和基于合约的监测机制,同时应对量子机器学习管道中的硬件漂移和恶意信道替换威胁。
Comments 54 pages, 12 Tables, 5 figures
激光增材制造扫描顺序优化的强化学习:用于奖励和世界模型诊断的双层代理-有限元分析诊断框架
发表机构 * College of Engineering, Design and Physical Sciences, Brunel University London(布鲁内尔大学伦敦工程、设计与物理科学学院) ; Pattern Recognition Laboratory, Institute of Automation, Chinese Academy of Sciences(中国科学院自动化研究所模式识别实验室) ; ISIS Neutron and Muon Source, Science and Technology Facilities Council, Rutherford Appleton Laboratory(Rutherford Appleton实验室,科学与技术设施委员会ISIS中子与μ子源)
AI总结 本文提出一个双层代理-有限元分析诊断框架,通过轻量代理和稀疏有限元模拟,诊断强化学习在激光增材制造扫描顺序优化中的奖励和世界模型保真度问题。
Comments 31 pages, 7 figures, 3 tables
GL-LFGNN:基于Liang-Kleeman信息流的全局-局部双分支因果图神经网络用于脑电情感识别
发表机构 * School of Mathematics (Zhuhai), Sun Yat-sen University, Zhuhai, China(中山大学数学学院(珠海))
AI总结 提出GL-LFGNN模型,利用Liang-Kleeman信息流理论构建有向因果图,通过全局-局部双分支架构整合全脑与区域连接,在MEEG数据集上以少量参数实现高精度情感识别。
Comments 10 pages, 3 figures
随机神经网络对非线性偏微分方程的表达能力
发表机构 * Department of Mathematics(数学系) ; Imperial College London(帝国理工学院伦敦分校) ; School of Computer Science(计算机科学学院) ; University of St. Gallen(圣加尔登大学)
AI总结 研究随机生成隐藏权重的神经网络(RaNNs)对非线性偏微分方程解的逼近能力,推导了误差界并得到维数无关的逼近率1/2,应用于多孔介质方程和可压缩Navier-Stokes方程。
具有分块缺失值的多模态堆叠及其在预测免疫治疗耐药性的PIONeeR生物标志物研究中的应用
发表机构 * Inria – Inserm team COMPO, COMPutational pharmacology and clinical Oncology, Centre Inria Sophia Antipolis - Méditerranée, Centre de Recherches en Cancérologie de Marseille, Inserm U1068, CNRS UMR7258, Institut Paoli-Calmettes, Pharmacy faculty, Aix-Marseille University(Inria - Inserm COMPO团队,计算药理学和临床肿瘤学,Inria Sophia Antipolis -地中海, Marseille癌症研究中心,Inserm U1068,CNRS UMR7258,Paoli-Calmettes研究所,药学系,Aix-Marseille大学) ; Veracyte SAS, Marseille, France(Veracyte SAS,法国马赛) ; Assistance Publique-Hôpitaux de Marseille (APHM), Marseille, France(马赛公共医院(APHM),法国马赛) ; Toulouse University Hospital, Toulouse, France(图卢兹大学医院,法国图卢兹) ; Centre Leon Berard, Lyon, France(Leon Berard中心,法国里昂) ; Innate Pharma, Marseille, France(Innate Pharma,法国马赛) ; Université Paris Saclay, Gustave Roussy, Inserm, Prédicteurs Moléculaires et nouvelles cibles en oncologie (U981), F-94805, Villejuif, France(巴黎萨克雷大学,Gustave Roussy,Inserm,分子预测与肿瘤学新靶点(U981),法国维尔若,F-94805)
AI总结 提出多模态堆叠框架MSB,通过独立建模各模态特征并利用交叉验证堆叠元学习器聚合预测,解决高维和分块缺失问题,在PIONeeR研究中预测非小细胞肺癌免疫治疗无进展生存期,性能优于基线算法。
TRACE:一个基于分类学的合成数据集,用于应用行为分析中的教学程序生成和会话解释
发表机构 * Drexel University(德雷塞尔大学) ; Pombo Labs(波莫实验室)
AI总结 提出TRACE数据集,通过分类学驱动的确定性生成器创建2999个合成示例,覆盖教学程序生成和多会话行为解释任务,以解决ABA领域真实数据受隐私保护无法公开的问题。
Comments 11 pages, 3 tables. Dataset: https://huggingface.co/datasets/PomboLabs/TRACE ; code: https://github.com/Pombo-Labs/TRACE
MimirRAG:一种集成元数据的金融数据检索多智能体RAG框架
发表机构 * Copenhagen Business School(哥本哈根商学院)
AI总结 提出MimirRAG多智能体RAG框架,通过元数据集成、表格感知分块和智能体工作流,在金融数据检索中实现89.3%准确率,优于基线。
强化学习挑战中的流体力学环境视角
发表机构 * Sony AI(索尼人工智能) ; Cohere Labs(Cohere实验室) ; The Hebrew University of Jerusalem(耶路撒冷希伯来大学)
AI总结 本文提出将经典流体力学问题作为强化学习测试平台,通过非线性不稳定性环境中的状态、动作空间和奖励函数设计,促进智能体在高维动态环境中的高效交互。
基于多源数据的都市尺度弹性可信交通流推断
发表机构 * School of Transportation, Jilin University(吉林大学交通运输学院) ; Department of Computer Science, City University of Hong Kong (Dongguan)(香港城市大学(东莞)计算机科学系) ; Institute for Transport Planning and Systems, ETH Zurich(苏黎世联邦理工学院交通规划与系统研究所) ; Institute of Intelligent Transportation Systems, College of Civil Engineering and Architecture, Zhejiang University(浙江大学智能交通系统研究所) ; ZJU-UIUC Institute, Zhejiang University(浙江大学-UIUC研究院)
AI总结 提出任务感知注意力神经过程(TA-ANP)统一概率框架,融合浮动车数据和稀疏固定检测器数据,实现高精度、可信的不确定性量化的全局交通状态推断,并在都市尺度数据集上取得最优性能。
Comments The paper has been submitted to Elsevier for possible publication
通过对齐约束缓解PINN中的梯度病理
发表机构 * Department of Information Science and Engineering, KTH Royal Institute of Technology, Stockholm, Sweden(信息科学与工程系,皇家理工学院,斯德哥尔摩,瑞典) ; School of Advanced Manufacturing and Robotics, Peking University, Beijing, China(先进制造与机器人学院,北京大学,北京,中国) ; School of Advanced Technology, Xi’an Jiaotong-Liverpool University, Suzhou, China(先进技术学院,西安交通大学利物浦大学,苏州,中国) ; Department of AI, School of Engineering, Westlake University, Hangzhou, China(人工智能系,工程学院,西湖大学,杭州,中国)
AI总结 针对物理信息神经网络训练中梯度冲突导致的局部最优问题,提出约束对齐损失与流形提升方法,通过重新表述零阶项为对齐约束并引入延迟因子,显著提升数值稳定性和效率。
面向任务驱动无人机网络的能量感知多智能体强化学习扩展与个体奖励
发表机构 * Department of Computer Science, ETH Zurich(苏黎世联邦理工学院计算机科学系) ; Department of Computer Science, Colby College(科尔比学院计算机科学系)
AI总结 提出基于个体奖励函数的能量感知多智能体强化学习模型,利用深度Q网络解决无人机网络动态环境和电池容量限制下的轨迹规划问题,实验表明在任务密度高时成功率接近100%,且扩展性优于共享奖励模型。
Comments IEEE Internet of Things Journal
基于不确定性触发的特征路径探索的点击率预测选择性测试时计算扩展
发表机构 * Alibaba Group(阿里巴巴集团)
AI总结 针对点击率预测中训练数据稀疏导致的不确定性,提出无需训练、模型无关的UTTSI框架,通过双信号估计器区分认知不确定性和偶然模糊性,对不确定实例进行自适应特征过滤和随机特征路径探索,在保持最坏延迟不变的情况下实现平均约2.8倍基础模型开销,实验和在线A/B测试均取得显著提升。
Comments 12 pages, 4 Figures, 3 Tables
点击率预测中面向异构感知特征生成的自平衡梯度分配
发表机构 * Alibaba Group(阿里巴巴集团)
AI总结 针对生成式CTR方法中重建目标忽略特征场异构性导致难场欠拟合的问题,提出HeteGenCTR,通过可学习的场难度参数联合训练去噪网络,实现自平衡损失和难度引导注意力机制,在五个基准和在线A/B测试中取得显著提升。
Comments 12 pages, 5 figures, 4 tables
软体合成蛇在三维异质环境中的学习、运动与导航
发表机构 * Carl R. Woese Institute for Genomic Biology, University of Illinois Urbana–Champaign(卡尔·R·沃塞基因组生物学研究所,伊利诺伊大学厄巴纳-香槟分校) ; Department of Mechanical and Aerospace Engineering, Hong Kong University of Science and Technology(香港科学与技术大学机械与航空航天工程系) ; Department of Mechanical Science and Engineering, University of Illinois Urbana–Champaign(伊利诺伊大学厄巴纳-香槟分校机械科学与工程系)
AI总结 提出基于仿生驱动和感知模型的强化学习框架,使软体合成蛇能够自主导航非结构化三维地形,并通过高保真环境验证鲁棒性。
Comments 14 pages, 5 figures
共形预测中非一致性评分函数的基准测试
发表机构 * Department of Medical Epidemiology and Biostatistics, Karolinska Institutet(卡罗林斯卡研究所医学流行病学与生物统计学系) ; Department of Molecular Medicine and Surgery, Karolinska Institutet(卡罗林斯卡研究所分子医学与外科学系)
AI总结 本文综述了共形预测中非一致性评分函数的性质,提出原始修改和评估方法,并通过实验比较了不同函数在平衡和不平衡类别设置下的性能。
Comments 3 tables, 1 supplementary table, 1 supplementary figure
有限标注下的大语言模型选择
发表机构 * TU Delft(代尔夫特理工大学) ; ETH Zurich(苏黎世联邦理工学院)
AI总结 提出SELECT-LLM框架,通过基于期望信息增益的查询选择规则,在有限标注下高效识别最佳大语言模型,显著降低标注成本。
Comments 33 pages, 5 figures, 4 tables
弥合差距:实现软演员-评论家算法用于高性能腿部运动
发表机构 * ETH Zurich(苏黎世联邦理工学院)
AI总结 本文通过识别软演员-评论家(SAC)在并行训练中性能不足的根本原因,并提出策略初始化、超时感知评论家目标和多步回报估计等改进,使其在腿部运动任务中达到与近端策略优化(PPO)相当的性能。
TGFormer:基于自相关机制的时间图Transformer
发表机构 * Hangzhou Dianzi University, School of Cyberspace(杭州电子科技大学信息学院) ; Tianjin University, College of Intelligence and Computing(天津大学智能与计算学院) ; State Key Laboratory of Systems Medicine for Cancer, Shanghai Cancer Institute(癌症系统医学国家重点实验室,上海癌症研究院)
AI总结 针对时间图神经网络在捕获长期依赖和周期模式上的不足,提出TGFormer,通过轨迹框架和自相关机制实现子交互级别的依赖发现与表示聚合,在六个基准上最高提升9.35%精度。
OSDTW:长尾识别的最优共享深度与任务加权
发表机构 * Shenzhen International Graduate School, Tsinghua University, Shenzhen, China(清华大学深圳国际研究生院,中国深圳) ; Shenzhen Zkosemi Semiconductor Technology Co., Ltd(深圳卓芯半导体科技有限公司)
AI总结 提出OSDTW框架,通过分解任务、共享编码器与任务特定解码器,并基于Fisher信息矩阵推导泛化误差的偏置-方差分解,以优化共享深度和任务权重,解决长尾识别中头部-尾部性能权衡问题。
Comments ICIC 2026 Oral
视觉基础模型在面部深度伪造检测中的跨域泛化极限
发表机构 * Department of Software Engineering, Faculty of Computer and Information Sciences(软件工程系,计算机与信息科学学院)
AI总结 本文通过系统评估三种视觉基础模型(RoPE-ViT、DINOv3、NVIDIA C-RADIOv4-H)在DF40基准上的线性探测性能,揭示了它们在面部深度伪造检测中的跨域泛化极限,发现基础模型对全脸合成保持高判别力,但对局部编辑技术存在根本性边界。
MedMamba: 基于自适应图学习的多视图状态空间模型用于医疗时间序列分类
发表机构 * Northwest Polytechnical University(西北工业大学) ; University of Hong Kong(香港大学)
AI总结 提出MedMamba,一种集成状态空间模型与领域特定归纳偏置的端到端架构,通过多尺度卷积嵌入、三支差分状态空间编码器和空间图Mamba模块,分别处理局部-全局动态、非平稳性和潜在通道交互,在五个真实数据集上实现最先进性能。
Comments Accepted to 2026 ICML
探究优化下上下文与参数化思维链忠实性之间的相互作用
发表机构 * University of Copenhagen(哥本哈根大学) ; Technische Universität Berlin(柏林技术大学) ; German Research Center for Artificial Intelligence (DFKI)(德国人工智能研究中心(DFKI)) ; BIFOLD – Berlin Institute for the Foundations of Learning and Data(BIFOLD – 柏林学习与数据基础研究院)
AI总结 通过提出统一偏好对齐接口FaithMate,研究上下文与参数化两种思维链忠实性范式在优化下的相互作用,发现两者正相关但不对称,且上下文忠实性指标间存在权衡。
Comments The first two authors contributed equally and share first-authorship
通过区域感知注意力重校准减轻视觉语言模型中的对象幻觉
发表机构 * Qilu University of Technology (Shandong Academy of Sciences)(齐鲁工业大学(山东省科学院)) ; China Telecom Digital Intelligence Technology Co, Ltd(中国电信数字智能技术有限公司) ; Shenyang Aerospace University(沈阳航空航天大学) ; Qilu Institute of Technology(齐鲁理工学院)
AI总结 提出一种无需训练的区域感知自适应加权机制,通过计算注意力头的稳健统计中点并利用跨头分歧动态调整干预预算,以连续惩罚调制抑制幻觉路径,有效纠正视觉语义错位,同时保持生成流畅性。
ARCANE-PedSynth:具有行为穿越注释的合成多行人数据集
发表机构 * Computer Vision Center (CVC), Universitat Aut\` o noma de Barcelona (UAB), Bellaterra, Barcelona, Spain ; Institute of Electronics, Faculty of Computer Science, Electronics ; Telecommunications, AGH University of Krakow, Krak\' o w, Poland
AI总结 提出基于CARLA的开源框架ARCANE-PedSynth,通过混合AI-手动控制架构和12状态行为有限状态机生成高穿越率的多行人合成数据,支持RGB、LiDAR和DVS模态及行为标注,用于自动驾驶中的行人穿越预测。
RealBench: 在操作条件和极端事件挑战下对数据驱动数值天气预报的基准测试
发表机构 * The Hong Kong University of Science and Technology(香港科学与技术大学) ; Nanjing University(南京大学) ; Southern University of Science and Technology(南方科技大学) ; Shanghai AI Laboratory(上海人工智能实验室) ; Shanghai TechWind Technology Co., Ltd.(上海技风科技有限公司)
AI总结 提出RealBench基准,通过使用低延迟操作分析和全球10,000+站点观测数据,在严格分布外测试集上评估AI天气预报模型,揭示再分析指标与实际性能的显著差异,特别是极端事件方面。
Comments 35 pages, 22 figures
LLM代理中的记忆诱导工具漂移
发表机构 * Virginia Tech(弗吉尼亚理工大学)
AI总结 研究LLM代理中长期记忆存储的个性偏见(如成本意识、不耐烦等)在不适用情境下静默影响工具调用的问题,提出MEMDRIFT基准测试,发现偏置记忆导致工具参数偏离基线,且现有防御措施无法消除该现象。
熵正则化softmax策略梯度的全局线性收敛性:超越表格MDP
发表机构 * School of Mathematics(数学系)
AI总结 本文研究连续状态和动作空间的无限时域熵正则化马尔可夫决策过程中策略梯度的全局收敛性,通过线性函数逼近的log-linear softmax策略,在$Q^π_τ$可实现性假设下建立非均匀Polyak--Łojasiewicz不等式,并识别两种特征机制下非均匀常数的有界性,证明正则化目标沿梯度流的全局线性收敛。
通过随机镜像下降估计混合分布
发表机构 * Department of Electrical and Computer Engineering(电气与计算机工程系) ; University of California San Diego(加州大学圣地亚哥分校)
AI总结 针对从样本中估计未知分布的问题,提出基于随机镜像下降(SMD)的混合模型估计器族,通过选择Bregman散度实现灵活估计,在大规模候选分量下保持高效,并在KL散度和ℓ2范数下达到近最优收敛率。
BandVQ: 分带向量量化的脑电图基础模型
发表机构 * Tokyo University of Agriculture and Technology(东京农工大学) ; National University of Mongolia(蒙古国国立大学)
AI总结 针对脑电图基础模型中频率特异性活动表征不足的问题,提出BandVQ模型,通过分带VQ-VAE分词器和共享Transformer编码器,在71个公共数据集上预训练,并在六个分类任务上取得领先性能。
Comments 15 pages, 1 figure
共享分数的四元数自注意力
发表机构 * Tokyo Woman's Christian University(东京女子基督教大学)
AI总结 提出一种共享分数四元数自注意力机制,通过四元数内积计算单一实值分数并共享注意力分布,在保持性能的同时大幅降低计算成本。
Comments 26 pages, 6 figures and 15 tables. Accepted at ICML2026
MVR-cache:通过多向量检索和学习型提示分割优化语义缓存
发表机构 * School of Computer Science, Peking University, Beijing, China(北京大学计算机科学学院,北京,中国) ; School of Information, Renmin University of China, Beijing, China(中国人民大学信息学院,北京,中国)
AI总结 提出MVR-cache方法,利用多向量检索和学习型提示分割模型,通过强化学习优化缓存命中率,在保证正确性的前提下将缓存命中率提升高达37%。
Comments Published in ICML 2026
可解释的视网膜成像用于预测2型糖尿病多器官功能障碍
发表机构 * Faculty of Computer Science and Artificial Intelligence(计算机科学与人工智能学院) ; Frontier Science Computing Center(前沿科学计算中心) ; Chinese Academy of Sciences(中国科学院) ; Chinese University of Hong Kong(香港中文大学) ; Zhuhai People's Hospital(珠海人民医院) ; Beijing Institute of Technology(北京理工大学) ; Jinan University(暨南大学) ; Lampang Inter-Tech College
AI总结 本研究利用常规实验室生物标志物构建系统级异常指数,通过梯度提升模型预测2型糖尿病多系统失调,并采用SHAP实现可解释性,揭示了高血糖、肾功能障碍、血脂异常和炎症是主要驱动因素。
Comments 15 pages, 8 figures
因式分解以泛化:面向时间序列预测的检索引导不变-动态分解
发表机构 * College of Computer Science and Technology, Jilin University(吉林大学计算机科学与技术学院) ; College of Computing and Data Science, Nanyang Technological University(南洋理工大学计算机与数据科学学院) ; City St George’s, University of London(伦敦大学城圣乔治学院) ; Systems Research Institute, Polish Academy of Sciences(波兰科学院系统研究所)
AI总结 提出检索引导的不变-动态分解框架,通过分离稳定共享结构与实例特定变化,提升时间序列零样本预测在分布偏移下的鲁棒性。
论类别不平衡对深度神经网络学习动态的影响:直观洞察
发表机构 * Faculty of Computing(计算机学院) ; Universiti Teknologi Malaysia(技术大学) ; Adejkunle Ajasin University(阿德吉库内勒·阿贾辛大学) ; Johor, Malaysia(马来西亚 Johor) ; Akungba-Akoko, Nigeria(尼日利亚 Akungba-Akoko)
AI总结 通过监测不同不平衡比率下深度神经网络对多数类和少数类的学习模式,系统研究了类别不平衡如何导致模型早期欠拟合少数类并仅学习多数类,最终造成少数类表示过拟合而非泛化。
Comments Conference
SEED: 预算约束下应对概念漂移的半监督持续恶意软件检测
发表机构 * Indian Institute of Technology Ropar(印度理工学院罗帕尔) ; Indian Institute of Technology Hyderabad(印度理工学院海得拉巴)
AI总结 提出SEED方法,结合定制二元交叉熵损失与半监督持续学习和主动学习,在有限标注下有效检测未知恶意软件,平均AUT提升40%(BODMAS)和14%(AndroZoo)。
当推理有害:面向临床SOAP笔记生成的前沿LLM源感知评估
发表机构 * University of California, Davis(加州大学戴维斯分校)
AI总结 通过源感知基准测试,评估推理增强型LLM在临床SOAP笔记生成中的表现,发现推理能力反而降低GPT-5.4的质量,而相同源RAG带来模型依赖的小幅提升。
基于随机裁剪的高效DP-SGD用于大语言模型
发表机构 * Meta Platforms Inc(Meta平台公司) ; University of Southern California(南加州大学)
AI总结 提出DP-SGD-RC算法,利用随机迹估计(Hutchinson和Hutch++)降低每样本梯度范数估计的内存开销,在保持隐私保证的同时减少内存和计算复杂度。
Comments Accepted at ICML 2026
IV-Net: 用于随机和高变系数椭圆型偏微分方程的神经网络
发表机构 * Oden Institute for Computational Science and Engineering, The University of Texas at Austin(计算科学与工程院,德克萨斯大学奥斯汀分校) ; Walker Department of Mechanical Engineering, The University of Texas at Austin(机械工程系,德克萨斯大学奥斯汀分校)
AI总结 提出一种受V-cycle多重网格求解器启发的神经算子架构IV-Net,用于逼近高对比度空间变系数线性椭圆型偏微分方程的解,在高度异质系数问题上优于POD和现有神经算子,在光滑系数低频振荡Helmholtz问题上与Fourier神经算子性能相当。
Comments 36 pages
迈向通用因果推理器
发表机构 * The University of Chicago(芝加哥大学) ; University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校)
AI总结 提出UniCo数据生成框架,覆盖Pearl因果阶梯的18种查询类型,将符号示例转化为代码和自然语言,通过监督微调显著提升LLM的因果推理能力和推理忠实度。
聚类频率共形预测用于局部覆盖
发表机构 * Institute of Applied AI Research (AAIR)(应用人工智能研究学院) ; Faculty of Computer and Information Science(计算机与信息科学学院) ; Ben-Gurion University of the Negev(贝叶尔-加隆大学) ; Institute for Interdisciplinary Computational Science (ICS)(跨学科计算科学研究所)
AI总结 提出聚类频率共形预测(CFCP)框架,通过聚类嵌入并估计局部标签频率分布,结合全局先验和可靠性感知收缩,在标准共形预测中实现类级覆盖改进,并在图像和文本基准上验证有效性。
时间代理模型的准确性与展开稳定性比较研究
发表机构 * Cargill Inc.(卡吉尔公司)
AI总结 本文比较了多种深度神经网络架构在混沌动力系统时间代理建模中的长期预测稳定性,发现具有积分器式更新的模型表现出更低的偏差和扰动放大,从而实现稳定的长期展开和更准确的预测。
Comments 24 pages, 18 figures, submitted to journal
统一跨域离线强化学习中异构数据集的价值对齐与价值分配
发表机构 * City University of Hong Kong ; Tencent ; Institute of Artificial Intelligence (TeleAI), China Telecom ; Institute of Automation, Chinese Academy of Sciences. Corresponding Author
AI总结 针对异构跨域离线强化学习中价值误分配问题,提出V2A方法,通过时间一致模态表示学习和模态感知优势学习统一动力学对齐、价值对齐与价值分配,显著提升策略性能。
Comments Accepted at ICML 2026
DBPnet:基于阻尼特性的贝叶斯物理信息神经网络用于车轮载荷估计
发表机构 * Department of Civil, Architectural, and Environmental Engineering, The University of Texas at Austin(德克萨斯大学奥斯汀分校土木、建筑与环境工程系) ; School of Automation and Intelligent Sensing, Shanghai Jiao Tong University(上海交通大学自动化与智能感知学院) ; College of Electrical Engineering, Zhejiang University(浙江大学电气工程学院) ; School of Automotive Studies, Tongji University(同济大学汽车学院) ; School of Architecture, The University of Texas at Austin(德克萨斯大学奥斯汀分校建筑学院) ; Department of Civil and Environmental Engineering, University of Wisconsin-Madison(威斯康星大学麦迪逊分校土木与环境工程系)
AI总结 提出DBPnet,一种结合阻尼特性嵌入模块的贝叶斯物理信息神经网络,通过悬架连杆级建模和物理信息损失函数,实现鲁棒的车轮载荷估计。
Comments 14 pages, 12 figures, 6 tables
概念分配区:追踪概念如何跨越Transformer深度形成
发表机构 * Independent Researcher(独立研究者)
AI总结 提出概念分配区(CAZ)框架,通过层间度量(分离度、概念一致性、概念速度)检测概念在残差流中逐渐形成的深度区间,并在34个模型上验证了分离曲线的多模态性及温和CAZ的因果活性。
Comments 34 models, 8 architectural families, 7 concepts. Companion papers: GEM (arXiv forthcoming), CAZ Validation (arXiv forthcoming), PRH Validation (arXiv forthcoming). Code: https://github.com/jamesrahenry/Rosetta_Tools
T2S-MPC:面向时变动力学的时间嵌入在线自适应模型预测控制
发表机构 * JHU Department of Applied Mathematics and Statistics, Johns Hopkins University, MD, USA(约翰霍普金斯大学应用数学与统计学系) ; CMU Department of Electrical and Computer Engineering, Carnegie Mellon University, PA, USA(卡内基梅隆大学电气与计算机工程系)
AI总结 提出T2S-MPC框架,通过时间嵌入和双时间尺度更新在线学习残差动力学模型,实现快速时变环境下的自适应模型预测控制,在四旋翼任务中优于经典和神经MPC方法。
DriftingMol: 用于一次性属性条件分子生成的解码器耦合漂移
发表机构 * Beijing Key Laboratory of Artificial Intelligence for Advanced Chemical Engineering Materials(北京先进化工材料人工智能重点实验室)
AI总结 提出 DriftingMol 两阶段框架,通过解码器耦合漂移将漂移模型适应于 SELFIES 潜在分子空间,实现低采样成本、高有效性和多样性的属性条件分子生成。
Comments 9 pages, 5 figures
RouteScan: 通过专家路由遥测对MoE大语言模型安全性进行非侵入式审计
发表机构 * Zhejiang University(浙江大学) ; Donghua University(东华大学) ; Louisiana State University(路易斯安那州立大学)
AI总结 提出RouteScan,一种利用MoE模型GPU级专家路由遥测(如预填充阶段活跃线程数)作为微架构指纹,通过轻量级检测流水线识别恶意提示的非侵入式审计框架,在未见过的有害领域AUROC超0.93,新越狱包装下超0.96,且相比基于内容的审计方法具有隐私优势。
Comments 20 pages. Under submission
跨域能量引导扩散生成用于动态偏移强化学习
发表机构 * Duke University(杜克大学) ; Johns Hopkins University(约翰霍普金斯大学)
AI总结 提出CEDGE框架,利用能量引导扩散模型生成目标域轨迹,解决动态偏移下离线强化学习的域适应问题。
Comments 29 pages, 3 figures, and 14 tables
解缠双机器学习用于精确因果效应估计
发表机构 * School of Computer Science and Information Engineering, Hefei University of Technology(合肥工业大学计算机科学与信息工程学院) ; School of Computer and Information Technology, Shanxi University(山西大学计算机与信息学院)
AI总结 提出解缠双机器学习(DDML),通过因果角色解缠和残差依赖正交化策略,解决高维或有限样本下双机器学习中因混淆因子未解缠导致的偏差和不稳定问题,在合成、半合成和真实数据集上优于13种基线方法。
Comments 15 pages, 9 figures
随机上下文线性老虎机的主动学习
发表机构 * Stanford University(斯坦福大学)
AI总结 提出一种通过主动采样上下文-动作对奖励来学习近最优策略的算法,理论上证明主动上下文采样可将最小最大率改进最多√d倍,并在华法林剂量预测和笑话推荐任务中验证了样本效率提升。
CONF-KV:面向长序列LLM的置信度感知KV缓存淘汰与混合精度存储
发表机构 * Carnegie Mellon University(卡内基梅隆大学)
AI总结 提出CONF-KV方法,利用模型当前不确定性(置信度)动态调整KV缓存预算,结合混合精度存储和分块在线softmax注意力,在长序列推理中显著降低显存占用并保持高精度。
互补子模信息度量用于平衡和鲁棒的数据选择
发表机构 * The University of Texas at Dallas(德克萨斯大学达拉斯分校)
AI总结 提出互补子模信息(CSI)目标函数,通过建模子集与其补集之间的共享结构信息,实现平衡且鲁棒的数据选择,并在理论上证明其近似单调性和贪心近似保证,实验表明在鲁棒隐藏切片感知子集选择中优于经典子模目标。
Hermite-NGP:用于学习PDE的梯度增强哈希编码
发表机构 * Georgia Institute of Technology, Atlanta, GA, USA(佐治亚理工学院,亚特兰大,GA,美国)
AI总结 提出Hermite-NGP,一种梯度增强的多分辨率哈希编码,通过显式存储哈希网格顶点处的函数值和混合偏导数并利用Hermite插值实现解析梯度计算,从而快速准确地计算神经PDE求解器的空间导数,并引入多分辨率课程训练策略,在2D和3D PDE基准上实现高达约20倍误差降低和2-10倍收敛时间减少。
Comments Accepted by ICML 2026.Project page: https://jinjinhe2001.github.io/hermite-ngp/
从理论到决策规则:校准视觉-语言模型弱监督的噪声标签交叉点——基于三个医学影像基准
发表机构 * Department of Computer Science, Stanford University(计算机科学系,斯坦福大学)
AI总结 通过三个医学影像基准校准理论预测的噪声标签交叉点,提出基于少量金标标签的决策规则。
Comments 5 pages, 2 figures, 4 tables
Muon在视觉Transformer中的应用:优化器-数据增强交互与梯度谱
发表机构 * Los Alamos National Laboratories(洛斯阿拉莫斯国家实验室) ; Sandia National Laboratories(桑迪亚国家实验室) ; Lehigh University(莱斯大学)
AI总结 研究Muon优化器在视觉Transformer训练中的表现,发现其优于AdamW,且增益依赖于数据增强,通过梯度奇异值分析揭示Muon与AdamW在注意力投影和深层前馈块中的谱差异。
Comments 25 pages, 15 figures
CyberMaskQA: 一个用于评估大语言模型在网络安全问答中隐私意识的基准
发表机构 * Department of Computer Science and Engineering(计算机科学与工程系) ; University of California, San Diego (UCSD)(加州大学圣地亚哥分校)
AI总结 针对现有基准缺乏隐私保护评估的问题,提出CyberMaskQA基准,通过结合人工场景与LLM语义扩展生成带隐私标签的数据集,以评估模型在网络安全问答中的推理与隐私保护能力。
面向机器学习应用的全尺寸压水堆流场高保真建模
发表机构 * Department of Nuclear Engineering and Radiological Sciences, University of Michigan(密歇根大学核工程与辐射科学系) ; Department of Nuclear Science and Engineering, Massachusetts Institute of Technology(麻省理工学院核科学与工程系) ; Korea Atomic Energy Research Institute(韩国原子能研究所) ; Department of Mechanical Engineering, University of Michigan(密歇根大学机械工程系) ; Department of Computer Science and Engineering, University of Michigan(密歇根大学计算机科学与工程系)
AI总结 本研究利用高保真CFD模拟和机器学习模型,对四环路压水堆组件级流场进行表征,揭示了冷腿旋流和下腔室输运导致的入口流量分布不均匀性,并验证了ConvLSTM等空间感知架构在流场重建与预测中的优越性。
Comments 30 pages, 10 figures, and 6 Tables
强化学习的收缩反馈语义
发表机构 * The George Washington University(乔治华盛顿大学)
AI总结 本文通过将单步决策过程视为开放随机组件,并利用收缩反馈环实现无限时域策略评估,建立了强化学习的组合语义,并推导出近似等价、状态抽象和合约规范的理论结果。
运动补偿权重压缩
发表机构 * Multidisciplinary Faculty of Nador Mohammed Premier University(纳多莫哈梅德 premier 大学多学科学院)
AI总结 提出运动补偿权重压缩(MCWC)方法,通过对齐置换对称块并利用层序预测和熵编码,有效压缩神经网络权重,在Transformer语言建模和视觉分类任务中提升率-精度帕累托前沿。
Comments 54 pages, 17 tables, 6 Figures
从Ising模型中学习采样的计算相变
发表机构 * Machine Learning Department, Carnegie Mellon University(卡内基梅隆大学机器学习系) ; Department of Computer Science and Engineering, UC San Diego(加州大学圣地亚哥分校计算机科学与工程系)
AI总结 本研究构造了谱阈值以上的有界宽度Ising模型族,证明在标准密码学假设下学习采样是计算困难的,从而在谱阈值处建立了尖锐的计算相变。
神经奖励模型如何学习策略优化的特征:单指标分析
发表机构 * The University of Tokyo(东京大学) ; RIKEN AIP(理化学研究所AIP) ; LY Corporation(LY公司)
AI总结 本文通过高斯单指标模型分析两阶段神经奖励模型,研究指数奖励加权对特征学习的影响,并推导出倾斜策略价值差距的界限,给出可接受的部署温度范围。
Comments 35 pages
基于深度学习的日冕物质抛射地效性预测:利用SOHO和SDO观测数据
发表机构 * Institute for Space Weather Sciences(空间天气科学研究所) ; Department of Computer Science(计算机科学系) ; Center for Solar-Terrestrial Research(太阳-地球研究中心) ; Big Bear Solar Observatory(大熊太阳观测站)
AI总结 提出一种融合卷积神经网络和预测网络的模型,利用SOHO和SDO观测数据预测日冕物质抛射是否引发地磁暴及其概率,在五折交叉验证中TSS达0.703,Brier分数0.095。
Comments 23 pages, 12 figures, 4 tables
用于多轮LLM微调的合成轨迹的双层优化
发表机构 * Harvard University(哈佛大学) ; Georgia Institute of Technology(佐治亚理工学院)
AI总结 提出BOOST双层优化框架,通过内层加权训练和外层轻量级重加权头学习,解决合成轨迹质量异质性导致的LLM多轮交互性能下降问题。
通过InChIfied不变量将分子图解释与化学身份对齐
发表机构 * University of Lugano(卢加诺大学) ; Philochem AG(Philochem公司)
AI总结 提出基于InChI的节点、边和图特征(InChIfied Invariants),确保化学等价分子图具有一致表示,从而提升预测和解释的一致性。
关于鲁棒二元假设检验的样本复杂度
发表机构 * Department of Pure Mathematics and Mathematical Statistics, University of Cambridge(剑桥大学纯数学与数学统计系) ; Department of Statistics, Carnegie Mellon University(卡内基梅隆大学统计系)
AI总结 研究在三种污染模型下鲁棒二元假设检验的样本复杂度,证明最不利分布的存在性并给出显式公式,揭示样本复杂度对污染参数的不稳定性,并建立不同模型间样本复杂度的可比性。
Comments Comments welcome
可达性的强化学习:保证渐近最优性
发表机构 * Institute of Science and Technology, Austria(奥地利科学与技术研究所) ; Georgia Institute of Technology, USA(美国佐治亚理工学院) ; Dartmouth College, USA(美国达特茅斯学院)
AI总结 针对可达性规格的强化学习,提出一种基于PAC学习的迭代方法,在无需已知MDP内部参数的情况下实现渐近最优策略,并通过实验验证收敛动态。
Comments Main text and appendix of work accepted in ICML 2026
面向语音情感识别的硬件感知联邦学习
发表机构 * Computer Engineering(计算机工程) ; Istanbul Technical University(伊斯坦布尔技术大学) ; Department of Computer Technologies(计算机技术系) ; Istanbul University-Cerrahpaşa(伊斯坦布尔大学-塞拉赫帕沙)
AI总结 提出一种硬件感知联邦学习框架,通过硬件性能分析、Top-K客户端选择和自适应本地轮数,在IEMOCAP数据集上实现情感识别,相比FedAvg减少约36.5%训练时间和40%通信成本。
Comments 4 pages, 3 figures, 4 Tables
μP 下宽神经网络中的特征学习:平均场极限的可辨识性与稀疏字典分解
发表机构 * Independent Researcher(独立研究者)
AI总结 本文在最大更新参数化(μP)下,针对宽两层神经网络,建立了特征学习的四个结构结果,包括平均场极限的全局存在唯一性、可辨识性刻画、稀疏字典分解以及总特征学习误差分解,并揭示了架构-数据对的自然学习单元。
Comments 86 pages
部分可观测下的流式强化学习与实时循环学习
发表机构 * Technical University of Darmstadt(德累斯顿技术大学) ; University of Würzburg(维尔茨堡大学) ; German Research Center for AI (DFKI)(德国人工智能研究中心 (DFKI)) ; Zuse School(祖斯学校)
AI总结 提出使用递归迹单元(RTU)实现精确实时循环学习(RTRL),在参数数量上具有线性时间和内存复杂度,解决了部分可观测环境下流式强化学习的梯度计算瓶颈,并在离散和连续控制任务中保持性能。
Comments 16 pages, 4 figures
MDIA:HealthBench Professional上的多智能体诊断智能流水线
发表机构 * TietAI
AI总结 提出MDIA多智能体诊断系统,通过7节点专业路由临床推理图架构,在非微调LLM上实现HealthBench Professional基准性能提升3.72个百分点,归因于系统架构设计而非提示工程。
Comments 33 pages, 10 figures
CALIBURN: 操作校准流式入侵检测的机制敏感性研究
发表机构 * Independent Researcher(独立研究者)
AI总结 本文提出CALIBURN流式告警流水线,通过贝叶斯变化点检测、等渗校准、成本敏感阈值、共形风险控制和多窗口烧毁率告警五个组件,在不同攻击率场景下评估其性能,在罕见攻击场景下AUC-PR达到0.943。
Comments 55 pages, 5 figures, 14 tables. Under review at Cyber Security and Applications. Code: https://github.com/MichelYsf/rcbsid-paper. Archived release: https://doi.org/10.5281/zenodo.20074590
运动规划的动态引导代价和扩散模型
发表机构 * Computer Engineering Department, Hacettepe University(哈切特佩大学计算机工程系)
AI总结 提出一种基于扩散模型的高泛化运动规划方法,通过总碰撞代价梯度引导去噪过程并动态选择引导起始步,在Mπnets数据集上取得最优性能。
Comments Accepted at the Frontiers of Optimization for Robotics Workshop at the IEEE International Conference of Robotics & Automation (ICRA), 2026
超越聚合困境:多模态图的先验保持解耦学习
发表机构 * School of Computer Science and Engineering, Central South University(中南大学计算机科学与工程学院) ; Department of Data Science and Artificial Intelligence, The Hong Kong Polytechnic University(香港理工大学数据科学与人工智能系) ; School of Information and Communication Technology, Griffith University(格里菲斯大学信息与通信技术学院)
AI总结 针对多模态属性图学习中强制聚合导致性能反转的聚合困境,提出解耦双路径架构SUPRA,通过保持先验特征的独立性和轻量级共享GNN捕获结构协同,并辅以深度监督缓解梯度饥饿,实现SOTA性能且显著降低计算开销。
基于轨迹的难度评分用于表格数据的可靠学习
发表机构 * Faculty of Computer and Information Science, Ben-Gurion University of the Negev(计算机与信息科学学院,本·古里安内盖夫大学)
AI总结 提出轨迹难度评分(TDS),通过分析梯度提升树的逐树累积预测轨迹,为每个实例估计难度,并在分类和回归任务中优于现有基线,同时支持主动学习、选择性预测和共形预测等应用。
凸聚类中的亲和图连通性
发表机构 * Department of Statistical Science, Duke University(杜克大学统计科学系) ; Department of Biostatistics, University of California Los Angeles(加州大学洛杉矶分校生物统计学系)
AI总结 研究凸聚类中亲和权重对应一般连通图时的有限样本界,通过随机游走理论分析聚类性能与图结构连通性的关系,并提出超参数调优应包括亲和权重的调整。
Comments 28 pages, 6 figures
当平均交叉熵失效时:中位数交叉熵能更好地跟踪语言模型质量
发表机构 * i14 ; University of Melbourne(墨尔本大学) ; University of California, Santa Cruz(加州大学圣克ruz分校)
AI总结 本文发现中位数交叉熵比平均交叉熵更能反映语言模型在训练过程中的任务性能,并建议在评估时报告多个百分位交叉熵。
Comments 20 pages
IterInject: 通过反馈引导的迭代优化实现对LLM智能体的间接提示注入
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; The University of Hong Kong(香港大学)
AI总结 提出IterInject框架,通过规则诊断器和LLM优化器迭代优化对抗载荷,实现对LLM智能体的间接提示注入攻击,在多个基准和实际系统中显著优于现有方法,并揭示了注意力介导的阈值机制。
Comments Submitted to EMNLP 2026
WLNO: 用于求解偏微分方程的小波-拉普拉斯神经算子
发表机构 * Department of Mechanical and Aerospace Engineering, University of Tennessee, Knoxville(田纳西大学机械与航空航天工程系)
AI总结 提出WLNO,通过融合Haar小波多尺度空间分解与拉普拉斯神经算子的极点-留数公式,在五个基准PDE问题上优于LNO,尤其擅长处理具有强空间多尺度结构的问题。
WINO: 一种用于变域超弹性问题的弱形式物理信息神经算子
发表机构 * School of Science, Harbin Institute of Technology, Shenzhen, P. R. China(哈尔滨工业大学深圳校区) ; School of Science, Harbin Institute of Technology, Shenzhen, Guangdong(哈尔滨工业大学深圳校区) ; Institute of Structural Mechanics, Bauhaus-Universität Weimar(魏玛 Bauhaus 大学结构力学研究所)
AI总结 提出一种无数据框架WINO,结合神经算子的效率与φ-有限元法的几何灵活性,通过最小化弱形式残差和惩罚项训练,实现高精度且计算时间减少50-80%。
揭秘神话或颠覆漏洞经济学?从零日不对称到防御者修复吞吐量
发表机构 * University College London(伦敦大学学院) ; Bynario
AI总结 本文通过漏洞经济学视角分析LLM驱动的漏洞发现,指出其核心影响并非增加零日漏洞,而是提升防御者修复吞吐量,并利用Anthropic Mythos预览和Mozilla Firefox合作数据论证这一转变。
超越生成先验:JEPA引导扩散的少数采样
发表机构 * Department of Artificial Intelligence, Kookmin University, Seoul, South Korea(人工智能系,韩国全州大学,首尔)
AI总结 提出一种基于世界模型JEPA引导的扩散采样框架,通过近似策略实现高效计算,在无条件、类别条件和文本到图像生成中提升少数样本的保真度和语义有效性。
Comments ICML 2026, 21 pages, 9 figures
相位感知的基于小波散射的编解码器用于密集预测
发表机构 * Northern Paris Computer Science Lab, Sorbonne Paris Nord University, Villetaneuse, France(北巴黎计算机科学实验室,巴黎-索邦大学,法国维莱特内斯)
AI总结 提出一种相位感知散射编解码器,通过在跳跃连接中显式保留相位信息来恢复空间结构,在图像去噪和皮肤病变分割任务中验证了相位对密集预测的有效性。
Comments 21 pages, 16 figures, 10 tables
通过激活修补测量大语言模型遗忘的深度
发表机构 * Sungkyunkwan University(全北大学)
AI总结 提出遗忘深度评分(UDS),通过激活修补量化遗忘的机制深度,在150个遗忘模型上的元评估中达到最高忠实性和鲁棒性。
Comments 18 pages
超越不动点:非对称Hopfield网络的超多项式容量
发表机构 * COATI, CNRS, Inria, I3S, Université Côte d’Azur, France(法国国家科学研究中心(CNRS)、法国国家信息与自动化研究所(Inria)、I3S研究所、蔚蓝海岸大学) ; School of Electrical and Computer Engineering, Tel Aviv University, Israel(特拉维夫大学电气与计算机工程学院) ; Department of Informatics, King’s College London, UK(伦敦国王学院信息学院) ; Institute of Science and Technology Austria (ISTA), Klosterneuburg, Austria(奥地利科学与技术研究所(ISTA))
AI总结 通过结合组合数学、数论和观点动力学分析,在经典同步非对称Hopfield网络中实现了指数级数量的极限环吸引子,每个吸引子具有指数级周期且对噪声鲁棒,首次证明了非对称Hopfield网络的超多项式容量。
基于数学形态学的深度卷积学习的格论与代数模型
发表机构 * Mines Paris, PSL University, CMA-Center for Applied Mathematics, Sophia-Antipolis, France(巴黎 Mines 学院,PSL 大学,应用数学中心,法国索菲亚-安蒂波利斯)
AI总结 本文基于格论和数学形态学,为深度卷积架构(CNN、ResNet、UNet)建立了严格的代数框架,揭示了标准CNN流水线是交叉格算子,并识别出三种真正的幂等开运算层设计。
CSP-Atlas: 稀疏Python Transformer中的概念特异性神经回路
发表机构 * University College London(伦敦大学学院)
AI总结 通过提取106个Python概念的特异性神经回路,发现模型内部组织遵循计算结构而非语义类别,并识别出原子性超簇。
Comments Code: https://github.com/piotrwilam/AtlasCSP
学习通过A*后训练进行高效推理
发表机构 * ETH Zürich(苏黎世联邦理工学院) ; MPI for Intelligent Systems, Tübingen(图宾根智能系统研究所) ; Purdue University(普渡大学)
AI总结 本文通过A*搜索算法指导LLM生成正确且高效的推理步骤,提出监督微调和强化学习两种训练方法,在1B-3B参数模型上显著提升推理准确性和效率。
Comments Preprint
Physen-Noise2Noise: 低光条件下带偏差校正的物理引导自监督散焦去模糊
发表机构 * School of Mathematics and Statistics, Central South University(数学与统计学学院,中南大学) ; Key Laboratory for Micro/Nano Optoelectronic Devices of Ministry of Education, Hunan Provincial Key Laboratory of Low-Dimensional Structural Physics and Devices, School of Physics and Electronics, Hunan University(教育部微/纳米光电器件重点实验室,湖南省低维结构物理与器件重点实验室,物理与电子学院,湖南大学)
AI总结 提出一种基于物理模型的自监督散焦去模糊框架Physen-Noise2Noise,通过可学习噪声偏差参数和频域约束,在无干净参考图像的情况下联合校正偏差噪声并恢复高频细节。
Comments 14 pages
HeartBeatAI:用于多标签心电图心律失常的可解释且鲁棒的深度学习框架
发表机构 * Department of Computer Science and Engineering, Indian Institute of Technology Roorkee(印度拉胡尔理工学院计算机科学与工程系)
AI总结 提出HeartBeatAI框架,结合域泛化、多尺度特征聚合和临床可解释性,通过Squeeze-and-Excitation ResNet和多层浓度管道实现鲁棒的12导联心电图分类,在跨数据集评估中达到98%宏F1分数,但跨机构部署时罕见异常检测仍存在挑战。
LAPLEX: 可学习拉普拉斯核的FFT
发表机构 * Faculty of Mathematics and Computer Science, Jagiellonian University(杰里戈尼亚大学数学与计算机科学系) ; Doctoral School of Exact and Natural Sciences, Jagiellonian University(杰里戈尼亚大学精确与自然科学博士学院) ; Centre for Credible Artificial Intelligence, Warsaw University of Technology(华沙技术大学可信人工智能中心)
AI总结 提出LAPLEX算子,通过可学习坐标锚点隐式定义满秩稠密矩阵,实现FFT规模的可训练矩阵-向量运算,分离表达性与存储成本。
多态性即旋转:从两层Transformer到Pythia-70m的操作性机械可解释性
发表机构 * Independent Researcher(独立研究者)
AI总结 本文发现独立训练的Transformer在残差流基上通过均匀随机旋转相互关联,并利用正交Procrustes拟合实现特征字典和转向向量在模型间的迁移,无需重新训练。
Comments 26 pages, 4 figures, 40 references. Pre-registered four-bar framework; all numerical claims reproducible
PILOT: 策略引导的学习优化器用于自适应深度网络训练
发表机构 * King Abdullah University of Science and Technology(卡布斯大学) ; University of Strathclyde(斯特拉思克莱德大学)
AI总结 提出PILOT在线优化器,通过梯度方向一致性信号动态调整动量、归一化和符号更新的组合,在FashionMNIST和CIFAR-10上实现更高准确率。
Comments 16 pages, 5 figures
EMA: 面向解剖学努力引导的人体运动扩散的努力度量注意力
发表机构 * Nara Institute of Science and Technology(奈良科学技术大学)
AI总结 提出基于努力度量注意力(EMA)的强度控制框架,通过数值努力信号调节运动扩散模型,实现细粒度、区域化的运动强度控制,并验证了与LMA描述符的单调对齐。
Comments Accepted at IEEE International Conference on Automatic Face and Gesture Recognition (FG 2026)
召唤神谕以屠之:利用大语言模型缓解金融回测中的前瞻偏差
发表机构 * University of Edinburgh(爱丁堡大学)
AI总结 提出FinCAD方法,通过对抗性偏差发现和实体日期自适应规则,在不重新训练的情况下抑制大语言模型对历史结果的记忆,从而缓解金融回测中的参数化前瞻偏差。
立场:科学人工智能应将测量到数据集的处理流程视为推理组件
发表机构 * College of Computer and Information Science(计算机与信息科学学院) ; Chongqing Key Laboratory of Brain-Inspired Cognitive Computing and Educational Rehabilitation for Children with Special Needs(重庆脑启发认知计算及特殊需要儿童教育康复重点实验室) ; Chongqing Normal University(重庆师范大学)
AI总结 本文主张科学人工智能中的测量到数据集流程应被视为推理组件,并揭示了将其输出视为固定数据导致的三个失败模式,通过大规模神经科学实证验证了问题的严重性,呼吁建立可计算的观测框架。
Comments 23 pages, 5 figures, Proceedings of the 43 rd International Conference on Machine Learning, Seoul, South Korea. PMLR 306, 2026
多语言诅咒在检索层:来自阿姆哈拉语的证据
发表机构 * Independent Researcher(独立研究者) ; University of Amsterdam(阿姆斯特丹大学)
AI总结 针对零样本多语言检索在低资源形态丰富语言(如阿姆哈拉语)上表现不佳的问题,通过对比实验发现单语检索器显著优于多语言检索器,并揭示了多语言基准测试的局限性。
Comments 10 pages, 4 tables. Accepted to the 1st Workshop on Multilinguality in the Era of Large Language Models (MeLLM) at ACL 2026
越狱以保护:通过临时越狱进行缓冲和强化以实现大型语言模型的安全微调
发表机构 * School of Electrical Engineering, Korea Advanced Institute of Science and Technology (KAIST)(韩国科学技术院电子工程学院)
AI总结 针对微调即服务中安全对齐被有害微调攻击削弱的问题,提出一种基于梯度分析的缓冲与强化框架,通过临时越狱适配器减少有害更新并利用QR分解合并强化安全,实现无需额外安全数据的高效防御。
Comments ICML 2026 Spotlight
Deep ZakaiJ:用于跳跃扩散时间序列预测的结构化滤波
发表机构 * University of Texas at Austin(德克萨斯大学奥斯汀分校) ; University of California, Berkeley(加州大学伯克利分校)
AI总结 提出Deep ZakaiJ模型,将Zakai非线性滤波方程嵌入神经编码器-解码器架构,通过Strang分裂实现隐状态信念更新,用于部分观测的跳跃扩散系统,在合成、金融和海洋数据集上改进了分布预测并保持点精度竞争力。
基于可学习文本反馈的强化学习:一种双层方法
发表机构 * University of Central Florida(佛罗里达中央大学)
AI总结 针对稀疏奖励导致样本效率低的问题,提出一种双层优化框架Bi-NAC,联合训练评论家生成可改善策略的文本反馈和演员利用该反馈,在MATH-500等任务上提升了样本和参数效率。
通过记忆视角重新思考联邦遗忘学习
发表机构 * Royal Melbourne Institute of Technology(皇家墨尔本理工学院) ; Griffith University(格里菲斯大学) ; Swinburne University of Technology(斯威本理工大学)
AI总结 针对联邦学习中遗忘数据与保留数据重叠导致遗忘无效和客户端不公平的问题,提出基于分组记忆评估的联邦记忆剪枝方法,通过重置负责记忆的冗余参数实现高效遗忘。
Comments This paper has been accepted by SIGKDD 2026
AI驱动的自适应对手与公钥系统中密码学信任的侵蚀
发表机构 * Department of Computer Sciences, University of Oxford(牛津大学计算机科学系) ; The Alan Turing Institute(艾伦·图灵研究所) ; British Library(大英图书馆)
AI总结 本文研究人工智能驱动的自适应对手如何利用实现层面的可观测性侵蚀公钥密码学的安全性,提出了一种新的安全评估框架。
SemanticZip: 以LLM作为语义解压器的有损文本压缩的试点框架
发表机构 * Embedded Intelligence Lab (EMILAB)(嵌入式智能实验室)
AI总结 提出SemanticZip框架,通过LLM将文本压缩为紧凑代码并解压为任务相关语义,在结构化散文、JSON等六种表示上评估,发现结构化散文恢复率最高(WAR=0.956,19.1%令牌增益),而CCL-Min平衡性最佳(39.4%令牌增益,WAR=0.874)。
Comments 13 pages, 1 figure, 2 tables. Pilot framework paper; code and supplementary artifacts available in ancillary files
MOSS:自主智能体系统中通过源代码级重写的自我进化
发表机构 * University of Science and Technology of China(中国科学技术大学) ; Hong Kong Generative AI Research & Development Center(香港生成式AI研究与开发中心) ; The Hong Kong University of Science and Technology(香港理工大学) ; Hong Kong Baptist University(香港 Baptist大学)
AI总结 提出MOSS系统,通过源代码级重写实现自主智能体系统的自我进化,利用生产故障证据自动批处理和多阶段确定性流水线,在OpenClaw上单周期内将平均评分从0.25提升至0.61。
Comments 12 pages, 3 figures, 2 tables. Preprint. Code: https://github.com/hkgai-official/Moss
ChronoVAE-HOPE:超越注意力——面向专业时间序列分类的下一代VAE基础模型
发表机构 * Department of Computer Science and Artificial Intelligence(计算机科学与人工智能系) ; DiCITS ; iMUDS ; DaSCI ; University of Granada(格拉纳达大学) ; Advanced Medical Imaging Group(先进医学成像组) ; Instituto de Investigación Biosanitaria de Granada(格拉纳达生物医学研究 institute) ; Department of Software Engineering(软件工程系) ; Department of Rural Engineering(农村工程系) ; University of Córdoba(科尔多瓦大学)
AI总结 提出ChronoVAE-HOPE,一种基于VAE和HOPE块(含Titans模块和连续记忆系统)的下一代时间序列基础模型,通过解耦潜在空间分离趋势与季节成分,在UCR基准分类任务上表现优异。
利用学习随机参数化分解 Lorenz '96 中的集合离散度
发表机构 * Technical University of Munich(慕尼黑技术大学) ; Helmholtz Munich(海德堡-慕尼黑研究所) ; Munich Center for Machine Learning (MCML)(慕尼黑机器学习中心) ; Centrum Wiskunde & Informatica (CWI)(荷兰代尔夫特数学与信息研究所) ; Korteweg-de Vries Institute for Mathematics, University of Amsterdam(阿姆斯特丹大学克罗内克-德·维尔斯数学研究所)
AI总结 本研究利用双尺度 Lorenz 1996 系统,通过比较多种集合配置和参数化策略,系统分析了内在变率、初始条件扰动和随机模型不确定性对集合离散度的影响,揭示了随机参数化特别是时间持续结构能增强早期离散度增长并改善离散度-误差一致性。
多模态机器学习用于群体和个体特异性lncRNA-2型糖尿病关联分析
发表机构 * Department of Electronics and Communication Engineering, IIITDM Jabalpur(IIITDM Jabalpur电子与通信工程系) ; Department of Electronics and Communication Engineering, Central University of Jammu(Jammu中央大学电子与通信工程系)
AI总结 本研究通过整合表达、二级结构和序列特征的多模态机器学习框架,在独立队列中识别与2型糖尿病相关的lncRNA,并利用SHAP分析实现群体和个体水平的关联解释。
Comments This work has been submitted to the IEEE for possible publication
基于米勒指数的潜在晶体学断裂面推理与生成:视觉-语言模型方法
发表机构 * Independent research(独立研究)
AI总结 研究多模态大语言模型能否利用米勒指数作为结构化潜在表示来推理断裂几何,实验表明模型在理想条件下可进行潜在推理,并能拒绝不适用物理的表示。
ClaimDiff-RL: 通过视觉声明比较进行细粒度描述强化学习
发表机构 * The Chinese University of Hong Kong(香港中文大学) ; MiniMax
AI总结 提出ClaimDiff-RL框架,利用原子声明差异作为奖励单元,通过多模态判断器枚举视觉差异并分配错误类型和严重程度,以解决长描述强化学习中事实性与覆盖度的权衡问题。
通过多项式最大化密度估计的方差缩减流形采样
发表机构 * Department of Information, Multimedia Technologies and Design, Cherkasy State Business College(切爾卡西州商業學院信息、多媒體技術與設計系) ; State Scientific Research Institute of Armament and Military Equipment Testing and Certification(武器和軍事設備測試和認證國家科學研究 institutes) ; Department of Cybernetics and Applied Mathematics, Uzhhorod National University(烏茲霍羅德國家大學自動控制與應用數學系)
AI总结 针对隐式定义流形上的均匀采样问题,提出一种基于多项式最大化矩估计的密度估计模块PMM-MASEM,通过门控机制在非平坦间距分布下替代传统插件估计,降低密度均方误差22-36%。
Comments 16 pages, 5 figures, 3 tables. Code supplement: https://github.com/SZabolotnii/Ku-PMM-MASEM-code-supplement
解锁持续模型合并的潜力:ODE视角
发表机构 * Northeastern University, Shenyang, China(东北大学,沈阳,中国)
AI总结 提出ODE-M框架,将持续模型合并建模为参数空间中的轨迹,通过整流时变速度场和效用感知时间调度平衡历史知识与新任务,提升长任务流性能。
Comments 21 pages, 8 figures
使用高阶朗之万动力学减少扩散模型记忆化
发表机构 * Department of Applied Math & Statistics(应用数学与统计学系) ; Stony Brook University(石溪大学) ; Department of Electrical and Computer Engineering(电气与计算机工程系) ; Faculty of Engineering(工程学院) ; Bar-Ilan University(巴伊兰大学)
AI总结 本文研究高阶朗之万动力学(HOLD)对扩散模型记忆化的影响,通过理论分析表明HOLD通过低通滤波学习得分函数并随阶数增加平滑度,从而缓解记忆化,并在真实数据上验证了理论。
前沿模型的成长之痛:当排行榜不再区分以及接下来衡量什么
发表机构 * Zehen Labs(泽亨实验室)
AI总结 本文通过分解SWE-bench和GPQA Diamond分数为种群耦合趋势和每版本残差(h场),诊断前沿模型能力之间的协作与权衡,并提供三步诊断法、每实验室测量优先级表及七个可证伪预测。
Comments 13 pages, 5 figures, 4 tables. Companion paper: "Lying Is Just a Phase: The Hidden Alignment Transition in Language Model Scaling." ( https://doi.org/10.48550/arXiv.2605.18838 ). Code: https://github.com/adilamin89/cape-scaling . Dashboard: https://zehenlabs.com/cape/
KairosHope: 一种基于双记忆架构的下一代时间序列基础模型,用于专门分类
发表机构 * Department of Computer Science and Artificial Intelligence(计算机科学与人工智能系) ; DiCITS, iMUDS, DaSCI(DiCITS、iMUDS、DaSCI) ; University of Granada(格拉纳达大学) ; Advanced Medical Imaging Group(先进医学成像组) ; Instituto de Investigación Biosanitaria de Granada (ibs.Granada)(格拉纳达生物医学研究机构(ibs.Granada)) ; Department of Software Engineering(软件工程系) ; Department of Rural Engineering(农村工程系) ; University of Córdoba(科尔多瓦大学)
AI总结 针对标准注意力计算瓶颈和经典统计知识缺失问题,提出KairosHope模型,通过双记忆系统(Titans模块和连续记忆系统CMS)替代二次注意力,并融合深度表示与统计特征的混合决策头,在UCR基准上实现优越分类性能。
少样本示例如何累加:上下文学习中函数向量的因果分解
AI总结 本文通过因果分解揭示少样本提示中函数向量由示例级子向量线性组合而成,并发现模型通过注意力重加权机制根据上下文调整示例贡献。
Comments Accepted at ICML 2026. 70 pages, 65 figures
多语言OCR感知微调和提示引导的链式思维推理用于多模态大语言模型
发表机构 * Meta AI ; UT Austin(德克萨斯大学奥斯汀分校)
AI总结 提出一种多语言OCR感知的多模态训练框架,通过合成数据生成、OCR感知微调和结构化视觉链式思维提示,提升多模态大语言模型在复杂视觉条件下的OCR完整性和多语言翻译准确性。
一步之遥:为什么针对恶意微调的防御在自适应对手面前失败
发表机构 * Ben-Gurion University of the Negev(贝纳-约瑟夫大学) ; Amrita Vishwa Vidyapeetham(阿米塔维莎瓦迪耶佩塔)
AI总结 本文通过分析15种近期防御机制,发现它们共享一个弱点:仅掩盖或误导有害行为路径而未消除行为本身,并开发了一种统一的自适应攻击,成功突破了所有防御机制。
Comments Under review
经典规划中提升动作模式的可微学习
发表机构 * RWTH Aachen University(亚琛工业大学)
AI总结 提出一种神经网络架构,从完全可观测状态但动作参数未观测的轨迹中学习提升动作模式,实现近乎完美的结构恢复。
涌现性失调中的人格模型崩溃
发表机构 * TELUS Digital Research Hub(TELUS数字研究中心) ; Center for Artificial Intelligence and Machine Learning(人工智能与机器学习中心) ; Institute of Mathematics, Statistics and Computer Science(数学、统计与计算机科学研究所) ; University of São Paulo(圣保罗大学)
AI总结 提出人格模型崩溃假说,通过道德易感性(S)和道德稳健性(R)两个指标,证明在有害数据上微调大语言模型会导致模型模拟、区分和维持一致角色的内部能力恶化,从而引发涌现性失调。
Comments 23 pages, 7 figures, 7 tables; NeurIPS 2026 submission; Corrected code repository URL
无套利条件下使用变分自编码器的收益率曲线动力学
发表机构 * Department of Applied Mathematics and Statistics, Johns Hopkins University, USA(应用数学与统计学系,约翰霍普金斯大学,美国)
AI总结 提出一种物理信息生成框架,通过两阶段架构(学生t条件变分自编码器+动态水平注入和神经随机微分方程)解决深度学习统计灵活性与固定收益理论约束的冲突,在多个主权货币上显著降低预测误差并实现无套利。
Comments This is the full script (version 2) of our paper, which is awaiting submission to financial journals/conferences, after modifying and double-checking the reference lists
保持分数:通过分数增强损失函数提高神经似然代理训练的效率
发表机构 * Department of Statistics and Data Science(统计与数据科学系)
AI总结 针对随机过程模型,提出通过分数增强损失函数和自适应加权改进神经似然代理训练,在显著降低计算成本的同时提升代理质量,实现与10倍训练数据相当的推理性能。
Comments 9 pages of main text, 9 pages of appendices, 13 figures
SURGE: 二值神经网络中的替代梯度自适应
发表机构 * National College for Excellent Engineers, Beihang University, Beijing, China(北京航空航天大学优秀工程师学院) ; School of Artificial Intelligence, Beihang University, Beijing, China(北京航空航天大学人工智能学院) ; School of Electronic and Information Engineering, Beihang University, Beijing, China(北京航空航天大学电子与信息工程学院) ; King Abdullah University of Science and Technology, Saudi Arabia(沙特国王 Abdullah 科学技术大学) ; Huawei Noah’s Ark Lab, China(华为诺亚实验室)
AI总结 针对二值神经网络中梯度失配和固定范围梯度裁剪导致的信息损失问题,提出一种基于理论的可学习梯度补偿框架SURGE,通过双路径梯度补偿器和自适应梯度缩放器实现偏差减少的梯度估计与动态平衡,在图像分类、目标检测和语言理解任务上达到最优性能。
Comments Accepted as a poster at the 43rd International Conference on Machine Learning (ICML 2026)
一种面向计算连续体中因果可观测性的不确定性感知韧性微代理
发表机构 * Department of Computer Systems and Sciences(计算机系统与科学系) ; Department of Computer Science(计算机科学系)
AI总结 提出AURORA框架,通过集成自由能原理、因果do-calculus和局部因果状态图,在边缘层实现灰色故障的因果诊断与缓解,并采用双门控执行机制在不确定性高时避免破坏性干预。
跟随均值:参考引导的流匹配
发表机构 * University of Amsterdam(阿姆斯特丹大学) ; AMLab(AML实验室)
AI总结 提出通过改变参考集均值来引导预训练流匹配模型实现可控生成,无需微调或额外网络。
PACZero: 通过符号量化的语言模型PAC隐私微调
发表机构 * CWI Amsterdam(阿姆斯特丹信息与计算科学研究所) ; MIT Cambridge(麻省理工学院) ; Vrije Universiteit Amsterdam(阿姆斯特丹自由大学)
AI总结 提出PACZero系列零阶机制,通过符号量化实现零互信息下的PAC隐私微调,在SST-2和SQuAD上取得竞争性结果。
基于随机洗牌的DP-SGD的权衡函数:紧的上界和下界
发表机构 * CWI Amsterdam(阿姆斯特丹信息与计算科学研究所) ; Vrije Universiteit Amsterdam(阿姆斯特丹自由大学)
AI总结 本文在$f$-DP框架下,针对基于随机洗牌子采样的差分隐私随机梯度下降(DP-SGD),推导了权衡函数的紧致分析,得到了透明且可解释的闭式界,并展示了单轮训练中达到有意义的差分隐私所需的参数设置。
使用行为树和LLM的组合任务奖励塑造与动作掩码
发表机构 * Vanderbilt University(范德比大学)
AI总结 提出MRBT结构,结合LLM自动生成奖励和动作掩码,通过SMT验证和神经符号RL循环,提升组合任务训练效率和成功率。
全谱图神经网络:表达力与可扩展性
发表机构 * Division of Mathematical Sciences, School of Physical and Mathematical Sciences, Nanyang Technological University, Singapore 637371, Singapore(数学科学学院,物理与数学科学学院,南洋理工大学,新加坡637371,新加坡)
AI总结 提出全谱图神经网络(FSpecGNN),通过将信号从节点域提升到节点对域并将单变量谱滤波器扩展为双变量滤波器,实现了对节点对信号的通用逼近,同时保持可扩展性。
Comments 41 pages, 4 figures. Accepted to ICML 2026
将结果监督内化为过程监督:推理强化学习的新范式
发表机构 * Alibaba Group(阿里巴巴集团) ; Tsinghua University(清华大学)
AI总结 提出一种监督内化方法,使模型在仅结果监督下自动提取过程级学习信号,实现细粒度策略优化。
通过测试时后验调整缓解表格上下文学习中的标签偏移
发表机构 * LG AI Research(LG人工智能研究)
AI总结 针对TabPFN在表格数据上下文学习中对标签偏移敏感的问题,提出DistPFN方法,通过测试时后验调整重新缩放类别概率,无需修改架构或额外训练,在250多个OpenML数据集上显著提升分类性能。
Comments ICML 2026
从肌肉爆发到运动意图:面向异质EMG的自监督令牌建模
AI总结 提出AEMG自监督学习方法,通过事件级令牌建模和Transformer编码,从异质EMG数据中提取可复用的神经肌肉表征,提升跨用户、跨会话的鲁棒性并减少校准数据需求。
Comments After further verification, we identified issues in the current version that may affect the reliability and reproducibility of the reported experimental results. In particular, part of the evaluation relies on a dataset for which the public-release/redistribution status and supporting validation remain unresolved
稀疏混合专家模型中的软到硬路由
发表机构 * Meta Platforms, Inc(Meta平台)
AI总结 本文通过边界层微积分方法,研究了稀疏混合专家模型中softmax路由随温度趋于零时趋近于硬top-1路由的极限过程,并给出了基于路由界面邻域概率的定量误差界。
迷失在解码中?复现与压力测试生成式检索中的前瞻先验
发表机构 * University of Amsterdam(阿姆斯特丹大学)
AI总结 本文复现并压力测试了生成式检索中的前瞻先验方法PAG,发现其规划信号在词汇表面形式变化下脆弱,并评估了跨语言鲁棒性与查询端缓解策略。
Comments 12 pages, 5 figures, 9 tables; accepted to the 49th International ACM SIGIR Conference on Research and Development in Information Retrieval, July 20-24, 2026, Melbourne/Naarm, Australia
MoBayes:一种用于对话式临床决策支持中推理与语言分离的模块化贝叶斯框架
发表机构 * LiGHT, EPFL(LiGHT,瑞士联邦理工学院) ; University of Bern(伯尔尼大学) ; Aarhus University(奥胡斯大学)
AI总结 提出MoBayes框架,通过将LLM作为语言接口、贝叶斯模块进行概率推理,实现推理与语言分离,在临床决策支持中优于独立前沿LLM医生。
Comments 50 pages including appendix, 13 figures, 22 tables. Preprint
基于分类决策的新产品最优探索
发表机构 * Stern School of Business, New York University(纽约大学斯特恩商学院) ; Massachusetts Institute of Technology(麻省理工学院)
AI总结 研究平台在容量约束下通过分类决策在线学习新产品质量,提出最优探索策略以最小化遗憾,并揭示新产品应与顶级现有产品搭配、同时探索数量由潜力决定等结构洞见。
深度寄存器解锁 SwiGLU 上的 W4A4:一种读取器/生成器分解
AI总结 本研究通过深度寄存器和铰链损失(DR+sink)训练时干预,将 SwiGLU 解码器语言模型的 W4A4 量化困惑度从 1727 降至 119,并分解出残差轴读取器主导误差,而生成器 w2 的双线性输入是剩余差距的主因。
Comments The authors have decided to withdraw this version following internal review regarding authorship and contribution agreements
重新思考序列级强化学习中的比较单元:从损失校正到样本构建的等长配对训练框架
发表机构 * Alibaba Group(阿里巴巴集团) ; Tsinghua University(清华大学)
AI总结 本文提出序列级相对强化学习中的长度问题本质是比较单元构建问题,并基于此提出等长配对训练框架EqLen,通过双轨同步生成、前缀继承和段掩码构建可比较的训练样本。
文本上的联邦:多智能体推理的洞察共享
发表机构 * University of Chicago(芝加哥大学) ; Google DeepMind(谷歌DeepMind)
AI总结 提出一种类似联邦学习的框架FoT,通过迭代聚合多个客户端的本地推理过程,构建跨任务元认知洞察库,无需共享问题实例或任务指令,显著提升推理效果和效率。
Comments 46 pages
ORACAL: 一种基于因果图增强的鲁棒且可解释的智能合约漏洞检测多模态框架
发表机构 * Information Security Lab, University of Information Technology(信息安全部,信息科技大学) ; Vietnam National University(越南国家大学) ; School of Computer Science and Information Technology, Adelaide University(计算机科学与信息技术学院,阿德莱德大学)
AI总结 提出ORACAL异构多模态图学习框架,集成控制流图、数据流图和调用图,通过RAG和LLM增强关键子图,并采用因果注意力机制和PGExplainer实现鲁棒且可解释的智能合约漏洞检测。
Comments 21 pages, version 2
基于CSI元组的多模态学习辅助3D信道指纹构建
发表机构 * National Mobile Communications Research Laboratory, Southeast University(东南大学国家移动通信研究中心) ; Purple Mountain Laboratories(紫金山实验室) ; Huawei Technologies Co., Ltd.(华为技术有限公司)
AI总结 针对低空通信中的3D信道指纹构建问题,提出一种基于CSI元组的多模态回归框架,通过融合位置、通信测量和地理环境地图,实现高效高精度的信道状态信息估计。
Comments 14 pages, 9 figures
利用深度VAE-GAN增强数据同化中储层属性的参数化
发表机构 * Departamento de Engenharia de Minas e de Petróleo, Escola Politécnica, Universidade de São Paulo(圣保罗大学采矿与石油工程系,理工学院) ; Department of Earth Science and Engineering, Imperial College London(伦敦帝国理工学院地球科学与工程系)
AI总结 提出将VAE-GAN与ESMDA结合,以同时实现高质量储层描述和良好历史拟合,克服传统方法在非高斯分布和有限集合大小上的局限。
有界噪声下多元核回归的最优不确定性界:基于高斯过程的对偶函数
发表机构 * Institute for Dynamical Systems and Control, ETH Zurich(动态系统与控制研究所,苏黎世联邦理工学院) ; Department of Electrical Engineering, Chalmers University of Technology(电气工程系,查尔姆斯理工大学) ; Department of Mechanical Engineering, Imperial College London(机械工程系,伦敦帝国理工学院)
AI总结 针对有界噪声下再生核希尔伯特空间中的多输出函数,提出一种紧致、确定性的不确定性界,通过无约束对偶公式获得,具有与经典高斯过程置信界相同的结构,便于集成到下游优化中。
Comments Extended version
GeMPO:在线扩散强化学习的广义度量匹配
发表机构 * Harvard University(哈佛大学) ; Georgia Institute of Technology(佐治亚理工学院)
AI总结 提出GeMPO框架,通过将扩散RL中的重加权从softmax推广到一般单调函数,并引入负重加权机制,以解决过贪策略和负样本利用不足的问题。
Comments 22 pages, 6 figures
Grouter: 将路由与表示解耦以加速MoE训练
发表机构 * School of Mathematical Sciences, Peking University, Beijing, China(北京大学数学科学学院) ; Center for Machine Learning Research, Peking University, Beijing, China(北京大学机器学习研究中心) ; Yuanpei College, Peking University, Beijing, China(北京大学元培学院) ; Zhejiang Lab, Hangzhou, China(浙江实验室)
AI总结 提出Grouter方法,通过从预训练MoE模型中蒸馏高质量结构作为固定路由器,解耦结构优化与权重更新,显著加速模型收敛并提升训练吞吐量。
基于LoRA的持续学习中任务驱动的子空间分解用于知识共享与隔离
发表机构 * Department of XXX, University of YYY, Location, Country(XXX部门,YYY大学,地点,国家) ; School of ZZZ, Institute of WWW, Location, Country(ZZZ学院,WWW研究所,地点,国家) ; State Key Laboratory of Integrated Services Networks, School of Telecommunications Engineering, Xidian University, Xi'an, China(信息服务网络国家重点实验室,电信工程学院,西安电子科技大学,西安,中国) ; School of Electronic Engineering, Xidian University, Xi'an, China(电子工程学院,西安电子科技大学,西安,中国)
AI总结 提出LoDA方法,通过任务驱动分解构建通用和任务特定LoRA子空间,结合梯度对齐优化和闭式重校准,实现知识共享与隔离,提升持续学习性能。
Comments Accepted by ICML 2026
通过打字行为检测认知特征以实现非侵入式作者验证
发表机构 * Writerslogic, Inc.(Writerslogic公司)
AI总结 利用大规模击键数据集中的认知负荷相关性(CLC)区分真实创作与机械转录,提出一种仅收集时间元数据的非侵入式验证框架,在保护隐私的同时实现85-95%的判别准确率,并证明认知特征对时序伪造攻击具有鲁棒性。
Comments 7 pages
TorchLean: 在 Lean 中形式化神经网络
发表机构 * California Institute of Technology(加利福尼亚理工学院) ; Washington University in St. Louis(华盛顿大学圣路易斯分校) ; University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校)
AI总结 提出 TorchLean 框架,在 Lean 4 中统一神经网络的执行、验证与定理证明,通过共享语义弥合执行网络与分析工件之间的语义鸿沟。
Comments 55 pages
多流审计的全局序贯检验
发表机构 * Mathematical Institute for Data Science (MINDS), Johns Hopkins University(数据科学数学研究所(MINDS),约翰霍普金斯大学) ; Department of Biomedical Engineering, Johns Hopkins University(生物医学工程系,约翰霍普金斯大学) ; Amazon Responsible AI(亚马逊负责任人工智能)
AI总结 针对多数据流审计问题,提出基于鞅合并的序贯检验方法,在稀疏和密集备择假设下分别达到最优停止时间,并通过实验验证。
Adam和Muon在光滑齐次神经网络上的隐式偏差
发表机构 * Department of Computer Science and Applied Mathematics, Weizmann Institute of Science, Rehovot, Israel(计算机科学与应用数学系,魏茨曼科学研究院,以色列雷霍夫特)
AI总结 研究动量优化器在光滑齐次模型上的隐式偏差,证明Muon、MomentumGD和Signum在衰减学习率下近似于最速下降轨迹,并偏向于对应边际最大化问题的KKT点,同时将分析扩展到Adam和混合范数优化器。
Comments ICML 2026. 8 pages, 1 figure (with appendix: 45 pages, 3 figures)
UniComp: 通过剪枝、量化和蒸馏对大型语言模型压缩的统一评估
发表机构 * University College London(伦敦大学学院) ; University of Tübingen(图宾根大学) ; Tübingen AI Center(图宾根人工智能中心)
AI总结 提出UniComp框架,统一评估剪枝、量化和知识蒸馏三种压缩方法,从性能、可靠性和效率三个维度在40个数据集上分析,发现知识偏差、性能与可靠性解耦以及任务特定校准可提升推理性能。
Comments 18 pages, 5 figures, 18 tables
LLM-SAA:基于LLM人格生成分布的决策方法
发表机构 * Stern School of Business, New York University(纽约大学 Stern 商学院) ; Department of Computer Science, Columbia University(哥伦比亚大学 计算机科学系) ; Graduate School of Business and Data Science Institute, Columbia University(哥伦比亚大学 商学院和数据科学研究院)
AI总结 研究利用LLM生成分布(如模拟消费者支付意愿)支持下游决策,通过三个经典问题(分类优化、定价、报童模型)评估其实际效用,发现低数据场景下有效,且决策无关指标(如Wasserstein距离)可能误导。
通过聊天模板的推理时后门:从LLM供应链到代理系统妥协
发表机构 * Fujitsu Research of Europe(富士通欧洲研究)
AI总结 提出一种通过恶意修改聊天模板实现推理时后门攻击的方法,无需修改模型权重或训练数据,在LLM、代理和多代理系统层面均能成功攻击,且能绕过现有防御。
Comments V3: Accepted to ICLR 2026 Trustworthy AI Workshop, V4: Submitted to CCS 2026
超图神经网络的反事实解释
发表机构 * Department of Computer Control and Management Engineering, Sapienza University(计算机控制与管理工程系,萨皮恩扎大学) ; Department of Computer Science, Sapienza University(计算机科学系,萨皮恩扎大学)
AI总结 提出CF-HyperGNNExplainer方法,通过最小结构变化生成反事实超图,以解释超图神经网络的预测决策。
SPA-Cache: 扩散语言模型中的自适应缓存奇异代理
发表机构 * College of Computing(计算学院) ; Data Science, Nanyang Technological University, Singapore, Singapore(数据科学,南洋理工大学,新加坡,新加坡)
AI总结 针对扩散语言模型因非因果特性无法使用标准KV缓存导致计算开销大的问题,提出SPA-Cache方法,通过低维奇异代理识别关键令牌并自适应分配缓存预算,实现高达8倍吞吐量提升和2-4倍加速。
Comments Accepted by ICML 2026.The code repository is available at https://github.com/wenhao728/spa-cache
MemSkill:面向自进化智能体的可学习与进化记忆技能
发表机构 * Nanyang Technological University(南洋理工大学) ; University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校) ; University of Illinois Chicago(伊利诺伊大学芝加哥分校) ; Tsinghua University(清华大学)
AI总结 提出MemSkill框架,将记忆操作转化为可学习和可进化的技能,通过控制器选择技能、执行器生成记忆、设计者进化技能集,形成闭环提升LLM智能体任务性能。
Comments Code is available at https://github.com/ViktorAxelsen/MemSkill
深度,而非数据:Hessian谱分叉分析
发表机构 * Department of Computer Science(计算机科学系) ; Dartmouth College(达特茅斯学院) ; University of Birmingham(伯明翰大学)
AI总结 本文通过分析深度线性网络,证明Hessian矩阵的谱分叉结构(主导特征值与主体特征值分离)可仅由网络深度引起,与数据协方差平衡无关,且主导与主体特征值之比与深度线性相关。
用于可解释分类的单元划分神经网络及显式类别区域
发表机构 * Department of Mathematics(数学系)
AI总结 提出单元划分神经网络(PUNN),通过直接学习满足和为1的非负函数来定义类别概率,无需softmax层,实现可解释分类并证明其稠密性,实验表明在保持精度的同时大幅减少参数。
Comments v2: substantially revised; under review at TMLR
带有参数噪声的随机线性赌博机
发表机构 * Tel Aviv University(特拉维夫大学) ; Google Research(谷歌研究)
AI总结 研究带有参数噪声的随机线性赌博机模型,提出一种简单的探索-利用算法,实现了与下界匹配(对数因子内)的遗憾界,并揭示了与经典加性噪声模型不同的最优遗憾阶。
Comments 8 pages
BEAR:面向大语言模型推荐中束搜索感知的优化
发表机构 * Zhejiang University(浙江大学) ; The Chinese University of Hong Kong, Shenzhen(香港中文大学(深圳)) ; Hangzhou City University(杭州市城市大学)
AI总结 针对监督微调与束搜索推理之间的不一致性,提出BEAR正则化方法,通过确保正例每个token在解码步骤中排名前B来避免过早剪枝,显著提升推荐性能。
Comments Accepted by SIGIR 2026
一步贝尔曼对齐实现在线强化学习中的可证明高效迁移
发表机构 * Department of Technology, Operations, & Statistics, New York University(纽约大学技术、运营与统计系) ; Department of Operations Research & Financial Engineering, Princeton University(普林斯顿大学运筹学与金融工程系) ; Department of Computer Science, Dartmouth College(达特茅斯学院计算机科学系)
AI总结 提出一步贝尔曼对齐作为在线强化学习中迁移的正确抽象,并通过重加权目标(RWT)实现算子级修正,在RKHS函数逼近下建立了与任务迁移复杂度相关的遗憾界。
动力学揭示结构:挑战线性传播假设
发表机构 * University of Tübingen(图宾根大学)
AI总结 通过关系代数研究神经网络中线性传播假设的几何极限,证明其在对合运算(否定、逆)上可行,但在组合运算上存在根本性障碍,导致特征映射崩溃,并解释知识编辑失败、反转诅咒和多跳推理等问题的共同根源。
SA-PEF:用于高效联邦学习的前瞻部分误差反馈
发表机构 * Department of Electronic Systems, Norwegian University of Science and Technology (NTNU)(挪威科学技术大学电子系统系) ; Department of Information and Communications Engineering, Aalto University(阿尔托大学信息与通信工程系) ; CSIRO’s Data61(CSIRO数据61)
AI总结 提出SA-PEF方法,通过结合前瞻校正和部分误差反馈,在非IID数据和部分客户端参与下加速联邦学习收敛,并理论证明其收敛速率与Fed-SGD相当。
RDumb++:漂移感知的持续测试时自适应
发表机构 * Department of Computer Science(计算机科学系) ; University of British Columbia(不列颠哥伦比亚大学)
AI总结 针对持续测试时自适应中分布快速变化或长期漂移导致性能崩溃的问题,提出RDumb++方法,通过熵和KL散度漂移检测机制与自适应重置策略,在CCC基准上实现约3%的绝对准确率提升。
基于回合的结构性触发器:多轮LLM中的无提示后门
发表机构 * School of Cyber Security, University of Chinese Academy of Sciences(中国科学院大学网络安全学院) ; Institute of Information Engineering, Chinese Academy of Sciences(中国科学院信息工程研究所) ; Institute of Software, Chinese Academy of Sciences(中国科学院软件研究所) ; Ant Group(蚂蚁集团)
AI总结 提出一种利用对话结构(回合索引)作为触发器的后门攻击方法TST,无需用户输入即可激活,实现高攻击成功率并绕过提示中心防御。
CROCS:一种基于智能电表数据的以行为为中心的消费者细分的两阶段聚类框架
发表机构 * Ausgrid(澳大利亚电网公司)
AI总结 提出CROCS两阶段聚类框架,通过消费者日常负荷曲线的独立聚类和基于加权最小距离的集合间比较,实现鲁棒且可扩展的消费者行为细分。
FUME: 用于牲畜瘤胃酸中毒检测的融合统一多气体排放网络
发表机构 * Southern Illinois University, Carbondale(南方伊利诺伊大学,卡本达勒分校) ; University of California, Davis(加州大学戴维斯分校)
AI总结 提出FUME网络,利用双气体(CO2和CH4)光学成像,通过轻量双流架构和通道注意力融合,实现瘤胃酸中毒的高精度分割与分类。
Comments 10 pages, 5 figures
QASA: 面向鲁棒多模态情感分析的质量感知语义增强
发表机构 * School of Computer Science, South China Normal University(华南师范大学计算机学院)
AI总结 提出QASA框架,利用扩散模型生成视觉和听觉增强样本,并通过解耦质量感知评分模块分配训练权重,以解决高质量数据稀缺问题,提升多模态情感分析的鲁棒性和泛化能力。
Comments 11 pages, 4 figures
通过密度加权Stein算子的流匹配中的隐式几何正则化
发表机构 * The Institute of Statistical Mathematics(统计数学研究所)
AI总结 提出γ-流匹配(γ-FM),通过动态密度加权策略隐式正则化高维空间中的回归几何,改善向量场平滑性和采样效率。
Comments Revised version
PairFlow: 离散流模型中用于少步生成的闭式源-目标耦合
发表机构 * KAIST(韩国科学技术院)
AI总结 提出PairFlow,一种轻量级预处理方法,通过闭式反演构建源-目标配对样本,无需预训练教师即可实现离散流模型的少步采样,匹配甚至超越两阶段微调性能。
Comments ICLR 2026
基于错误驱动的算术推理提示优化
发表机构 * Deptartment of Data Science & Visualization, Faculty of Informatics, University of Debrecen(数据科学与可视化系,信息学院,德布勒恩大学)
AI总结 提出一种错误驱动的提示优化框架,通过聚类错误预测迭代优化提示规则,使小型本地语言模型在算术推理任务中准确率达到70.8%,超越GPT-3.5 Turbo。
冲突感知融合:通过结构化认知先验缓解大语言模型中的逻辑惯性
发表机构 * Xtracta & Strong AI Lab, University of Auckland(Xtracta与强人工智能实验室,奥克兰大学) ; School of Humanities, China University of Political Science and Law(人文学院,中国政法大学) ; Strong AI Lab, University of Auckland(强人工智能实验室,奥克兰大学)
AI总结 针对大语言模型在规则系统结构扰动下表现脆弱的问题,提出冲突感知融合训练流程,通过验证-演绎结构先验和符号推理奖励,在多个压力测试中实现鲁棒性饱和。
使用预条件未调整朗之万算法实现快速且鲁棒的MR图像重建扩散后验采样
发表机构 * Institute of Biomedical Imaging, Graz University of Technology, Graz, Austria ; Department of Radiology, Boston Children's Hospital, Harvard Medical School, Boston, USA ; Chandra Family Department of Electrical Engineering, University of Texas at Austin, USA ; Department of Diagnostic Medicine, Dell Medical School, University of Texas at Austin, USA
AI总结 针对MR图像重建中扩散后验采样速度慢和参数调优问题,提出基于预条件未调整朗之万算法的精确似然方法,实现快速收敛且无需调参的鲁棒采样。
Comments Submitted to Magnetic Resonance in Medicine
AGI 需要在模式存储库之上建立协调层
发表机构 * Department of Computer Science, Stanford University(斯坦福大学计算机科学系)
AI总结 本文提出大型语言模型(LLM)并非AGI的死胡同,而是缺少系统2协调层,通过UCCT和RCA实现语义锚定与因果验证,并设计MACI多智能体协调栈,实验表明自适应控制优于静态提示。
Comments 15 pages, 5 figures, 7 tables
混合合成数据生成与域随机化实现极端类别不平衡下基于视觉的零样本零件检测
发表机构 * Department of Mechanical Engineering, University of Michigan, Ann Arbor, MI 48109, USA ; Materials \& Manufacturing Systems Research Lab, General Motors, Warren, MI 48092, USA
AI总结 提出一种结合仿真渲染、域随机化和真实背景合成的混合合成数据生成框架,仅用合成数据训练YOLOv8n和MobileNetV3-small模型,在极端类别不平衡下实现零样本工业零件检测,检测mAP@0.5达0.995,分类准确率96%,平衡准确率90.1%。
Comments Submitted to the NAMRC 54
IPR-1:交互式物理推理器
发表机构 * CARNEGIE MELLON UNIVERSITY(卡内基梅隆大学)
AI总结 提出IPR模型,通过世界模型滚动评分和强化VLM策略,结合物理中心动作代码PhysCode,在1000+异构游戏基准上实现鲁棒的物理推理,性能超越GPT-5并零样本迁移至未见游戏。
Comments Accepted by CVPR 2026. 13 pages of main text and 20 pages of appendices. Project page: https://mybearyzhang.github.io/ipr-1
在物理信息神经网络中通过投影保证积分守恒
发表机构 * MIT(麻省理工学院) ; IBM(国际商业机器公司)
AI总结 提出一种投影方法,通过求解约束非线性优化问题,在物理信息神经网络中分别或联合保证线性和二次积分量的守恒,将守恒误差降低三到四个数量级。
使用密度驱动的Stein算子进行稳健推断
发表机构 * The Institute of Statistical Mathematics(统计数学研究所)
AI总结 提出基于γ-散度的γ-Stein算子,通过密度加权实现未归一化概率模型的稳健推断,并应用于稳健拟合优度检验和贝叶斯后验近似。
Comments Revised version
图神经算子的谱框架:收敛保证与权衡
发表机构 * Applied Mathematics and Statistics(应用数学与统计学) ; Johns Hopkins University(约翰霍普金斯大学)
AI总结 本文提出统一谱框架,分析图神经算子在无正则性、全局Lipschitz连续和分段Lipschitz连续假设下的收敛率与权衡。
聚类校准:通过学习子群体实现表示感知的概率校准
发表机构 * Faculty of Computer and Information Science(计算机与信息科学学院)
AI总结 提出聚类校准框架,通过在特征空间聚类识别子群体并拟合混合校准器,结合分层收缩实现上下文特定校准,在表格、图像和文本基准上提升或匹配强全局校准器的负对数似然和Brier分数。
基于小集合的数据同化:一种机器学习增强的有限集合数据同化方法
发表机构 * Centre for Regional Oceans, Department of Ocean Science and Technology, and State Key Laboratory of Internet of Things for Smart City, University of Macau(澳门地区海洋研究中心、海洋科学与技术学院及智能城市物联网国家重点实验室,澳门大学) ; School of Naval Architecture and Ocean Engineering, Huazhong University of Science and Technology(华中科技大学船舶与海洋工程学院) ; Ningbo Institute of Dalian University of Technology(大连理工大学宁波研究院) ; College of Civil Engineering, Zhejiang University of Technology(浙江工业大学土木工程学院) ; Department of Naval Architecture and Ocean Engineering, Hongik University(成均馆大学船舶与海洋工程学院) ; State Key Laboratory of Internet of Things for Smart City, University of Macau(智能城市物联网国家重点实验室,澳门大学) ; Zhuhai UM Science and Technology Research Institute(珠海UM科技研究院)
AI总结 提出一种结合集合卡尔曼滤波与全连接神经网络的机器学习数据同化方法,通过小集合生成初步分析状态并用神经网络预测修正项,在几乎不增加计算成本下提升精度。
虚假不动点:大语言模型中的康德反馈、稳定误校准与表征压缩
发表机构 * ToppyMicroServices OÜ(ToppyMicroServices公司)
AI总结 本文通过康德承诺门控框架和线性反馈模型,研究大语言模型中高置信度错误作为局部稳定、内部一致且自信错误的虚假不动点现象,发现稳定性与正确性可分离,并探索高信噪比惯性和表征压缩作为稳定误校准的可能机制。
Comments 27 pages, 8 figures, v3.0
哪种方法更能减少过时和易受攻击的依赖:固定版本还是浮动版本?
发表机构 * North Carolina State University(北卡罗来纳州立大学)
AI总结 本研究通过实证分析npm、PyPI和Cargo生态系统中依赖版本约束的使用趋势,利用生存分析比较固定版本与浮动版本对依赖过时和易受攻击风险的影响。
Comments Accepted to ASE 2025
Dale meets Langevin: 乘法去噪扩散模型
发表机构 * Department of Electrical Engineering(电子工程系) ; Indian Institute of Science(印度科学研究所)
AI总结 提出以几何布朗运动为前向噪声过程的乘法分数生成模型,推导反向时间SDE并设计两种乘法采样器,引入Hyvärinen分数和乘法去噪分数匹配目标,在图像数据集上验证生成能力。
INSIGHT: 视觉-语言-动作模型中生成帮助触发器的推理时序列内省
发表机构 * Department of Computer Science, Yale University(耶鲁大学计算机科学系)
AI总结 提出INSIGHT框架,利用令牌级不确定性信号(熵、对数概率、不确定性估计)训练变压器分类器,预测VLA模型何时需要人类帮助,并对比强/弱监督下的性能,发现建模时间动态优于静态评分。
一次性条件采样:MMD 遇见最近邻
发表机构 * University of Chicago(芝加哥大学) ; MBZUAI(马斯克商学院) ; Carnegie Mellon University(卡内基梅隆大学)
AI总结 提出 CGMMD 框架,通过最小化最大均值差异(MMD)实现一次性条件采样,理论保证收敛性,并在图像去噪和超分辨率等任务中表现优异。
Comments Accepted at the 43rd International Conference on Machine Learning (ICML 2026)
VisualOverload: 在真正密集场景中探测VLM的视觉理解
发表机构 * Independent Researcher(独立研究者) ; JKU Linz(林茨JKU) ; MIT CSAIL ; Tübingen AI Center(图宾根人工智能中心) ; Stanford(斯坦福) ; MIT-IBM Watson AI Lab(MIT-IBM沃森人工智能实验室)
AI总结 提出VisualOverload基准,通过密集场景中的简单视觉任务测试VLM,发现最佳模型仅达69.5%准确率,揭示计数、OCR和逻辑一致性等关键缺陷。
Comments Accepted at CVPR 2026
桥接设备端与云端大语言模型实现协作推理:本地路由与后训练的统一方法
发表机构 * Purdue University(普渡大学) ; Yonsei University(延世大学)
AI总结 提出通过强化学习后训练使设备端LLM内部决定是否调用云端,结合分层奖励和自适应提示过滤,显著缩小与纯云端LLM的性能差距。
Comments We propose a unified post-training framework that integrates routing optimization, enabling the on-device LLM to improve its problem-solving ability while learning routing strategies
动态关系先验提升Transformer在多变量时间序列中的表现
发表机构 * Department of Computer Science, Southern Methodist University, Dallas TX USA(计算机科学系,南方 Methodist 大学,德克萨斯州达拉斯)
AI总结 提出动态关系先验注意力机制(prime attention),通过为每个token对动态调整表示,有效捕捉多变量时间序列中异构的通道间依赖关系,在保持相同计算复杂度下提升预测精度达6.5%。
基于不确定性感知效用锚点的自适应偏好优化
发表机构 * State Key Laboratory of Cognitive Intelligence, University of Science and Technology of China(认知智能国家重点实验室,中国科学技术大学) ; Institute of Artificial Intelligence, Hefei Comprehensive National Science Center(人工智能研究院,合肥综合性国家科学中心) ; State Key Laboratory of General Artificial Intelligence, BIGAI(通用人工智能国家重点实验室,BIGAI)
AI总结 提出一种通用离线偏好优化框架UAPO,通过引入锚点函数估计偏好数据标注的不确定性,支持非配对数据训练,提升数据利用效率和训练鲁棒性。
Comments Accepted by EMNLP 2025 Findings
概率决策算法分析导论
发表机构 * Western University and Vector Institute(西方大学和向量研究所)
AI总结 本文为概率决策算法(包括赌博机算法、贝叶斯优化和树搜索算法)的理论分析提供了一本自包含的入门指南,旨在降低非专家的理解门槛。
使用正交多项式稀疏回归逼近通用热气候指数
发表机构 * Department of Knowledge Technologies, Jo z ef Stefan Institute, Jamova 39, 1000 Ljubljana, Slovenia Faculty of Mathematics ; Physics, University of Ljubljana, Jadranska ulica 19, 1000 Ljubljana, Slovenia
AI总结 针对通用热气候指数(UTCI)标准多项式近似误差大的问题,提出基于正交多项式基的稀疏回归方法,在保持计算效率的同时显著降低平均误差和大误差频率。
Comments Final peer-reviewed version of the manuscript
QUTCC: 成像逆问题的分位数不确定性训练与保形校准
AI总结 提出QUTCC方法,结合分位数回归与U-Net实现空间自适应保形校准,在多个成像逆问题中生成更紧的不确定性区间并定位模型幻觉。
Fredholm神经网络用于椭圆型偏微分方程反问题
发表机构 * Division of Applied Mathematics, Brown University(布朗大学应用数学系) ; Department of Statistics and Stochastic Modelling and Applications Laboratory, Athens University of Economics and Business(雅典经济与商业大学统计学与随机建模与应用实验室)
AI总结 基于Fredholm神经网络框架,提出可解释的Potential Fredholm神经网络(PFNN)求解椭圆型偏微分方程正反问题,实现高精度并严格证明误差界。
股市读心术:图神经网络预测MINT与G7国家之间的秘密对话
发表机构 * Hacettepe University(哈切特佩大学)
AI总结 使用MTGNN图神经网络分析2012-2024年G7与MINT国家股市指数,揭示美国、加拿大、印尼和土耳其的影响力,并证明该方法优于传统预测模型。
从睡眠分期到纺锤波检测:端到端自动化睡眠分析的案例研究
发表机构 * Department of Medical Engineering and Technomathematics, FH Aachen University of Applied Sciences(医学工程与技术数学系,亚琛应用科学大学) ; Department of Information and Computing Sciences, Utrecht University(信息与计算科学系,乌得勒支大学) ; Institute for Data-Driven Technologies, FH Aachen University of Applied Sciences(数据驱动技术研究所,亚琛应用科学大学) ; Department of Psychiatry and Psychotherapy, University Hospital Carl Gustav Carus, Technische Universität Dresden(精神病学与心理治疗系,卡尔·古斯塔夫·卡尔斯大学医院,德累斯顿技术大学)
AI总结 本研究通过案例评估,使用已验证的机器学习模型(RobustSleepNet和SUMOv2)实现全自动化睡眠分析,成功复现了专家基于双相情感障碍的研究发现,表明全自动化方法可促进大规模睡眠研究。
Comments 12 pages, 4 figures, 2 tables
轻量级直接文档相关性优化用于生成式信息检索
发表机构 * Institute for Clarity in Documentation(文档清晰度研究所) ; Inria Paris-Rocquencourt(巴黎- Rocquencourt 国家信息与自动化所) ; Rajiv Gandhi University(拉朱·甘地大学) ; Tsinghua University(清华大学) ; Palmer Research Laboratories(帕勒尔研究实验室) ; University of Amsterdam(阿姆斯特丹大学)
AI总结 提出直接文档相关性优化(DDRO)方法,通过成对排序直接对齐令牌级文档ID生成与文档级相关性估计,无需显式奖励建模和强化学习,在MS MARCO和Natural Questions上分别提升MRR@10 7.4%和19.9%。
Comments 12 pages, 3 figures. SIGIR '25 Proceedings of the 48th International ACM SIGIR Conference on Research and Development in Information Retrieval July 13--18, 2025 Padua, Italy. Code and pretrained models available at: https://github.com/kidist-amde/ddro/
利用大语言模型发现算法:进化搜索遇见强化学习
发表机构 * EPFL(苏黎世联邦理工学院) ; Apple(苹果公司)
AI总结 提出通过强化学习微调持续优化大语言模型,结合进化搜索加速发现更优算法,在组合优化任务上验证有效性。
Comments 34 pages
Rademacher复杂度和Dudley熵积分的泛化误差界的Lean形式化
发表机构 * RIKEN AIP(日本理化学研究所AIP) ; CyberAgent Inc.(CyberAgent公司) ; OMRON SINIC X Corporation(OMRON SINIC X株式会社) ; University College Cork(科克大学) ; The University of Tokyo(东京大学)
AI总结 本文在Lean 4中形式化了基于Rademacher复杂度的泛化误差界,通过形式化对称化论证、有界差异分析和McDiarmid不等式,并扩展到可数假设类及可分离拓扑索引集,最后应用得到线性预测器的经验Rademacher界和Dudley熵积分界。
Comments accepted at ITP2026
一种连接可观测量与高效学习方法
发表机构 * Center for Computational Sciences, University of Tsukuba(茨川大学计算科学中心)
AI总结 提出多参数本征值问题(MEP)仿真器,通过连接不同仿真器实现从可观测量到可观测量的直接预测,并利用特征向量延续(EC)和参数矩阵模型(PMM)数据进行训练,在一维格点模拟和$^{28}$O示例中验证了性能与预测概率分布获取的简便性。
Comments 5+2 pages, 4 figures, matched published version. Shared data and toy model code in the source file (shared.zip)
Kolmogorov-Arnold 傅里叶网络
发表机构 * Sun Yat-sen University(中山大学) ; Vast Intelligence Lab(远见实验室)
AI总结 针对KAN网络参数爆炸和高维任务中高频特征捕获能力不足的问题,提出Kolmogorov-Arnold傅里叶网络(KAF),通过谱重参数化将局部B样条表示转换为全局自适应谱表示,引入可训练随机傅里叶特征和自适应混合GELU-傅里叶激活机制,在CV、NLP、音频和PDE求解任务上取得最优性能。
Comments Code:https://github.com/kolmogorovArnoldFourierNetwork/KAF
联邦草图LoRA:一种用于异构协作微调大语言模型的灵活框架
发表机构 * Purdue University(普渡大学) ; Yonsei University(延世大学) ; University at Buffalo-SUNY(布法罗大学- SUNY)
AI总结 针对资源受限客户端上大语言模型微调中的异构性问题,提出联邦草图LoRA(FSLoRA),通过草图机制让客户端选择性更新服务器维护的全局LoRA模块子矩阵,并利用草图比例灵活适应客户端约束,提供收敛性分析,实验表明优于基线并提升训练效率。
Comments We propose Federated Sketching LoRA (FSLoRA), a theoretically grounded methodology for collaborative LLM fine-tuning that retains LoRA's flexibility while adapting to the communication and computational capabilities of individual clients
ReactEmbed: 一种基于生化反应网络统一蛋白质-分子表示的可插拔模块
发表机构 * Technion(技术ion)
AI总结 提出ReactEmbed模块,利用生化反应网络对齐蛋白质和分子嵌入,实现跨域统一表示,无需重新训练。
GDformer:超越子序列隔离的多变量时间序列异常检测
发表机构 * The Hong Kong University of Science and Technology (Guangzhou)(香港科学与技术大学(广州)) ; China Mobile (Jiangxi) Virtual Reality Technology Co., Ltd.(中国移动(江西)虚拟现实技术有限公司) ; Salesforce AI Research(Salesforce AI研究) ; Institute of Computing Technology, Chinese Academy of Sciences(中国科学院计算技术研究所)
AI总结 提出全局字典增强Transformer(GDformer),通过基于字典的交叉注意力机制学习整个序列中所有正常点的全局表示,并利用原型捕获正常点-全局相关权重分布,实现基于表示相似性的统一检测准则,在五个基准数据集上达到最先进性能。
分裂-合并:一种基于差异的主特征值问题方法
发表机构 * LMIB of the Ministry of Education, School of Mathematical Sciences, Beihang University(教育部离散数学与信息检索重点实验室,北京航空航天大学数学科学学院) ; National Frontiers Science Center for Industrial Intelligence and Systems Optimization, Northeastern University(工业智能与系统优化国家级前沿科学中心,东北大学)
AI总结 针对对称半正定矩阵的主特征对计算问题,提出一种基于差异的无约束优化框架,并设计分裂-合并算法,实现无矩阵、无参数迭代,收敛速度优于经典幂法。
查询空间转录组数据中的结构和功能生态位
发表机构 * MOE Key Laboratory of Bioinformatics and Bioinformatics Division of BNRIST, Department of Automation, Tsinghua University(生物信息学教育部重点实验室和北京理工大学生物信息学分部,自动化系,清华大学) ; Center for Synthetic and Systems Biology, School of Life Sciences and School of Medicine, Tsinghua University(合成与系统生物学中心,生命科学学院和医学学院,清华大学) ; Department of Thoracic Surgery, National Cancer Center/National Clinical Research Center for Cancer/Cancer Hospital, Chinese Academy of Medical Sciences and Peking Union Medical College(胸外科部门,国家癌症中心/国家癌症临床研究中心/癌症医院,中国医学科学院和北京协和医学院) ; Peking Union Medical College, Chinese Academy of Medical Sciences(北京协和医学院,中国医学科学院) ; Biomedical Pioneering Innovation Center (BIOPIC), Peking University(生物医学前瞻性创新中心(BIOPIC),北京大学) ; Cancer Research UK Cambridge Institute, University of Cambridge(英国癌症研究Cambridge研究所,剑桥大学) ; Department of Immunology, School of Basic Medical Sciences, Harbin Medical University(免疫学部门,基础医学学院,哈尔滨医科大学) ; Zhongguancun Academy, Beijing, China(中关村学院,北京,中国) ; Zhongguancun Institute of Artificial Intelligence, Beijing, China(中关村人工智能研究院,北京,中国)
AI总结 提出QueST方法,通过子图建模和对比学习查询空间转录组样本中的相似生态位,有效捕捉异质环境中的生态位结构并跨平台泛化。
探究网络剪枝对性能与可解释性的影响
发表机构 * AI Center, Neural Information Processing Group University of Tübingen(人工智能中心、神经信息处理组 汤姆森大学)
AI总结 本文通过系统应用非结构化、结构化剪枝及连接稀疏方法,研究不同剪枝技术对GoogLeNet在ImageNet验证集上的分类性能和可解释性的影响,发现充分重训练后性能可接近甚至超越原始网络,且可解释性评分与剪枝率无显著关联。
Comments 4 pages, 6 figures
桥接进化算法与强化学习:混合算法的全面综述
发表机构 * College of Intelligence and Computing, Tianjin University(天津大学智能与计算学院) ; Montreal Institute of Learning Algorithms (MILA)(蒙特利尔学习算法研究所) ; Department of Computer Science and Engineering, Southern University of Science and Technology(南方科技大学计算机科学与工程系)
AI总结 本文全面综述了进化强化学习(ERL)领域,将进化算法(EA)与强化学习(RL)融合,系统总结了三种主要研究方向:EA辅助RL优化、RL辅助EA优化以及EA与RL协同优化,并分析了各分支解决的问题及未来挑战。
Comments New Version, add more methods
全局 $\mathcal{L}^2$ 最小化:通过深度学习中的几何自适应梯度下降实现均匀指数速率
发表机构 * Department of Mathematics, University of Texas at Austin(德克萨斯大学奥斯汀分校数学系)
AI总结 本文利用微分几何中黎曼度量的任意性,提出两种改进的梯度下降流(过参数化和欠参数化设置),在秩条件成立时证明其以均匀指数收敛速率驱动 $\mathcal{L}^2$ 代价到全局最小值,并推广到秩条件不成立的情形。
Comments AMS Latex, 21 pages. Typos corrected, references and comments added
多维时间序列数据中的自动制度分类:基于切片Wasserstein k-means聚类
发表机构 * Citigroup, London, UK(伦敦英国摩根大通公司) ; Data Science Institute, London School of Economics, London, UK(伦敦经济学院数据科学研究所)
AI总结 提出切片Wasserstein k-means聚类方法,通过近似多维Wasserstein距离,实现多维时间序列数据的自动制度分类,并在合成数据和真实外汇数据中验证有效性。
具有认证数据遗忘的可遗忘联邦线性学习
发表机构 * University of British Columbia(不列颠哥伦比亚大学) ; Vector Institute(向量研究所) ; Renmin University of China(中国人民大学)
AI总结 提出一种基于预训练模型线性近似的联邦遗忘框架,通过联邦线性训练实现高效、安全且可认证的客户端数据遗忘。
Comments IEEE Transactions on Neural Networks and Learning Systems
我们究竟在解码什么?非侵入式脑到语言检索的源归因
发表机构 * KTH(瑞典皇家理工学院) ; University of Cambridge(剑桥大学) ; EPFL(苏黎世联邦理工学院) ; Karolinska Institutet(Karolinska研究所) ; McGill University(麦吉尔大学)
AI总结 针对非侵入式神经语言解码中结果被非刺激诱发源(如解码器先验、嵌入度量、信号时长等)膨胀的问题,提出一个审计框架,通过结构捷径、窗口级刺激锁定证据和跨窗口上下文聚合三种源分离,并引入组上下文偏差(GCB)作为可控的源归因干预,实现性能的源归因而非仅报告。
Comments 35 pages, 7 figures, 25 tables
MindAlign: 弥合脑电图、视觉和语言实现零样本视觉解码
发表机构 * KTH, SWeden(瑞典皇家理工学院) ; University of Cambridge, UK(剑桥大学) ; EPFL, Switzerland(瑞士联邦理工学院) ; McGill University, Canada(麦吉尔大学) ; Karolinska Institutet, Sweden(卡罗林斯卡研究所)
AI总结 提出一种三模态对比学习框架MindAlign,通过对齐脑电图、图像和文本表示,在Things-EEG2零样本基准上实现54.1% Top-1和83.4% Top-5准确率,显著超越先前方法。
Comments 20 pages, 10 figures, 15 tables
AnnotateMissense:一个用于错义致病性预测的全基因组注释和基准测试框架
发表机构 * School of Chemistry and Molecular Biology(化学与分子生物学学院) ; The University of Queensland(昆士兰大学) ; Baker Heart and Diabetes Institute(贝克心脏病与糖尿病研究所)
AI总结 提出AnnotateMissense框架,整合多种特征,通过XGBoost模型在ClinVar数据集上实现高精度错义变异致病性预测,并生成全基因组预测结果。
ECHO: 终端代理免费学习世界模型
发表机构 * Microsoft Research(微软研究院)
AI总结 提出ECHO混合目标,通过预测环境观测令牌将终端反馈转化为密集监督信号,显著提升CLI代理在TerminalBench-2.0上的性能。
Sentinel-2 数据中的湖泊检测与水质估计
发表机构 * Transilvania University of Bra\c sov, Faculty of Mathematics and Computer Science(布拉索夫特拉西亚大学数学与计算机科学学院)
AI总结 本文比较了三种机器学习架构用于水体识别与监测,并提出了针对水质指数的有意义配色方案,以提高可解释性和决策支持。
具有重尾噪声的零阶非凸非光滑优化
发表机构 * Zhuanghua Liu(刘庄华) ; Luo Luo(罗洛)
AI总结 针对目标函数Lipschitz连续的非凸非光滑问题,提出一种通过裁剪两点梯度估计器的在线到非凸转换框架的随机零阶算法,在重尾噪声下实现$(δ, ε)$-Goldstein驻点,其零阶复杂度为${\\mathcal O}(d^{\\frac{p}{2(p-1)}}δ^{-1}ε^{-\\frac{2p-1}{p-1}})$,与已知最优结果一致。
Φ-Noise:基于相位噪声操作的无训练时间视频条件生成
发表机构 * Canvas-Lab
AI总结 提出一种无需训练的方法,通过将参考视频的低频相位信息注入扩散噪声潜变量,实现运动条件视频生成,无需修改模型架构或推理流程。
Comments Under Review; 26 pages, 21 figures
组合优化中通过复相位动力学实现的隐式二值化
发表机构 * School of Physics and Astronomy, Tel Aviv University(特拉维夫大学物理与天文学学院) ; School of Electrical and Computer Engineering, Tel Aviv University(特拉维夫大学电气与计算机工程学院)
AI总结 提出一种受物理启发的连续松弛框架,通过将离散二进制变量参数化为复单位圆上的连续波状状态,隐式正则化促进收敛到离散状态,显著提升NP难组合优化问题的求解性能。
Comments 27 pages, 5 figures
市场制度委员会:多智能体LLM决策系统中的动态信用分配
发表机构 * University of Bristol, UK(布里斯托大学)
AI总结 提出市场制度委员会(MRC),一种基于Shapley值进行在线智能体加权、贝叶斯自适应混合和制度依赖乘数的多智能体决策系统,在加密货币投资中实现高夏普比率和累计收益。
Comments 35 pages, 13 figures, preprint
SPACE:统一对称与非对称路由问题的通用神经求解器
发表机构 * School of Automation and Intelligent Manufacturing, Southern University of Science and Technology, Shenzhen, China(自动化与智能制造学院,南方科技大学,深圳,中国) ; Pengcheng Laboratory, Shenzhen, China(鹏城实验室,深圳,中国) ; Guangdong Provincial Key Laboratory of Fully Actuated System Control Theory and Technology, Southern University of Science and Technology, Shenzhen, China(广东省全驱动系统控制理论与技术重点实验室,南方科技大学,深圳,中国) ; College of Computer Science and Software Engineering, Shenzhen University, Shenzhen, China(计算机科学与软件工程学院,深圳大学,深圳,中国)
AI总结 针对现有神经求解器在对称与非对称车辆路径问题中表现不一致的问题,提出基于空间枢轴对齐的无坐标嵌入框架SPACE,通过双向弗雷歇表示和权重解耦自适应解码机制,实现统一节点表示与解生成,在110个变体上取得优异零样本泛化。
正则非光滑模型的归一化最大似然:测度理论基础与几何采样
发表机构 * Department of Mathematics, The Chinese University of Hong Kong(香港中文大学数学系)
AI总结 针对现代机器学习中非光滑估计器(如Lasso、稀疏SVM)的归一化最大似然(NML)编码长度计算问题,本文利用几何测度论和保守雅可比矩阵建立严格框架,并提出一种几何MCMC采样器(PDL-PPMH)以精确计算非光滑模型的随机复杂度。
平衡公平性、隐私和准确性:面向集中式数据驱动系统的多任务对抗框架
发表机构 * School of Computing Technologies, RMIT University(计算技术学院,皇家墨尔本理工大学)
AI总结 提出一种多任务对抗模型,将公平性和隐私作为核心目标,通过优化代价函数动态平衡三者,在最小化性能损失的同时实现高公平性和隐私保护。
Comments 13 Pages, 6 figures, IEEE TKDE
基于非对称自适应的过渡工况实时故障诊断
发表机构 * MCC5 Group Shanghai Co. LTD(MCC5集团上海有限公司) ; Tsinghua University(清华大学)
AI总结 针对离线训练未覆盖的过渡工况导致分布偏移问题,提出一种结合离线域泛化与在线测试时自适应的非对称自适应故障诊断方法,通过周期原型重投影和不对称学习率策略实现快速适应并保持判别能力。
Comments 6 pages, 3 figures, Accepted by ICAIS & ISAS 2026
法律判决预测中的时间概念漂移:跨越乌克兰法院判决三个时期的神经基线
AI总结 通过微调四种Transformer编码器在乌克兰法院三个时期(战前、混合战争、全面入侵)的判决上,研究法律语言的时间漂移,发现前向性能严重下降(最多27.2个百分点),法律领域预训练不能提升绝对性能但能减轻漂移,时序持续学习可消除灾难性遗忘。
Comments 17 pages, 6 tables, 5 figures. Dataset: https://huggingface.co/datasets/overthelex/ukrainian-court-decisions
基于强化学习的视觉引导户外飞行与避障
发表机构 * College of Engineering, Department of Electrical Engineering and Computer Science, University of California Berkeley(加州大学伯克利分校工程学院电气工程与计算机科学系)
AI总结 提出一种基于立体视觉深度和视觉惯性里程计的传感器运动策略,通过强化学习和特权学习在仿真中训练,实现零样本迁移到未知户外环境和无人机平台进行自主避障导航。
Comments Published in IEEE Robotics and Automation Letters, vol 11, no 2. Presented at the IEEE International Conference on Robotics and Automation 2026
CAffNet: 硬约束仿射神经网络
发表机构 * Department of Mechanical and Industrial Engineering, Northeastern University, Boston, MA 02115 USA(东北大学机械与工业工程系) ; Department of Electrical Engineering, Ulsan National Institute of Science and Technology, Ulsan 44919, Republic of Korea(乌山科学技术研究院电子工程系)
AI总结 提出一种将任意基数的输入相关仿射约束硬嵌入前馈神经网络和Transformer的框架,通过可训练的约束仿射层实现联合优化并保持通用逼近性质。
一种受强化学习启发的基于潜在收益的自适应算法切换机制
发表机构 * Indian Institute of Technology Patna(印度理工学院帕纳布分校) ; Indian Institute of Technology Guwahati(印度理工学院古瓦哈提分校)
AI总结 针对在线或动态环境中算法选择困难的问题,提出一种受强化学习启发的潜在收益方法,通过封装奖励和惩罚触发探索与利用,实现自适应算法切换,并在排序算法和机器人避障任务中验证了有效性。
Comments Accepted and published in the Proceedings of the 29th European Conference on Applications of Evolutionary Computation (EvoApplications 2026), held as part of EvoStar 2026, Toulouse, France, April 8 to 10, 2026. Lecture Notes in Computer Science (LNCS), Springer Nature Switzerland
基于先验校正的正交信任区域引导的平滑动作块流策略
发表机构 * South China University of Technology(华南理工大学) ; Zhejiang University(浙江大学)
AI总结 提出POTR方法,通过先验校正权重和正交信任区域约束,改善流匹配机器人策略中动作块推理的边界不连续性和横向扰动,提升成功率和运动平滑性。
表示引导的离散分子图逆合成
发表机构 * Sun Yat-sen University(中山大学) ; University of Science and Technology of China(中国科学技术大学)
AI总结 提出表示引导的分子图逆合成方法GRG,通过将预训练编码器的化学语义注入扩散模型,在USPTO-50k上达到58.6/77.2/83.4/87.1的top-1/3/5/10准确率,多样性提升至15.5,并加速收敛35%的epoch和30%的时间。
动量流:优化器启发的Transformer
发表机构 * Carnegie Mellon University(卡内基梅隆大学)
AI总结 提出一类优化器启发的Transformer(如三重动量TMMFormer),通过将残差更新解释为优化器步骤,发现动量是性能提升的关键,能收敛到更平坦的极小值,减少遗忘并改善泛化。
基于随机占优的聚类及其对风险规避者和风险寻求者的应用
发表机构 * School of Science, Changchun University, Changchun, China(长春大学科学学院,中国长春) ; School of Mathematics and Science, Northeast Normal University, Changchun, China(东北师范大学数学与科学学院,中国长春)
AI总结 针对传统聚类方法无法捕捉资产间风险占优关系的问题,提出基于随机占优检验统计量的聚类分析框架,通过构造随机占优系数矩阵并改进K-means和层次聚类算法,实现面向不同风险偏好投资者的定制化资产配置。
毒害瞭望塔:通过对抗性日志内容对LLM增强的安全运营进行提示注入攻击
发表机构 * DigitalOcean ; Arizona State University(亚利桑那州立大学)
AI总结 研究攻击者控制的日志字段如何向LLM注入指令(日志基底提示注入),提出四类攻击分类,并评估不同防御下的攻击成功率。
Comments 10 pages
批归一化加剧记忆化和隐私风险
发表机构 * Queen’s University Belfast(女王大学贝尔法斯特)
AI总结 本文通过实证和理论分析,发现批归一化层会显著增加模型对异常样本的记忆化,从而加剧隐私泄露风险。
ChainLearn: 一种基于区块链的容量感知联邦集成学习框架
发表机构 * EdddTri
AI总结 针对医院计算资源异构导致标准联邦学习失效的问题,提出容量感知协调方法,通过区块链分离链上策略与链下学习,为各医院分配适当架构并加权集成,在降低通信开销的同时保持竞争性精度与校准误差。
Comments 10 pages, 7 figures, 11 tables. IEEE conference format. Code: https://github.com/EdddTri/ChainLearn
LLMTabBench:从零样本到少样本的二元表格分类中评估LLM
发表机构 * Sb AI Lab, HSE, NES(Sb AI Lab,HSE,NES) ; Sb AI Lab, HSE(Sb AI Lab,HSE) ; Sb AI Lab, HSE University(Sb AI Lab,HSE大学) ; Sb AI Lab
AI总结 提出LLMTabBench基准,系统评估LLM在数据稀缺条件下进行表格分类时,先验知识与上下文信息(任务描述和少样本示例)的交互作用,以及性能随数据复杂度的扩展规律。
Synheart Capacity: 一种理论驱动的从可穿戴信号中认知容量动态的生理表征
发表机构 * Synheart AI
AI总结 提出一种理论驱动的多模态学习框架,通过心脏和皮肤电信号的双流编码,将认知容量状态建模为资源分配(努力)和超负荷(压力)的二维生理表征,在SWELL-KW数据集上实现跨个体泛化,并区分不同认知状态。
模型并非产品:面向本地优先心理辅导的双支柱架构
发表机构 * iOS application(iOS应用)
AI总结 本文提出Psych LM,一种基于本地优先架构的iOS应用,通过自动记忆语料库和检索增强生成实现近无限上下文窗口,在移动设备上提供可靠的上下文感知心理辅导。
Comments 10 pages, 3 figures
一个统一的Python框架:基于直接PPO的AHU控制,包含节能器逻辑和CO2约束通风
发表机构 * Research and Development Department Owtana Tech- Turin, Italy(Owtana科技研发部,意大利都灵) ; Department of Energy Politecnico di Torino- Turin, Italy(都灵理工学院能源部,意大利都灵) ; Department of Energy University of Tehran- Tehran, Iran(伊朗德黑兰大学能源部,伊朗德黑兰) ; Department of Energy Sharif University of Technology- Tehran, Iran(伊朗谢赫大学能源部,伊朗德黑兰)
AI总结 本文提出一个基于深度强化学习和PPO算法的统一Python框架,通过层次流逻辑和焓基节能器实现AHU的节能控制,在保证CO2浓度不超限的同时提升温度稳定性和能效。
Comments 10 pages, 7 figures
生成式OOD正则化的基于模型的策略优化
发表机构 * University of California, San Diego(加州大学圣地亚哥分校) ; Abiomed(阿比omed)
AI总结 提出GORMPO算法,利用生成式密度估计在稀疏状态-动作空间中限制策略更新到高密度区域,以解决离线强化学习中的分布外动作问题,并在真实医疗数据集和离线RL数据集上优于基线方法。
AvAtar: 通过主动最优输运学习对齐
发表机构 * University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校) ; University of Florida(佛罗里达大学) ; Arizona State University(亚利桑那州立大学)
AI总结 提出AvAtar框架,利用主动学习策略通过熵正则化最优输运的梯度影响量化候选点信息量,并采用伴随状态法高效求解,以提升对齐性能。
Comments Published as a conference paper at ICML 2026
学习拉普拉斯特征空间:基于质量感知神经算子的点云处理
发表机构 * University of Science and Technology of China(中国科学技术大学) ; Tsinghua University(清华大学) ; Shanghai Qi Zhi Institute(上海智院) ; Laoshan Laboratory(崂山实验室)
AI总结 提出神经特征空间算子(NEO),通过预测稳定不变的低频子空间而非特征向量,结合质量感知神经算子和瑞利-里兹精化,实现点云上拉普拉斯-贝尔特拉米算子的快速谱分解。
费米-狄拉克机作为神经元的量子化
发表机构 * Department of Physics, Cornell University(康奈尔大学物理系) ; Institute of Natural Sciences, Shanghai Jiao Tong University(上海交通大学自然科学研究院) ; School of Mathematical Sciences, Shanghai Jiao Tong University(上海交通大学数学科学学院) ; Ministry of Education Key Laboratory in Scientific and Engineering Computing, Shanghai Jiao Tong University(上海交通大学教育部科学与工程计算重点实验室) ; Global College, Shanghai Jiao Tong University(上海交通大学全球学院) ; School of Electrical and Computer Engineering, Cornell University(康奈尔大学电气与计算机工程学院)
AI总结 本文将费米-狄拉克机重新解释为经典神经元的正则量子化,通过用算子替换经典变量,开发了高效混合量子-经典算法来评估和训练量子化神经元,并证明了基于费米-狄拉克神经元的计算决策问题是BQP完全的。
Comments 87 pages, 12 figures, 2 tables
评估基础模型在时间序列预测中的操作可行性
发表机构 * Google, USA(谷歌公司,美国)
AI总结 通过对比基础模型与监督学习方法在四种操作场景下的性能,提出基于经验特征的复杂度路由器以实现精度与效率的平衡。
Comments 21 pages, 8 Figures, Code available at [https://github.com/kavin-soni/timeseries-zeroshot-eval]
GEESE: 基因型感知的端到端时空嵌入用于行为表型分析
发表机构 * Department of Computer Science and Engineering(计算机科学与工程系) ; Department of Radiology(放射学系)
AI总结 提出GEESE框架,利用预训练时间序列基础模型从3D姿态动力学中直接学习行为表征,无需手工特征,在三个自闭症相关基因模型上超越传统方法,并开发了交互式工具HONK。
基于高斯排序邻域度的图神经网络图像分类方法
发表机构 * Institute of Mathematics and Computer Science (ICMC)(数学与计算机科学研究所) ; University of São Paulo (USP)(圣保罗大学) ; São Carlos -- SP -- Brazil(巴西圣卡洛斯)
AI总结 提出GRaNDe(高斯排序邻域度)方法,通过结合邻域排序与高斯距离加权来改进图神经网络中的度归一化,在五个公开图像分类数据集上取得一致准确率提升。
结构感知检索增强生成:面向对话代理的噪声数据结构化检索增强生成
发表机构 * UCLA(加州大学洛杉矶分校) ; NEC Labs(日本电装实验室)
AI总结 提出结构感知检索增强生成(SA-RAG),通过表格作为中间结构化表示来减少噪声并保留关键信息,结合质量感知的表格元数据生成框架和优化方法,在噪声真实数据集上显著优于现有RAG基线。
多校准提升:理论、收敛性和可迁移性
发表机构 * Department of Biostatistics and Epidemiology(生物统计学与流行病学系) ; University of Pennsylvania(宾夕法尼亚大学)
AI总结 本文统一了多校准提升(MCBoost)的理论框架,揭示了校准-风险权衡,并建立了在弱假设下的收敛率、有限样本保证和协变量偏移下的迁移性保证。
熵正则化演员-评论家的精细化分析
发表机构 * CMAP, CNRS, École Polytechnique, Institut Polytechnique de Paris, 91120 Palaiseau, France(法国巴黎政治学院CMAP、国家科学研究中心、巴黎政治学院、巴黎理工学院、法国Palaiseau) ; Université Paris-Saclay, CNRS, LMO, 91405, Orsay, France. Now at Google DeepMind.(巴黎萨克雷大学、国家科学研究中心、LMO、法国Orsay、现就职于DeepMind) ; Mohamed bin Zayed University of Artificial Intelligence, UAE(阿联酋Mohamed bin Zayed人工智能大学)
AI总结 本文精细化分析了熵正则化有限折扣环境中演员-评论家算法中评论家的作用,证明精确评论家可强方差缩减,使随机梯度演员-评论家达到与确定性策略梯度相同的样本复杂度,并指出评论家误差足够小时方差缩减和快速收敛得以保持,强调了准确评论家估计的关键性。
通过分位数贝叶斯风险MDP演化在线强化学习中的鲁棒性-探索权衡
发表机构 * School of Industrial and Systems Engineering(工业与系统工程系) ; Georgia Institute of Technology(佐治亚理工学院)
AI总结 本文提出一种基于分位数贝叶斯风险MDP的自适应算法,通过动态调整分位数水平来平衡早期鲁棒性与后期探索,并证明了亚线性贝叶斯遗憾界。
ChainzRule: 跨表格、NLP和视觉任务的样本高效、鲁棒深度学习
发表机构 * Sentivity AI
AI总结 提出ChainzRule架构,用可学习多项式层替代激活函数,结合微分正则化,通过限制中间导数实现低频率、结构稳定的表示,在多个领域以更少数据和标准推理成本取得更优性能。
CurveRL: 用于LLM推理的基于分布感知的上下文重加权原则
发表机构 * University of Pennsylvania(宾夕法尼亚大学)
AI总结 本文提出CurveRL方法,通过分位数坐标变换实现分布感知的提示重加权,在RLVR框架下统一优化理论并显著提升推理性能。
域间注意力:超越令牌级键值记忆
发表机构 * Imperial College London, UK(伦敦帝国学院) ; University of Copenhagen, Denmark(哥本哈根大学) ; Shanghai University of Finance(上海金融学院) ; Canon Inc., Japan(日本佳能公司) ; Technical University of Denmark, Denmark(丹麦技术大学)
AI总结 提出域间注意力机制,通过核方法将状态空间模型集成到注意力模块中,实现固定大小状态上的查询条件注意力,在语言建模中优于SSM和标准注意力基线。
量子启发特征映射的匹配光谱基准
发表机构 * Department of Computer Science, University of Lagos(拉各斯大学计算机科学系) ; Department of Physics, University of Lagos(拉各斯大学物理系) ; Department of Chemical Engineering, University of Notre Dame(圣母大学化学工程系)
AI总结 通过匹配输出维度和强经典控制,比较振幅、角度和基编码作为确定性特征映射在经典监督学习中的表现,分析其几何特性并发现固定量子启发编码几何本身并非经典数据上机器学习优势的可靠来源。
宗教表征中的省略偏见:评估LLM在日常伦理决策中的回答
发表机构 * Brigham Young University ; Baylor University ; University of Notre Dame ; Yeshiva University
AI总结 通过构建AllFaith宗教表征基准,评估LLM在回答日常伦理问题时是否提及宗教,发现模型普遍存在省略宗教框架的偏见,尤其在个人实际情境中更为明显。
从单次SGD到数据重用:草图线性回归中的小批量缩放定律
发表机构 * The University of Sydney(悉尼大学)
AI总结 本文通过分析单次批量SGD、有放回多次批量SGD和无放回多次批量SGD在幂律协方差谱下的风险分解,推导了草图线性回归中小批量大小的缩放定律,揭示了小批量对优化偏差、方差和波动项的影响。
Comments 56 pages, 3 figures
利用多语言大语言模型的嵌入发现词汇空缺
发表机构 * Department of Cognitive Science, University of California San Diego(加州大学圣地亚哥分校认知科学系)
AI总结 提出一种数据驱动框架,通过多语言大语言模型的上下文嵌入计算语义相似度,以识别跨语言词汇空缺,在韩英和英韩方向上分别达到0.81和0.76的AUC。
Comments CoNLL 2026
ChaosBench-Logic v2: 大规模评估大语言模型在动力系统上的逻辑推理能力
发表机构 * Mohamed bin Zayed University of Artificial Intelligence(穆罕默德·本·扎耶德人工智能大学)
AI总结 针对二元推理基准的准确性掩盖了关键缺陷,本文提出包含40,886个问题、覆盖165个动力系统的ChaosBench-Logic v2基准和CARE评估协议,揭示模型在状态转换推理、FOL演绎等任务上的表现差异和系统性反相关。
Comments 14 pages, 8 figures. Published at the ICLR 2026 Workshop on LLM Reasoning
增强基于LLM的安全代码生成的可靠性
发表机构 * Department of Computer Science, Birzeit University(巴伊兹大学计算机科学系) ; Department of Computer Science, University of Central Florida(佛罗里达中央大学计算机科学系)
AI总结 提出Mitigation-Aware Chain-of-Thought (MA-CoT)框架,通过嵌入任务特定的CWE缓解指导和语言感知安全措施,显著降低LLM生成代码中的漏洞,在多个模型和语言上验证了其一致的安全可靠性提升。
Comments 15 pages; 7 tables; 3 figures
LLMs 未显示出个体化元认知的迹象
发表机构 * Pareto AI
AI总结 通过因素分析和校准方法,研究20个前沿大语言模型在六个基准上的置信度判断,发现模型间置信度差异主要由共享的难度因子和决策阈值决定,而非个体化元认知,数学推理中的表面例外实为混淆效应。
LLM生成代码安全性的提示方法实证评估
发表机构 * Department of Computer Science, Birzeit University(计算机科学系,巴勒斯坦比泽大学) ; King Fahd University of Petroleum and Minerals(国王法赫德石油和矿物大学) ; University of Central Florida(中央佛罗里达大学)
AI总结 通过跨5个LLM和4种编程语言的实证评估,提出弱点感知零样本链式思考(WA-0CoT)提示策略,发现提示方法虽影响弱点类别分布,但无法显著降低漏洞频率或密度。
Comments 40 pages, 22 tables, 8 figures
通过高斯图模型进行私有自适应协方差估计
发表机构 * Manning College of Information and Computer Sciences(信息与计算机科学学院)
AI总结 提出PACE-GGM,一种数据自适应的差分隐私协方差估计方法,通过将隐私预算集中在经验协方差矩阵信息量最大的条目上,并在每轮中选择近似差的条目进行高斯机制测量,然后通过最大熵重建目标重构完整协方差矩阵,从而在高维和低到中等隐私预算下显著降低估计误差。
使用自监督学习和强化学习在Android恶意软件检测中适应概念漂移
发表机构 * Birzeit University(巴伊兹大学) ; University of Central Florida(中央佛罗里达大学)
AI总结 提出一个基于自监督学习和强化学习的框架,通过冻结编码器测量潜在漂移并轻量适配,同时利用PPO控制器在成本约束下选择维护动作,以应对Android恶意软件检测中的概念漂移。
Comments 9 pages, 2 figures, 2 tables
TUBE: 离散扩散语言模型证据的切线上界
发表机构 * Applied AI Institute(应用人工智能研究所) ; HSE University(俄罗斯高等经济学院) ; MIRAI
AI总结 针对离散扩散模型无法精确计算对数似然的问题,提出变分上界TUBE,并通过无偏蒙特卡洛估计器评估,发现块状扩散模型和块状任意阶自回归模型的对数似然严格低于自回归模型基线。
Comments Preprint. 9 pages main text, 5 figures, plus appendix
忠实性作为信息流:评估与训练忠实的链式思维推理
发表机构 * Dept. CSE, Michigan State University(密歇根州立大学计算机科学系) ; Anthropic
AI总结 通过信息流视角提出基于充分性、完整性和必要性的框架,结合熵、掩码KL和梯度诊断评估链式思维忠实性,并引入更新时干预(如注意力掩码、反向梯度掩码等)训练更忠实的推理模型。
面向物理信息神经网络的傅里叶特征金字塔
发表机构 * Department of Computing and Mathematical Sciences, California Institute of Technology(计算与数学科学部,加州理工学院) ; Cahill Center for Astronomy and Astrophysics, California Institute of Technology(天文与天体物理中心,加州理工学院) ; Google DeepMind(谷歌DeepMind)
AI总结 提出一种名为beignet的多分辨率傅里叶特征金字塔架构,通过可训练的特征网格和傅里叶插值,结合链式法则与FFT高效计算空间导数,以更少的参数实现比现有PINN方法更高的求解精度。
输入凸神经网络训练的提升方法
发表机构 * Department of Computer Science(计算机科学系)
AI总结 针对输入凸神经网络(ICNN)中非负权重约束导致的训练困难,提出一种通过超网络参数扩展的“提升”方法,软化损失景观,避免梯度衰减,在多个任务上达到更低测试损失。
优化数字治疗干预:内源性依从性下的在线学习
发表机构 * Department of Industrial and Systems Engineering, University of Wisconsin-Madison(威斯康星大学麦迪逊分校工业与系统工程系) ; College of Health Solutions, Arizona State University(亚利桑那州立大学健康解决方案学院)
AI总结 针对慢性病数字治疗中患者依从性受推荐和过去依从性影响的问题,提出一个包含线性动力系统和logit链接的决策支持框架,并设计基于乐观主义的UCB-BOLD算法实现亚线性遗憾。
Comments 48 pages, 6 figures
重新思考边缘上的持续异常检测:在现实工业条件下进行基准测试
发表机构 * University of Houston(休斯敦大学)
AI总结 针对现有持续异常检测方法在评估、比较和边缘部署约束上的不足,提出统一基准和训练无关方法DINOSaur,在多种协议下超越所有现有方法,并在边缘设备上实现快速推理和适应。
PrivFusion: 一种用于协调分布式数据集的隐私保护多智能体框架
发表机构 * IBM Research(IBM研究院)
AI总结 提出PrivFusion框架,通过多智能体自动协调异构结构化数据集,在联邦学习前实现隐私保护的数据对齐,减少人工干预。
Comments Accepted by IEEE CBMS 2026
Agent-ToM: 通过心智理论推理学习监控自主LLM智能体
发表机构 * Cisco Outshift(思科Outshift)
AI总结 针对自主LLM智能体的隐蔽恶意行为监控难题,提出基于心智理论推理的Agent-ToM框架,通过信念推断、意图假设与验证实现结构化轨迹分析,在监控基准上取得优于集成方法的性能。
Comments 23 pages, 9 figures
迈向评估工程:机器学习评估工具在野外的实证研究
发表机构 * Software Analysis and Intelligence Lab (SAIL), School of Computing, Queen's University(软件分析与智能实验室(SAIL),计算学院,女王大学) ; Concordia University(Concordia大学) ; Lahore University of Management Sciences (LUMS)(拉合尔管理科学大学(LUMS))
AI总结 通过对57个评估工具的实证研究,提出五阶段工具模型,并分类16560个问题,发现规范阶段问题最多(41.4%),主要根因是未实现功能(24.3%)、文档缺失(20.3%)和输入验证缺失(17.2%),为将评估工程作为独立软件工程关注点奠定实证基础。
分布鲁棒迁移学习在结构缺失协变量中的应用:以跨国心脏骤停预测为例
发表机构 * Centre for Biomedical Data Science, Duke-NUS Medical School, Singapore(生物医学数据科学中心,杜克-国家大学医学院,新加坡) ; Duke-NUS AI + Medical Sciences Initiative, Duke-NUS Medical School, Singapore(杜克-国家大学医学院AI+医学科学倡议,新加坡) ; Department of Biostatistics and Bioinformatics, Duke University, Durham, NC, USA(生物统计学与生物信息学系,杜克大学,北卡罗来纳州达勒姆,美国) ; Duke Clinical Research Institute, Durham, NC, USA(杜克临床研究学院,北卡罗来纳州达勒姆,美国) ; Emergency Medicine Department, National University Hospital, Singapore(急诊医学部,国立大学医院,新加坡) ; Department of Sport and Medical Science, Faculty of Physical Education, Kokushikan University, Tokyo, Japan(体育与医学科学系,体育学院,立命馆大学,东京,日本) ; Graduate School of Emergency Medical System, Kokushikan University, Tokyo, Japan(急救医疗系统研究生院,立命馆大学,东京,日本) ; Department of Emergency Medicine, Seoul National University College of Medicine, Seoul, Republic of Korea(急诊医学系,首尔国立大学医学院,首尔,韩国) ; Center for Emergency Medicine, Bach Mai Hospital, Hanoi, Vietnam(急救医学中心,巴赫梅医院,河内,越南) ; Center for Critical Care Medicine, Bach Mai Hospital, Hanoi, Vietnam(重症医学中心,巴赫梅医院,河内,越南) ; Health Services Research Centre, Singapore Health Services, Singapore(卫生服务研究中心,新加坡卫生服务,新加坡) ; Department of Emergency Medicine, Singapore General Hospital, Singapore(急诊医学部,新加坡中央医院,新加坡) ; Pre-hospital & Emergency Research Centre, Health Services Research and Population Health, Duke-NUS Medical School, Singapore(院前与急诊研究中心,卫生服务研究与人口健康,杜克-国家大学医学院,新加坡)
AI总结 提出DRUM框架,通过分布鲁棒优化和神经网络生成器处理目标域中结构缺失的协变量,实现无标签目标域的预测模型迁移,并在跨国心脏骤停预测中验证有效性。
神经过程表示能力的刻画
发表机构 * University of Cambridge(剑桥大学)
AI总结 本文通过严格层级分析,刻画了条件神经过程、注意力神经过程、Transformer神经过程及其潜在变体的表示能力,揭示了不同架构在函数表示上的包含关系与局限。
Comments To appear at ProbML/AABI 2026
将深度学习设计融入数据库查询
发表机构 * University of Washington(华盛顿大学)
AI总结 提出一种将深度学习自然集成到数据库查询中的方法,通过为元组关联可学习的向量嵌入,使查询同时操作数据和嵌入,实现关系深度学习。
通过可微渲染从成像声纳进行单视图海底恢复
发表机构 * California Institute of Technology(加州理工学院)
AI总结 提出一种无需训练的方法,通过可微渲染在30秒内从单张声纳图像恢复海底地形,利用已知海底倾斜条件,首次实现单视图高度恢复。
音乐转录:几乎无需监督
发表机构 * Cornell University(康奈尔大学)
AI总结 采用循环一致性翻译框架,利用少量配对数据作为锚点,充分挖掘未配对音频和乐谱数据,实现高质量音乐转录。
滤波后验均值集合:扩散泛化分析模型的统一框架
发表机构 * University of British Columbia(不列颠哥伦比亚大学) ; Inverted AI ; Alberta Machine Intelligence Institute(阿尔伯塔机器智能研究所)
AI总结 本文提出滤波后验均值集合(FPMC)统一框架,通过查询精度向量、响应权重和源分布建模扩散模型去噪函数的泛化行为,并通过软松弛和源分布增强提升现有方法性能。
Comments 27 Pages, 7 figures
AvalancheBench: 通过潜在世界恢复评估企业数据智能体
发表机构 * Brown University and Snowflake(布朗大学和Snowflake)
AI总结 提出AvalancheBench基准,通过潜在世界恢复评估企业数据智能体的分析理解能力,揭示早期错误如何传播并导致系统性错误推荐。
通过填充从扩散语言模型中提取训练数据
发表机构 * University of Waterloo(滑铁卢大学) ; KTH Royal Institute of Technology(皇家理工学院)
AI总结 提出填充提取协议,利用扩散语言模型的双向去噪能力,通过任意二进制掩码参数化,揭示掩码几何形状控制提取能力,边缘条件掩码比前缀条件掩码多提取三倍逐字序列,且双向访问打开了自回归模型无法利用的通道。
PromptAudit: 审计基于LLM的漏洞检测中的提示敏感性
发表机构 * University of Central Florida(佛罗里达大学)
AI总结 提出PromptAudit框架,通过固定数据集、解码和解析仅变化提示策略,评估五种提示策略在五个开源模型上对1000个CVE(6074个代码样本,16种编程语言)的漏洞检测性能,发现标准思维链提示整体性能最佳,而提示敏感性是系统的一级属性。
基于生化信息的神经常微分方程学习动力系统
发表机构 * Laboratory for Systems Medicine, Department of Medicine, University of Florida(系统医学实验室,医学系,佛罗里达大学) ; Department of Computational Science and Philosophy, Frankfurt School of Finance and Management(计算科学与哲学系,法兰克福金融与管理学院)
AI总结 提出生化信息神经常微分方程(BINODEs),通过将神经网络表示的过程嵌入化学计量结构,在保持可解释性的同时灵活建模部分已知的生化动力系统。
Comments 23 pages, 13 figures, 4 tables
推理时上下文稀疏性:幻觉还是机遇?
发表机构 * Berkeley(伯克利)
AI总结 本文通过实证和理论证据论证,在长上下文LLM推理中采用极端但原则性的上下文维度稀疏性不仅是可行的,而且能显著加速处理(如H100上实现10倍加速),从而挑战了密集注意力机制的必要性。
Comments 19 pages, 8 figures
知识图谱调制的深度学习用于有限样本临床数据分析
发表机构 * Department of Radiation Oncology, Stanford University(放射肿瘤科,斯坦福大学) ; Stanford University(斯坦福大学) ; Stanford University School of Medicine(斯坦福大学医学院) ; Department of Computer Science, Stanford University(计算机科学系,斯坦福大学) ; Department of Electrical Engineering, Stanford University(电气工程系,斯坦福大学) ; Department of Biomedical Data Science, Stanford University School of Medicine(生物医学数据科学系,斯坦福大学医学院) ; Stanford Cancer Institute, Stanford University(斯坦福癌症研究所,斯坦福大学) ; Institute for Stem Cell Biology and Regenerative Medicine, Stanford University(干细胞生物学与再生医学研究所,斯坦福大学) ; Department of Medicine, Division of Oncology, Stanford University(医学系,肿瘤学分会,斯坦福大学) ; Institute of Computational and Mathematical Engineering, Stanford University(计算与数学工程研究所,斯坦福大学)
AI总结 提出Graph-in-Graph (GiG)框架,通过将患者表示为模块化图并整合生物知识图谱,在有限样本临床任务中显著提升预测性能。
Comments 17 pages, 4 figures, 12 supplementary figures
一种可解释的CF-RL-TOPSIS融合模型用于技能感知的人才推荐
发表机构 * Sakarya University(萨克萨大学)
AI总结 提出CF-RL-TOPSIS可解释融合模型,结合协同过滤、强化学习臂和熵权TOPSIS,在ICT人才历史基准上验证其在不同数据模式下的有效性。
Comments Preprint submitted to Knowledge-Based Systems; 4 figures and 8 tables
EVA:通过高效向量量化架构加速大语言模型解码
发表机构 * Duke University(杜克大学)
AI总结 针对大语言模型解码阶段内存瓶颈和计算利用率低的问题,提出EVA架构,将GEMV计算转化为GEMM并消除内存冲突,实现最高11.17倍加速和7.17倍能效提升。
Comments 17 pages. Accepted to ISCA 2026
MAPLE:不完全信息游戏中AlphaZero的多状态聚合策略评估
发表机构 * Department of Computer Science, National Yang Ming Chiao Tung University(国立阳明交通大学计算机科学系) ; Institute of Information Science, Academia Sinica(中科院信息所)
AI总结 提出MAPLE方法,通过单搜索树聚合多个采样世界状态的策略和价值评估,结合PIMC和IS-MCTS优势,在Phantom Go和Dark Hex上分别提升Elo 291和136。
Comments Accepted by the IEEE Conference on Games (IEEE CoG 2026)
通过边际轨迹分布判别检测高维亚稳态盆地
AI总结 提出一种基于边际轨迹分布比较的判别方法,通过神经网络近似贝叶斯分类器来识别高维马尔可夫过程中的亚稳态盆地,克服了传统谱方法在高维和非线性几何下的局限性。
黎曼原型分析:变形星形分布上的可解释非线性数据分析
发表机构 * Department of Mathematics(数学系) ; University of California, Los Angeles(加州大学洛杉矶分校)
AI总结 提出黎曼原型分析(RAM),通过数据驱动的拉回几何将经典原型分析扩展到非线性流形,结合可解释性与非线性表达能力,并基于凸松弛与非凸细化的优化方案实现。
克服地球观测中的“物理冲击”:面向PINN洪水推断的异方差不确定性框架
发表机构 * Built Environment Department, College of Science and Technology, North Carolina A&T State University(北卡罗来纳A&T州立大学科学与技术学院建筑环境系) ; United Nations University Institute for Water, Environment and Health(联合国大学水、环境与健康研究所)
AI总结 提出一种不确定性感知的物理信息神经网络框架,通过动态热身启动和异方差不确定性建模,解决遥感洪水映射中物理约束与噪声数据冲突导致的梯度发散问题,在Sen1Floods11数据集上IoU提升25%。
Comments This article is accepted in IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing
Verified SHAP: 神经网络精确Shapley值的可证明界
发表机构 * University of Konstanz, Konstanz, Germany(康斯坦茨大学) ; Hebrew University of Jerusalem, Jerusalem, Israel(耶路撒冷希伯来大学) ; University of St.Gallen, St.Gallen, Switzerland(斯图加特大学)
AI总结 利用神经网络验证技术,提出一种计算SHAP值精确上下界的算法,可扩展到比现有精确方法大数个数量级的搜索空间。
Comments Accepted at ICML 2026. 34 pages, 13 figures
LWM-CDE:无线数据推理与可迁移性的表示空间
发表机构 * School of Electrical, Computer and Energy Engineering, Arizona State University(电气、计算机与能源工程学院,亚利桑那州立大学) ; InterDigital, Inc.(InterDigital公司)
AI总结 提出基于预训练无线基础模型特征空间的数据集相似性框架LWM-CDE,通过对比学习和几何形状损失微调数据集嵌入,构建距离可靠指示可迁移性的结构化流形,在无线基准测试中比现有指标更高效且与经验迁移性能相关性更强。
Comments The model and relevant scripts are available on the WILab Hugging Face page: https://huggingface.co/wi-lab
因果关系作为人工智能的统计良知:从珀尔的阶梯到可信机器
发表机构 * School of Mathematics and Statistics, College of Science(数学与统计学学院,科学学院)
AI总结 本文论证因果推断是AI不可或缺的统计良知,通过统计必要性定理、统一因果统计估计框架以及三种AI失败模式的因果盲区分析,提出可信AI本质上是因果统计问题。
Comments 18 pages, 4 figures, 1 table
基于半经验轨道电荷的多任务学习实现样本高效的机器学习原子间势
发表机构 * Department of Physical and Environmental Sciences(物理与环境科学系) ; Department of Electrical and Computer Engineering(电气与计算机工程系) ; The Alliance for AI-Accelerated Materials Discovery(人工智能加速材料发现联盟)
AI总结 提出利用半经验轨道电荷进行多任务学习,通过等变模型预测轨道电荷,显著提升机器学习原子间势的样本效率和精度,减少46%能量误差并降低五倍数据需求。
Comments 16 pages, 6 figures
多元神经网络输出的最优非渐近 Edgeworth 展开
发表机构 * Department of Mathematics, University of Luxembourg(卢森堡大学数学系)
AI总结 针对有限宽度全连接神经网络输出,利用任意阶 Edgeworth 展开逼近其与高斯极限的偏差,并给出总变差距离的上下界。
Comments 34 pages, 2 figures
洞察风暴内部:通过整合气象驱动因子改进临近预报
发表机构 * Guangzhou Meteorological Observatory(广州气象局)
AI总结 提出MetroLogist框架,通过物理定制的编码器、时间相位对齐器和跨场空间聚合器,整合热力学、动力学和微物理驱动因子,实现风暴生命周期的完整建模,显著提升临近预报性能。
超关系知识图谱上的生成式表示学习:基于掩码离散扩散
发表机构 * School of Computing(计算学院) ; Department of AI Computing, KAIST, Daejeon, South Korea(人工智能计算系,韩国科学技术院,大田,韩国)
AI总结 针对超关系知识图谱中任意掩码查询的补全与事实生成任务,提出基于掩码离散扩散的生成式表示学习方法KREPE,统一链接预测与事实生成,性能达到最优。
Comments 28 pages, 16 figures, 18 tables, 43rd International Conference on Machine Learning (ICML 2026)
基于人体通信的联邦学习用于体表边缘智能:综述、分类法与BODYFED-HBC调度示例
发表机构 * Department of Computing and Information Technology(计算与信息技术系) ; The University of the West Indies(西印度大学)
AI总结 本文综述了人体通信与联邦学习在可穿戴设备中的交叉领域,提出了一种区分体内、体中心、跨用户和临床云联邦学习部署的分类法,并引入BODYFED-HBC参考架构和调度算法以解决体信道感知的联邦学习问题。
符号胜过浮点:面向设备端微调的低秩双二值适配器
发表机构 * Fujitsu Limited(富士通株式会社) ; Institute of Science Tokyo(东京科学研究所) ; RIKEN Center for AIP(理化学研究所先进信息处理中心) ; Tokai University(静冈大学)
AI总结 提出LoRDBA,一种用二值符号载波和通道级缩放替代低秩因子的适配器,在保持LoRA兼容性的同时显著降低存储和计算开销,并在设备端微调中匹配或超越低比特基线性能。
Comments 34 pages, 3 figures
特征彩票?概念涌现的分岔理论
发表机构 * MIT(麻省理工学院)
AI总结 提出一种基于分岔理论的方法,通过损失Hessian驱动的超临界叉形分岔检测表示动力学中的结构涌现,并引入无标签相位坐标β/β_c,在多种设置下验证了四个不同的转变阶段,揭示了特征可解释性的早期可预测性。
Cascade-KDE:面向分布外脉冲损坏的鲁棒时间序列恢复
发表机构 * School of Digital and Intelligent Industry (School of Cyber Science and Technology)(数字与智能产业学院(网络科学与技术学院)) ; Inner Mongolia University of Science and Technology(内蒙古科技大学)
AI总结 提出Cascade-KDE无训练框架,通过二维密度估计、密度截断鲁棒期望和指数级联自适应停止,在保留局部结构的同时鲁棒恢复被高斯噪声和脉冲异常损坏的时间序列。
打破概率的锁链:中智逻辑作为大型语言模型中认知不确定性的新框架
发表机构 * Universidad Bolivariana del Ecuador, Coordinación Académica de Posgrado(巴尔干大学厄瓜多尔分校,研究生院) ; Universidad de Guayaquil(瓜亚基尔大学) ; Universidad Bernardo O’Higgins(伯纳多·奥希金斯大学) ; Mathematics, Physics, and Natural Sciences Division, University of New Mexico(新墨西哥大学数学、物理和自然科学系)
AI总结 本文提出使用中智逻辑(Truth、Indeterminacy、Falsity三个独立维度)替代传统概率框架,通过实验发现该框架能更丰富地表示LLM的内部状态,并在35%的评估中自发出现超真状态,为透明、可靠和伦理感知的AI系统提供关键步骤。
Comments Published in Neutrosophic Sets and Systems, Vol. 99 (2026). Author's preprint version. Open code and data available at: github.com/mleyvaz/neutrosophic-llm-logic
移动众包中用于LLM微调的诚实在线偏好聚合
发表机构 * Singapore University of Technology and Design(新加坡科技设计大学) ; Hong Kong University of Science and Technology(香港科技大学)
AI总结 针对移动众包中工人可能策略性谎报偏好反馈的问题,提出一种动态贝叶斯博弈模型和在线加权聚合机制,确保工人诚实反馈并实现次线性遗憾。
互补代理混合:鲁棒的大语言模型集成
发表机构 * DIMACS, Rutgers University(罗格斯大学DIMACS研究中心) ; Department of Mathematics, Rutgers University(罗格斯大学数学系) ; Department of Computer Science, George Mason University(乔治·梅森大学计算机科学系) ; Department of Computer Science, Rutgers University(罗格斯大学计算机科学系)
AI总结 将大语言模型选择视为组合选择问题,提出基于互补性的贪心选择算法,在性能与成本间取得最佳平衡。
大规模数据集与基准:蛋白质-配体模型学习的是结合位点还是仅仅结合可能性?
发表机构 * School of Computing Science(计算科学学院) ; School of Cancer Sciences(癌症科学学院) ; School of Life Science and Technology(生命科学与技术学院) ; Institute of Science Tokyo(东京科学研究院) ; Cancer Research UK Scotland Institute(英国癌症研究会苏格兰研究所) ; Language Technology Lab(语言技术实验室) ; Department of Medicine, Brigham and Women’s Hospital, Harvard Medical School(哈佛医学院内科部,布里格斯妇女医院) ; The Broad Institute of MIT and Harvard(MIT和哈佛大学Broad研究所)
AI总结 针对现有基准无法评估模型是否定位结合位点的问题,提出包含约10万对蛋白质-配体的InteractBind数据集和细粒度基准,通过结合位点定位任务揭示模型在强二元预测下定位能力有限。
Comments Under Review for the NeurIPS 2026 Conference, Track on Evaluations and Datasets
LLM-AutoSciLab:通过LLM主动实验进行闭环科学发现
发表机构 * Virginia Tech(弗吉尼亚理工大学) ; Sandia National Laboratories(桑迪亚国家实验室)
AI总结 提出LLM-AutoSciLab闭环框架,通过假设生成与实验选择迭代优化,在预算约束下实现主动数据采集,在三个基准上优于现有方法且样本效率提升2-5倍。
迈向可验证的Transformer:求解器可检查的电路解释
发表机构 * Independent Researcher(独立研究者)
AI总结 提出Verifiable Transformers框架,通过将任务局部Transformer电路转化为有界、求解器可检查的声明,实现电路属性的形式化验证。
无套利约束下使用深度学习进行波动率曲面重建
发表机构 * Universidad de Buenos Aires(布宜诺斯艾利斯大学)
AI总结 研究使用深度学习模型在无套利约束下从稀疏噪声期权报价重建隐含波动率曲面,比较多种神经网络架构与经典SVI参数化方法,发现Transformer和U-Net在稀疏观测下重建精度高,软套利惩罚有效减少套利违规。
Comments MSc thesis, Universidad de Buenos Aires, 2026. 94 pages, 27 figures
面向大模型特征编码
发表机构 * NTU(国立台湾大学) ; USTC(中国科学技术大学) ; DUT(东吴大学)
AI总结 本文提出大模型特征编码(LaMoFC)基准与评估框架,通过构建涵盖4类16场景的特征数据集LaMoFCBench,揭示现有编码范式与大模型特征异构性之间的严重错位。
MGVQ:协同多维敏感度感知与梯度-海森融合的向量量化
发表机构 * Bauman Moscow State Technical University(巴甫洛夫莫斯科国立技术大学)
AI总结 提出MGVQ框架,通过敏感度引导的结构化混合精度量化和梯度感知的二阶误差补偿,实现视觉-语言模型的超低位向量量化,在2-bit量化下最高提升4.9个点。
利用包含气溶胶信息的扩散模型改进集合CAPE预报
发表机构 * Cornell University, Department of Statistics and Data Science(康奈尔大学统计与数据科学系) ; Washington University in St. Louis, Department of Statistics and Data Science(圣路易斯华盛顿大学统计与数据科学系) ; Cornell University, Department of Earth and Atmospheric Sciences(康奈尔大学地球与大气科学系)
AI总结 针对GFS/GEFS系统夏季CAPE低估偏差,提出两阶段训练的AI扩散模型,通过输入GFS预报并输出集合,显著提升RMSE、CRPS和Brier评分,并引入气溶胶光学厚度作为额外特征以改善预报。
CAFD: 使用视觉语言模型的概念感知深度神经网络故障检测
发表机构 * School of EECS, University of Ottawa(渥太华大学电子工程与计算机科学学院) ; Research Ireland Lero centre for software, University of Limerick(利默尼克大学爱尔兰研究中心)
AI总结 提出概念感知故障检测(CAFD)方法,通过整合模型信号、距离特征和基于视觉语言模型的概念故障比(CFR)特征,在保持效率的同时显著提升DNN故障检测性能。
一种用于通信感知评估流水线并行LLM训练的表格调度抽象
发表机构 * Hardware and Artificial Intelligence (HAWAII) Lab, Heidelberg University, Heidelberg, Germany(海德堡大学硬件与人工智能实验室) ; NVIDIA Corporation, Santa Clara, CA, USA(英伟达公司)
AI总结 本文提出一种表格调度抽象和统一的多抽象方法,通过公式推理、理想化调度表和通信感知执行模拟,比较了GPipe、1F1B、Chimera和Hanayo等流水线调度方案,发现通信会抵消气泡分析的结构优势,调度排名依赖于执行环境。
Comments Accepted at the 25th IEEE International Symposium on Parallel and Distributed Computing (ISPDC 2026)
推理--想象--行动:基于世界模型的闭环LLM自动驾驶决策
发表机构 * 1Department of Information Management, Peking University, Beijing 100871, China ; 2School of Intelligence Science ; Technology, Peking University, Beijing 100871, China ; 3State Key Laboratory of General Artificial Intelligence, BIGAI, Beijing 100080, China ; 4Yuanpei College, Peking University, Beijing 100871, China ; 5China Agricultural University, Beijing, China ; 6CRSC Research \& Design Institute Group Co., Ltd., Beijing, China
AI总结 提出Reason--Imagine--Act (RIA)闭环框架,结合LLM推理器与动作条件世界模型进行在线安全验证,在CARLA点目标协议下实现80.05%路线完成率、51.10%到达率和0.20%碰撞率。
Comments Accepted by the 2026 IEEE International Conference on Intelligent Transportation Systems (ITSC 2026). 8 pages, 2 figures
IVR-R1:通过强化学习中的迭代视觉基础推理优化轨迹
发表机构 * Hangzhou International Innovation Institute, Beihang University(北京航空航天大学杭州国际创新研究院) ; School of Artificial Intelligence, Beihang University(北京航空航天大学人工智能学院) ; Kuaishou Technology(快手科技) ; Shenzhen Institute of Advanced Integration Technology, Shenzhen(深圳先进集成技术研究院)
AI总结 提出IVR-R1框架,利用奖励驱动的筛选机制和迭代再推理循环,在强化学习中动态校正多模态推理轨迹,以解决视觉幻觉和逻辑错误问题。
TSFLora: 面向无线边缘网络的令牌压缩分割微调
发表机构 * School of Computer Science and Engineering(计算机科学与工程学院) ; Center for Intelligent Networking and Communications(智能网络与通信中心) ; School of Computer Science(计算机科学学院) ; Beijing University of Posts and Telecommunications(北京邮电大学)
AI总结 针对无线设备资源受限下大模型微调难题,提出TSFLora框架,通过注意力引导的令牌选择、合并、低比特量化及LoRA适配器,在分割联邦训练中压缩中间令牌序列,显著降低通信开销和内存占用,同时保持精度。
面向多模态在线分布式工业异常检测的参数高效多类智能调度
发表机构 * Pengcheng Laboratory(鹏城实验室) ; Shenzhen International Graduate School(深圳国际研究生院)
AI总结 针对工业异常检测中分布式、持续生成数据的特点,提出多模态在线分布式工业异常检测框架,通过多类智能调度问题和序列边际增益贪婪算法协调模型更新,并采用资源高效类级低秩适应策略降低系统开销,在MVTec 3D-AD和Eyecandies数据集上取得优越性能。
算法度量:算法反馈下的预测
发表机构 * University of Oxford(牛津大学)
AI总结 提出算法度量框架,研究预测算法影响自身评估数据的反馈机制,证明部署风险不可仅由历史数据识别,并给出估计方法。
物理引导的混合相SnO-SnO$_2$一氧化碳传感器中具有p-n切换的电阻瞬态浓度推断
发表机构 * Centro de Modelamiento Matemático, Universidad de Chile & IRL 2807 - CNRS(智利大学数学建模中心及CNRS IRL 2807) ; Department of Chemical Engineering, Biotechnology and Materials, FCFM, Universidad de Chile(智利大学化学工程、生物技术与材料系) ; ANID - Millenium Science Initiative, Millenium Nuclei of Advanced MXenes for Sustainable Applications (AMXSA)(ANID-千年科学计划,可持续应用先进MXenes的千年核) ; CSIR-National Physical Laboratory, Dr. K.S. Krishnan Marg, New Delhi, 110012, India(印度国家物理实验室,Dr. K.S. Krishnan Marg,新德里,110012)
AI总结 提出一种物理引导的机器学习框架,利用混合相SnO-SnO$_2$气体传感器的电阻瞬态信号推断CO浓度,通过物理可解释描述符和频域特征实现p型和n型传感模式下的分类与回归,揭示了p型利于分类、n型利于高保真回归的双模行为。
Comments 15 pages, 14 figures
从指数到股票:预训练Transformer用于股票回报预测
发表机构 * Faculty of Engineering, McMaster University(麦基尔大学工程学院) ; Department of Economics, Universidad Veracruzana, Mexico(墨西哥韦拉克鲁斯大学经济系)
AI总结 本文研究基于Transformer的股票预测模型,通过在多伦多证券交易所指数上预训练再微调到个股,提升了预测性能,并与LSTM和XGBoost对比。
多模态对齐与偏好优化用于零样本条件RNA生成
发表机构 * Univ. Grenoble Alpes, CNRS, Grenoble INP, LJK(格勒诺布尔阿尔卑斯大学、法国国家科学研究中心、格勒诺布尔INP、LJK实验室) ; Center for Computational Mathematics, Flatiron Institute(计算数学中心、Flatiron研究所)
AI总结 提出Moirain框架,通过多模态监督微调和直接偏好优化实现条件RNA序列生成,在零样本条件下生成具有高结合亲和力的生物合理RNA序列。
通过知识引导的表示分解学习蛋白质结构-功能关系
发表机构 * Shenzhen International Graduate School, Tsinghua University, Shenzhen, China(清华大学深圳国际研究生院) ; Pengcheng Laboratory, Shenzhen, China(鹏城实验室) ; School of Electronic and Computer Engineering, Peking University, Shenzhen, China(北京大学电子与计算机工程学院) ; CAIR, University of Agder, Norway(阿格德大学CAIR) ; Shanghai Smart Logic Technology Co. Ltd., Shanghai, China(上海智略科技有限公司)
AI总结 提出知识引导的框架ProtDiS,基于信息瓶颈原理分解预训练的蛋白质微环境嵌入,得到更特异、独立和信息高效的结构特征,在12个下游任务上取得一致改进。
Comments 28 pages, 17 figures, icml 2026 regular
低成本标签,可靠选择:用于作业车间调度的Rollout校准超启发式算法
发表机构 * Faculty of Applied Sciences, Macao Polytechnic University(澳门理工学院应用科学学院) ; Pazhou Lab (Huangpu), Guangzhou(广州 Pazhou 实验室(黄埔)) ; College of Animal Science and Technology, Zhongkai University of Agriculture and Engineering(仲恺农业工程学院动物科学与技术学院) ; Macao Polytechnic University(澳门理工学院)
AI总结 提出一种基于Rollout校准的超启发式算法,通过遗憾归一化标签、上下文KNN不确定性估计和门控机制,在低成本标签下实现可靠的选择器,显著降低平均RPD。
QUIVER: 复合AI系统中扰动传播与分岔的量化形式化框架
发表机构 * Servicenow CA, USA(Servicenow加州美国)
AI总结 提出QUIVER形式化框架,通过敏感性矩阵、轨迹散度、分岔阈值和分布忠实度四个组件,量化图结构LLM流水线中扰动传播与结构分岔,并在三个不同架构的企业和公共流水线上验证其有效性。
用于股票价格预测的异构投资者交互博弈论建模
发表机构 * School of Computer Science, Beijing Institute of Technology(北京理工大学计算机科学学院) ; Faculty of Engineering, Shenzhen MSU-BIT University(深圳MSU-BIT大学工程学院)
AI总结 提出一种嵌入博弈论机制的异构图建模方法,通过模拟投资者动态策略交互来提升股票价格预测准确性。
Comments 10 pages, 1 figure, intended for conference submission
DRIVE:在持续学习下为Web代理建模推理与交互层面的技能
发表机构 * College of Intelligence Science and Technology, National University of Defense Technology(智能科学与技术学院,国防科技大学) ; College of Computer Science and Technology, National University of Defense Technology(计算机科学与技术学院,国防科技大学)
AI总结 提出DRIVE框架,通过将历史经验分离为自然语言推理技能和程序化交互技能,并采用场景感知协调机制,解决Web代理在持续学习中推理与交互知识纠缠的问题,在WebArena上平均任务成功率提升7.3个百分点。
Comments 35 pages, 5 figures
LLM介导的普适系统中的权威倒置:当模型信任用户胜过传感器
发表机构 * School of Computer Science and Engineering, South China University of Technology(华南理工大学计算机科学与工程学院) ; School of Computer Science(计算机科学学院) ; Engineering, South China University of Technology(华南理工大学工程学院)
AI总结 本研究揭示了大语言模型在融合传感器与用户冲突信息时,由于格式依赖性导致数值传感器数据被自然语言用户主张支配的权威倒置现象,并提出了几何框架、审计指标(CIR和AAI)以及推理时层干预方法(GAC)来诊断和缓解该问题。
模糊、中智和不确定图论:性质与应用
AI总结 本书系统综述了不确定性下的图论,以不确定图框架为核心,统一了模糊、中智等模型,并介绍了扩展图类及其在分子图、决策系统、图神经网络等领域的应用。
Comments 326 pages. Publisher: Neutrosophic Science International Association (NSIA) Publishing House. ISBN: 978-197250204-4
当正确信念崩溃:LLMs在临床压力下的认知韧性
发表机构 * Research Center for Social Computing and Interactive Robotics, Harbin Institute of Technology, China(社会计算与交互机器人研究院,哈尔滨工业大学,中国)
AI总结 研究LLMs在临床对话中面对逐步升级压力时信念稳定性问题,提出Med-Stress压力测试框架,发现知识-韧性差距,并设计RBED和R-FT方法提升鲁棒性。
Comments ACL 2026
量子青蛙:量化时间合作博弈中的涌现合作与难度缩放
发表机构 * Gymnasium API
AI总结 通过强化学习分析量化时间合作博弈Quantum Frog,发现同步冲刺策略最优,合作训练可大幅提升成功率并缩短回合步数。
多少思考才足够?量化和理解LLM推理中的冗余
发表机构 * Fudan University(复旦大学) ; The Chinese University of Hong Kong(香港中文大学)
AI总结 本文通过形式化推理冗余度量,量化了前沿推理模型在数学基准上高达61%-93%的步骤级冗余,并证明这种冗余是长度无关结果奖励的结构性后果,而非模型特定伪影。
高风险人工智能系统与欧洲人工智能法案中的身份问题
发表机构 * Institute of Biomedical Ethics and History of Medicine, University of Zürich(伦理与医学史研究所,苏黎世大学) ; SUPSI, Dalle Molle Institute for Artificial Intelligence (IDSIA)(SUPSI,达勒莫利人工智能研究所) ; ETH Zürich(苏黎世联邦理工学院)
AI总结 本文通过功能+框架分析欧盟AI法案中高风险AI系统的身份认定问题,提出同步身份测试方法以支持监管审计。
Comments Accepted as a non-archival paper at The 2026 ACM Conference on Fairness, Accountability, and Transparency (FAccT '26), June 25-28, 2026, Montreal, QC, Canada
模型停放税:量化始终在线GPU模型部署的隐藏能耗成本
AI总结 通过跨架构测量,发现GPU空闲功耗由DVFS状态决定,而非显存占用,CUDA上下文贡献了超过98%的停放税,并建立了冷启动盈亏平衡模型。
Comments 7 pages, 3 figures, 5 tables
大型语言模型中的置信度校准
发表机构 * U.C. Berkeley(伯克利大学) ; University of Southern California(南加州大学)
AI总结 通过预注册研究,发现大型语言模型(LLMs)的置信度普遍高于准确率,且存在显著的难易效应:困难测试中过度自信,简单测试中信心不足,并提出了LifeEval测试用于评估不同难度下的模型校准。
匹配原则:面向干扰鲁棒表示学习的损失函数几何理论
发表机构 * KU Leuven(根特大学)
AI总结 提出匹配原则,通过估计任务协方差矩阵并匹配惩罚矩阵的像空间,统一了多种鲁棒性方法,并在线性高斯模型中证明最优性。
Comments 58 pages, 13 pre-specified empirical blocks. v2: partial-pass framing, geometry-task dissociation, T2B protocol v3, layout/figure fixes; core theorems unchanged. Code: matching-pmh (PyPI). Related note: arXiv:2604.21395
语言模型中的关系线性性质:一项实证研究
发表机构 * University of Copenhagen(哥本哈根大学) ; University of Trento(特伦托大学) ; University of Bologna(博洛尼亚大学) ; University of Pisa(比萨大学)
AI总结 本文提出基于KL散度的探针方法,实证检验语言模型中关系线性假设(即固定关系下对象解嵌入可由主体嵌入线性映射预测),发现其随模型、层和关系表述变化。
检查你的大语言模型的秘密词典!五行代码揭示你的大语言模型学到了什么(包括它不应该学到的)
发表机构 * Mgnite Inc.(Mgnite公司)
AI总结 通过对lm_head权重矩阵进行奇异值分解(仅需五行PyTorch代码且无需模型推理),直接从模型权重中揭示可解释的语义子空间,并发现模型训练数据组成和策展哲学。
LT2: 线性时间循环Transformer
发表机构 * Rice University(里士大学) ; Apple(苹果公司) ; UC Santa Cruz(圣克ruz大学) ; Carnegie Mellon University(卡内基梅隆大学)
AI总结 提出LT2系列架构,用次二次线性时间注意力替代二次softmax注意力,通过循环实现线性注意力中的迭代记忆精炼和稀疏注意力中的有效感受野扩展,在召回、状态跟踪和语言建模任务上取得一致提升,并展示了混合变体在效率和性能上的优势。
ECUAS$_n$: 一种用于原则性评估不确定性增强系统的度量族
发表机构 * School of Engineering, UBA, Argentina(阿根廷UBA工程学院) ; ICC, CONICET-Universidad de Buenos Aires, Argentina(阿根廷CONICET-布宜诺斯艾利斯大学ICC) ; LISN, CNRS, Université Paris-Saclay, France(法国CNRS巴黎萨克雷大学LISN) ; International Laboratory on Learning Systems, Canada(加拿大学习系统国际实验室) ; CSC, CONICET, Argentina(阿根廷CONICET CSC) ; Mila - Quebec AI Institute, Canada(加拿大魁北克AI研究所Mila) ; CNRS, Université Paris-Saclay, France(法国CNRS巴黎萨克雷大学)
AI总结 针对高 stakes 自动决策中不确定性增强系统的评估问题,提出一种基于适当评分规则的度量族 ECUAS$_n$,通过参数 $n$ 平衡错误预测成本与不确定性质量,并在分类和生成数据集上验证其理论优势与实证效果。
Comments pre-print, 9-pages paper, 25 pages total
深度神经层扩散
发表机构 * School of Electrical Engineering and Computer Science, KTH Royal Institute of Technology, Stockholm, Sweden(电气工程与计算机科学学院,皇家理工学院,斯德哥尔摩,瑞典)
AI总结 针对图神经网络深层堆叠导致表示崩溃的问题,提出用层邻接算子替代层拉普拉斯算子,结合归一化、奇非线性函数和门控机制,在合成和真实数据集上显著提升深层网络性能。
Comments Accepted at the ICML 2026 Workshop on Graph Foundation Models (GFM@ICML 2026). Code available at https://github.com/remibourgerie/deep-neural-sheaf-diffusion
HypergraphFormer: 从大语言模型中学习超图以实现可编辑的楼层平面图生成
发表机构 * Autodesk Research(Autodesk研究院) ; York University(约克大学) ; UC Berkeley(加州大学伯克利分校)
AI总结 提出HypergraphFormer,利用大语言模型学习超图表示来生成楼层平面图,在RPLAN数据集上超越现有方法,并支持任意边界和高度可编辑性。
变分自编码器中恒定坍缩的单纯形见证证书
发表机构 * Independent Researcher(独立研究者) ; School of Computing, Southeast University(东南大学计算机学院)
AI总结 提出一种基于GMM教师后验和单纯形见证的证书,用于检测和量化VAE编码器均值是否发生输入无关的恒定坍缩,并在MNIST、CIFAR-10和CIFAR-100上验证了方法有效性。
分类问题的神经正切核
发表机构 * Mathematical Institute, University of Oxford(牛津大学数学研究所) ; Oxford-Man Institute of Quantitative Finance, University of Oxford(牛津大学量化金融研究所) ; OATML, University of Oxford(牛津大学OATML研究中心) ; Department of Computer Science, University of Oxford(牛津大学计算机科学系) ; Spotify
AI总结 本文通过识别宽神经网络在分类损失下保持懒惰训练的条件,将神经正切核理论扩展到分类问题,并分析了参数正则化对核常数性的影响以及预测器分布与贝叶斯方法的关系。
Comments Preprint
通过反事实推理路径减少信用分配方差
发表机构 * Alibaba Group(阿里巴巴集团) ; Tsinghua University(清华大学)
AI总结 提出反事实比较框架,通过采样多条推理轨迹并利用差异隐式估计过程级优势,将稀疏终端奖励转化为步骤敏感信号,从而改进大语言模型多步推理的信用分配,并引入隐式行为策略优化(IBPO)提升训练稳定性和性能上限。
光谱先验 vs. 注意力:探究注意力机制在基于脑电图的诊断中的效用
发表机构 * University of Cincinnati(辛辛那提大学)
AI总结 本文提出一种基于频带选择的光谱特征构建方法,证明在小型EEG数据集中,传统机器学习模型性能可匹敌或超越SOTA深度学习模型,而注意力机制无法提取稳定的光谱特征。
面向工业视觉检测的架构感知解释审计
AI总结 本文提出一种基于原生读出假设的架构感知解释审计协议,通过扰动实验证明解释方法的忠实度受其与模型原生决策机制的结构距离约束,并揭示忠实度排名是(模型、解释器、扰动算子)三元组的联合属性。
Comments Format update
减少偏差与方差:用于图像聚类的生成语义引导与双层集成
发表机构 * Institute of Big Data Science and Industry(大数据科学与产业研究院) ; Key Laboratory of Evolutionary Science Intelligence of Shanxi Province(山西省进化智能科学重点实验室) ; School of Artificial Intelligence, Shanxi University(山西大学人工智能学院)
AI总结 提出GSEC框架,通过生成语义引导减少偏差、双层集成学习降低方差,在六个基准数据集上超越18种最新方法。
真实 vs. 半模拟:重新思考治疗效果估计的评估
发表机构 * Department of Computer Science University of Luxembourg(计算机科学系卢森堡大学)
AI总结 通过大规模实证研究,比较了半模拟基准和真实数据集上使用反事实指标与可观测指标评估治疗效果估计模型的效果,揭示了两种评估体系之间的差距,并发现简单元学习器与强基础模型结合具有竞争力。
使用Ping2Hex方法的整车运输智能卡车匹配
发表机构 * Project44 Gmbh(Project44公司)
AI总结 提出基于Ping2Hex的智能卡车匹配系统ITM 2.0,通过概率排序和LightGBM模型解决GPS数据中车辆标识缺失导致的匹配问题,显著提升精度和覆盖率。
Comments 12 pages, 10 figures, 8 tables. Accepted at iSCSi 2026 (International Conference on Industry Sciences and Computer Sciences Innovation). To appear in Procedia Computer Science (Elsevier)
E = T*H/(O+B):混合专家生态的无量纲控制参数
发表机构 * School of Integrated Circuits, Wuxi Taihu University(无锡太湖大学集成电路学院)
AI总结 提出无量纲控制参数E = T*H/(O+B),通过12个控制实验证明E≥0.5可保证混合专家模型无死亡专家,并发现专家复活、正交毒性依赖数据集等六项额外结果。
Comments 12 experiments, 11,000+ training epochs, cross-modal validation (vision + language). Extended version of the Claude-in-the-Loop ecology framework
通过自适应共形语义熵进行LLM不确定性量化
发表机构 * Toronto Metropolitan University(多伦多 Metropolitan 大学) ; Vector Institute(向量研究所)
AI总结 提出自适应共形语义熵(ACSE)方法,通过聚类语义熵并自适应调整不确定性分数,结合共形校准实现统计可靠的接受/弃权决策,在多个数据集上优于现有基线。
Comments Accepted for publication in the Proceedings of the 35th International Joint Conference on Artificial Intelligence (IJCAI 2026); 14 Pages
NeuroViz:神经网络训练中前向和后向传播的实时交互式可视化
发表机构 * Boston University(波士顿大学)
AI总结 提出NeuroViz交互式可视化工具,通过实时展示全连接神经网络训练中的激活值、权重更新和损失变化,以及逐神经元方程,显著提升训练透明度和可解释性。
Comments 9 pages, 4 figures, 6 tables
先验无关的鲁棒预测聚合
发表机构 * Chinese University of Hong Kong(香港中文大学)
AI总结 针对未知状态空间和先验的鲁棒预测聚合问题,提出一种显式闭式对数几率聚合器,在线性对数几率空间线性池化预测,并在三种知识体制下给出接近极小极大遗憾的界。
分数排斥蒙特卡洛:面向一般状态空间中具有恒定内存的高效非马尔可夫采样器
发表机构 * CSE, Oakland University, Rochester, USA(计算机科学与工程系,奥本大学,罗切斯特,美国) ; ECE, North Carolina State University, Raleigh, USA(电子工程系,北卡罗来纳州立大学,拉勒米希茨,美国) ; IPAI, Seoul National University, Seoul, Korea(IPAI,首尔国立大学,首尔,韩国) ; AIGS, Ulsan National Institute of Science and Technology, Ulsan, Korea(AIGS,乌山国立科学与技术研究所,乌山,韩国)
AI总结 提出分数排斥蒙特卡洛(SRMC)框架,通过分数评估的运行平均值总结轨迹历史,利用指数分数倾斜构建替代目标,实现恒定内存下的非马尔可夫采样,降低渐近方差并改善模式覆盖。
Comments Accepted at ICML 2026 (Spotlight); GitHub Repo: https://github.com/srmc-project/Score-Repellent-Monte-Carlo
线性系统求解器中后向误差的通用收敛性
发表机构 * University of Michigan(密歇根大学) ; University of Oxford(牛津大学) ; Princeton University(普林斯顿大学)
AI总结 本文证明经典Richardson迭代在半正定线性系统上具有与条件数无关的1/k后向误差收敛率,并基于Krylov子空间最小化后向误差提出MINBERR算法,实现O(n^2/√ε)复杂度。
Comments Added convergence analysis of MINBERR-NE for general linear systems (Theorems 5.1 and 5.3)
序列级奖励的组内学习设计条件:令牌梯度消除
发表机构 * Alibaba Group(阿里巴巴集团) ; Tsinghua University(清华大学)
AI总结 针对大语言模型多步推理中稀疏终端奖励导致的信用分配问题,提出反事实比较框架和隐式行为策略优化(IBPO),通过轨迹差异近似替代决策,将稀疏奖励转化为步骤敏感信号,提升训练稳定性和推理性能。
M$^\star$:每个任务都应有专属的记忆框架
发表机构 * City University of Hong Kong(香港城市大学) ; Microsoft(微软)
AI总结 提出M$^\star$方法,通过可执行程序进化自动发现任务优化的记忆系统,在对话、具身规划和专家推理等任务上优于固定记忆基线。
Comments Preprint. Code: https://github.com/wbopan/mstar ; Live demo: https://mstar.wenbo.io
基于条件流匹配的倾斜平面上颗粒流生成建模
发表机构 * School of Construction, University of North Carolina at Charlotte(北卡罗来纳大学夏洛特分校建设学院) ; Department of Civil, Environmental, and Construction Engineering, Texas Tech University(德克萨斯理工大学土木、环境与建设工程系) ; College of Civil Engineering, Zhejiang University of Technology(浙江工业大学土木工程学院)
AI总结 提出首个条件流匹配(CFM)框架,利用稀疏边界观测重建颗粒流内部运动,通过可微前向算子和稀疏感知梯度引导机制实现高精度重建,并优于确定性CNN基线。
折扣Beta-Bernoulli奖励估计用于基于可验证奖励的样本高效强化学习
发表机构 * KAIST(韩国科学技术院)
AI总结 针对基于可验证奖励的强化学习样本效率低的问题,提出折扣Beta-Bernoulli奖励估计方法,利用历史奖励统计量降低估计方差并避免方差崩溃,在多个推理基准上显著提升性能。
Comments 14 pages, 3 figures
结构抽象作为非平稳语言模型训练的归纳偏置
发表机构 * University of Southern California(南加州大学)
AI总结 提出抽象增强训练(AAT)方法,通过联合优化具体实例及其结构抽象,减少灾难性干扰并提升关系泛化能力,在非平稳语言模型训练中验证了结构抽象作为稳定学习信号的有效性。
理解与生成相冲突吗?统一多模态模型DPO的诊断研究
AI总结 通过系统实验发现,在统一多模态模型上应用DPO时,生成质量难以对齐,主要原因是理解和生成梯度近乎正交且存在11-14倍的幅度不平衡,源于VQ token数量不对称。
Comments Experiments are inconclusive: The claim that architectures such as Chameleon or Emu would exhibit stronger gradient conflict is not supported by experiments or analysis, and all experiments are conducted on Janus-Pro without evaluation on other unified multimodal architectures
为什么智能体定理证明器有效:数学推理模型的统计可证明性理论
发表机构 * CyberAgent, Inc.(CyberAgent公司) ; National Institute of Informatics, Japan(日本信息机构)
AI总结 本文通过统计可证明性理论,将形式化证明搜索建模为有限视界可达性MDP,分析了智能体定理证明器中各组件对有限预算下证明成功率的影响,并给出了成功率差距的误差界。
Comments accepted at icml2026
Agent World Model: 用于智能体强化学习的无限合成环境
发表机构 * University of North Carolina at Chapel Hill(北卡罗来纳大学教堂山分校)
AI总结 提出Agent World Model (AWM)全合成环境生成管道,通过代码驱动和数据库支持的环境进行大规模强化学习,使智能体在多样日常场景中泛化。
Comments Accepted to ICML 2026
逻辑引导的向量场用于约束生成建模
发表机构 * Rochester Institute of Technology(罗切斯特理工学院)
AI总结 提出逻辑引导向量场(LGVF)框架,通过可微逻辑约束松弛注入流匹配生成模型,结合训练时逻辑损失和推理时梯度调整,在三个约束生成案例中减少59-82%的约束违反。
生成式视觉代码移动世界模型
发表机构 * Trillion Labs(万亿实验室)
AI总结 提出通过单一视觉语言模型预测可执行网页代码来生成移动GUI下一状态,结合文本和视觉世界模型优势,实现高保真视觉生成与精确文本渲染。
Comments ICML 2026
通过有界一致性实现多样性:多模态融合的几何正则化
发表机构 * Department of Informatics University of Bern(伯尔尼大学信息学院) ; College of Computing and Data Science Nanyang Technological University(南洋理工大学计算机与数据科学学院) ; School of Software Engineering Xi’an Jiaotong University(西安交通大学软件工程学院)
AI总结 提出一种轻量级即插即用的几何正则化框架,通过有界一致性原则在保持模态特异多样性的同时约束跨模态漂移,提升多模态融合性能。
深度神经网络的临界组织与p进统计场论
发表机构 * University of Texas Rio Grande Valley School of Mathematical \& Statistical Sciences One West University Blvd Brownsville, TX 78520, United States
AI总结 本文严格证明了深度神经网络在激活函数为sigmoid时的热力学极限,揭示了参数空间中的分岔临界组织,并利用p进整数编码层次结构,将临界组织与层次拓扑联系起来,同时研究了随机版本网络的输出分布。
Comments Many typos and minor errors were corrected. The main theorem was strengthened
随机到达的在线非质心聚类中的延迟分配
发表机构 * Bar Ilan University(巴伊兰大学) ; University of Oxford(牛津大学)
AI总结 针对随机到达模型,提出一种常数竞争比的在线非质心聚类算法,允许延迟分配以平衡聚类距离成本和延迟成本。
Comments To Appear in the 25th International Conference on Autonomous Agents and Multiagent Systems (AAMAS), 2026
诊断不同PDE族中神经算子的失败模式
发表机构 * Georgia Institute of Technology(佐治亚理工学院)
AI总结 本文提出一个标准化压力测试框架,通过在不同PDE族上测试FNO、DeepONet和CNO三种架构,发现分布内准确率不能可靠预测鲁棒性,且失败模式依赖于架构和PDE族的组合。
Comments Published in Transactions on Machine Learning Research. 17 pages, 7 figures, 1 table
未来KL正则化GRPO:基于f-散度正则化的过程级信用分配
发表机构 * University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校)
AI总结 本文提出未来KL正则化策略优化(FRPO),通过因果未来正则化回报修正GRPO中局部KL损失缺失的梯度信号,在数学推理任务中提升pass@16并保持更高熵和更低策略漂移。
PID引导的多模态去中心化联邦学习部分对齐
发表机构 * Department of Electrical and Computer Engineering, Stony Brook University(石溪大学电气与计算机工程系) ; Department of Applied Mathematics and Statistics and the Department of Computer Science, Stony Brook University(石溪大学应用数学与统计系和计算机科学系) ; Department of Electrical and Computer Engineering, New York University(纽约大学电气与计算机工程系) ; Department of Computer Science, New York Institute of Technology(纽约理工学院计算机科学系)
AI总结 针对多模态去中心化联邦学习中异构代理间更新不兼容的问题,提出基于部分信息分解的PARSE框架,通过特征分裂和部分对齐实现高效通信与协作。
AnatomiX:一种解剖学感知的胸部X光解读多模态大语言模型
发表机构 * Hasso Plattner Institute(霍普夫纳研究所) ; MBZUAI(穆萨大学人工智能研究所)
AI总结 提出AnatomiX,一种两阶段解剖学感知多模态大语言模型,通过先识别解剖结构再执行下游任务,在解剖定位、短语定位、定位诊断和定位描述任务上相比现有方法提升超过25%。
RepetitionCurse:在DoS压力下测量和理解混合专家大语言模型中的路由器不平衡
发表机构 * Ruixuan Huang(黄瑞轩) ; Qingyue Wang(王庆越) ; Hantao Huang(黄翰涛) ; Yudong Gao(高宇东) ; Dong Chen(陈东) ; Shuai Wang(王帅) ; Wei Wang(王伟)
AI总结 针对混合专家大语言模型在推理时缺乏显式负载均衡约束的问题,提出低成本的对抗性提示方法RepetitionCurse,利用重复令牌模式操纵路由策略,导致计算瓶颈和拒绝服务攻击,显著增加端到端推理延迟。
Comments Accepted by ICML 2026
高熵标记作为视觉-语言模型中的多模态失败点
发表机构 * The Australia National University(澳大利亚国立大学) ; The University of Queensland(昆士兰大学) ; GE research(GE研究)
AI总结 本研究揭示视觉-语言模型中约20%的高熵标记集中了不成比例的对抗性影响,并提出基于熵引导的稀疏攻击方法(EGA),实现高攻击成功率与有害率。
Comments 19 Pages,11 figures,8 tables
有限维学习动力学的学习稳定性剖面
发表机构 * Department of Mathematics(数学系) ; Kabale University(卡巴尔大学)
AI总结 提出一个有限维灵敏度框架,通过Lyapunov准则控制学习稳定性剖面,适用于前馈网络、残差架构、随机梯度方法和非光滑系统。
Comments 19 pages, 0 figures
DIVER-1: 扩展颅内脑电图基础模型以实现可迁移表示
发表机构 * Seoul National University(首尔国立大学) ; Brookhaven National Laboratory(布鲁克海文国家实验室)
AI总结 提出DIVER-1自监督iEEG基础模型,通过可变电极-时间注意力、时空重采样等设计处理可变输入,在5310小时ECoG和SEEG上预训练,在认知解码和癫痫检测任务上超越现有模型,并首次进行受控计算感知的扩展研究。
Comments 31 pages, 12 figures, 14tables
无安全神谕下通过模型预测控制近似安全反馈
发表机构 * Northeastern University(东北大学)
AI总结 提出一种利用模拟器和模型预测路径积分算法,基于可逆性和正不变性假设来近似安全函数的方法,避免手动设计安全反馈。
Comments 8 pages, 5 figures
Bi-CoG:面向视觉语言模型的双一致性引导自训练
发表机构 * School of Intelligence Science and Technology, Nanjing University, China(南京大学智能科学与技术学院) ; National Key Laboratory for Novel Software Technology, Nanjing University, China(南京大学新型软件技术国家重点实验室)
AI总结 针对半监督微调中模型偏差和超参数敏感问题,提出一种利用模型间和模型内一致性以及误差感知动态伪标签分配策略的即插即用方法Bi-CoG,在14个数据集上显著提升现有方法性能。
Comments Accepted by IJCAI 2026
测试时图搜索用于目标条件强化学习
发表机构 * Department of Computer Science, University of Toronto, Toronto, Canada(多伦多大学计算机科学系) ; Vector Institute, Toronto, Canada(向量研究所) ; University of Texas at Austin, Austin, USA(德克萨斯大学奥斯汀分校) ; Harvard University, Cambridge, USA(哈佛大学)
AI总结 提出测试时图搜索方法,通过构建离线数据集图并自适应选择子目标,在不额外训练的情况下显著提升目标条件强化学习在长时域任务中的成功率。
微调掩码扩散以实现可证明的自校正
发表机构 * Harvard University(哈佛大学) ; The University of Texas at Austin(德克萨斯大学奥斯汀分校) ; Kempner Institute(凯姆纳研究所)
AI总结 提出PRISM方法,通过轻量级模型无关的重新掩码策略,在掩码扩散模型中实现可证明的自校正,无需强化学习或验证器,提升低质量令牌检测与修正能力。
Comments Authorship statement: Jaeyeon Kim and Seunggeun Kim contributed equally, and Taekyun Lee is also a co first author
扩散与流模型中温度采样的时间分数重缩放
发表机构 * School of Computer Science, Carnegie Mellon University, Pittsburgh, USA(计算机科学系,卡内基梅隆大学,匹兹堡,美国) ; Department of Computer Science, Stanford University, California, USA(计算机科学系,斯坦福大学,加利福尼亚,美国)
AI总结 提出一种无需微调或改变训练策略的方法,通过重缩放噪声数据的得分函数来调控扩散和流模型的采样多样性,实现局部温度控制,并在图像生成、姿态估计、深度预测、机器人操作和蛋白质设计等任务中验证了有效性。
Comments Accepted at ICML 2026. Project page: https://temporalscorerescaling.github.io/
执行功能的贝叶斯分布模型
发表机构 * Division of Computing and Data Science, Washington University(华盛顿大学计算与数据科学系) ; Department of Computer Science and Engineering, Washington University(华盛顿大学计算机科学与工程系) ; Department of Biomedical Engineering, Washington University(华盛顿大学生物医学工程系) ; Department of Psychology, University of Maribor(马里博大学心理学系) ; Department of Human Development and Quantitative Methodology, University of Maryland(马里兰大学人类发展与定量方法系) ; Department of Teaching and Learning, Policy and Leadership, University of Maryland(马里兰大学教学与学习、政策与领导系) ; Department of Psychology, Northeastern University(东北大学心理学系) ; Department of Computer and Information Science, University of Pennsylvania(宾夕法尼亚大学计算机与信息科学系)
AI总结 本研究使用已知真实参数的受控模拟,评估分布潜变量模型(DLVM)和贝叶斯分布主动学习(DALE)相比传统独立最大似然估计(IMLE)的优势,证明DLVM结合DALE能更高效地估计认知表现分布。
Comments 45 pages, 8 figures, 2 tables
GPT-4o mini 是否被自身的安全过滤器蒙蔽?揭示多模态到单模态瓶颈在仇恨言论检测中的作用
AI总结 本文通过 Hateful Memes Challenge 数据集系统分析 GPT-4o mini 在多模态仇恨言论检测中的安全架构,发现并实验验证了“单模态瓶颈”缺陷,即上下文无关的安全过滤器会优先阻断多模态推理,导致误报。
Comments This paper reports preliminary findings from a small-scale study whose sample size is insufficient to support the stated conclusions. The authors are withdrawing it to conduct a more comprehensive evaluation
基于电导的神经元模型退化群体的尖峰时间快速重建
发表机构 * Montefiore Institute, University of Liège(里耶克斯大学蒙特福尔研究所) ; LTCI, Telecom Paris, Institut Polytechnique de Paris(巴黎电信LTCI研究院,巴黎理工院)
AI总结 结合深度学习与动态输入电导理论,从尖峰时间快速重建高维电导模型的退化群体,实现高精度、鲁棒且可扩展的推断。
标签清理的一些鲁棒性性质
AI总结 本文证明,依赖聚合标签(例如从噪声响应中提炼的标签信息)的学习过程具有数据清理无法实现的鲁棒性,体现在风险一致性、模型误设下的收敛性等方面。
Comments 41 pages, 3 figures. Accepted to Transactions on Machine Learning Research (TMLR)
用虚拟化身设计歌唱教学大纲:AI辅助的大纲重创
发表机构 * Kentucky State University, USA(美国肯塔基州立大学)
AI总结 本文提出一种AI辅助工作流,将传统文本教学大纲转化为音乐、视频和虚拟化身增强的学习制品,作为正式大纲的补充。
Comments 16 pages, 1 figures, 1 table
基于Kac流的电报生成模型
发表机构 * Institute of Mathematics, TU Berlin(柏林技术大学数学研究所)
AI总结 提出一种基于阻尼波动方程(电报方程)的新型生成模型,利用Kac过程与电报方程的Feynman-Kac关系,通过流匹配训练神经网络近似速度场,实现样本生成,并展示其相对于扩散模型的优势。
Comments V2: Added CIFAR. V3: Old FID & CIFAR images of Kac model corresponded to schedule g(t) = t. Updated them with both schedules t and t^2. V4: Corrected minor implementation error & updated CIFAR results. V5: Added: Prop. A1 (mean-reverting Kac process is Lipschitz); rigorous proof of decomp. Lemma 6.1; nearest neighbor analysis. V7: Correction in proof of Lem. 6.1. V6/8: Polishing
Uni-DPO:大语言模型动态偏好优化的统一范式
发表机构 * Harbin Institute of Technology, Shenzhen(哈尔滨工业大学(深圳)) ; Xi’an Jiaotong University(西安交通大学) ; The Chinese University of Hong Kong(香港中文大学) ; University of Chinese Academy of Sciences(中国科学院大学) ; Tsinghua University(清华大学) ; Huazhong University of Science and Technology(华中科技大学)
AI总结 针对现有DPO方法忽略数据质量和学习难度差异的问题,提出Uni-DPO统一框架,通过自适应重加权偏好对实现更有效的数据利用和更优性能。
Comments Accepted by ICLR 2026. Code & models: https://github.com/pspdada/Uni-DPO
FLoRIST: 用于高效准确的大语言模型联邦微调的奇异值阈值化方法
发表机构 * Anonymous Institution, Anonymous City, Anonymous Region, Anonymous Country(匿名机构,匿名城市,匿名地区,匿名国家)
AI总结 提出FLoRIST框架,通过奇异值阈值化在紧凑中间空间中对局部适配器进行分解,实现数学上准确的聚合,同时保持通信和计算高效。
Comments 21 pages, 12 figures
PageLLM:面向整页优化的大语言模型多粒度奖励框架
发表机构 * Arizona State University(亚利桑那州立大学) ; Nokia(诺基亚) ; University of Kansas(堪萨斯大学)
AI总结 针对整页优化中人工标注成本高和页面级连贯性与项目级放置粒度不匹配的问题,提出PageLLM框架,通过将隐式反馈解耦为粗粒度页面级奖励和细粒度项目级奖励,结合PPO的RLHF进行微调,显著提升排序性能并在线上部署中取得收益。
关于批噪声、自适应性和压缩在$(L_0,L_1)$-光滑性下的相互作用:一种SDE方法
发表机构 * University of Basel(巴塞尔大学) ; University of Oslo(奥斯陆大学) ; MBZUAI(马克斯·普朗克智能系统研究所) ; Max Planck Institute for Intelligent Systems(马克斯·普朗克智能系统研究所) ; ELLIS Institute Tübingen(图宾根ELLIS研究所) ; Tübingen AI Center(图宾根人工智能中心)
AI总结 本文通过随机微分方程(SDE)框架,在$(L_0,L_1)$-光滑性假设下统一分析分布式压缩SGD及其符号变体,揭示了梯度噪声、通信压缩和自适应更新之间的相互作用,并提出了新的SDE模型以准确捕捉学习率限制与几何特性的关系。
Comments Accepted at ICML 2026 (Poster)
动态优化与安全指示注入:针对多模态安全过滤器的文本到图像模型越狱方法
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; The Chinese University of Hong Kong(香港中文大学)
AI总结 提出OptJail框架,通过动态提示优化与自适应安全指示注入,绕过文本和图像过滤器,实现高成功率越狱,并揭示多模态防御的系统性漏洞。
InfiFPO:通过偏好优化实现大型语言模型的隐式模型融合
发表机构 * The Hong Kong Polytechnic University (PolyU)(香港理工大学) ; Zhejiang University(浙江大学) ; PolyU-Daya Bay Technology and Innovation Research Institute(香港理工大学-大亚湾技术与创新研究院)
AI总结 提出InfiFPO方法,通过将DPO中的参考模型替换为融合源模型,在序列级别合成多源概率,实现隐式模型融合,从而在偏好对齐阶段有效融合多个LLM并提升性能。
逆问题的神经积分算子:小样本光谱分类的算子学习框架
发表机构 * Department of Mathematics and Statistics, Idaho State University, Physical Science Complex, 921 S. 8th Ave., Stop 8085, Pocatello, ID 83209, USA(数学与统计学系,爱达荷州立大学,物理科学中心,921 S. 8th Ave., Stop 8085, Pocatello, ID 83209, USA) ; Department of Computer Science, Idaho State University, 921 S. 8th Ave Mail Stop 8060, Pocatello, ID 83209-8023, USA(计算机科学系,爱达荷州立大学,921 S. 8th Ave Mail Stop 8060, Pocatello, ID 83209-8023, USA) ; Institute for the Advanced Study of Culture and the Environment (IASCE), University of South Florida, 4202 E Fowler Ave, Tampa, FL 33620, USA(文化与环境高级研究机构(IASCE),佛罗里达州立大学,4202 E Fowler Ave, Tampa, FL 33620, USA)
AI总结 提出神经积分算子(NIO)框架,通过参数化Urysohn核和蒙特卡洛采样隐式正则化,在小样本光谱分类任务中优于传统机器学习和深度学习基线。
Comments 20 pages. 4 figures, 3 tables. v2: Link to code repository added. v3: Article largely reorganized and several portions rewritten for clarity. Comments are welcome
一种用于求解偏微分方程的对抗神经网络训练的自然原始-对偶混合梯度方法
AI总结 提出一种可扩展的预条件原始-对偶混合梯度算法,通过引入预条件算子实现自然梯度优化,并利用Krylov子空间方法高效求解,适用于多种线性和非线性偏微分方程,数值实验表明该方法比PINNs、DeepRitz和WANs等方法更稳定、更精确。
Comments Several typographical errors and notational inconsistencies have been corrected
一种面向CNN全网络滤波器剪枝的贪婪层次方法
发表机构 * Department of Computer Science and Engineering(计算机科学与工程系) ; Indian Institute of Technology, Kharagpur, India(印度理工学院,Khargpur,印度)
AI总结 提出一种基于线性近似的两层层次化贪婪剪枝算法,通过低层滤波器选择和全局剪枝准则高效剪枝,在多个网络上优于现有方法。
Comments Accepted in TMLR 2024
Soft Dice Confidence: 语义分割中选择性预测的近似最优置信度估计器
发表机构 * Department of Automation and Systems Engineering, Federal University of Santa Catarina(圣卡塔琳娜联邦大学自动化与系统工程系)
AI总结 针对语义分割中的选择性预测问题,提出一种基于Dice系数的近似最优置信度估计器SDC,在已知或估计边际后验概率下均优于现有方法。
Comments 48 pages, 11 figures
训练后的量子神经网络是高斯过程
发表机构 * Korteweg–de Vries Institute for Mathematics, University of Amsterdam(阿姆斯特丹大学Korteweg–de Vries数学研究所) ; QuSoft, Science Park 123, Amsterdam(阿姆斯特丹QuSoft) ; Scuola Normale Superiore, Piazza dei Cavalieri 7, 56126, Pisa (PI), Italy(意大利比萨斯克里瓦纳超级学院) ; Department of Mathematics, University of Bologna(博洛尼亚大学数学系)
AI总结 研究由参数化单量子比特门和固定双量子比特门构成的量子神经网络在无限宽度极限下的行为,证明未训练和训练后的网络生成的函数概率分布均收敛于高斯过程,并分析了测量噪声的影响。
Comments 116 pages
开放词汇时空语义表示的组合语义
发表机构 * Graduate School of Informatics, Nagoya University(名古屋大学信息学研究科) ; Ludolab ; TIER IV
AI总结 提出潜在组合语义嵌入z*作为可查询时空语义记忆的知识表示,证明其存在性、最优性及可发现性,并引入充分相似性推理方法提升重叠语义推理性能。
Comments Preprint
作为人文学科方法论的算法失败:机器学习的错误预测识别出用于定性分析的丰富案例
AI总结 本文通过实验验证了Munk等人提出的利用机器学习失败预测识别定性分析中模糊且丰富案例的方法,使用简单kNN算法对虚构角色与机器视觉技术互动的动作数据进行分类,发现不可预测的动作更具矛盾性和情感负荷,支持该方法在人文学科中的适用性。
贝叶斯马尔可夫决策过程的离线风险感知策略选择方法
发表机构 * Natural Intelligence Toulouse Institute, University of Toulouse, France(图卢兹大学自然智能研究所) ; ISAE-SUPAERO, University of Toulouse, France(图卢兹大学ISAE-SUPAERO)
AI总结 针对离线强化学习中模型不确定性导致策略风险高的问题,提出一种基于贝叶斯形式化框架的风险感知策略选择方法EvC,通过最大化贝叶斯后验下的风险感知目标来选择稳健策略。
Comments Preprint, under review
正权重受限玻尔兹曼机中的快速混合
发表机构 * School of Informatics, University of Edinburgh, Informatics Forum, UK(爱丁堡大学信息学院) ; School of Computing and Data Science, The University of Hong Kong, HK(香港大学计算与数据科学学院)
AI总结 本文通过分析铁磁双自旋系统的Glauber动力学,证明了正权重受限玻尔兹曼机的交替扫描采样器具有多对数混合时间界,并得到了临界阈值内的新混合时间界。
PowerFlow: 通过原则性分布匹配释放LLMs的双重特性
发表机构 * Institute for Interdisciplinary Information Sciences, Tsinghua University, Beijing, China(清华大学交叉信息研究院)
AI总结 提出PowerFlow框架,将无监督微调重构成分布匹配问题,利用GFlowNet和长度感知轨迹平衡目标,通过调整α-幂分布方向性激发LLMs的逻辑推理或创造性。
Comments Camera-ready version accepted at ICML 2026
BlitzRank: 基于锦标赛图的原则性零样本排序智能体
发表机构 * ContextualAI
AI总结 提出一种基于锦标赛图框架的k-wise排序方法,通过聚合偏好图并计算传递闭包,以最少比较次数准确识别top-m项,在LLM重排序中实现25-40%的token节省。
Comments ICML 2026 spotlight
MoBiQuant: 面向令牌自适应任意精度LLM的混合比特量化
发表机构 * University of Arizona(亚利桑那大学) ; Duke University(杜克大学) ; Sungkyunkwan University(成均馆大学) ; Panasonic AI Lab(松下人工智能实验室) ; Korea Advanced Institute of Science and Technology(韩国科学技术院)
AI总结 针对动态运行时约束下大语言模型任意精度量化的泛化性问题,提出基于令牌敏感度的混合比特量化框架MoBiQuant,通过多合一递归残差量化和令牌感知路由器实现灵活推理,在匹配或超越前沿单精度PTQ的同时显著节省内存并提升吞吐量。
Comments 20 pages, 10 figures
挖矿的智能时机:用于比特币硬件投资回报率预测的深度学习框架
发表机构 * Singapore University of Technology and Design(新加坡科技设计大学)
AI总结 提出MineROI-Net,一种基于Transformer的深度学习框架,将比特币ASIC硬件采购建模为时间序列分类任务,预测一年内的投资回报率类别,在2015-2024年20种ASIC矿机数据上达到83.2%准确率和83.5%宏F1分数。
基于立方体持续同调的MRI无训练分割
发表机构 * Centre G. Borelli ; ENS Paris-Saclay(巴黎-萨克雷大学) ; IST Austria(IST奥地利研究所) ; EMAp, Fundação Getulio Vargas(EMAp,格洛里亚·瓦格斯基金会)
AI总结 提出一种基于拓扑数据分析的无训练MRI分割框架,通过自动阈值、提取已知拓扑子集和分解成分三步实现,利用持续同调中的近似代表循环建立拓扑特征与解剖成分的可解释联系,在胶质母细胞瘤和胎儿皮质板分割中验证有效性。
Comments Similar to the published version. 22 pages, 11 figures, 3 tables. For associated code, see https://github.com/antonfrancois/gliomaSegmentation_TDA
URS:一种面向跨问题零样本泛化的统一神经路由求解器
发表机构 * School of Automation and Intelligent Manufacturing, Southern University of Science and Technology, Shenzhen, China(自动化与智能制造学院,南方科技大学,深圳,中国) ; Guangdong Provincial Key Laboratory of Fully Actuated System Control Theory and Technology, Southern University of Science and Technology, Shenzhen, China(广东省全驱动系统控制理论与技术重点实验室,南方科技大学,深圳,中国) ; College of Computer Science and Software Engineering, Shenzhen University, Shenzhen, China(计算机科学与软件工程学院,深圳大学,深圳,中国) ; Department of Computer Science, City University of Hong Kong, Hong Kong SAR, China(计算机科学系,香港城市大学,香港特别行政区,中国) ; School of Mathematics and Statistics, Xi'an Jiaotong University, Xi'an, China(数学与统计学学院,西安交通大学,西安,中国)
AI总结 提出URS,一种统一神经路由求解器,通过统一数据表示和混合偏置模块,实现单个模型在110种车辆路径问题变体(含99种未见变体)上的零样本泛化,并支持高达7000节点的规模。
Comments accepted by ICML 2026
超越代理:用于离线GFlowNet训练的轨迹蒸馏指导
发表机构 * Institute for Interdisciplinary Information Sciences, Tsinghua University, Beijing, China(清华大学交叉信息研究院)
AI总结 提出轨迹蒸馏GFlowNet(TD-GFN),利用逆强化学习从离线轨迹中提取稠密边奖励,通过DAG剪枝和优先反向采样指导策略,避免代理模型,提升离线GFlowNet训练的收敛速度和样本质量。
Comments Camera-ready version accepted at ICML 2026
重尾噪声下的非凸分布式随机双层优化
发表机构 * Temple University(特拉华大学)
AI总结 针对重尾噪声下的非凸双层优化问题,提出一种无需裁剪的归一化随机方差缩减梯度下降算法,并首次给出严格收敛性证明。
WhisTLE: 深度监督的文本领域自适应方法用于预训练语音识别Transformer
发表机构 * comcast Speech AI(comcast语音人工智能)
AI总结 提出WhisTLE,一种通过变分自编码器建模文本到编码器输出并微调解码器的文本领域自适应方法,显著降低词错误率。
Comments 10 pages
HiGraph:用于恶意软件分析的大规模层次图数据集
发表机构 * University of Technology Sydney(新南威尔士大学) ; Yunnan University(云南大学) ; University of New South Wales(新南威尔士大学)
AI总结 针对现有图方法忽略软件层次结构的问题,提出包含2亿控制流图和59.5万函数调用图的大规模层次图数据集HiGraph,用于构建抗混淆和演化的鲁棒恶意软件检测器。
Comments updated dataset statistics
实例条件适应:神经路由求解器的大规模泛化
发表机构 * School of Automation and Intelligent Manufacturing and Guangdong Provincial Key Laboratory of Fully Actuated System Control Theory and Technology, Southern University of Science and Technology, Shenzhen 518055, China(自动化与智能制造学院和广东省全驱动系统控制理论与技术重点实验室,南方科技大学,深圳518055,中国) ; Department of Computer Science, City University of Hong Kong, Hong Kong SAR, China(计算机科学系,香港城市大学,香港特别行政区,中国) ; Huawei Noah’s Ark Lab, Hong Kong SAR, China(华为诺亚实验室,香港特别行政区,中国)
AI总结 提出实例条件适应模型(ICAM),通过简单高效的实例条件适应函数和低复杂度的适应模块,显著提升神经路由求解器在大规模旅行商问题(TSP)、容量车辆路径问题(CVRP)和非对称旅行商问题(ATSP)上的泛化性能,同时保持快速推理速度。
Comments 13 pages, 5 figures
相对平移不变Wasserstein距离
发表机构 * Department of Computer Science(计算机科学系) ; George Washington University(乔治华盛顿大学) ; University of California, Los Angeles(加州大学洛杉矶分校) ; Department of Electrical and Computer Engineering(电气与计算机工程系) ; Princeton University(普林斯顿大学)
AI总结 受Bures距离启发,提出相对平移不变Wasserstein距离RW_p,证明其度量性质,并设计双层算法计算离散分布间的RW_p距离,当p=2时提出RW_2-LP和RW_2-Sinkhorn算法以提高数值稳定性,实验验证了算法在减少数值误差和实际雷暴模式检索中的有效性。
Comments Accepted by Transactions on Machine Learning Research (TMLR). Final accepted version. The implementation is publicly available at \url{https://github.com/DRKWang/rw_metric}