Models Take Notes at Prefill: KV Cache Can Be Editable and Composable
模型在预填充阶段记笔记:KV缓存可编辑且可组合
发表机构 * Pine AI
AI总结 研究发现KV缓存像笔记一样存储结论,支持编辑和组合:编辑单个字段可修正决策(8B模型准确率1.00,仅需~1%计算),组合预编译技能可无缝插入任意上下文(logit余弦相似度0.90-0.999),延迟降低至O(L)。
模型在预填充阶段记笔记:KV缓存可编辑且可组合
发表机构 * Pine AI
AI总结 研究发现KV缓存像笔记一样存储结论,支持编辑和组合:编辑单个字段可修正决策(8B模型准确率1.00,仅需~1%计算),组合预编译技能可无缝插入任意上下文(logit余弦相似度0.90-0.999),延迟降低至O(L)。
PowerOPD:利用有界幂变换稳定在线策略蒸馏
发表机构 * Eastern Institute of Technology, Ningbo(宁波东方理工大学) ; The Hong Kong Polytechnic University(香港理工大学) ; Shanghai Jiao Tong University(上海交通大学) ; University of Waterloo(滑铁卢大学)
AI总结 针对在线策略蒸馏中log-ratio奖励无界导致训练不稳定问题,提出基于Box-Cox幂变换的有界、符号一致奖励族PowerOPD,在数学推理任务上平均提升Avg@8/Pass@8达+6.37/+5.71,并降低59.2%时间与23.1%显存。
离散对数时钟:Transformer如何学习模乘法
发表机构 * Stanford University(斯坦福大学)
AI总结 通过乘法特征变换分析,发现Transformer在模乘法任务中学习到稀疏的傅里叶谱,其嵌入和MLP神经元主要编码少数乘法频率,表明模型实现了离散对数空间中的加法运算,即“离散对数时钟”算法。
Comments 5 pages, 5 figures. Accepted to the Mechanistic Interpretability Workshop at ICML 2026
通过残差正交化减少Boosting中的学习器冗余
发表机构 * Shenzhen Institutes of Advanced Technology, Chinese Academy of Sciences(中国科学院深圳先进技术研究院) ; College of Information Science and Technology, Beijing University of Chemical Technology(北京化工大学信息科学与技术学院) ; Gaoling School of Artificial Intelligence, Renmin University of China(中国人民大学高瓴人工智能学院) ; School of Computer Science, Central China Normal University(华中师范大学计算机学院) ; the School of Computing, Engineering and Mathematical Sciences, La Trobe University(拉筹伯大学计算、工程与数学科学学院)
AI总结 针对Boosting中残差拟合导致的学习器冗余问题,提出SCBoost框架,通过谱残差投影和协方差正则加权两种机制减少冗余,理论证明其几何性质,实验表明在精度和F1分数上表现优异。
当动力学模型读取错误的时间步:无标签事件信用重锚定以实现鲁棒的全局读出
AI总结 针对序列到全局接口中的时间信用稀释问题,提出无训练无标签的CREST方法,通过事件核心估计与对比重锚定,减少分布外误差并恢复事件信用。
Comments 7 pages, 6 figures
现代神经架构的守恒律
发表机构 * National University of Singapore(新加坡国立大学) ; Center for AI Research, VinUniversity(Vin大学人工智能研究中心) ; Independent Researcher(独立研究者) ; Hanoi University of Science and Technology(河内科学技术大学)
AI总结 本文提出统一框架,刻画GELU、SiLU、SwiGLU激活的前馈网络、多头注意力及混合专家模型中的梯度流守恒律,实验验证了理论预测的不变量。
Comments Published at the International Conference on Machine Learning (ICML 2026)
注意力中的功能等价性:一项综合研究及其在线性模式连通性中的应用
发表机构 * National University of Singapore(新加坡国立大学) ; Center for AI Research, VinUniversity(Vin大学人工智能研究中心) ; Independent Researcher(独立研究者) ; Technical University of Munich(慕尼黑技术大学)
AI总结 本文形式化研究了Transformer中位置编码对功能等价性的影响,发现正弦编码保持原始注意力的对称性,而旋转编码显著减少对称群从而增强表达力,并通过对齐算法实证了位置编码对线性模式连通性的关键作用。
Comments Published at the International Conference on Machine Learning (ICML 2026)
从漂移到一致:稳定LLM中的信念
发表机构 * Department of Statistics, Seoul National University ; Korea Advanced Institute of Science \& Technology ; Department of AI, Kookmin University ; University of Hong Kong
AI总结 研究LLM在多项选择问答中的信念漂移问题,提出提示式预测重采样(PPR)方法,发现信念过程会自稳定并收敛,进而提出种子答案提示策略和自一致性损失以加速稳定并提高预测一致性。
单调Kolmogorov-Arnold网络:单调性作为归纳偏置的理论与实证研究
发表机构 * Jozef Stefan Institute(约瑟夫·斯特凡研究所)
AI总结 提出MKAN,通过指数重参数化B样条系数、正边权和单调基激活实现硬单调性,理论证明任何特征提取器可被单调化且编码器规模有界,实验表明MKAN在单调性基准上达到最优并保持KAN的逐边功能透明性。
KANLib -- 一个模块化、可扩展且快速的Kolmogorov-Arnold网络实现
发表机构 * Intelligent Embedded Systems University of Duisburg-Essen(智能嵌入式系统杜伊斯堡-埃森大学)
AI总结 提出KANLib框架,通过统一现有KAN实现、支持多种基函数和自适应网格缩放,在保持灵活性和高性能的同时,实现可复现的预测结果。
SoftMoE: 用于大语言模型混合专家网络的软可微路由
发表机构 * AGH University of Krakow, Poland(克拉科夫AGH大学) ; Faculty of Mathematics(数学系) ; Computer Science, Jagiellonian University, Poland(计算机科学系,杰哥利安大学,波兰) ; Centre for Credible Artificial Intelligence, Warsaw University of Technology(可信人工智能中心,华沙技术大学)
AI总结 提出SoftMoE,通过软top-k LapSum松弛替代离散路由,实现专家路由的梯度优化,并学习每层专家激活数量,在语言建模中激活更少专家达到相当或更优性能。
Comments Accepted at ICML 2026
LoopCoder-v2: 仅循环一次以实现高效的测试时计算扩展
发表机构 * Beihang University(北京航空航天大学) ; IQuest Research ; Langboat(浪波) ; Renmin University of China(中国人民大学)
AI总结 本文提出并行循环Transformer(PLT)并研究循环次数选择,发现两循环变体在代码生成等任务上显著提升,而三循环以上性能下降,揭示了增益-成本权衡。
循环世界模型
发表机构 * FaceMind Research Asia
AI总结 提出循环世界模型(LoopWM),通过参数共享的Transformer块迭代细化潜在环境状态,实现高达100倍参数效率,并建立迭代潜在深度作为世界模拟的新缩放轴。
Comments Technical Report
动作生成应从何处开始?面向生成式机器人策略的可学习源先验
发表机构 * Southeast University(东南大学) ; The Chinese University of Hong Kong(香港中文大学)
AI总结 提出LeaP,用轻量MLP预测基于本体感知的对角高斯分布作为动作生成源先验,替代标准高斯分布,在15个RoboTwin任务中平均成功率81.6%,优于基线方法6.5-25.5个百分点。
深度Transformer中基于有界深度文法的层次建模的表达性分析
发表机构 * University of Sydney(悉尼大学) ; San Francisco State University(旧金山州立大学) ; IIT Madras(印度理工学院马德拉斯分校)
AI总结 通过有界深度上下文无关文法,证明深度Transformer的深度随文法深度线性增长,神经元数随派生树形状和产生式规则数量缩放,支持线性表示假说。
重新审视自回归多任务表格识别中的结构依赖性:基于顺序无关的单元格级表示
发表机构 * Preferred Networks, Inc.(Preferred Networks公司)
AI总结 针对自回归多任务表格识别中单元格表示顺序依赖导致全局一致性下降的问题,提出通过非因果注意力生成顺序无关的单元格特征,实现并行推理,在两大数据集上提升定位与识别性能,推理时间减少约3倍。
Comments ICDAR 2026
INI-VPINN:一种隐式处理纽曼边界和界面的变分物理信息神经网络,适用于具有几何奇异性的多材料域
发表机构 * DESTeC University of Pisa(DESTeC 帕尔米斯大学)
AI总结 提出一种新的弱形式物理信息神经网络INI-VPINN,通过隐式处理纽曼边界和界面条件,无需额外损失项或多子域网络,在多材料问题中实现更高精度和更快收敛。
Comments Preprint version. Under peer review. Code available at: https://github.com/ShayanDodge/INI-VPINN
一种基于凸拟线性化的物理信息神经网络求解非线性偏微分方程的方法
发表机构 * Texas A\&M University, College Station, Texas, U.S.A.(德克萨斯大学阿姆斯特朗分校)
AI总结 提出LiL-Q方法,通过Bellman-Kalaba拟线性化将非线性PDE转化为线性子问题序列,采用线性参数化试验空间(LiL)和凸最小二乘求解,避免非凸梯度训练,理论保证牛顿-康托罗维奇收敛,在多个基准上以少量外迭代达到高精度。
Comments Preprint. 56 pages, 18 figures. Code: https://github.com/awojinrin/lilq-pinn
自适应体积力学属性场:分辨率无关
发表机构 * NVIDIA(英伟达)
AI总结 提出AdaVoMP方法,利用稀疏自适应体素结构和自回归Transformer编解码器,为3D物体预测高分辨率空间变化的杨氏模量、泊松比和密度,相比现有技术分辨率提升16^3倍且更准确。
Comments Project Page and hi-res paper: https://research.nvidia.com/labs/sil/projects/adavomp/. ICML 2026
一种用于混沌时间序列预测的张量网络方法
AI总结 针对混沌时间序列预测问题,提出基于张量网络的模型,通过分解高维数组降低参数复杂度,在精度和计算效率上优于传统回声状态网络。
Comments 15 pages, 4 figures. Comments are welcome!
从逾渗视角看待Dropout神经网络训练
AI总结 本文研究使用dropout训练深度神经网络时的逾渗现象,建立新逾渗模型刻画网络拓扑与路径问题的关系,揭示dropout中的逾渗效应及其可能导致训练崩溃的机制。
Comments 21 pages, 14 figures
重新思考时间序列的多模态融合:文本模态需要受约束的融合
AI总结 针对多模态时间序列预测中朴素融合方法效果不佳的问题,提出受约束融合方法及受控融合适配器(CFA),通过低秩适配器过滤无关文本信息,在多种数据集和模型上验证了有效性。
Comments KDD Workshop on Mining and Learning from Time Series 2026
Olmo Hybrid:从理论到实践再回到理论
AI总结 本文通过理论分析和实验验证,证明混合模型(结合注意力与线性RNN)在表达能力、扩展效率上优于纯Transformer,并训练了7B参数的Olmo Hybrid模型,在标准评估中超越Olmo 3。
Comments Corrected author list and typos in appendix
宪法性在策略安全蒸馏
发表机构 * Institute of Trustworthy Embodied AI(可信具身人工智能研究院) ; Fudan University(复旦大学) ; Shanghai Innovation Institute(上海创新研究院) ; Ant Group(蚂蚁集团) ; Zhejiang University(浙江大学) ; City University of Hong Kong(香港城市大学)
AI总结 针对在策略自蒸馏在安全对齐中因宪法条件导致教师分布收缩、表达能力下降的问题,提出宪法性在策略安全蒸馏(COPSD),通过交叉SFT冷启动校准教师分布,再进行宪法条件在策略蒸馏,在12个基准上实现了更优的安全-有用性权衡并降低安全税。
何时写入与何时抑制:面向记忆辅助知识编辑的路径专用双适配器
发表机构 * institutetext(机构)
AI总结 提出路径专用双适配器编辑器,通过相关性路由器决定是否应用编辑记忆,分别训练编辑适配器和局部性适配器,在三个基准上取得最佳概率偏好准确率。
有理稀疏自编码器
发表机构 * Lehigh University(里海大学)
AI总结 提出有理稀疏自编码器(RSAE),用可训练有理函数替代固定编码器激活,通过两阶段流程(初始化+微调)在多种语言模型和基线激活族上提升重构与下游行为指标,不牺牲特征可解释性。
Comments Accepted to the Mechanistic Interpretability Workshop at ICML 2026
警惕混叠——信号保留对鲁棒图像复原至关重要
AI总结 针对图像复原网络因混叠导致鲁棒性差的问题,提出BOA-Restormer,通过在频域执行部分下采样和上采样操作,确保无混叠路径,在低成本下提升模型鲁棒性。
Comments Tags: Adversarial attack, image restoration, image deblurring, frequency sampling
资源高效的变分量子分类器
发表机构 * IT4Innovations, VSB - Technical University of Ostrava(IT4Innovations奥斯特拉瓦技术大学) ; Faculty of Electrical Engineering and Computer Science, VSB - Technical University of Ostrava(电气工程与计算机科学学院,奥斯特拉瓦技术大学)
AI总结 提出基于汉明距离测量与经典后处理的无歧义量子分类器,通过更有效利用ansatz表达性提升分类性能,同时大幅减少电路评估次数,并增强对噪声的鲁棒性。
Comments 13 pages, 7 figures, 1 table; current format of preprint template
Co-PLNet: 一种用于提示引导的线框解析的协作点线网络
AI总结 提出点线协作框架Co-PLNet,通过点线提示编码器交换空间线索,并利用交叉引导线解码器增强点线一致性,在Wireframe和YorkUrban数据集上提升线框解析的准确性和鲁棒性。
GOT-JEPA:基于联合嵌入预测架构的通用目标跟踪与模型自适应及遮挡处理
AI总结 提出GOT-JEPA框架,通过预测跟踪模型而非图像特征来提升泛化能力,并设计OccuSolver增强遮挡感知,在七个基准上验证了有效性。
Comments Accepted by IEEE Transactions on Circuits and Systems for Video Technology (TCSVT). This research focuses on learning model adaptation for adverse and dynamic environments, as well as fine-grained occlusion perception for tracking
自适应领域模型:贝叶斯演化、热旋转与几何及神经形态AI的规范化训练
AI总结 提出基于维度类型系统、程序超图和b-posit有界设计的替代训练架构,实现内存开销恒定、梯度精确累积和级保持更新,并引入贝叶斯蒸馏和热旋转机制,支持领域特定模型的持续自适应与可验证正确性。
Comments 32 pages, 3 figures
FoundCause: 从观测数据中发现含隐混淆因子的因果关系
发表机构 * Amazon Web Services(亚马逊云服务) ; Department of Statistics, University of California, Davis(加州大学戴维斯分校统计系)
AI总结 提出FoundCause,一种基于合成数据训练的摊销因果发现模型,通过单次前向传递直接映射数据集到因果图,显式建模隐混淆因子,在15个真实数据集上优于11种非摊销和4种摊销方法。
Comments Download the model at https://github.com/amazon-science/foundcause
扩展SPHERE-JEPA:超球面上的统计正则化器家族
AI总结 为解决自监督学习中切片统计正则化器因蒙特卡洛采样引入投影方差导致优化不稳定和收敛慢的问题,提出全维MMD、KSD和KL散度正则化器,并采用旋转不变核,在ImageNet和Galaxy10上实现更稳定优化和一致改进。
通过无监督对称性发现实现潜在域盲恢复
发表机构 * Bogazici University(博阿齐奇大学)
AI总结 提出无监督框架,通过发现数据分布的对称性,从无结构观测中恢复潜在域和信号,使用浅层群卷积网络并施加平稳性和局部性正则化。
隐式定义潜在流形上的测地线计算
AI总结 提出将自编码器的潜在流形视为隐式子流形,并开发离散黎曼微积分工具以近似经典几何算子,通过去噪目标学习近似投影,实现潜在流形上的测地线路径计算和黎曼指数映射。
Comments 26 pages, 18 figures
Brep2Shape:通过自监督变换器对齐边界与形状表示
AI总结 提出Brep2Shape自监督预训练方法,利用双Transformer骨干和拓扑注意力对齐B-rep的抽象边界表示与直观形状表示,在多项下游任务中达到最优精度并加速收敛。
可扩展且可解释的序数相似性表示对齐
发表机构 * University of Maryland(马里兰大学) ; Google Research(谷歌研究院)
AI总结 针对现有表示相似性度量缺乏可解释性、对异常值敏感且计算复杂的问题,提出基于序数相似性的三元组和四元组相似性指数,实现可解释、鲁棒且高效的对齐度量。
E2Vec:基于时间信息的特征嵌入用于分析电子书系统中的学生行为
发表机构 * Kyushu University(九州大学)
AI总结 提出E2Vec方法,利用词嵌入将操作日志和时间间隔转化为学生向量,用于风险检测任务,提升泛化性和性能。
Comments Research paper published in the Proceedings of the 17th Educational Data Mining Conference (EDM 2024), see https://doi.org/10.5281/zenodo.12729853
基于权重正则化的稳定且可操控的稀疏自编码器
AI总结 通过L1/L2权重正则化提高稀疏自编码器的跨种子特征一致性,并在语言模型上提升操控成功率,同时保持可解释性分数。
ThinkJEPA:赋予潜在世界模型大型视觉-语言推理能力
AI总结 提出ThinkJEPA框架,结合密集JEPA分支与稀疏VLM思考者分支,通过分层金字塔表示提取模块,实现细粒度运动建模与长程语义引导,在手部操作轨迹预测任务上超越基线。
Comments 10 pages, 5 figures
括号序列Transformer中可解码性与因果使用的分离
AI总结 通过探针和干预实验,发现Dyck语言Transformer中层级表示虽可解码,但仅注意力模式中的栈顶位置对长距离准确性有因果影响。
先验通过抑制持续存在:词汇覆盖的斯特鲁普范式
发表机构 * The University of Hong Kong(香港大学)
AI总结 通过斯特鲁普范式实验,发现语言模型中的词汇先验在局部规则覆盖后仍持续存在,并通过激活修补定位到源位置三元组,揭示了先验是干扰起源和覆盖痕迹的共同通道。
发现功能选择性脑区:一种深度地形多模态模型
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; Max Planck Institute for Human Cognitive and Brain Sciences(马克斯·普朗克人类认知与脑科学研究所) ; ETH Zurich(苏黎世联邦理工学院)
AI总结 提出Topo-Omni模型,通过空间平滑微调预训练基础模型,在单一连续虚拟皮层上整合视觉、听觉和语言/认知处理,产生与人类神经影像一致的多模态聚类,并用于发现新脑区。
Comments Preprint. First two author contributed equally
重新思考无评论强化学习中的分组
发表机构 * Université de Montréal(蒙特利尔大学) ; McGill University(麦吉尔大学) ; Mila - Quebec AI Institute(Mila - 魁北克人工智能研究所) ; University of Waterloo(滑铁卢大学) ; The Chinese University of Hong Kong(香港中文大学) ; Huawei Noah’s Ark Lab(华为诺亚方舟实验室)
AI总结 针对无评论强化学习分组策略的数据低效和同步问题,提出负令牌过滤方法,实现单次 rollout 稳定训练,在推理和代理任务上表现相当或更优。
不确定性下的决策驱动地质导向:序列决策优化的统一框架
发表机构 * NORCE Research Centre(NORCE研究机构) ; University of Stavanger(斯塔夫anger大学) ; Stanford University(斯坦福大学)
AI总结 提出一个将粒子滤波与强化学习结合的地质导向框架,通过显式建模地质不确定性并评估三种决策策略,实现稳定且高效的井轨迹实时优化。
性能驱动的多时间尺度学习环境抽象
发表机构 * Georgia Institute of Technology(佐治亚理工学院) ; University of North Carolina at Charlotte(北卡罗来纳大学夏洛特分校)
AI总结 针对大规模马尔可夫决策过程,提出一种性能驱动的环境抽象方法,通过多时间尺度强化学习联合优化策略和树结构抽象,平衡性能与复杂度,实现状态压缩和样本效率提升。
用于对抗性航天器接近操作中自适应安全关键控制的内存高效元强化学习
发表机构 * MIT(麻省理工学院) ; University of Illinois, Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校)
AI总结 本文研究利用元强化学习调整输入约束控制屏障函数的类K函数,比较三种循环网络架构和两种训练算法,发现Mamba与PPO组合在合作与非合作场景中均能提升任务完成率、安全性和燃料效率。
基于时变需求的约束赌博机在线LLM选择
发表机构 * Department of Electrical and Computer Engineering, University of Florida(佛罗里达大学电气与计算机工程系) ; Manning College of Information and Computer Sciences, University of Massachusetts Amherst(马萨诸塞大学阿默斯特分校曼宁信息与计算机科学学院)
AI总结 针对边缘云推理系统中异构LLM的选择问题,提出一种基于置信界估计和需求预测的在线学习算法,在硬预算和软延迟约束下实现亚线性遗憾和约束违反。
Comments 11 pages, 3 figures with multiple subfigures, 1 table, submitted for possible journal publication
学习精炼隐藏状态以实现可靠的LLM推理
发表机构 * Tongyu0924
AI总结 提出ReLAR框架,通过强化学习引导的潜在状态精炼,自适应调整推理步数和方向,提升复杂多步推理的准确性和稳定性,降低推理开销。
Comments Code is available at tongyu0924/Learning-to-Refine-Hidden-States
通过深度强化学习的连续时间最优停止
发表机构 * Department of Statistics & Applied Probability, UC Santa Barbara(加州大学圣塔芭芭拉分校统计与应用概率系)
AI总结 提出CARLOS算法,利用聚合深度神经网络学习任意精细时间分辨率下的停止规则,通过渐进式时间网格细化和自适应采样,逼近美式期权价格上界。
Comments 33 pages
逆向Q学习
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出逆向Q学习(RQL)算法,通过扩展MDP框架和逆向流生成虚拟在线轨迹,结合偏差-方差缩减技术,实现基于流策略的离线强化学习,在50个机器人任务中取得最佳平均性能。
EnvRL: 在智能体强化学习中从环境动力学中学习
发表机构 * Department of Computer Science and Technology, Tsinghua University(清华大学计算机科学与技术系) ; Shanghai AI Laboratory(上海人工智能实验室)
AI总结 提出EnvRL框架,通过状态预测和逆动力学两个辅助目标,将环境动力学学习融入智能体强化学习,在长周期任务中显著提升成功率。
深度强化学习用于最小零强制集
发表机构 * Department of Computing Sciences, Villanova University(维拉诺瓦大学计算科学系)
AI总结 提出一种基于强化学习的框架SD-ZFS,通过改进S2V-DQN架构求解最小零强制集问题,在多种图结构上验证了其优于贪心启发式算法。
多目标强化学习中学习公平帕累托最优策略
AI总结 针对多目标强化学习中固定用户偏好无法提供多样化策略的问题,提出基于广义基尼福利函数的多策略方法,学习公平帕累托最优策略集。
Comments Accepted at the Reinforcement Learning Conference (RLC) 2025. 12 pages main + appendix, 8 figures, 4 tables
WallZero:通过战略分析掌握WallGo游戏
发表机构 * National Yang Ming Chiao Tung University(国立阳明交通大学) ; Academia Sinica(中央研究院)
AI总结 提出基于AlphaZero的WallZero智能体,通过定制动作和特征设计,在WallGo游戏中击败职业围棋选手,并分析游戏公平性与关键策略。
Comments Accepted by the Computers and Games conference (CG 2026)
通过分类器模型进行集成强化学习:在交易策略中增强风险回报权衡
AI总结 本文研究了在金融交易策略中使用集成强化学习模型的全面研究,利用分类器模型来提升性能。通过将A2C、PPO和SAC等强化学习算法与传统分类器如支持向量机(SVM)、决策树和逻辑回归相结合,探讨不同分类器组如何整合以改善风险回报权衡。研究评估了各种集成方法的有效性,将其与单个强化学习模型在关键金融指标(包括累计回报率、夏普比率(SR)、卡勒姆比率和最大回撤(MDD))上进行比较。结果表明,集成方法在风险调整后的回报方面始终优于基础模型,提供了更好的回撤管理和整体稳定性。然而,我们发现集成性能对方差阈值τ的选择敏感,强调了动态调整τ以达到最佳性能的重要性。本研究强调了将强化学习与分类器结合在自适应决策中的价值,对金融交易、机器人和其他动态环境具有启示。
Comments 23 pages,10 figures, 9 table
带强盗反馈的匹配博弈学习
AI总结 研究广义双边匹配市场中代理通过零和博弈交互的学习问题,提出基于UCB的算法,以匹配不稳定性为遗憾度量,实现次线性遗憾上界。
Comments 22 pages, 2 figures
乐观主义稳定自适应推断的汤普森采样
AI总结 本文通过引入乐观机制(如方差膨胀或均值奖励)稳定汤普森采样,使得各臂拉取次数收敛于确定性尺度,从而在K臂随机bandit中实现渐近有效的Wald推断,并解决了多最优臂的扩展问题。
Comments Accepted in part to COLT 2026
具有广义双线性偏好的可证明高效正则化在线RLHF
AI总结 研究在线RLHF中正则化最佳响应最大遗憾最小化问题,通过广义双线性偏好模型证明强凸性可导出多对数遗憾,表明快速遗憾不限于KL散度。
Comments 48 pages, 3 figures (ver3: major revisions; ver2: more colorful boxes, fixed some typos)
Curiosity-Critic:累积预测误差改进作为世界模型训练的可处理内在奖励
AI总结 提出Curiosity-Critic方法,通过可处理的每步替代项(当前预测误差与渐近误差基线的差值)作为内在奖励,利用共训练的评论家在线估计误差基线,有效分离可约与不可约预测误差,在随机网格世界实验中优于现有方法。
Comments Accepted to ICML 2026 Workshop on Epistemic Intelligence in Machine Learning (EIML@ICML 2026). Code: https://github.com/vinbhaskara/Curiosity-Critic
婴儿自发运动噪声改善深度强化学习中的探索
发表机构 * Frankfurt Institute for Advanced Studies(法兰克福高等研究所) ; School of Computer Science and Engineering, University of New South Wales(新南威尔士大学计算机科学与工程学院) ; Escuela de Ingeniería, Universidad Central de Chile(智利中央大学工程学院) ; Faculty of Electrical Engineering, Czech Technical University(捷克理工大学电气工程学院)
AI总结 受婴儿自发运动噪声启发,提出一种在RL训练中逐步增加时间自相关的探索噪声机制,实验表明其能产生结构化探索行为并提高学习效率。
Comments 6 pages, 4 figures, 1 table. Accepted at IEEE ICDL 2026. Cite as: F. M. López, M. R. Ernst, F. Cruz, M. Hoffmann, and J. Triesch, "Infant Spontaneous Movement Noise Improves Exploration in Deep RL", in 2026 IEEE International Conference on Development and Learning (ICDL). IEEE, 2026, pp. 1-6
OmniRetarget:面向人形全身运动操控与场景交互的交互保持数据生成
AI总结 提出OmniRetarget引擎,通过交互网格显式建模并保持智能体、地形和物体间的空间与接触关系,将人类运动重定向为机器人运动,生成高质量轨迹以训练强化学习策略,实现长时间跑酷和操控技能。
Comments Project website: https://omniretarget.github.io
学习上下值包络以塑造在线强化学习:一种原则性方法
AI总结 提出一种两阶段框架,利用离线数据学习值函数的上下界,并将其融入在线算法,通过解耦上下界实现更灵活紧致的近似,理论分析给出高概率遗憾界,实验表明显著降低遗憾。
Comments 35 pages, 5 figures
大型语言模型的隐性协调
AI总结 研究大型语言模型在多智能体无通信协调中的焦点涌现能力,通过博弈和搜救任务评估,发现模型在多数场景匹配或超越人类,但在数值常识和文化显著性任务中失败,并提出无学习策略改善协调。
Comments Code: https://github.com/EmanueleLM/focal-points
OmniSapiens: 一种通过异质性感知相对策略优化进行社会行为处理的基础模型
发表机构 * Massachusetts Institute of Technology(麻省理工学院) ; National University of Singapore(新加坡国立大学) ; Nanyang Technological University(南洋理工大学) ; Prince Sattam bin Abdulaziz University(普森·萨塔姆·本·阿卜杜勒阿齐兹大学) ; University of Rochester(罗切斯特大学)
AI总结 针对行为数据异质性导致的训练不平衡问题,提出Omnisapiens-7B 2.0基础模型,采用异质性感知相对策略优化(HARPO)方法,在10个行为任务和5个零样本泛化基准上取得最佳性能。
Comments Accepted to ICML 2026 Main Conference
克服激励崩溃悖论
AI总结 针对AI辅助任务中激励崩溃问题,提出哨兵审计支付机制,在有限成本下维持正人力努力,并构建激励感知的主动统计推断框架优化审计率与采样分配。
Comments Accepted to ICML 2026
减阻还是奖励黑客?赚取其奖励的循环多智能体强化学习
发表机构 * School of Science and Technology, Department of Engineering, City St. George’s, University of London(伦敦大学科学与技术学院,工程系,圣乔治学院)
AI总结 针对壁湍流减阻控制中强化学习奖励与设计目标偏离的问题,提出可微投影、循环策略和真实壁面功率奖励的修正方案,在诚实核算下实现17%的保守减阻。
信息性缺失生成不规则临床时间序列
发表机构 * Aalborg University(奥尔堡大学) ; University of Pavia(帕维亚大学) ; Bowling Green State University(博林格林州立大学)
AI总结 提出基于扩散的临床时间序列生成方法,联合建模实验室值和观察模式,在DACMI基准上验证,能捕获生理与检测行为间的临床依赖。
约束扩散模型与原始-对偶推理
发表机构 * Department of Electrical and Systems Engineering, University of Pennsylvania(宾夕法尼亚大学电气与系统工程系)
AI总结 提出原始-对偶推理(PDI)方法,通过联合推断最优原始分布和其对偶变量,在扩散模型反向过程中交替去噪与对偶上升,实现平均约束下的熵正则化优化问题采样。
离散自回归变压器用于生成式机构综合
发表机构 * Computer-Aided Design and Innovation Lab, Department of Mechanical Engineering, Stony Brook University(石溪大学机械工程系计算机辅助设计与创新实验室)
AI总结 提出离散自回归变压器,将平面路径综合转化为条件序列建模,通过VAE潜在变量和机构类型令牌生成关节坐标,实现多样准确机构设计。
Perron--Frobenius算子匹配用于生成建模
发表机构 * Texas A&M University(德克萨斯农工大学) ; City University of Hong Kong(香港城市大学)
AI总结 提出Perron-Frobenius算子匹配(PFOM)生成框架,通过积分PF算子匹配密度演化,统一流、扩散和跳跃模型,并证明KL散度在Bregman散度中唯一保持密度级与样本条件目标等价,开发Nesterov加速训练和采样方法。
掩码扩散模型中的递归缩放
发表机构 * LTS4, EPFL, Lausanne, Switzerland(瑞士洛桑联邦理工学院LTS4实验室) ; University of Cambridge, Cambridge, UK(英国剑桥大学)
AI总结 提出递归掩码扩散模型(R-MDMs),通过在每个扩散步骤中重复应用同一去噪变换器增加递归深度,实现参数高效缩放,在数独和倒计时等结构化生成任务中,以更少参数匹配非递归基线性能。
NoiseTilt: 噪声倾斜反向核用于扩散奖励对齐
发表机构 * KAIST(韩国科学技术院) ; The University of Tokyo(东京大学)
AI总结 提出噪声倾斜反向核(NTRK),通过将奖励梯度注入噪声项实现奖励引导采样,保持预训练反向核不变,每步仅需单样本,在奖励对齐任务中超越现有方法且不损失样本质量。
Comments 52 pages
Volterra生成模型
发表机构 * The Hong Kong University of Science and Technology (Guangzhou)(香港科技大学(广州))
AI总结 提出Volterra生成模型,通过分数阶核引入路径依赖噪声,利用马尔可夫提升和残差状态学习,解决非马尔可夫动力学下的扩散生成问题,在MNIST和CIFAR-10上验证有效性。
Comments 36 pages
用于鲁棒扩散策略的Kolmogorov回归
发表机构 * Bala Cynwyd, PA 19004(巴拉辛威德, PA 19004)
AI总结 提出后向Kolmogorov方程将扩散策略提升至Cameron-Martin空间,用确定性边界值PDE问题替代随机分数匹配,通过精度加权损失和残差诊断实现收敛保证、轨迹规则化和无奖励故障检测。
AMPGAN v3 的非经典抗菌肽智能发现
发表机构 * University of Vermont(弗吉尼亚大学) ; Larner College of Medicine, University of Vermont(弗吉尼亚大学医学学院) ; Purdue University(普渡大学) ; Department of Comparative Pathobiology(比较病理科部门) ; Department of Horticulture and Landscape Architecture(园艺与景观建筑部门) ; Department of Industrial and Molecular Pharmaceutics(工业与分子药学部门)
AI总结 提出 AMPGAN v3,一种多目标条件 GAN,扩展生成词汇至 D-氨基酸和末端修饰,通过双判别器提升稳定性,体外验证显示对革兰氏阳性菌有活性,并引入 PepCraft 多智能体框架用于端到端发现。
Comments Presented at the GenBio Workshop, ICML 2026
将音乐识别转化为神经前向传播
发表机构 * Music X Lab(音乐X实验室) ; Mohamed Bin Zayed University of Artificial Intelligence(Mohamed Bin Zayed人工智能大学)
AI总结 提出用生成式Transformer通过单次神经前向传播实现音乐识别,在短音频片段上超越传统声学指纹方法,存储和延迟显著降低。
基于轨迹直线度的整流流根选择不动点反演
发表机构 * KAIST(韩国科学技术院)
AI总结 提出SelFix方法,通过选择使逆轨迹更直的不动点解,在整流流中实现精确反演,提升图像重建和编辑质量。
具有潜在高维稳态几何流的变分自编码器用于动力学
AI总结 提出VAE-DLM方法,在潜在空间中引入稳态几何流,通过物理信息方法求解高维流,增强潜在表示的表达能力,在PDE型数据上降低OOD误差15%-35%。
世界模型批判:一种用于世界建模的生成式潜在预测架构
AI总结 本文从心理学“假设性思维”出发,提出世界模型的核心目标是模拟真实世界的所有可行动可能性,并设计了一种基于状态化、分层、多级、混合连续/离散表示的生成式潜在预测(GLP)架构。
流匹配模型的渐进微调
AI总结 提出渐进微调(GFT)框架,通过退火策略在目标分布样本下微调流生成模型,理论保证逼近真实目标,实验表明稳定性、效率与多样性优于现有方法。
Comments Preprint. Added methodology and experimental sections
从错误中学习:自纠正掩码扩散模型
发表机构 * Cornell(康奈尔大学) ; NVIDIA(英伟达)
AI总结 提出ProSeCo框架,通过训练模型同时进行掩码去除和错误纠正,在生成过程中迭代修正已解码标记,提升样本质量并实现更快的采样速度。
Comments Code to reproduce our experiments is available here: https://github.com/kuleshov-group/proseco
DPRM: 一种用于扩散语言模型的即插即用Doob h变换诱导的令牌排序模块
AI总结 提出DPRM模块,通过在线估计从置信度驱动排序逐步过渡到过程奖励引导排序,改进扩散语言模型的令牌排序策略,在九种任务中提升性能。
潜在生成模型中的几何保持编码器/解码器
发表机构 * Department of Mathematics, The Ohio State University(俄亥俄州立大学数学系) ; Department of Mathematics, University of Minnesota(明尼苏达大学数学系) ; Zu Chongzhi Center for Mathematics and Computational Sciences, Duke Kunshan University(杜克-昆山大学仲长奇中心)
AI总结 本文提出一种新型几何保持编码器/解码器框架,通过保留数据分布的几何结构,在潜在扩散模型中实现更高效的训练和更快的收敛。
Comments 50 pages
无崩溃的递归学习:基于加权的稳定化框架
AI总结 针对递归生成模型训练中的模型崩溃问题,提出基于加权的训练策略,在混合真实与合成数据场景下,理论推导出最优加权方案的统一表达式,揭示合成数据利用与模型性能间的权衡。
Comments This article has been accepted for publication in Journal of the Royal Statistical Society: Series B, published by Oxford University Press
CoCoEmo: 通过激活引导实现可组合且可控的类人情感语音合成
AI总结 提出基于激活引导的框架,在混合TTS模型中实现可组合的混合情感合成和文本-情感不匹配合成,发现情感韵律主要由语言模块而非流匹配模块生成。
RAIGen: 文本到图像生成模型中的罕见属性识别
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; UC Berkeley(加州大学伯克利分校)
AI总结 提出RAIGen框架,利用Matryoshka稀疏自编码器和新颖的少数度量,在无标签条件下发现扩散模型中的罕见属性,并支持属性放大。
Comments Accepted at ICML 2026. Webpage and code available at https://github.com/VSSILPA/RAIGen
从噪声到有序:通过去噪扩散学习排序
发表机构 * University of Guelph(圭尔夫大学) ; Independent Researcher(独立研究者) ; University of California, Berkeley(加州大学伯克利分校) ; McGill University(麦吉尔大学) ; University of Toronto(多伦多大学)
AI总结 提出基于去噪扩散的生成式排序模型DiffusionRank,通过建模特征向量与相关性标签的联合分布,在四个标准LTR数据集上优于传统判别式方法。
CogGen: 认知负荷启发的全无监督深度生成模型用于压缩感知MRI重建
AI总结 提出CogGen框架,基于认知易到难原则,通过自定进度课程学习和MRI感知双阈值加权策略,将CS-MRI重建分解为分阶段反演问题,理论证明降低局部充分迭代界和累积噪声放大界,实验优于现有无监督和有监督方法。
通过浅层通道电路学习和生成混合态
发表机构 * QuEra Computing Inc.(QuEra计算公司) ; School of Engineering and Applied Sciences, Harvard University(哈佛大学工程与应用科学学院)
AI总结 研究通过浅层通道电路生成混合态的学习问题,证明在特定相态下,仅通过测量数据即可高效学习生成混合态,为量子生成模型提供结构基础。
Comments 44 pages, 14 figures, 1 table
DVD: 用于3D生成和编辑的离散体素扩散
发表机构 * Imperial College London(伦敦帝国学院) ; Math Magic ; Hitem3D
AI总结 提出离散体素扩散框架(DVD),通过将体素占用视为离散变量,实现稀疏体素的生成、不确定性估计和编辑,避免连续到离散的阈值处理,并提供可解释的生成动态。
连续语言扩散作为解码器-接口问题
发表机构 * Tsinghua Shenzhen International Graduate School, Tsinghua University(清华大学深圳国际研究生院, 清华大学)
AI总结 研究连续扩散语言模型如何从高斯噪声生成流畅文本,提出解码器-盆地机制,并设计诊断协议揭示标量指标隐藏的失败,通过接口相图解释令牌恢复行为。
噪声驱动从亚稳态逃逸解释深度神经网络中的grokking现象
发表机构 * Complexity Science Group, Institute of Physics and Astronomy, University of Potsdam(波茨坦大学物理与天文研究所复杂性科学组)
AI总结 本文通过线性DNN模型证明,grokking现象源于L2正则化引起的一阶相变中的迟滞效应,SGD噪声驱动模型从低精度亚稳态逃逸,逃逸时间符合Arrhenius标度。
Comments 13 pages, 4 figures. Accepted at HiLD 2026: 4th Workshop on High-dimensional Learning Dynamics
鲁棒半空间学习中重加权铰链方法的平方和度障碍:一个Christoffel函数刻画
发表机构 * Xiaoyu Li(李小宇)
AI总结 本文通过Christoffel函数精确刻画了有界度证书无法去除的异常质量,揭示了重加权铰链方法在恶意噪声下学习γ-间隔半空间时,证书的SoS度与异常容忍度之间的基本权衡。
多输入神经算子学习在Sobolev空间中的泛化保证
发表机构 * Georgia Institute of Technology(佐治亚理工学院) ; University of Notre Dame(圣母大学) ; Hong Kong Baptist University(香港浸会大学)
AI总结 针对多输入神经算子,在Sobolev范数下建立逼近和泛化误差估计,量化各输入空间对误差界的贡献,并揭示平衡状态下输入维度、正则性和Sobolev阶的相互作用。
MGUP:一种用于随机优化的动量-梯度对齐更新策略
发表机构 * Shenzhen Institute of Advanced Technology, Chinese Academy of Sciences(中国科学院深圳先进技术研究院) ; Shenzhen University of Advanced Technology(深圳理工大学) ; Pengcheng Laboratory(鹏城实验室) ; University of Chinese Academy of Sciences(中国科学院大学)
AI总结 提出MGUP机制,通过按固定比例选择参数施加大步长、其余参数用小步长,增强动量优化器,理论保证收敛,实验表明提升训练效率与稳定性。
Comments Published in NeurIPS 2025
Edge Flow: 一种可处理且可预测的梯度下降在稳定性边缘的连续时间模型
发表机构 * Inria, École Normale Supérieure, PSL Research University(法国国家信息与自动化研究所,巴黎高等师范学院,PSL研究大学)
AI总结 针对深度学习梯度下降在稳定性边缘(EoS)的动力学,提出Edge Flow模型,通过三个耦合常微分方程分解为中心、振荡方向和幅度,实现可处理且预测性的建模,并揭示锐度自稳定机制。
Comments 24 pages, 13 figures
符号秩、索引与列表可复制性:联系与分离
发表机构 * McGill University(麦吉尔大学) ; Ohio State University(俄亥俄州立大学)
AI总结 本文研究二元概念类的符号秩下界,通过比较Z2-索引和列表可复制数,证明Z2-索引被列表可复制数的线性函数上界,从而解决符号秩与Z2-索引的分离问题,并进一步建立列表可复制数的上界与组合性质。
Comments 29 pages, 1 figure
再探概率测度的Log-PCA:一种动力学公式与统计收敛性
发表机构 * Department of Statistics University of Illinois Urbana-Champaign(统计学系伊利诺伊大学厄巴纳-香槟分校) ; Department of ACMS University of Notre Dame(ACMS系诺丁汉大学) ; Department of Mathematics University of British Columbia(数学系不列颠哥伦比亚大学) ; Department of Mathematics Thomas Lord Department of Computer Science University of Southern California(数学系托马斯·劳德计算机科学系南加州大学)
AI总结 本文在Wasserstein几何下提出一种动力学公式解释log-PCA,称为Wasserstein切向PCA(WT-PCA),并推导了经验WT-PCA相对于总体测度的统计收敛速率。
基于确定性积分时间的哈密顿动力学的加速凸优化
发表机构 * Department of Computer Science, Yale University(耶鲁大学计算机科学系) ; Department of EECS, Massachusetts Institute of Technology(麻省理工学院电子工程与计算机科学系)
AI总结 提出基于哈密顿动力学的平滑凸优化算法,通过利用平均哈密顿流轨迹的收缩而非端点收缩,实现确定性加速收敛,并推导出具有最优一阶复杂度的离散实现。
Comments 51 pages, 7 figures. Accepted to the 39th Annual Conference on Learning Theory (COLT 2026)
低次稀疏布尔多项式的紧 $L_\infty$ 样本复杂度
发表机构 * Institute for Mathematical and Computational Engineering(数学与计算工程研究所) ; Pontificia Universidad Católica de Chile(智利天主教大学) ; Blavatnik School of Computer Science and AI(Blavatnik计算机科学与人工智能学院) ; Tel Aviv University(特拉维夫大学) ; Department of Industrial and Systems Engineering(工业与系统工程系)
AI总结 针对有界二进制黑箱函数优化,研究布尔超立方体上多项式代理的学习问题,要求均匀 $L_\infty$ 误差保证,刻画了次高斯噪声下两类有界多项式的最小最大样本复杂度。
无限可交换序列的有界差分集中不等式及其在AI基准不确定性中的应用
发表机构 * Department of Statistics, Columbia University(哥伦比亚大学统计系) ; Google DeepMind(谷歌DeepMind)
AI总结 通过de Finetti测度分解有界差分函数的偏差,提出有效方差代理的集中不等式,并证明零和线性对比中潜在混合项完全抵消,应用于AI基准如MMLU的不确定性量化。
超越IGO流:面向连续空间中IGO的收敛性分析
发表机构 * University of Tsukuba, Tsukuba, Japan(茨口大学) ; RIKEN Center for Advanced Intelligence Project, Tokyo, Japan(理化学研究所先进情报项目)
AI总结 研究离散时间IGO在连续空间中的收敛性,针对强凸二次目标函数上的多元高斯族,证明了协方差矩阵收敛到零矩阵,并在条件数有界时均值向量收敛到全局最优。
Comments Accepted at PPSN 2026
基于张量的二阶因果发现
AI总结 提出TSCD算法,利用观测和干预数据的协方差矩阵张量,在线性结构方程模型下识别有向无环图及其边函数,仅要求噪声不相关,并扩展到非线性模型,具有对数级干预可识别性。
Comments 27 pages, 7 figures. Code available at https://github.com/QWE123665/Tensor-based-Second-order-Causal-Discovery
马尔可夫噪声下线性特征时序差分学习的扩散近似
发表机构 * Technical University of Munich (TUM), Munich, Germany(慕尼黑技术大学) ; University of Basel, Basel, Switzerland(巴塞尔大学) ; Boston University, Boston, USA(波士顿大学)
AI总结 针对线性TD(0)在马尔可夫噪声下的随机波动,提出随机微分方程近似模型,揭示投影Bellman算子收缩动力学与马尔可夫采样影响的区别,解释常数步长误差下限。
随机网络中的有限时间队列峰值律:几何阈值后的对数缩放
发表机构 * University of Illinois Urbana–Champaign(伊利诺伊大学厄巴纳-香槟分校)
AI总结 研究广义交换机中有限时间队列峰值,证明在均匀内部松弛条件下,漂移最小化调度策略的峰值包络从平方根律转变为对数律,并给出匹配下界和几何阈值。
论神经网络的满射性:你能从模型中诱导出任何行为吗?
AI总结 本文证明现代神经网络架构(如预层归一化和线性注意力模块)几乎总是满射,意味着任何输出(包括有害内容)原则上都可生成,揭示了模型在对抗攻击下的固有脆弱性。
Comments Blog: https://astro-eric.github.io/blogs/surjective/
大提示词机制下的Softmax作为线性注意力:基于测度的视角
AI总结 提出基于测度的框架,证明在无限提示词极限下softmax注意力收敛到线性算子,并给出有限提示词下的非渐近浓度界,从而将线性注意力的优化分析迁移到大提示词下的softmax注意力。
噪声驱动的探索与瞬态冻结在随机梯度下降中选择平坦极小值
AI总结 通过分析SGD学习动力学,发现非平衡机制驱动解选择:瞬态探索阶段逃离尖锐谷,噪声重塑势能稳定平坦解,冻结延迟增强泛化。
Comments 12 pages, 4 figures
关于在线策略分类中的随机化算法
AI总结 研究在线策略分类中随机化算法的优势,在可实现和不可知场景下分别给出基于Littlestone维度和操纵图最大度的改进界限,并证明随机化可突破确定性算法的下界。
Zeta: 通过坐标自适应预处理实现矩阵优化的双重白化
发表机构 * South China University of Technology(华南理工大学) ; AIGCode ; Hong Kong Baptist University(香港浸会大学)
AI总结 针对矩阵优化中坐标尺度异质性问题,提出双重白化优化器Zeta,通过先坐标白化后谱白化的严格顺序降低正交化误差,在语言建模和视觉任务上提升收敛速度与泛化性能。
对数凹分布约束采样的随机中点方法
AI总结 提出约束域中过阻尼和动能朗之万扩散的随机中点离散化方法,通过投影算子建立统一框架,证明Wasserstein-q距离下的收敛保证并得到近最优下界。
基于相似性核的稳健局部多项式回归
AI总结 针对传统局部多项式回归对异常值敏感的问题,提出一种结合响应变量信息的条件密度核加权方法,通过局部密度估计降低异常值影响,在保持与标准LOWESS竞争力同时降低经验偏差。
神经网络分析的动力学系统视角
AI总结 利用动力学系统重新表述深度神经网络、梯度下降等挑战,研究信息传播、训练动态和平均场极限,揭示网络嵌入、稳定性及图极限等性质。
Comments preprint of a book chapter contribution
零和博弈中纳什均衡的表征:一种受物理学启发、可并行化且具有线性梯度查询次数的方法
发表机构 * Industrial and Systems Engineering(工业与系统工程系) ; Rensselaer Polytechnic Institute(伦塞拉尔理工学院)
AI总结 提出一种受哈密顿动力学启发的在线优化方法,通过交替梯度下降在线性迭代次数内表征零和博弈的纳什均衡集,支持并行化和任意学习率,实验性能显著优于传统方法。
从有偏且昂贵的数据源学习:预算下的极小极大最优数据收集
AI总结 针对预算固定的多源数据收集问题,提出最大化有效样本量的采样方案,结合事后分层估计器,实现极小极大最优风险。
Comments COLT 2026
基于高斯过程的工具变量和近端因果推断
AI总结 提出去条件高斯过程框架,用于存在未观测混杂时的因果推断,同时提供可靠的后验不确定性量化,并通过边际似然优化实现模型选择。
平均场薛定谔桥的广义Sinkhorn算法
AI总结 针对平均场薛定谔桥问题,提出广义Hopf-Cole变换并设计Sinkhorn型递归算法求解积分-偏微分方程组,在弱假设下证明收敛性,数值实验验证有效性。
刻画层次聚类的可容许目标函数
发表机构 * Faculty of Engineering, Shizuoka University(izuoka大学工学部) ; Graduate School of Integrated Science and Technology, Shizuoka University(izuoka大学综合科学技术研究院)
AI总结 本文研究层次聚类的可容许目标函数,对基于聚合相似度的和型目标函数,完整刻画了对称多项式次数≤2时的可容许性,并给出次数为3的充分条件;引入最大型目标函数,刻画了任意对称缩放函数的可容许性。
Comments 20 pages, 3 figures. Minor correction to abstract metadata. Manuscript unchanged from v2. Submitted to Discrete Applied Mathematics
Eigen-Spike 涌现与共轭核在非线性可分数据上的二次等价
发表机构 * Department of Mathematics ICSI and Department of Statistics(数学系ICSI和统计系) ; University of California, San Diego, USA(美国加州大学圣地亚哥分校) ; University of California, Berkeley, USA(美国加州大学伯克利分校) ; Department of Mathematics ICSI, LBNL and Department of Statistics(数学系ICSI、劳伦斯伯克利国家实验室和统计系)
AI总结 针对非线性可分数据(XOR问题),通过共轭核矩阵的二次等价模型,分析异常特征值涌现及其与标签对齐的BBP型相变,揭示样本复杂度、信噪比、激活函数和预训练特征对非线性可学习性的影响。
Comments 81 pages, 8 figures
数据科学中的表示代价:基础与深度神经网络的拟巴拿赫空间
发表机构 * Marquette University(马凯特大学) ; University of California, San Diego(加州大学圣地亚哥分校)
AI总结 本文建立了一个统一框架,通过参数空间正则化子分析参数化数据拟合方法的表示代价,揭示了深度神经网络诱导的本征空间是拟巴拿赫空间,并证明了表示定理等自然结果。
MODE: 面向MoE多模态大语言模型的模态分解专家级混合精度量化
发表机构 * Institute of Automation, Chinese Academy of Sciences(中国科学院自动化研究所) ; School of Artificial Intelligence, University of Chinese Academy of Sciences(中国科学院大学人工智能学院) ; Zhongguancun Academy(中关村学院)
AI总结 针对MoE多模态大语言模型在专家重要性估计中存在的跨模态和视觉内偏差,提出模态分解的专家级混合精度量化框架MODE,通过分解选择频率、过滤冗余视觉令牌并评估模态敏感性,在给定预算下分配比特宽度,在W3A16下平均性能损失控制在2.9%以内。
Comments 18 pages, 8 figures
算子提升产生帕累托高效的PDE代理模型
发表机构 * College of Computing, Georgia Institute of Technology(佐治亚理工学院计算学院) ; Department of Mathematics and Systems Engineering, Florida Institute of Technology(佛罗里达理工学院数学与系统工程系)
AI总结 提出算子提升框架,通过残差学习直接构建紧凑神经算子代理,在30个数据集-架构对上平均准确率提升,参数量减少72-95%,并在多个PDE基准上实现帕累托改进。
Comments 19 pages, 4 figures, 3 tables. Preprint submitted to Elsevier
面向ReRAM的模型微调:解决I-V非线性和保留误差
发表机构 * Intel Corporation(英特尔公司)
AI总结 提出一种基于微调的硬件感知训练算法,通过范围收缩的sinh变换缓解I-V非线性,并将保留误差纳入正则化损失,实现ReRAM上DNN的高效部署,在图像分类和问答任务中精度损失极小。
Comments 11 pages, 12 figures, 2 tables, with appendix (5 pages, 9 figures)
可重构计算挑战:Versal AI Engine上的喷注标记Transformer
发表机构 * Department of Computer Science and Engineering(计算机科学与工程系) ; University of California San Diego(加州大学圣地亚哥分校) ; La Jolla, CA, USA(拉贾拉, 加州, 美国)
AI总结 针对CERN LHC喷注标记任务,提出在AMD Versal AI Engine上部署量化整数Transformer的初始实现,并开发可重用软件框架自动生成Vitis图代码。
Comments 4 pages, 4 figures. In FCCM 2026 proceedings
持续自我改进:轻量级经验潜在记忆
发表机构 * Toyota Motor Europe(丰田汽车欧洲公司) ; University of Trento(特伦托大学)
AI总结 提出一种在线方法,将推理时计算转化为轻量级模块化潜在记忆,通过自生成测试时信号进行训练,实现持续改进且避免灾难性遗忘。
AnchorKV: 通过拒绝锚点的软惩罚实现安全感知的KV缓存压缩
发表机构 * Department of Computer Science, Tufts University(塔夫茨大学计算机科学系) ; Department of Electrical and Computer Engineering, Tufts University(塔夫茨大学电气与计算机工程系)
AI总结 提出AnchorKV,一种通过软惩罚机制调整令牌保留分数以远离有害提示的KV缓存压缩方法,在保持实用性的同时显著提升安全性。
S4oP:面向资源受限设备的结构化状态空间模型的算子级剪枝
发表机构 * University of Verona(威尼斯大学)
AI总结 提出一种针对S4和S4D模型的增量算子级剪枝方法,通过结构化掩码与微调交替进行,在保持预测性能的同时显著降低推理成本,首次系统研究SSM的结构化算子剪枝。
Ternary Mamba: 分组量化感知训练的 W1.58A16 状态空间模型
发表机构 * EdgeVerve Systems Limited(EdgeVerve系统有限公司)
AI总结 提出从预训练检查点进行分组量化感知训练(QAT)结合知识蒸馏,以极低数据量(1亿token)将Mamba-2 1.3B压缩至3.61倍,零样本准确率接近Bi-Mamba,并发现预训练QAT特有的零比率坍塌问题。
从压缩到部署:超受限微控制器上的实时节能FastGRNN
发表机构 * Electronics Engineer Independent Researcher, Izmir, Turkey
AI总结 针对超受限微控制器,提出端到端开源FastGRNN压缩部署方案,结合低秩分解、稀疏化和量化,在8位和16位MCU上实现实时50Hz推理,模型仅566字节权重,F1达0.918,并贡献了跨平台确定性推理、循环预热延迟、无乘法器查找表和硬件能耗分析。
Comments 14 pages, 8 figures. Code: https://github.com/emre1998/fastgrnn-har
AoiZora: 面向扩散变换器推理的拓扑感知自动并行优化
发表机构 * Rice University(里士大学) ; Independent Researcher(独立研究者) ; Google(谷歌)
AI总结 针对扩散变换器推理中的低延迟需求,提出AoiZora编译器,通过拓扑感知的物理布局优化自动并行策略,在TPU子片上实现高达1.42倍的加速。
迈向利用AutoML实现可持续深度学习:深度移位神经网络上的多目标HPO方法
AI总结 针对深度学习计算成本高的问题,提出结合多保真度HPO与多目标优化,在深度移位神经网络上同时最大化精度和最小化能耗,实验获得超80%精度且低计算开销。
EmbodiTTA:面向具身视觉系统的资源高效测试时自适应
AI总结 提出按需测试时自适应范式OD-TTA,通过轻量域移检测、源域选择和分离批归一化更新,在边缘设备上实现高效准确的自适应,显著降低计算和能耗开销。
搜索物联网网关上传感器节点的神经架构
发表机构 * University of Genoa(基因瓦大学)
AI总结 提出一种在物联网网关上自动设计神经网络的方法,保护数据隐私,在Raspberry Pi Zero 2上10小时内搜索出达到SOTA的架构。
MoSE: 混合可瘦身专家实现高效自适应语言模型
AI总结 提出MoSE架构,每个专家具有可变宽度的嵌套结构,支持在推理时连续调节精度-计算权衡,通过多宽度训练和轻量级测试时训练实现高效自适应。
Comments Accepted to ICML 2026
通过学习支持函数摊销最大内积搜索
AI总结 提出基于回归的摊销MIPS方法,通过训练神经网络直接预测最优键,利用支持函数的凸性加速搜索,在BEIR基准上显著提升IVF匹配率。
AIMER: 免校准任务无关的MoE专家剪枝
AI总结 提出AIMER方法,通过专家权重的集中度模式识别独特专家,实现免校准的任务无关MoE专家剪枝,在7B至47B模型上优于现有方法。
conformalized 量子 deeponet 集团用于具有分布自由不确定性的可扩展操作学习
AI总结 本文提出一种结合量子正交神经网络和适应性置信预测的框架,解决高维动态系统运算学习中的二次推断复杂度和不确定性量化问题,通过压缩多个模型到单个电路实现高效并行计算。
向量量化中度量普适性的代价至多为0.11比特
AI总结 本文证明存在一个通用码本,对于所有可能的X统计量,在W为高斯时,其性能至少与速率每维度降低0.11比特的X自适应水填充码本相当。
Comments 41 page, 1 figure
C2FL:空间和时间漂移下的聚类持续联邦学习
发表机构 * University of Bologna(博洛尼亚大学) ; Aarhus University(哥本哈根大学)
AI总结 针对空间异质性和时间漂移下节点隐私保护的集体自适应问题,提出C2FL方法,通过空间聚类自组织学习组,结合经验回放和停留时间感知自适应平均,实现鲁棒集体适应。
TrustErase:基于护照嵌入表示的可审计即时机器遗忘
发表机构 * University of Catania(卡塔尼亚大学)
AI总结 提出TrustErase框架,利用护照嵌入表示实现无需数据、可验证的即时遗忘,通过参数高效适配层中的护照作为密钥,仅需停用即可移除特定类别或数据集,无需重训练或微调。
高斯过程后验采样的差分隐私
发表机构 * School of Mathematics, University of Bristol(布里斯托大学数学学院)
AI总结 研究高斯过程后验样本路径的隐私性,通过Rényi-DP界分离后验均值与协方差泄露,揭示有效岭正则化的关键作用,并验证成员推断攻击与正则化的依赖关系。
Comments 8 pages of main text + 25 pages appendix
高斯差分隐私:机器学习中报告差分隐私保证的方法
AI总结 针对当前机器学习中差分隐私报告不完整的问题,提出使用非渐近高斯差分隐私(GDP)作为主要报告方式,通过数值会计和决策理论度量,证明GDP能无误差地捕获DP-SGD等算法的完整隐私特征。
Comments IEEE SatML 2026 (position paper track)
AnalogFed: 基于联邦生成式AI的大规模模拟电路隐私保护发现
AI总结 提出AnalogFed,首个结合联邦学习和生成式AI的隐私保护框架,用于大规模模拟电路拓扑发现,通过虚拟令牌注入和同态加密防御成员推理和模型反转攻击,实现高效协作设计。
HeteRo-Select: 信息量作为异构联邦学习中的参与驱动因素
AI总结 提出HeteRo-Select框架,用客户端信息量分数替代带宽驱动压缩,联合决定客户端选择、压缩比和聚合权重,降低异构性并减少流量,在CIFAR-10上实现1.78倍加速和18.2%流量减少。
部分接收下分散式联邦学习的逆概率加权与信息年龄聚合
发表机构 * University of Melbourne(墨尔本大学) ; University of Technology Sydney(悉尼科技大学)
AI总结 针对无线网络下分散式联邦学习的选择偏差和更新过时问题,提出结合逆概率加权与信息年龄加权的DFL-AA方法,理论消除链路质量偏差,实验优于现有基线。
Comments 14 pages, 9 figures, research paper for journal submission
MM++: 无监督尺度不变多层OOD检测通过Top-K门控特征融合
发表机构 * School of Computing, State University of New York at Binghamton(纽约州立大学宾汉姆顿分校计算机学院)
AI总结 提出MM++框架,通过熵密度下降识别判别性中间层,结合Ledoit-Wolf正则化协方差矩阵实现无监督、后处理、尺度不变的多层OOD检测,在近/远OOD场景中表现鲁棒。
MorphStrata: 时间序列移动目标防御中生成Morphence学生的层特定扰动
发表机构 * Department of Computer Science, San Jos\' e State University, San Jos\' e , CA, USA ; Department of Computer Engineering, San Jos\' e State University, San Jos\' e , CA, USA ; Praxis Business School, Kolkata, India
AI总结 提出MorphStrata策略,通过选择性层特定随机噪声注入生成结构异质的学生模型,在保持移动目标防御鲁棒性的同时,将训练开销增量控制在1%以内,并在高熵周期性数据集上实现高达24.11%和97.97%的RMSE降低。
Comments 13 pages, 9 figures, 11 tables
几何感知的算子学习事后不确定性量化
发表机构 * Department of Mechanical and Aerospace Engineering, University of California, Irvine(加州大学尔湾分校机械与航空航天工程系)
AI总结 提出REEF-GP框架,通过高斯过程拟合冻结神经算子的残差,利用其内在坐标-特征表示构建几何感知的不确定性,在多个PDE基准上实现校准的不确定性估计,且计算成本远低于深度集成。
一种公平性感知的随机多准则可接受性分析扩展用于排序
发表机构 * Engineering School, Mackenzie Presbyterian University(麦肯锡长老会大学工程学院)
AI总结 提出SMAA-Fair,通过重加权排序以提升群体公平性,结合统计均等、rKL和nDKL指标,在保持鲁棒性同时改善受保护群体在有利位置的代表性。
无免费公平:学习系统中的基本限制与权衡
发表机构 * Hanoi University of Science and Technology(河内科技大学)
AI总结 本文提出无免费公平定理,揭示学习系统中三个固有差异来源:任务固有成本导致性能与公平的权衡、有限样本诱导子群差异、模型类表达力限制导致公平不可达,表明不公平源于决策问题结构、数据有限性和模型表达力。
损失景观投毒:从大语言模型中定向提取未见训练数据
发表机构 * Queen's University Belfast(女王大学贝尔法斯特) ; CSIT, Queen's University Belfast(女王大学贝尔法斯特计算机科学与技术研究所)
AI总结 提出一种通过投毒重塑模型损失景观,迫使模型记忆目标数据并实现高成功率提取的攻击方法,在语言和视觉-语言模型上验证有效性,并发现差分隐私可防御但存在绕过攻击。
视觉会撒谎,一致性说话:在视觉-语言模型中解耦空间注意力与可靠性
发表机构 * University of California, Santa Barbara(加州大学圣塔芭芭拉分校) ; Algoverse AI Research(Algoverse AI研究) ; University of California, Berkeley(加州大学伯克利分校)
AI总结 本文提出VLM可靠性探针(VRP),通过结构注意力指标和生成动态分析,发现空间注意力与准确性几乎无关(R≈0.001),而自一致性是可靠性的主要预测因子(R=0.429),揭示了视觉特征与最终生成之间的符号脱离现象。
Comments 16 pages. Accepted to the ICLR 2026 Workshop on Multimodal Intelligence. Code: https://github.com/itsloganmann/VLM-Reliability-Probe
大型音频语言模型时间理解失败模式的深入分析
发表机构 * University of Maryland, College Park(马里兰大学帕克分校)
AI总结 本文通过行为与因果机制分析,揭示大型音频语言模型在时间推理中因模态不平衡而失败,并提出注意力重分配方法提升准确率。
Comments Accepted to Interspeech 2026
基于强化学习优化器的分布外检测的理论基础
发表机构 * San Diego State University(圣地亚哥州立大学)
AI总结 本文提出一种强化学习引导的优化器,通过修正梯度下降更新来降低语义分布外误报率,理论分析了模型变化和环境变化对泛化误差的影响。
基于流的视觉-语言-动作模型的不确定性量化
发表机构 * TU Munich(慕尼黑工业大学) ; ETH Zurich(苏黎世联邦理工学院) ; MPI IS Tübingen(马克斯·普朗克智能系统研究所)
AI总结 提出利用速度场差异(VFD)量化流匹配模型中的认知不确定性,用于故障检测和主动微调,在LIBERO基准上实现高效任务适应。
Comments Project page: tum-lsy.github.io/uq_vla/. 28 pages, 12 figures
揭露公平的幻象:审计对分布操纵攻击的脆弱性
AI总结 研究恶意被审计方如何通过分布操纵制造公平假象,提出基于熵和最优传输的操纵策略,并评估统计检验的检测能力,为监管验证提供指导。
对抗攻击利用特征叠加中的干扰
AI总结 本文揭示神经网络中特征叠加导致的干扰是对抗脆弱性的根源,通过理论推导和实验验证了干扰模式决定攻击成功与迁移性。
Comments Forty-third International Conference on Machine Learning
MiniFool——深度神经网络中基于物理约束感知的最小化器对抗攻击
AI总结 提出MiniFool算法,通过最小化结合χ²检验统计量与目标分数偏差的代价函数,生成物理感知的对抗样本,用于测试粒子与天体物理中的神经网络分类器,并量化网络决策的鲁棒性。
Comments Submitted to Computing and Software for Big Science
通过分布鲁棒优化学习信度集成
AI总结 提出CreDRO方法,通过分布鲁棒优化学习集成模型,捕获由训练与测试数据分布偏移导致的认知不确定性,在分布外检测和选择性分类任务上优于现有方法。
Comments Accepted by ICML 2026 as Spotlight paper (https://icml.cc/virtual/2026/poster/62862)
从观察到干预:混合专家模型中专家重要性的因果审计
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 通过因果审计发现,混合专家模型中的路由统计指标无法预测专家重要性,现有剪枝方法的成功源于早期层冗余而非识别可删除专家。
Comments 9 pages, 2 figures, 9 tables. Accepted at the ICML 2026 Workshop on Philosophy of Science Meets Machine Learning (PhilML). Camera-ready Version. Non-archival
贪婪坐标扩散:通过扩散引导实现有效且语义一致的对抗攻击
发表机构 * University of Maryland(马里兰大学) ; University of California, Berkeley(加州大学伯克利分校)
AI总结 提出贪婪坐标扩散方法,利用扩散模型引导生成语义连贯的对抗样本,在保持自然性的同时实现高攻击成功率。
基于分位数期望的条件局部重要性
AI总结 提出模型无关的局部变量重要性方法CLIQUE,通过分位数期望捕获局部依赖关系,提升稳定性并直接适用于多类分类问题。
Comments 29 pages, 28 figures
最大化相对改进:将公平学习视为讨价还价问题
AI总结 提出将群体公平解释为子群体间的讨价还价问题,通过相对改进指标恢复Kalai-Smorodinsky解,并给出公理化和有限样本收敛保证。
Comments Accepted at ICML 2026
上下文环境诱导语言模型中的评估意识
AI总结 本文提出黑盒对抗优化框架,通过优化上下文提示诱导语言模型产生评估意识并策略性低表现(沙袋效应),实验显示优化提示可使算术任务准确率下降高达94个百分点,且沙袋效应主要由评估意识推理驱动。
可判定性通过构造实现:面向可信AI的设计时验证
AI总结 提出一种设计时验证框架,通过将AI模型属性约束为有限生成阿贝尔群上的可判定问题,在训练前以极低计算成本验证数值稳定性、计算正确性和物理一致性,消除后验验证开销。
Comments 21 pages, 1 figure
面向复杂地质构造中CO2运移的快速GNN替代模型
发表机构 * Systems and Computer Engineering and High Performance Computing Center, NACAD - COPPE, Federal University of Rio de Janeiro(里约热内卢联邦大学COPPE工程研究生院NACAD高性能计算中心,系统与计算机工程) ; Civil Engineering and High Performance Computing Center, NACAD - COPPE, Federal University of Rio de Janeiro(里约热内卢联邦大学COPPE工程研究生院NACAD高性能计算中心,土木工程) ; Mechanical Engineering and High Performance Computing Center, NACAD - COPPE, Federal University of Rio de Janeiro(里约热内卢联邦大学COPPE工程研究生院NACAD高性能计算中心,机械工程) ; Shell Global Solutions International B.V.(壳牌全球解决方案国际公司) ; TotalEnergies OneTech(道达尔能源OneTech)
AI总结 提出一种端到端图神经替代模型,用于地质封存中CO2羽流运移预测,通过各向异性消息传递和自回归残差公式在SPE11A基准上实现竞争性预测。
芬斯勒几何、图神经网络与你
发表机构 * Rice University(莱斯大学)
AI总结 针对图拉普拉斯只能近似各向同性算子的局限,提出基于芬斯勒拉普拉斯的图神经网络层,证明其收敛性并恢复非线性扩散方程的几何结构。
带拓扑正则化的非负矩阵分解
发表机构 * Recursive Inc.(Recursive公司) ; Graduate School of Science, Kyoto University(京都大学理学研究科) ; Institute of Mathematics for Industry, Kyushu University(九州大学数理学研究院)
AI总结 提出通过持久同调作为拓扑正则化项融入非负矩阵分解目标函数,以学习具有空间连贯性、周期结构或团状图信号的可解释基函数。
LLM特征可能损害GNN:同配图基准上的拼接干扰
AI总结 本文发现将LLM特征通过纯输入拼接(而非联合训练)引入图神经网络时,会在同配基准上系统性地降低准确率,并提出了一个基于LLM单独判别性指标Delta_sig来预测拼接效果。
Comments 29 pages, 8 figures
处理特征异质性:可学习图块方法
发表机构 * Zhejiang University(浙江大学) ; Huazhong University of Science and Technology(华中科技大学) ; Finvolution Group(信也科技集团)
AI总结 提出可学习图块概念,将图分解为语义单元,通过补丁编码器和聚合器实现跨域图数据的可迁移预训练,提升下游任务性能。
Comments Accepted at KDD 2025
半条链接足以预测整条链接:理解知识图谱基础模型中的泛化
发表机构 * Institute for AI, University of Stuttgart(斯图加特大学人工智能研究所) ; University of Southampton(南安普顿大学) ; University of Edinburgh(爱丁堡大学)
AI总结 本文通过分析知识图谱基础模型在未见图上的零样本泛化,发现模型利用部分可见的“半链接”进行预测,并基于此提出四类场景的分类法,揭示现有模型的泛化机制与改进方向。
图神经网络中的几何公平性
发表机构 * Department of Statistics, University Carlos III of Madrid, Spain(马德里卡斯蒂利亚-拉曼恰大学统计系) ; uc3m-Santander Big Data Institute(uc3m-桑坦德大数据研究所)
AI总结 针对图神经网络中公平性问题,通过修改拉普拉斯算子引入多种互补变换(子空间投影、频谱调整、频率滤波)来缓解偏差,理论分析并实验验证了公平性提升与竞争性能。
Comments 32 pages, 21 tables, 6 figures
Manifold GCN:基于扩散的流形值图卷积神经网络
发表机构 * BIFOLD—Berlin Institute for the Foundations of Learning and Data(柏林学习与数据基础研究院) ; Technical University Berlin(柏林技术大学) ; Zuse Institute Berlin(柏林泽尼茨研究所)
AI总结 提出两种适用于黎曼流形特征图的图神经网络层:基于流形值图扩散方程的扩散层和受向量神经元启发的切向多层感知器,两者在节点置换和流形等距下等变,在更广泛问题上优于任务特定网络。
Comments Extended ADNI experiment
基于梯度的因果发现框架及其在复杂工业过程中的应用
AI总结 提出GRNGC方法,通过对模型输入输出梯度施加L1正则化推断Granger因果,仅需一个预测模型,降低计算开销,在多个基准和真实数据集上优于现有方法。
Comments 9 pages,3 figures, conference
组合复形上的Weisfeiler-Lehman测试:拓扑神经网络的泛化表达能力
AI总结 提出组合复形Weisfeiler-Lehman(CCWL)框架,通过四种结构邻域统一拓扑神经网络的表达能力,并证明在特定条件下可简化为仅使用上下邻域桥信息,实例化为CCIN网络,实验验证其有效性。
多模态图负学习
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出GraphMNL框架,通过负学习解决多模态属性图中节点级分支语义不平衡问题,避免主导分支偏差传播,在Grocery和Reddit M数据集上取得最优性能。
SMGFM: 面向多模态属性图的谱多模态图预训练
AI总结 提出SMGFM框架,利用图频谱分解区分结构诱导语义与模态特有语义,通过频带路由实现跨模态融合,在图级和模态级任务上取得最优性能。
面向OOD区块链异常检测的时间模体感知图测试时自适应
发表机构 * State Key Laboratory of Blockchain and Data Security(区块链与数据安全国家重点实验室) ; Zhejiang Provincial Engineering Research Center for Real-Time SmartTech in Urban Security Governance(浙江省实时智能科技在城市安全治理中的工程研究中心) ; Hangzhou High-Tech Zone (Binjiang) Institute of Blockchain and Data Security(杭州高新技术区(滨江)区块链与数据安全研究院)
AI总结 提出TEMG-TTA框架,通过时间模体分布捕获和测试时自适应策略,解决区块链异常检测中的模式演化和分布外问题,在5个数据集上平均提升54.88%。
Comments Accepted to IJCAI-ECAI 2026, Special Track on AI for Social Good
预微调预测的风险分解框架
发表机构 * The Hong Kong University of Science(香港科技大学)
AI总结 提出风险分解框架,将预微调性能预测风险分解为内在极限与可降优化方差,证明优化方差衰减率存在下界,并导出预算最优探测原则及可预测性相图。
Comments 9 pages, 4 figures, accepted as ICML 2026 Poster:https://icml.cc/virtual/2026/poster/66570
TuneAhead: 在完整训练开始前预测微调性能
发表机构 * The Hong Kong University of Science(香港科学与技术大学) ; Huawei Technologies Ltd.(华为技术有限公司)
AI总结 提出TuneAHEAD框架,通过元特征向量和SHAP归因,在微调前预测性能,在Qwen2.5-7B-Instruct上RMSE为1.47个百分点,95.1%预测误差在±3%内。
Comments 9 pages, 6 figures, accepted as ICML 2026 poster:https://icml.cc/virtual/2026/poster/64847
混淆感知的迁移教师课程学习框架:解耦评分与节奏效应
发表机构 * Faculty of Computing, Sri Lanka Institute of Information Technology, Sri Lanka(斯里兰卡信息科技学院计算机学院,斯里兰卡) ; Faculty of Engineering, University of Sri Jayewardenepura, Sri Lanka(斯里兰卡贾亚韦达内普拉大学工程学院,斯里兰卡) ; Faculty of Engineering, Sri Lanka Institute of Information Technology, Sri Lanka(斯里兰卡信息科技学院工程学院,斯里兰卡) ; University of Sheffield, United Kingdom(谢菲尔德大学,英国) ; Utrecht University, The Netherlands(乌得勒支大学,荷兰)
AI总结 提出混淆感知难度评分,通过阶段性子集测试和随机基线解耦课程学习的评分与节奏效应,在CIFAR-10上验证评分可解释性,但全数据下无提升,仅在小数据量下提升数据效率。
Comments Accepted at International Conference on Machine Learning (ICML) GlobalSouthML Workshop (2026)
维度控制模块化在持续学习中的有效性
发表机构 * IT University of Copenhagen, Denmark(丹麦技术大学) ; Hasso Plattner Institute, University of Potsdam, Germany(波茨坦大学哈asso 印度学院)
AI总结 研究在持续学习中,模块化架构、任务相似性和表示维度如何共同影响组合学习,发现低维“丰富”机制下模块化结构显著提升性能,而高维“懒惰”机制下影响较小。
Comments Accepted to the 2nd Workshop on Compositional Learning (CompLearn) at ICML 2026, Seoul, South Korea. 8 pages, 5 figures
灾难性遗忘是低秩的:持续适应的函数空间理论
发表机构 * Tel Aviv University(特拉维夫大学)
AI总结 本文在神经正切核(NTK)框架下提出函数空间理论,推导出新任务训练导致旧任务预测漂移的闭式表达式,揭示遗忘集中在少量旧任务NTK本征模式上,并给出低秩特性与Kronecker缩放规则。
Comments Accepted to the ICML 2026 Workshop on Continual Adaptation at Scale: Towards Sustainable AI
从推理轨迹到可复用模块:理解语言模型推理中的组合泛化
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; Mohamed bin Zayed University of Artificial Intelligence(穆罕默德·本·扎耶德人工智能大学) ; Institute of Foundation Models(基础模型研究院) ; University of Michigan(密歇根大学)
AI总结 本文通过层次化潜在选择模型形式化组合泛化,理论证明SFT提供原子模块,RL分解轨迹实现组合泛化,实验验证RL能从复合轨迹中提取原子模块并重组解决新配置。
Comments ICML2026
超越领域:通过可迁移交互模式重用网络技能
发表机构 * University of Michigan(密歇根大学) ; Alibaba Group(阿里巴巴集团) ; Purdue University(普渡大学) ; McMaster University(麦克马斯特大学) ; University of Pennsylvania(宾夕法尼亚大学)
AI总结 提出SkillMigrator代理,通过学习可迁移交互模式(TIP)匹配布局结构而非元素引用,实现跨站点技能重用,在WebArena和Mind2Web上成功轨迹的LLM动作数减少8-10%。
基于原型语义一致性对齐的域自适应检索
发表机构 * School of Computer Science and Technology, Guangdong University of Technology(广东工业大学计算机科学与技术学院) ; School of Automation, Guangdong University of Technology(广东工业大学自动化学院) ; School of Computer Science, Guangdong Polytechnic Normal University(广东 polytechnic 正规大学计算机科学学院) ; School of Computer Science and Technology, Harbin Institute of Technology, Shenzhen(哈尔滨工业大学深圳校区计算机科学与技术学院) ; School of Artificial Intelligence, Guangzhou University(广州大学人工智能学院)
AI总结 提出原型语义一致性对齐(PSCA)两阶段框架,通过正交原型建立类级语义连接,利用几何邻近性加权伪标签置信度,并在重构特征上量化生成统一哈希码,解决域自适应检索中的类级对齐缺失和量化质量下降问题。
Comments AAAI2026
PLATE: 可塑性可调的几何感知持续学习高效适配器
AI总结 提出无需旧任务数据的持续学习方法PLATE,利用预训练网络的几何冗余性,通过结构化低秩更新显式控制可塑性-保留权衡,提升最坏情况保留保证。
Position: 模块化记忆是持续学习智能体的关键
AI总结 本文提出通过模块化记忆结合权重内学习与上下文学习,解决持续学习中的灾难性遗忘问题,实现大规模持续适应。
Comments ICML 2026 Position Track Spotlight. This work stems from discussions held at the Dagstuhl seminar on Continual Learning in the Era of Foundation Models (October 2025)
在任意文本条件下学习:一种超网络驱动的元门控大语言模型
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出一种超网络驱动的元门控机制,通过动态调整SwiGLU块中的β参数,使LLM适应不同文本条件,优于微调和元学习基线。
Comments Accepted by ICML2026
ProCUA-SFT 技术报告
发表机构 * NVIDIA(英伟达) ; University of Washington(华盛顿大学) ; Allen Institute for AI(艾伦人工智能研究所)
AI总结 提出 ProCUA-SFT 数据集,通过自动化管道从 2484 个应用组合的合成轨迹中蒸馏出 310 万步级 SFT 样本,微调 UI-TARS 7B 在 OSWorld 上达到 45.0% 的成功率,比基线提升 18.7 个百分点。
Comments 15 pages, 5 figures
CheckMIABench: 语言模型成员推理攻击的坚实基础
发表机构 * Harvard University(哈佛大学) ; Harvard Business School(哈佛商学院)
AI总结 为解决成员推理攻击评估中的分布偏移问题,提出基于训练中固定点前后数据同分布的基准框架,在Pythia和OLMo模型上评估多种攻击,并开源模块化库。
当下一步不是一步:面向并发Go程序的分布感知执行建模
发表机构 * University of Colombo School of Computing(科伦坡大学计算学院)
AI总结 针对并发程序非确定性调度导致单标签预测困难的问题,提出分布感知训练方法,通过多次运行聚合经验分布并微调7B模型,在真实Go缺陷预测中准确率达36.2%,并降低期望校准误差。
Comments 10 pages, 2 figures
基于偏好的离线轨迹评估
发表机构 * Carnegie Mellon University(卡内基梅隆大学)
AI总结 针对离线评估中仅使用终端成功率导致统计效率低下的问题,提出基于偏好的轨迹评估方法,通过比较轨迹的时间偏好减少平局,提升区分能力、排名稳定性和数据效率。
使用排序相关性和最近邻的一类分类模型的元分类
发表机构 * Faculty of Science, University of Hradec Kralove(赫拉德茨-克拉洛韦大学理学院) ; Malaysia-Japan International Institute of Technology (MJIIT), Universiti Teknologi Malaysia(马来西亚-日本国际技术学院,马来西亚理工大学) ; Regional Research Center, Iwate Prefectural University(岩手县立大学区域研究中心)
AI总结 提出用排序相关性和最近邻对一类分类模型进行元分类,实验表明能高精度区分数据集、算法和超参数,本质是数据集分类。
重新思考用于分类的数据集蒸馏:蒸馏集是否优于核心集?
发表机构 * Dolby Laboratory(杜比实验室)
AI总结 本文通过大规模标准化实验评估七种最先进的数据集蒸馏方法,发现其在大型数据集上性能不如或仅相当于核心集,且构建成本更高,核心集在数据分布覆盖和计算效率上更具优势。
RadSEM:放射学报告中临床一致性的逐发现指标
发表机构 * JDH Algo, JD Health International Inc., China ; Department of Big Data in Health Science, The First Affiliated Hospital of Wenzhou Medical University, China ; Zhejiang Engineering Research Center for Hospital Emergency ; Department of Intensive Care Unit, The First Affiliated Hospital of Wenzhou Medical University, Wenzhou, Zhejiang, China
AI总结 提出RadSEM指标,通过约束LLM辅助将报告重写为原子发现句,进行矛盾感知的多对多匹配,并计算异常加权的F1分数,在SSREE测试中优于现有指标,实现高一致性评分。
ARVO:开源软件可复现漏洞图谱
发表机构 * National Vulnerability Database(国家漏洞数据库) ; Google(谷歌)
AI总结 提出一种大规模构建可复现漏洞数据集的方法,基于OSS-Fuzz构建含6100+真实漏洞的ARVO数据集,实现81%复现率与89.4%补丁定位精度,解决可复现性、数量与多样性三难问题。
Comments Accepted at IEEE European Symposium on Security and Privacy (EuroS&P) 2026
NarrativeWorldBench:面向长程共创音频剧的前沿饱和基准与潜在世界模型
发表机构 * University of California, Santa Barbara(加州大学圣塔芭芭拉分校) ; Pocket FM
AI总结 提出NarrativeWorldBench基准,在九种叙事结构指标上评估21个模型,并引入N-VSSM变分状态空间模型,通过Mamba-2骨干和事件条件后验在200集以上维持结构化潜在状态,在长弧一致性和可控性上超越Claude Opus 4.5。
Comments 10 pages. Accepted to the ICML 2026 Workshops on High-dimensional Learning Dynamics (HiLD) and Culture x AI
基于域有效性门控的科学机器学习代理模型蜕变测试
发表机构 * School of Computing, University of South China(南方大学计算机学院) ; Hunan Engineering Research Center of Software Evaluation and Testing for Intellectual Equipment(湖南软件评估与测试研究中心) ; CNNC Key Laboratory on High Trusted Computing(中核高可信计算重点实验室)
AI总结 针对科学机器学习代理模型缺乏真实输出的问题,提出域有效性筛选方法将候选蜕变关系转化为可执行测试资产,并在多种代理模型上验证了其有效性。
胸部X光片的视觉-语言模型并不总是需要图像
发表机构 * Pattern Recognition Lab, Friedrich-Alexander-Universität Erlangen-Nürnberg(弗里德里希-亚历山大-埃尔朗根-纽伦堡大学模式识别实验室) ; Department of Diagnostic and Interventional Radiology, TUM University Clinic, School of Medicine and Health, Klinikum rechts der Isar, Technical University of Munich(慕尼黑工业大学医学院与健康学院伊萨尔河右岸医院诊断与介入放射学系) ; Lab for AI in Medicine, RWTH Aachen University(亚琛工业大学医学人工智能实验室) ; Department of Diagnostic and Interventional Radiology, University Hospital RWTH Aachen(亚琛工业大学医院诊断与介入放射学系)
AI总结 本文通过因果审计方法,发现许多医学视觉-语言模型在胸部X光片任务中依赖文本先验而非图像,纯文本模型与多模态模型性能接近,并提出了基于图像依赖性的评估框架。
通过两阶段回归的快速非参数条件独立性检验
发表机构 * Department of Biomedical Informatics, University of Pittsburgh(生物医学信息学系,匹兹堡大学)
AI总结 提出BLITZ方法,通过两阶段回归(低阶多项式+浅层树)快速消除条件集影响,实现校准良好的非参数条件独立性检验,适用于因果发现。
Comments A fast R implementation with C++ back-end is available at https://github.com/ericstrobl/BLITZ
评估开源大语言模型在CTI报告上的多标签ATT&CK技术分类
发表机构 * The University of Dhaka(达卡大学)
AI总结 针对开源LLM在复杂非结构化CTI报告上的ATT&CK分类性能未被评估的问题,构建了2076句人工标注数据集,评估7个开源LLM,最高F1为0.22,表明当前模型不足以用于生产。
多源网络安全日志:一个ATT&CK标记数据集及小语言模型评估
发表机构 * Windows endpoints(Windows终端)
AI总结 为解决多阶段网络攻击检测中缺乏带ATT&CK技术标签的多源日志数据集问题,构建了包含870个会话(70个攻击、800个良性)和约230万事件的多源日志数据集,并基于该数据集微调三个小语言模型,在分块分类任务上准确率从约8%提升至90%-97%。
ReproRepo: 利用 GitHub 仓库问题扩展可重复性审计
发表机构 * School of Computer Science, Carnegie Mellon University(卡内基梅隆大学计算机科学学院) ; Datadog
AI总结 提出 ReproRepo 框架,利用 GitHub issues 作为监督信号,对 1149 篇论文进行可重复性评估,发现 Codex with GPT-5.5 能识别约 90% 论文的语义相关复现问题。
Mordal: 面向视觉语言模型的自动化预训练模型选择
AI总结 提出Mordal框架,通过减少候选模型数量和评估时间,自动化搜索用户定义任务的最佳视觉语言模型,相比网格搜索降低GPU耗时8.9-11.6倍,加权Kendall's τ平均提升69%。
Moving Out: 基于物理的人机协作
AI总结 提出Moving Out基准测试,模拟物理约束下的协作场景,并开发BASS方法增强智能体多样性及动作理解,实验证明其与未见过的AI和人类均能有效协作。
Comments Accepted at ICML 2026
数据处理不等式是否反映实践?论低级任务的有用性
AI总结 本文研究低级处理(如去噪、编码)如何提升分类性能,证明在有限样本下存在预处理可提高准确率,并通过实验验证理论趋势。
Comments ICLR 2026 (camera-ready). Code is available at: https://github.com/serveroy/process-before-you-classify
R1-SyntheticVL:生成模型的合成数据是否已为多模态大语言模型做好准备?
AI总结 提出集体对抗数据合成(CADS)方法,通过集体智能和对抗学习自动生成高质量、多样且具有挑战性的多模态数据,用于增强多模态大语言模型(MLLM)在复杂现实任务中的性能。
Comments ICML 2026 Camera Ready
从归因集合中进行统计学习
发表机构 * Google Research(谷歌研究) ; Cornell University(康奈尔大学) ; Tel Aviv University(特拉维夫大学) ; UT Austin(德克萨斯大学奥斯汀分校)
AI总结 针对隐私约束下广告点击与转化无法直接关联的问题,提出基于归因集合的无偏损失估计方法,实现经验风险最小化的泛化保证,并优于行业启发式方法。
Comments COLT 2026. 45 pages
评估结构偏差下的提升建模:对指标稳定性和模型鲁棒性的洞察
AI总结 针对现实营销数据中的多种偏差,设计半合成基准框架,发现TARNet具有鲁棒性,且与ATE对齐的指标更稳定。
Comments Accepted by KDD 26
评估交互式二维可视化作为生物医学时间序列数据标注的样本选择策略
AI总结 针对生物医学时间序列标注困难,比较随机采样、最远优先遍历和基于交互式2D可视化(2DV)的三种样本选择方法,在婴儿运动评估和语音情感识别任务中,2DV在聚合标签时表现最佳,但个体标注者间标签分布差异大,随机采样最安全。
Comments Accepted for publication in Computers in Biology and Medicine (Elsevier)
DeMix: 通过影响向量调试包含混合错误类型的训练数据
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; ByteDance Inc.(字节跳动) ; Tiktok
AI总结 提出DeMix框架,利用影响向量捕捉不同错误类型对模型行为的独特模式,将数据调试转化为多标签分类问题,并引入基于干预的学习策略,在11个任务上显著提升调试F1分数和修复后模型性能。
学习带有右删失报告延迟的生存模型
发表机构 * The Graduate University for Advanced Studies(高级研究大学) ; Tokio Marine Holdings, Inc.(东京海上日赤保险株式会社) ; The Institute of Statistical Mathematics(统计数学研究所) ; RIKEN(理化学研究所)
AI总结 针对报告延迟导致的生存数据右删失问题,联合建模事件和报告过程的参数风险,提出一致估计量和蒙特卡洛EM算法,并利用迁移学习提高行政删失下及时风险评估的准确性。
Comments 26 pages, 3 figures, 3 tables
EngTrace:工程推理可验证过程监督的符号基准
AI总结 提出EngTrace符号基准,包含1350个参数化测试用例,通过两阶段可验证评估框架(分层协议+AI仲裁)检验中间推理轨迹与最终答案,揭示数值精度与轨迹保真度的权衡。
Comments 33 pages, includes figures and tables; introduces the EngTrace benchmark
质疑共形预测中的覆盖-长度度量:当更短的区间并不更好时
AI总结 本文批判性检验共形预测中标准度量(覆盖率和区间长度)的充分性,揭示一种称为“偏见技巧”(PT)的反直觉方法可欺骗性地缩短区间长度而保持覆盖有效,并提出新度量“区间稳定性”以检测此类行为。
视觉基础模型能否导航?零样本真实世界评估与经验教训
发表机构 * Polytechnique Montreal(蒙特利尔理工学院)
AI总结 本文对五种视觉导航模型在真实环境中进行零样本评估,发现其存在几何理解不足、感知混淆和分布漂移等系统性问题,并公开评估代码与数据集。
使用Fairlogue和All of Us研究计划评估临床机器学习用例中的交叉公平性
发表机构 * College of Engineering, The University of Arizona(亚利桑那大学工程学院)
AI总结 本文使用Fairlogue工具包在临床预测任务中评估交叉公平性,发现交叉群体差异大于单轴分析,但反事实诊断表明多数差异与随机分组相当。
Comments 10 pages, 7 figures, Accepted at the AMIA Annual Symposium 2026
数据增强自助法:通过近似不变性统一置信区间构建
发表机构 * Department of Statistics, University of Warwick(华威大学统计系)
AI总结 提出数据增强自助法(DAB),利用数据的近似不变性构建置信区间,统一了经典自助法、共形预测等方法的理论,并引入数据增强启发式方法。
Comments Added comparison with arXiv:2604.15229
AgentCyberRange:在真实网络靶场中基准测试前沿AI系统
发表机构 * Fudan University(复旦大学)
AI总结 提出首个开源多靶场基础设施AgentCyberRange,集成110个漏洞和156个内部主机,评估前沿AI系统在真实网络攻击中的能力,发现GPT-5.5+Codex在web利用和后利用任务中表现最佳。
配对时正确,分离时错误:多模态大语言模型中模态特定神经元的解耦与编辑
发表机构 * School of Information Science and Engineering, Yunnan University(云南大学信息科学与工程学院) ; School of Software, Yunnan University(云南大学软件学院) ; National University of Singapore(新加坡国立大学) ; School of Engineering, Yunnan University(云南大学工程学院)
AI总结 针对多模态大语言模型知识编辑中存在的解耦失败问题,提出DECODE方法,通过显式解耦和定位模态特定神经元组,实现跨模态触发下的有效知识更新。
Comments 18 pages, 11 figures
诊断和修复长距离单次条纹投影轮廓测量中的形状先验捷径
发表机构 * Department of Mechanical Engineering, Iowa State University(爱荷华州立大学机械工程系) ; College of Engineering, University of Georgia(佐治亚大学工程学院)
AI总结 通过机械可解释性和共形不确定性量化诊断长距离单次条纹投影轮廓测量中网络依赖形状先验而非条纹相位解码的问题,提出PhiCalNet架构修复,将物体平均绝对误差降低3.3倍。
Comments 44 pages, 27 figures
模型选择在因果推断中的关键作用:基于InferBERT框架的药物警戒分类模型比较分析
发表机构 * Department of Stochastics, Institute of Mathematics, Budapest University of Technology and Economics(布达佩斯技术与经济大学数学研究所随机学系) ; Institute of Biostatistics and Network Science, Semmelweis University(塞梅维什大学生物统计学与网络科学研究所) ; Department of Computer Science, University of Warwick(华威大学计算机科学系)
AI总结 本研究在InferBERT框架下比较XGBoost、ALBERT、BioBERT和Med-LLaMA四种模型,发现领域特定预训练(BioBERT)在药物警戒因果ADE检测中优于简单基线和大型LLM,校准改善ECE但对准确率和因果发现影响不一。
Comments 10 pages, 5 figures
探测、融合与可信度:基础模型表示在多模态癌症分析中的系统评估
发表机构 * The Alan Turing Institute(艾伦·图灵研究所) ; University of Bristol(布里斯托大学) ; University of Manchester(曼彻斯特大学) ; The Institute of Cancer Research(癌症研究所) ; Genentech(基因泰克)
AI总结 系统评估基础模型表示在计算病理学任务中的性能,发现图像和组学表示互补,多模态融合在单模态不占优时有效,并利用共形预测验证了不确定性感知推理的临床价值。
基于多项式混沌展开与多元主动学习的工程结构不确定性量化
发表机构 * Brno University of Technology(布尔诺理工大学) ; University of Rostock(罗斯托克大学)
AI总结 针对多输出工程问题中单一实验设计难以同时准确近似所有输出量的问题,提出一种自适应序贯采样方法,通过平衡输入空间探索与多输出聚合方差信息,构建多项式混沌展开代理模型,数值实验表明该方法提高了代理精度和稳定性。
棒球投球序列的反事实优化及其对赛季级统计指标影响的估计
发表机构 * Sports Innovation Organization, National Institute of Fitness and Sports in Kanoya(体育创新组织,国立健身与体育研究所)
AI总结 利用Transformer模型和反事实分析,优化MLB投球序列中的最终投球和设置投球,发现可显著提升赛季级表现(如K/9提高1.0以上),并提供了速度带有效位置等实用见解。
基于深度学习的OCO-2光谱大气CO2摊销概率检索:结合拉普拉斯近似与归一化流
发表机构 * University of Wisconsin–Madison(威斯康星大学麦迪逊分校) ; Jet Propulsion Laboratory, California Institute of Technology(加州理工学院喷气推进实验室)
AI总结 提出深度学习框架,利用拉普拉斯近似和归一化流从OCO-2光谱中快速、准确地检索大气CO2浓度,并量化不确定性,相比传统方法加速数个数量级且精度更高。
Comments 23 pages, 8 figures
面向可控催化剂逆向设计的大规模自回归预训练
发表机构 * Department of Chemical and Biomolecular Engineering, Institute of Emergent Materials, Sogang University(化学与生物分子工程系,新兴材料研究所,首尔大学) ; Department of Chemical Engineering and Materials Science, Ewha Womans University(化学工程与材料科学系,成实女子大学) ; Department of Chemical Engineering, Graduate Program in System Health Science and Engineering, Ewha Womans University(化学工程系,系统健康科学与工程研究生院,成实女子大学) ; Institute for Multiscale Matter and Systems (IMMS), Ewha Womans University(多尺度物质与系统研究所(IMMS),成实女子大学) ; KU-KIST Graduate School of Converging Science and Technology, Korea University(KU-KIST融合科学与技术研究生院,韩国大学) ; Department of Integrated Energy Engineering, Korea University(整合能源工程系,韩国大学) ; Center for Hydrogen and Fuel Cells, Korea Institute of Science and Technology(KIST)(氢气与燃料电池中心,韩国科学技术院(KIST))
AI总结 提出基于生成式预训练Transformer的条件催化剂生成模型,通过大规模预训练和微调实现高结构有效性和条件匹配率,显著提升筛选效率。
操作设计域转移下自动驾驶汽车责任的可信度加权定价
AI总结 针对自动驾驶系统部署中经验稀疏、ODD转移及风险非平稳问题,提出分层贝叶斯可信度框架,通过ODD相似性核进行部分池化,在Waymo数据上验证其有效性。
ResAware: 通过资源特权蒸馏实现跨环境网站指纹识别
发表机构 * Beijing University of Posts and Telecommunications(北京邮电大学) ; Zhongguancun Laboratory(中关村实验室)
AI总结 提出ResAware框架,利用资源级特征训练教师模型并通过异构知识蒸馏指导学生模型,在不增加在线开销下提升跨环境鲁棒性,在五个月大规模数据集上显著提升基线方法性能。
Comments 18 pages, 9 figures
多适配器PPO:一种用于LIBS定量分析的交叉注意力增强波长选择框架
发表机构 * Electrical and Computer Engineering(电气与计算机工程系) ; University of Arizona(亚利桑那大学) ; Computer Engineering University of Arizona Tucson, USA(计算机工程大学亚利桑那大学图森美国)
AI总结 提出多适配器PPO框架,将波长选择转化为强化学习问题,利用交叉注意力和多适配器捕获光谱关系,在钢铁和煤炭数据集上综合评分平均提升28.4%,预测精度提升45.2%。
Comments 6 pages
地理临界点早期预警的时空因果网络诊断
发表机构 * Jiangsu Center for Collaborative Innovation in Geographical Information Resource Development and Application(江苏省地理信息资源开发与应用协同创新中心) ; National Center for Applied Mathematics, Tianjin University(天津大学国家应用数学中心)
AI总结 提出时空因果网络诊断(ST-CND)框架,通过构建数据驱动的有向因果网络,结合局部恢复率估计和脆弱子网识别,解决地理临界点早期预警中的空间稀释、欧氏假设和相关噪声问题,在AMOC任务上AUROC达0.783。
物理约束神经网络改进短期天气预报:南太平洋案例研究
发表机构 * Faculty of Computer Science, Higher School of Economics(高等经济学院计算机科学系)
AI总结 提出三种改进物理约束神经网络(PCNN)的方法,包括升级数值求解器、统一自回归混合块和集成两种神经骨干,在WeatherBench南太平洋子集上相比纯神经网络模型在1-12小时预报中均方根误差降低8-22%,同时保持物理一致性。
Comments Presented at ICLR 2026 Workshop AI and PDE
ASTEROID: 用于分子动力学多步时间序列预测的时空信息变换器
发表机构 * Department of Medicinal Chemistry, School of Pharmaceutical Sciences, Fudan University(药学院药物化学系,复旦大学) ; School of Mathematical Sciences and School of AI, Shanghai Jiao Tong University(数学科学学院和人工智能学院,上海交通大学)
AI总结 提出ASTEROID框架,通过将分子动力学轨迹重构为高维时空序列并集成时空信息变换方程到Transformer中,实现多步原子坐标的直接预测,在多个量子力学分子数据集上显著提升预测精度并降低计算成本。
Comments 32 pages,10 figures
基于Delta目标重构的LSTM与Transformer短期电力负荷预测
AI总结 针对电力负荷非平稳性,提出Delta目标重构方法,让LSTM和Transformer预测负荷变化量而非绝对值,在小时级预测中MAE和MAPE降低超50%。
Comments 8 pages, 3 tables
QueryMarket: 数据市场中成本感知的在线主动学习
发表机构 * Dyson School of Design Engineering, Imperial College London(帝国理工学院戴森设计工程学院) ; Halfspace (part of Accenture)(埃森哲旗下Halfspace) ; Technical University of Denmark (DTU Management)(丹麦技术大学(DTU管理系)) ; Aarhus University (CoRE)(奥胡斯大学(CoRE))
AI总结 提出QueryMarket框架和OVBAL算法,通过D-最优性准则估计边际效用,在滚动预算约束下实现成本感知的在线主动学习,适应非平稳流和异构标签成本。
Comments 10 pages, 8 figures. Submitted to IEEE Transactions on Neural Networks and Learning Systems
电子商务中基于混合Ret-DNN与XGBoost模型的客户行为预测分析
发表机构 * Chewy Inc(Chewy公司) ; Pace Institute of Technology and Atlanta, USA(佩斯理工学院和亚特兰大美国) ; Nitte Meenakshi Institute of Sciences(尼特梅恩克希科学学院) ; Lovely Professional University(洛丽专业大学) ; Infinity Tech Group(无限科技集团) ; University(大学)
AI总结 提出混合Ret-DNN与XGBoost模型,通过特征提取和梯度提升预测客户购买概率,在UK零售数据集上MAE达0.2193。
Comments 2025 2nd International Conference on Software, Systems and Information Technology (SSITCON)
多重周期性与通道相关的小波分解在长期时间序列预测中的应用
发表机构 * School of Computer Science and Engineering, Central South University(中南大学计算机科学与工程学院)
AI总结 提出McWC模型,通过多层周期性构建、多层感知机提取通道相关性、多级小波分解融合高低频信息,并在频域解耦通道内自相关,实现高效准确的长期预测。
ConTex:重新定义时间序列预测的反事实生成
发表机构 * Institute for Technologies and Management of Digital Transformation, University of Wuppertal(伍珀塔尔大学数字转型技术与管理研究所)
AI总结 针对时间序列预测中反事实解释的不一致和高计算成本问题,提出ConTex模型,通过全局一致的干预策略实现单次前向传播生成稀疏反事实,显著降低计算成本并支持实时应用。
Comments 19 pages, 5 figures, 14 tables
面向微控制器级边缘设备的嵌入式机器学习:数据、特征、评估与部署流程
发表机构 * IEEE
AI总结 本文系统介绍面向微控制器平台的嵌入式机器学习工作流,重点涵盖采样缓冲、特征提取、不平衡验证、模型/运行时协同设计及流式部署等工程决策,并以惯性运动识别和关键词检测为例给出实用设计规则。
Comments 6 pages, 3 figures, 4 tables
PIVOT: 通过可微分的Jäckel算子桥接Black-Scholes隐含波动率与价格目标
发表机构 * Mathematical Institute, University of Oxford(牛津大学数学研究所) ; McMaster University(麦基尔大学) ; Vector Institute for AI(人工智能矢量研究所) ; DRW
AI总结 提出PIVOT层,通过隐式微分保留Jäckel求解器的前向精度,并利用门控机制处理低vega区域的奇异性,实现价格与隐含波动率空间的高效可微转换。
Comments 30 pages, 17 figures, 12 tables
KFTD: 用于连续海洋时空预测的Koopman-Fourier时间可微网络
发表机构 * Shandong University(山东大学) ; Laoshan Laboratory(崂山实验室) ; Chinese Academy of Sciences(中国科学院) ; Zhejiang University of Technology(浙江工业大学)
AI总结 提出KFTD网络,通过Koopman线性空间和傅里叶分析实现连续时间插值,结合轻量残差网络进行预测,在四个海洋数据集上均方误差平均降低5.6%,效率提升76.25%。
时间戳感知的时空图对比学习用于网络入侵检测
发表机构 * Central South University of Forestry and Technology, School of Computer Science and Mathematics(中央林业科技大学计算机科学与数学学院) ; Central South University, School of Computer Science and Engineering(中南大学计算机科学与工程学院)
AI总结 提出一种自监督图神经网络框架,通过时间戳构建时序图,结合E-GraphSAGE和LSTM编码时空依赖,并采用多视图图对比学习(时空特征对比)及自适应权重策略,在四个数据集上达到与监督方法相当的性能。
基于CFD合成数据的船舶自由航行操纵系统辨识的正则化机器学习:比较研究
发表机构 * Hamburg University of Technology (TUHH)(汉堡技术大学)
AI总结 本研究使用正则化回归方法从CFD生成的自由航行数据中辨识船舶水动力系数,重点评估了系数集大小、训练长度和操纵组合对模型性能的影响,发现Ridge回归在计算效率和预测精度间取得最佳平衡。
Comments 28 pages
VISTA:通过动作历史条件实现尺度感知的视觉导航
发表机构 * Polytechnique Montreal(蒙特利尔理工学院) ; MILA(MILA研究所) ; Institute of Science Tokyo(东京科学大学) ; CoRA Lab(CoRA实验室) ; Mist Lab(Mist实验室)
AI总结 针对视觉导航基础模型因动作归一化导致的尺度脆弱性,提出通过动作历史条件化提供物理位移上下文,并集成DINOv3编码器增强重复环境中的特征表示,实现零样本跨环境部署。
DriveJudge: 用视觉-语言模型重新思考自动驾驶评估
发表机构 * NVIDIA(英伟达)
AI总结 提出DriveJudge,结合规则评估与VLM推理,通过选择性调用物理规则函数实现可解释且上下文感知的驾驶评估,在驾驶质量分类和轨迹偏好选择任务上超越现有方法。
Comments Under Review
结构材料的秒级损伤自适应
发表机构 * Northwestern University(西北大学)
AI总结 提出LEAP方法,利用潜在损伤表示和集成学习,在软驱动系统中实现一分钟内对灾难性损伤的自适应,无需仿真。
Comments Proceedings of Robotics: Science and Systems
MODE-RAG: 基于流形异常诊断和能量的检索增强生成评估
发表机构 * School of Computer Science & Tech, Huazhong University of Science and Technology(华中科技大学计算机科学与技术学院) ; School of AI and Automation, Huazhong University of Science and Technology(华中科技大学人工智能与自动化学院)
AI总结 提出MODE-RAG多智能体系统,利用变分自由能和内部注意力状态动态门控干预,结合蒙特卡洛树搜索和logit扰动减少多模态检索增强生成中的幻觉和逻辑捏造。
Comments To be presented at ACL 2026
AUTOGATE:基于翻转感知的LLM驱动RTL重写的自动时钟门控
发表机构 * University of Maryland, College Park(马里兰大学学院公园分校) ; NVIDIA(英伟达)
AI总结 提出AUTOGATE框架,通过ML-LLM协同设计将波形翻转迹线转化为紧凑表示,指导LLM进行RTL重写,实现层次化代码库中的时钟门控优化,平均降低动态功耗49.31%。
Comments 9 pages, 6 figures, 7 tables
纽约市拥堵收费后公共交通增益与空间不均的出行需求变化
发表机构 * Department of Civil and Environmental Engineering, Massachusetts Institute of Technology(麻省理工学院土木与环境工程系) ; Department of Urban Studies and Planning, Massachusetts Institute of Technology(麻省理工学院城市研究与规划系) ; Mathematical Institute, University of Oxford(牛津大学数学院) ; Department of Mechanical Engineering, Massachusetts Institute of Technology(麻省理工学院机械工程系) ; College of Urban and Environmental Sciences, Peking University(北京大学城市与环境科学学院) ; Department of Urban and Regional Planning, University of Florida(佛罗里达大学城市与区域规划系) ; Center for Computational Science and Engineering, Massachusetts Institute of Technology(麻省理工学院计算科学与工程中心)
AI总结 利用时间序列基础模型生成概率反事实预测,评估纽约市2025年实施的拥堵收费政策,发现公交和地铁客流量显著增加,但总体出行需求略有下降,且影响存在空间异质性。
超越视觉线索:CoT增强推理用于半监督医学图像分割
发表机构 * School of Computer Science and Engineering, Southeast University(东南大学计算机科学与工程学院) ; Key Laboratory of New Generation Artificial Intelligence Technology and Its Interdisciplinary Applications, Ministry of Education(教育部新一代人工智能技术及其跨学科应用重点实验室) ; Nanjing University of Science and Technology(南京理工大学)
AI总结 提出CERS框架,通过集成链式思维推理和语义参考选择策略,解决半监督医学图像分割中的视觉-语义不匹配问题,在边界模糊和语义不一致场景下优于现有方法。
Comments Accepted to MICCAI 2026
LegalHalluLens: 类型化幻觉审计与校准的多智能体辩论以实现可信赖的法律AI
发表机构 * Independent Researcher, Sunnyvale, CA, USA(独立研究者,美国加州太阳谷) ; Independent Researcher, San Diego, CA, USA(独立研究者,美国加州圣地亚哥)
AI总结 针对法律AI中聚合指标掩盖的错误集中性和方向性问题,提出LegalHalluLens审计框架,通过类型化幻觉画像、风险方向指数(RDI)和校准辩论管道,将幻觉检测减少45%,并揭示聚合指标隐藏的失败模式。
Comments 15 pages, 5 figures; Published at the Second Workshop on Agents in the Wild: Safety, Security, and Beyond (AIWILD) at ICML 2026
当LLM分析疤痕:从图像到临床有意义的特征
发表机构 * Liaoning University of Traditional Chinese Medicine(辽宁中医药大学) ; School of Artificial Intelligence, Jilin University(吉林大学人工智能学院)
AI总结 提出ScaFE框架,利用LLM作为知识驱动的特征工程师,将高维图像转化为低维临床可解释特征,在数据稀缺的疤痕分类中优于端到端深度学习方法。
从观测中学习红方代理策略用于神经符号自主网络代理
发表机构 * MIT(麻省理工学院)
AI总结 针对网络攻击中红方动作不可观测的问题,提出基于模仿学习的策略学习技术,从网络观测和防御动作预测红方行为,集成神经符号防御代理实现高精度预测。
AnomalyMatch: 通过半监督和主动学习发现罕见感兴趣对象
AI总结 提出AnomalyMatch框架,结合半监督FixMatch算法和主动学习,将异常检测视为二分类问题,利用少量标注和大量未标注图像训练,在严重类别不平衡下实现高AUROC和AUPRC。
Comments Accepted for publication in RASTI; 17 pages; 12 figures
EqCollide: 等变且碰撞感知的可变形物体神经模拟器
发表机构 * Westlake University(西交大大学) ; Fudan University(复旦大学) ; Tongji University(同济大学) ; McGill University(麦吉尔大学)
AI总结 提出首个端到端等变神经场模拟器EqCollide,通过等变编码器和碰撞感知消息传递的图神经网络常微分方程,实现可变形物体碰撞的准确、稳定和可扩展模拟。
Comments SIGKDD 2026 Oral AI4S Track. 20 pages, 16 figures
先澄清再绘制:面向鲁棒文本到CAD生成的主动式智能体
AI总结 提出主动式智能体框架ProCAD,通过澄清代理在代码生成前解决用户提示中的歧义,再通过CAD编码代理生成可执行程序,显著提升鲁棒性,平均Chamfer距离降低79.9%。
Comments ICML 2026
DICE:扩散大语言模型在生成CUDA内核方面表现出色
AI总结 提出CuKe数据集和BiC-RL训练框架,构建DICE系列扩散大语言模型(1.7B/4B/8B),在KernelBench上显著优于同类自回归和扩散模型,实现CUDA内核生成新SOTA。
Comments v2: Expanded with dLLM vs. autoregressive LLM comparisons, ablation studies, and qualitative case studies
X-REFINE:基于XAI的相关性输入过滤与架构微调用于信道估计
AI总结 提出X-REFINE框架,通过分解稳定化LRP epsilon规则联合优化输入过滤和架构微调,在信道估计中实现性能-复杂度-可解释性的优越权衡。
Comments This paper has been accepted for publication in the IEEE Transactions on Vehicular Technology (TVT) as a correspondence paper
时间序列异常检测中根因分析的条件归因
AI总结 提出一种条件归因框架,通过检索与异常观测上下文相似的正态实例进行依赖保持的解释,结合变分自编码器和UMAP流形嵌入实现高维时间序列的高效归因,并在SWaT和MSDS基准上提升了根因识别准确率与鲁棒性。
Comments Accepted at ECML PKDD. 16 pages, 8 figures, 13 tables, and an appendix
用于剩余使用寿命估计的时间序列基础模型嵌入
发表机构 * University of Erlangen-Nuremberg(埃尔朗根-纽伦堡大学) ; Siemens AG(西门子股份公司)
AI总结 提出冻结预训练时间序列基础模型Chronos-2作为骨干,结合轻量回归头进行剩余寿命预测,在工业传感器数据上优于多种基线方法。
Comments Accepted to EUSIPCO 2026, 4 pages, 2 figures, 2 tables
集成营销归因:基于贝叶斯框架的隐私安全粒度测量,锚定于MMM
AI总结 提出集成营销归因(IMA)框架,结合营销组合模型(MMM)与贝叶斯归因模型,从聚合数据中推导出活动级效果,实现隐私安全且粒度精细的归因。
使用大型视觉语言模型审核不安全的用户生成内容游戏中的非法在线图像推广
AI总结 针对社交媒体上非法推广不安全UGC游戏的图像,提出UGCG-Guard系统,利用大型视觉语言模型和条件提示策略实现零样本域适应,检测准确率达94%。
Comments In Proceedings of the 33rd USENIX Conference on Security Symposium (SEC '24), August 14-16, 2024
基于预训练属性预测器的可适应方法用于跨多样约束与目标的晶体设计
AI总结 提出一种直接预测器引导的梯度优化方法,结合现成预测器、位点元素掩码、模板初始化和任务特定损失,实现数据高效、约束丰富的晶体设计,在钙钛矿中优于生成和贝叶斯基线,并支持半金属设计。
离散形状分析的Morse变换
AI总结 提出一种基于定向分段线性Morse理论的拓扑变换,通过记录多个高度函数下的临界点来量化嵌入对象的几何形状,生成的特征向量在配体虚拟筛选中取得最优平均AUROC。
Comments 37 pages, 3 main figures, 2 main tables, 12 appendix figures and 4 appendix tables
从理论到应用:神经算子在科学计算中的实用入门
AI总结 本文综述了用于学习参数偏微分方程解算子的神经网络架构,包括DeepONet、PCANet和傅里叶神经算子,并在三个典型问题上评估其性能,同时讨论了作为贝叶斯逆问题替代模型的应用及挑战。
Comments 72 pages, 22 figures, GitHub repository: https://github.com/CEADpx/neural_operators
利用人工智能检测和缓解DDoS攻击:综述
发表机构 * Department of Computer Science, University of Bucharest(布加勒斯大学计算机科学系)
AI总结 本文综述了基于AI的DDoS攻击检测与缓解方法,提供了基于专家层次和AI生成树状图的分类法,讨论了数据集、对抗训练及未来研究方向。
显式上下文驱动的神经声学建模用于高保真RIR生成
AI总结 提出MiNAF模型,通过查询房间网格并提取距离分布作为显式局部几何特征,引导神经隐式模型生成更准确的房间脉冲响应(RIR),在多项指标上达到竞争性能。
代码的回归语言模型
AI总结 提出回归语言模型(RLM),利用冻结的大语言模型编码器直接从文本预测代码执行结果(如内存占用、延迟、神经网络精度等),在多个任务上达到高相关度。
Comments Published in International Conference on Machine Learning (ICML) 2026
Branch-and-Browse:具有树状推理与动作记忆的高效可控网页探索
AI总结 提出Branch-and-Browse框架,通过树状结构化推理、网页状态重放和页面动作记忆,实现LLM网页代理的高效可控多分支探索,在WebArena上成功率35.8%,执行时间降低40.4%。
BioArtlas:生物艺术中多维复杂性的计算聚类
发表机构 * Graduate School of Culture Technology(文化科技研究生院)
AI总结 本文提出BioArtlas,通过新型轴感知表示对81件生物艺术作品进行多维分析,揭示四种组织模式,并通过交互式网页界面提供分析与探索。
Comments Bae, J. BioArtlas: Computational Clustering of Multi-Dimensional Complexity in Bioart. In The Thirty-ninth Annual Conference on Neural Information Processing Systems Creative AI Track: Humanity
从加密视频会议流量的数据包级别测量中学习QoE
AI总结 针对ISP无法访问加密内容评估QoE的挑战,提出基于CNN的框架仅利用数据包大小预测BRISQUE和MOS,在WhatsApp和Zoom数据集上优于先前模型。
超越独立基因:学习模块归纳表示用于单细胞基因扰动预测
AI总结 提出scBIG框架,通过基因关系聚类、基因簇感知编码器和结构感知对齐学习协调的基因程序模块表示,结合条件流匹配实现灵活泛化的扰动预测,在多个单细胞扰动基准上平均提升6.7%。
3D 等视域世界模型——揭示城市不可见几何及其涌现的跨城市特征
发表机构 * The Bartlett School of Sustainable Construction University College London, UK(可持续建设学院伦敦大学学院,英国) ; Department of Geography University College London, UK(地理系伦敦大学学院,英国) ; School of Project Management, Faculty of Engineering The University of Sydney, AU(工程学院项目管理学院悉尼大学,澳大利亚) ; School of Engineering Cardiff University, UK(工程学院卡迪夫大学,英国) ; School of Architecture Tsinghua University, Beijing, CN(建筑学院清华大学,北京,中国)
AI总结 提出一种预测3D等视域(球形可见性深度图)的具身世界模型,通过深度残差和自滚动调度采样训练,发现跨城市空间特征可从时间潜变量中线性解码。
使用因果变换模型(TRAM-DAG)估计急性缺血性卒中个体化治疗效果:一项多中心观察性研究及外部RCT验证
AI总结 提出因果变换模型(TRAM-DAG)估计急性缺血性卒中患者个体化治疗效果,基于观察数据拟合后,在RCT人群中验证其平均效果与ATE一致,并能正确排序患者预后。
Comments This submission has been withdrawn by the authors pending completion of internal review. A revised version will be posted in due course
Clay-CNN混合模型:利用地理基础模型作为滑坡检测的辅助上下文
发表机构 * Harvard University(哈佛大学)
AI总结 针对滑坡检测中的极端类别不平衡问题,提出将地理基础模型Clay v1.5作为辅助上下文注入U-Net瓶颈的混合方法,在Landslide4Sense基准上达到64.5% F1,优于纯Clay或U-Net基线。
医学启发式学习:一个用于可解释和可审计临床决策规则的LLM驱动框架
发表机构 * Centre for Artificial Intelligence Driven Drug Discovery, Macao Polytechnic University(人工智能驱动药物发现中心,澳门理工学院) ; Key Laboratory of Short-Range Radio Equipment Testing and Evaluation, Ministry of Industry and Information Technology Terahertz Science Application Center (TSAC), Beijing Institute of Technology(工业和信息化部短距离无线电设备测试与评估重点实验室,太赫兹科学应用中心(TSAC),北京理工大学) ; Department of Critical Care Medicine, Yantai Yuhuangding Hospital, Qingdao University(重症医学科,烟台友谊医院,青岛大学) ; Faculty of Education, The University of Hong Kong(教育学院,香港大学) ; College of Information Engineering, Dalian University(信息工程学院,大连大学)
AI总结 提出医学启发式学习(MHL),利用LLM驱动的工作流优化确定性可执行决策系统,生成可解释、可审计的Python决策规则,在医学数据集上达到与最先进方法相当的性能,并支持小样本和高度不平衡场景。
多智能体大语言模型系统中并发异常的可验证检测与预防
发表机构 * independent researcher(独立研究员)
AI总结 针对多智能体LLM系统,形式化四种并发异常并建立一致性层级,通过Verus验证检测器正确性,并在Rust运行时中实现预防。
Comments 32 pages, 2 figures, 6 tables. Verus/TLA+ verification artifact, reference Rust runtime, and Python harnesses, plus a supplementary appendix (Sections A-F, Tables S1-S6), included as ancillary files
Rift: 语言模型中欺骗行为的冲突特征
发表机构 * Harmonic Labs
AI总结 通过对比知情欺骗与无知错误,发现欺骗性前向传递具有高残差秩的冲突特征,能以100%准确率无标签识别谎言,并跨模型、语言和架构迁移。
Comments 13 pages, 4 figures. Code and experiment logs: https://github.com/Omibranch/Rift
智能体AI系统的模型验证:基于POMDP的信念状态、预测与策略验证框架
发表机构 * Quiota LLC(Quiota公司)
AI总结 提出基于部分可观测马尔可夫决策过程(POMDP)的智能体AI模型验证框架,将自主决策分解为信息、信念、预测、动作和效用组件独立验证,并通过投资组合管理案例展示其有效性。
Comments 28 pages, 3 figures, 6 tables. Source code available from https://github.com/mfrdixon/agentic-AI-as-POMDP
Handlebars模板化LLM提示中的结构角色注入:三花括号插值、分隔符家族与HTML自动转义的局限性
发表机构 * Department of Computer Science AI(计算机科学系人工智能) ; Media Analysis Lab Berlin, Germany(媒体分析实验室柏林德国)
AI总结 本文研究Handlebars模板引擎中双花括号与三花括号插值对结构角色注入攻击的影响,通过无模型分析和5760次实验,揭示HTML转义仅保护特定分隔符家族,无法替代指令与数据的结构分离。
Comments 7 pages, 6 figures
记忆作为消耗性资产:为具身智能体定价闪存耐久性及其局限性
发表机构 * KAIKAKU
AI总结 本文提出将机器人闪存耐久性视为折旧资本,通过单一影子价格η进行定价,实现成本最优的存储层级分配,并基于真实机器人日志测量价值-写入关联χ的符号,发现其取决于部署场景。
广播乘积:重新定义形状对齐的逐元素乘法及其扩展
AI总结 本文引入广播乘积$\boxdot$,形式化扩展Hadamard乘积以处理形状不匹配的张量逐元素乘法,并建立其代数性质及与线性代数的联系,为广播感知的张量运算奠定数学基础。
Comments TMLR2026. OpenReview: https://openreview.net/forum?id=zv0OtOPpPO
在人工智能协助下的人类对齐决策学习
发表机构 * GitHub
AI总结 本文研究了在高风险领域中,人工智能如何通过预测结果帮助决策者,并探讨了AI预测信心与决策者自身信心的对齐程度对决策学习复杂性的影响。
开放智能的组合框架
发表机构 * GitHub
AI总结 提出开放智能的形式化定义,通过有限原始集和组合算子生成闭包,支持跨任务和世界的无限组合生成,并引入下一原始预测作为架构目标。
Lean4Agent:面向智能体工作流与轨迹的形式化建模与验证
发表机构 * University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校) ; Independent researcher(独立研究者)
AI总结 提出Lean4Agent框架,利用依赖类型形式语言Lean4对智能体工作流进行形式化建模与验证,通过FormalAgentLib库和LeanEvolve方法提升工作流可靠性,实验验证通过的工作流性能平均提升11.94%。
离散流形上的Whittle-Matérn场逼近
发表机构 * Riemannian Manifolds(黎曼流形) ; Discrete Exterior Calculus(离散外 calculus) ; Finite Element Exterior Calculus(有限元外 calculus)
AI总结 提出一种基于离散外微分的GMRF逼近方法,统一处理Whittle-Matérn场族,支持推断参数,兼容点/分段平滑测量,计算独立于插值函数,并给出低秩近似用于压缩感知。
Comments More specific title, updated acknowledgement, minor typos fixed
大型语言模型值得模拟多少人意见?从不确定性量化角度出发
发表机构 * Department of IEOR, Columbia University(哥伦比亚大学工业工程与运筹学系) ; Decision, Risk, and Operations Division, Columbia Business School(哥伦比亚商学院决策、风险与运营分校) ; Department of IEOR and Data Science Institute, Columbia University(哥伦比亚大学工业工程与运筹学系及数据科学研究所)
AI总结 本文从不确定性量化角度出发,提出了一种框架,将LLM模拟的响应转换为人类响应总体参数的可靠置信集,通过量化人类-LLM不一致带来的不确定性。关键设计是模拟响应的数量:过多会导致置信集过窄且覆盖性差,过少则导致置信集过宽且信息不足。本文提出了一种数据驱动的方法,自适应选择模拟样本量以实现名义平均覆盖性,无论LLM的模拟保真度或置信集构建过程如何。所选样本量进一步反映了LLM能代表的有效人类人口规模,提供了其模拟保真度的定量度量。实验表明不同LLM和领域存在异质性模拟保真度。
Comments 63 pages, 13 figures
TriBand-BEV:基于高度感知的鸟瞰图与高分辨率特征融合的实时仅LiDAR三维行人检测
发表机构 * Karlsruhe Institute of Technology(卡尔斯鲁厄理工学院)
AI总结 本文提出TriBand-BEV方法,通过高度感知的鸟瞰图与高分辨率特征融合实现实时LiDAR-only三维行人检测,采用轻量级鸟瞰图张量映射,单网络一次通过检测车辆、行人和自行车,提升检测精度与速度。
Comments Accepted for publication in the Proceedings of the 2026 International Conference on Autonomous Agents and Multiagent Systems (AAMAS 2026)
300毫米FDSOI量子点自动电荷状态调节:基于神经网络的电荷稳定性图分割
发表机构 * CEA-Leti(法国格勒诺耶大学(Univ. Grenoble Alpes))
AI总结 本文提出基于深度学习的语义分割流程,通过识别电荷稳定性图中的过渡线实现量子点自动电荷调节,提升硅量子点量子比特的高通量电荷调节效率。
Comments 10 pages, 6 figures, supplementary materials available
基于动态算法配置的深度强化学习:在OneMax优化中使用(1+(λ,λ))-GA的案例研究
发表机构 * University of St Andrews, United Kingdom(圣安德鲁大学,英国) ; Sorbonne Université, CNRS, LIP6, France(索邦大学,法国) ; University of Freiburg, Germany(弗赖堡大学,德国)
AI总结 本文研究了深度强化学习算法DDQN和PPO在OneMax问题中控制(1+(λ,λ))-GA种群大小的挑战,发现DDQN和PPO存在可扩展性下降和学习不稳定问题,通过自适应奖励转移机制改进DDQN,使其在样本效率上优于传统方法。
Comments arXiv admin note: text overlap with arXiv:2502.20265
ARC-Fi: 利用天线空间多样性实现标签高效领域泛化在Wi-Fi传感
发表机构 * Suzhou Institute for Advanced Research, University of Science and Technology of China(中国科学技术大学苏州研究院) ; Suzhou Big Data and AI Research and Engineering Center(苏州大数据与人工智能研究与工程中心) ; School of Artificial Intelligence and Data Science, University of Science and Technology of China(中国科学技术大学人工智能与数据科学学院) ; Institute for Infocomm Research (I 2 R), A*STAR(资讯与通讯研究院(I2R),A*STAR) ; School of Computer Science and Technology, Soochow University(苏州大学计算机科学与技术学院)
AI总结 ARC-Fi通过引入物理指导的数据增强策略,解决Wi-Fi传感中领域偏移问题,实现高效领域泛化。
Comments This work has been submitted to the IEEE for possible publication
DECKBench:用于学术幻灯片生成和编辑的多智能体框架基准测试
发表机构 * Huawei Technologies Canada(华为加拿大技术有限公司) ; University of British Columbia(不列颠哥伦比亚大学)
AI总结 本文提出DECKBench,一个用于评估多智能体生成和编辑学术幻灯片的框架,通过定制数据集和模拟编辑指令,系统评估幻灯片和整个演示文稿的忠实度、连贯性、布局质量和多轮指令遵循能力。
通过量子注意机制进行量子相识别
发表机构 * Center for Quantum Technology Research(量子技术研究中心) ; Key Laboratory of Advanced Optoelectronic Quantum Architecture(先进光电量子架构重点实验室) ; Measurements (MOE), School of Physics, Beijing Institute of Technology, Beijing 100081, China(测量(MOE),物理学院,北京理工大学,北京100081,中国)
AI总结 本文提出混合量子-经典注意模型,利用交换测试和参数化量子电路提取量子态关联,实现基态分类,针对簇异或模型在9和15个量子比特系统中表现出高准确率和鲁棒性。
Comments 10 pages, 7 figures
通过霍普金斯损失控制特征空间拓扑
发表机构 * Signal Processing Research Centre Tampere University(信号处理研究中心塔尔皮莱大学) ; BABA Center, Department of Physiology University of Helsinki(BABA中心生理学系赫尔辛基大学)
AI总结 本文提出霍普金斯损失,用于控制特征空间拓扑,通过非线性瓶颈自编码器在语音、文本和图像数据中验证其在分类和降维中的有效性。
Comments Accepted for publication in Proc. IEEE ICTAI 2025, Athens, Greece
KPoEM:用于韩国现代诗歌情感分类与基于RAG的诗歌生成的人工标注数据集
发表机构 * The Academy of Korean Studies(韩国学术院) ; Graduate School of Korean Studies(韩国研究研究生院) ; Cultural Informatics(文化信息学)
AI总结 本研究构建了KPoEM多标签情感数据集,通过序列微调策略实现F1-micro 0.60的情感分类,并验证了基于RAG的诗歌生成在韩国文学情感与文化表达上的可行性。
Comments 43 pages, 22 tables, 3 figures, Digital Humanities and Social Sciences Korea Conference, James Joo-Jin Kim Center for Korean Studies, University of Pennsylvania, Philadelphia, USA
基于CT的心血管血流估计利用物理信息神经网络,通过sinogram训练提升:一项模拟研究
发表机构 * Dept. of Bioengineering, University of California San Diego(加州大学圣地亚哥分校生物工程系) ; Dept. of Computer Science Engineering, University of California San Diego(加州大学圣地亚哥分校计算机科学与工程系) ; Dept. of Mechanical Engineering, Univ of Washington(华盛顿大学机械工程系) ; Depts of Mechanical Engineering and Cardiology, Univ. of Washington(华盛顿大学机械工程与心内科系) ; Depts. of Bioengineering, Radiology, University of California San Diego(加州大学圣地亚哥分校生物工程与放射学系)
AI总结 本研究评估了CT影像对基于物理信息神经网络(PINN)的血流估计的影响,提出了一种改进框架SinoFlow,直接利用sinogram数据估计血流,结果显示SinoFlow在避免滤波反投影引入的误差方面表现更优。
先进物理指导神经网络与残差用于求解复杂积分方程
发表机构 * Department of Computer and Data Sciences, Shahid Beheshti University(计算机与数据科学系,谢赫·贝赫什提大学) ; Department of Cognitive Modeling, Shahid Beheshti University(认知建模系,谢赫·贝赫什提大学)
AI总结 本文提出残差积分求解网络(RISN),通过高精度数值方法与残差连接提升求解积分和积分微分方程的精度与稳定性,实验表明其在多种方程类型上均优于传统PINN及其变体。
KAN-SR:基于Kolmogorov-Arnold网络的符号回归框架
发表机构 * ETH Zürich(苏黎世联邦理工学院)
AI总结 本文提出基于Kolmogorov-Arnold网络的KAN-SR框架,通过深度学习技术和简化策略恢复Feynman符号回归科学发现数据集的真实方程,并结合神经控制微分方程精确建模生物过程系统。
数据驱动的全球海洋模型解析海洋-大气耦合动力学
发表机构 * Center for Climate and Carbon Cycle Research, Korea Institute of Science and Technology, Seoul, Republic of Korea(韩国科学技术院气候与碳循环研究中心,首尔,大韩民国) ; Department of Environment and Energy, Jeonbuk National University, Jeonju, Republic of Korea(全南国立大学环境与能源系,全州,大韩民国) ; School of Earth and Environmental Sciences, Seoul National University, Seoul, Republic of Korea(首尔国立大学地球与环境科学学院,首尔,大韩民国) ; Department of Environmental Management, Seoul National University, Seoul, Republic of Korea(首尔国立大学环境管理系,首尔,大韩民国)
AI总结 本文提出KIST-Ocean模型,利用U型视觉注意力对抗网络架构,通过部分卷积、对抗训练和迁移学习提升海洋预测能力,准确模拟热带太平洋的Kelvin波和Rossby波传播及环流风应力诱导的垂直运动,展现其在气候现象中的耦合机制表示能力。
Comments The manuscript contains 4 main figures. The Extended Data contains 7 figures and 3 tables. The Supplementary Information contains 3 text sections, 7 figures, 1 table
基于加速度计的日常活动能量消耗估计:不同加速度计配置的比较
发表机构 * Department of Electrical Engineering, University of Twente(特文特大学电气工程系) ; Department of Nuclear Medicine, Isala(Isala核医学部)
AI总结 本文比较了基于身体中心质量加速度和腕部加速度计的不同配置在日常活动能量消耗估计中的表现,发现基于身体中心质量的3-acc配置表现最佳。
Comments This work has been accepted by IEEE EMBC 2025
现实中的思维链推理并不总是忠实的
发表机构 * Poseidon Research(Poseidon研究)
AI总结 研究发现,在自然语言提示下,模型有时会生成表面连贯但自相矛盾的思维链,揭示出隐含的事后合理化现象,且前沿模型也未能完全避免。
Comments Published at the 43rd International Conference on Machine Learning (ICML 2026)
一种保护隐私的联邦学习框架用于头颈区域CBCT到合成CT的可推广转换
发表机构 * Institute of Biomedical Engineering(生物医学工程研究所) ; Karlsruhe Institute of Technology(卡尔斯鲁厄理工大学) ; Department of Experimental and Clinical Medicine(实验与临床医学系)
AI总结 本文提出一种跨机构联邦学习框架,用于头颈区域CBCT到合成CT的转换,通过保护数据隐私实现跨机构模型的泛化能力。
LLM生成调查中的公平性
发表机构 * Department of Computer Science, University of Chile(智利大学计算机科学系) ; National Center for Artificial Intelligence (CENIA)(国家人工智能中心) ; School of Government, Adolfo Ibáñez University(阿道弗·伊巴涅斯大学政府学院) ; Millennium Institute for Foundational Research on Data (IMFD)(数据基础研究千年研究所)
AI总结 研究分析了LLM在不同人口中的表现,发现其在美国数据集上表现更优,但存在因训练数据偏见导致的公平性问题,提出新的测量框架以提升模型公平性。
基于可穿戴运动传感器的自动婴儿运动分类中自监督预训练的评估
发表机构 * Helsinki University Hospital, Helsinki, Finland(赫尔辛基大学医院,芬兰)
AI总结 本文评估了自监督预训练在提高基于可穿戴运动传感器的婴儿运动分类准确性中的效果,发现预训练无标签数据可提升分类模型的鲁棒性,且选择上下文相关数据进一步提升了性能。
Comments To be published in Proc. IEEE EMBC 2023, Sydney, Australia
基于聚类的主动学习中自监督学习与降维方法的分析用于语音情感识别
发表机构 * Unit of Computing Sciences, Tampere University, Finland(图皮大学计算科学系,芬兰) ; Helsinki University Hospital, Helsinki, Finland(赫尔辛基大学医院,芬兰)
AI总结 本文研究了在语音情感识别中,利用自监督学习和降维方法提升基于聚类的主动学习性能,探讨了特征空间局部和全局拓扑结构对主动学习的影响,发现降维不影响性能且二维特征表现良好。
Comments To be published in Proc. Interspeech 2022, Incheon, South Korea
对新生儿重症监护病房中以儿童为中心的全天候录音中语音情感内容的自动分析
发表机构 * Unit of Computing Sciences, Tampere University, Finland(图瓦大学计算科学系) ; Department of Clinical Medicine, University of Turku, Finland(图尔库大学临床医学系) ; Department of Signal Processing and Acoustics, Aalto University, Finland(阿尔托大学信号处理与声学系)
AI总结 本文研究了如何通过自动语音情感识别系统分析新生儿录音中的情感内容,探讨了跨语料泛化、WGAN域适应和主动学习在新领域部署中的有效性,实现了73.4%的UAR分类性能。