Reasoning with Sampling: Cutting at Decision Points
基于采样的推理:在决策点进行裁剪
发表机构 * Yale University(耶鲁大学) ; Stanford University(斯坦福大学)
AI总结 提出Entropy-Cut Metropolis-Hastings算法,利用基础模型的下一词元熵作为代理识别关键决策点并重新采样,从而高效地从幂分布中采样以增强推理能力,在多个基准上超越基线和RL训练模型。
基于采样的推理:在决策点进行裁剪
发表机构 * Yale University(耶鲁大学) ; Stanford University(斯坦福大学)
AI总结 提出Entropy-Cut Metropolis-Hastings算法,利用基础模型的下一词元熵作为代理识别关键决策点并重新采样,从而高效地从幂分布中采样以增强推理能力,在多个基准上超越基线和RL训练模型。
有界记忆下的极限语言生成
发表机构 * Cornell University(康奈尔大学) ; Stanford University(斯坦福大学) ; Google Research(谷歌研究)
AI总结 研究有界记忆下语言生成的极限问题,通过组合界和滑动窗口分析记忆约束对可生成性、密度和识别的影响。
Comments The abstract has been shortened to fit within the arXiv limit
Talagrand 优势测度定理的贝叶斯证明与解释
AI总结 本文通过贝叶斯方法,利用高斯加性模型的两个面积恒等式,比较最大似然估计与贝叶斯最优估计,给出了 Talagrand 优势测度定理下界的简洁证明。
通过矩阵补全改进异质性处理效应估计的保证
发表机构 * Stanford University(斯坦福大学) ; Vin University(文大学) ; The University of Hong Kong(香港大学) ; Yale University(耶鲁大学)
AI总结 针对面板数据中的异质性处理效应估计问题,提出一种基于矩阵补全的简单高效估计器,在低秩假设下实现行向$\ell_2$误差$ ilde{O}(\sqrt{1/n + n/m^2})$,并首次建立了低秩逼近的行向$\ell_2$扰动界。
MEDAL: 通过自编码器学习的流形嵌入蒸馏
发表机构 * Department of Statistics, Columbia University(哥伦比亚大学统计学系) ; School of Data and Information Sciences, University of North Carolina at Chapel Hill(北卡罗来纳大学教堂山分校数据与信息科学学院) ; Irving Institute for Cancer Dynamics, Columbia University(哥伦比亚大学癌症动力学研究所) ; Center for Theoretical Neuroscience, Zuckerman Mind Brain Behavior Institute, Columbia University(哥伦比亚大学理论神经科学中心,Zuckerman心智-大脑-行为研究所)
AI总结 提出MEDAL框架,通过约束自编码器将流形嵌入蒸馏为可复用的编码器-解码器模型,实现留出验证、超参数选择和分布偏移检测。
通过戴森扩散的置换不变谱学习
发表机构 * Mathematical Institute, University of Oxford(牛津大学数学研究所) ; Mathematical bioPhysics Group, Max Planck Institute for Multidisciplinary Sciences(多学科科学研究所马克斯·普朗克数学生物物理组) ; School of Mathematics, Institute for Advanced Study(高级研究院数学学院) ; Department of Statistics, University of Oxford(牛津大学统计系) ; Mathematical Physics and Stochastic Dynamics, University of Freiburg(弗赖堡大学数学物理与随机动力学)
AI总结 提出戴森扩散模型,利用随机矩阵理论从分析上提取扩散过程的谱特性,将归纳偏置从架构转移到动力学,实现置换不变的谱学习,准确学习图谱并超越现有图扩散模型。
高斯分布的Wasserstein KL散度
AI总结 提出基于Wasserstein几何的高斯分布KL散度新版本(WKL散度),证明其与样本空间几何一致,且狄拉克测度的WKL散度正比于两点间距离平方。
用于数值表格数据集的相似性、检索和可解释对齐的统计嵌入
发表机构 * Idaho National Laboratory(爱达荷国家实验室)
AI总结 提出一种通过结构化探索性数据分析描述符、句子变换器嵌入和典型相关分析(CCA)来表征和比较数值表格数据集的方法,实现跨数据集的相似性检索和可解释变量级对齐,并支持差分隐私。
MoSAIC: 癌症成像中细胞共定位的多分辨率空间回归分析
AI总结 提出层次贝叶斯空间回归模型MoSAIC,联合分析多分辨率空间数据,分解全局肿瘤梯度效应、患者特异性效应和空间依赖性,在肾细胞癌成像中识别EMT梯度相关的免疫-肿瘤共定位变化。
Comments 45 pages (30 before supplement), 6 figures, submitted to ISBA and JSM
Wasserstein最小二乘法:概率分布的规范回归方法
AI总结 本文提出Wasserstein最小二乘回归方法,从凸分析角度证明其是欧几里得最小二乘在概率分布空间上的规范扩展,并在模板变形模型下实现n^{-1/2}的估计速率,应用于人口统计学数据分析。
对抗诚信:通过实时市场动态识别假球
AI总结 本研究利用意大利足球乙级联赛的高频实时投注数据,通过状态空间模型描述标准投注市场动态并预测预期投注量,再结合异常值检测技术识别异常投注行为,为早期发现假球提供统计支持。
单元稳健判别分析
AI总结 针对数据矩阵中的单元异常值,提出基于单元稳健估计和惩罚最大似然的判别分析方法(cellQDA/cellLDA),在训练和预测中同时处理单元和个案异常值及缺失值。
一种用于BATSE伽马射线暴无监督分类的全新无参数聚类算法
发表机构 * Department of Statistics, Presidency University(统计系,普雷斯顿大学)
AI总结 提出一种完全无参数的聚类算法,对BATSE伽马射线暴样本进行分类,支持双群(短暴与长暴)的合并-坍缩星理论。
视觉空间学习:使用卷积神经网络的单场空间插值
发表机构 * Centro de Matemática (CMAT), Universidade do Minho(数学中心(CMAT),明霍大学) ; DEI-FEUP & INESC TEC, Universidade do Porto(FEUP-DEI与INESC TEC,波尔图大学) ; Instituto Português do Mar e da Atmosfera, I. P. (IPMA, I. P.), Lisboa, Portugal(葡萄牙海洋与大气研究所(IPMA, I. P.),里斯本,葡萄牙) ; Centro de Ciências do Mar e do Ambiente (MARE), Évora, Portugal(海洋与环境科学中心(MARE),埃维拉,葡萄牙)
AI总结 提出基于卷积神经网络(CNN)的架构,直接从单次部分观测场学习空间插值,无需外部数据或先验场,作为克里金法的替代方案。
Comments 53 pages, 10 figures
高维数据中的测量误差
AI总结 针对高维回归中协变量存在测量误差的问题,综述并比较了岭回归、Lasso、Dantzig选择器和弹性网及其误差校正变体的性能,通过模拟和真实数据提供实践建议。
Comments 21 pages, 0 figure
利用大型语言模型提高随机对照试验的精度
AI总结 本文探索如何安全、严谨地利用大型语言模型(LLM)的预测来提升随机对照试验(RCT)的精度,并通过三个案例验证其有效性。
Comments Submitted to Machine Learning and Artificial Intelligence for Causal Inference in the Behavioral and Social Sciences: Methodological Advances and Applications, a topical issue of the Zeitschrift für Psychologie
扩散模型在学习低维多模态分布时具有统计最优性
发表机构 * Department of Industrial and Operations Engineering, University of Michigan, Ann Arbor, USA(工业与运营工程系,密歇根大学,安娜堡,美国)
AI总结 本文证明扩散模型在学习支撑在低维子空间并集上的分布时,样本复杂度仅依赖于内在维度,达到近最优的1-Wasserstein误差率,无需光滑性或有界密度假设。
Comments accepted to ICML 2026
潜在位置模型的精确高效MCMC
AI总结 针对潜在位置模型(LPM)的贝叶斯推断,提出两种MCMC算法:一种在几乎O(|E|)时间内运行且精度更高,另一种在几乎O(|V|)时间内运行且精度略有提升,主要创新是引入一种可廉价更新的辅助数据结构。
Comments 43 pages, 8 figures
学习外推到新任务:一种关系型任务外推方法
发表机构 * Department of Statistics, University of Michigan, Ann Arbor(统计学系,密歇根大学,安阿伯)
AI总结 提出关系型任务外推器(RTE),通过将目标任务分解为锚定任务和变换关系并学习关系算子,实现向未见任务的系统性外推,在函数预测和序列预测中显著优于现有方法。
Comments ICML 2026
植入超图和张量PCA中的低度估计阈值
AI总结 本文通过低度框架研究植入稠密子超图、稀疏张量PCA和一般先验张量PCA中的统计-计算差距,确定了低度估计的尖锐阈值,并给出了多项式时间算法。
Comments 67 pages, 1 figure
广义矩方法在低信噪比高斯潜变量模型中(几乎)具有统计有效性
AI总结 针对低信噪比高斯潜变量模型,证明广义矩方法在最优加权下与最大似然估计具有相同的一阶渐近协方差,从而提供统计有效的替代方案。
推理轨迹前缀的保形认证
发表机构 * Department of Electrical & Computer Engineering, Rice University(电气与计算机工程系,里士满大学)
AI总结 提出CROP方法,通过保形校准选择阈值,返回最长无错前缀,并控制错误包含概率,平衡保留有效推理与丢弃误导后缀。
Comments Code available at https://github.com/matthewyccheung/crop
高维后验比较的可信矩形
AI总结 提出一种贝叶斯框架,通过构建和比较后验分布的可信超矩形,实现脑连接图分析中的不确定性量化与比较,并提供高维可扩展算法和理论保证。
Comments 35 pages, 4 figures
核密度估计中的乘性偏差校正
AI总结 本文结合Hjort-Glad和Jones-Linton-Nielsen两种半参数密度估计方法,提出一种新的乘性偏差校正估计量,理论上实现高阶偏差并提升参数模型拟合时的性能,但模拟显示小到中等样本下实际效果有限。
Comments 9 pages, no figures. This is the authors' manuscript, Statistical Research Report, Department of Mathematics, University of Oslo, later published, in essentially similar form, in Sankyha: the Indian Journal of Statistics, Series A, 2009, pages 422.430
Journal ref Sankyha: the Indian Journal of Statistics, Series A, 2009, pages 422.430
泊松重置的岭回归:谱正则化的更新视角
发表机构 * manu.edu.mk
AI总结 通过非平衡统计物理中的随机重置与统计学习中的岭正则化建立联系,证明线性梯度流下以速率r重置到原点产生的稳态均值即为岭估计,并推广到一般更新重置律以生成替代谱滤波器。
重要性抽样的Wasserstein代价
AI总结 本文证明了在高维(d≥3)情况下,重要性抽样估计的Wasserstein距离期望以n^{-p/d}阶收敛,并给出了上下界常数,同时发现最优抽样分布是g的tempered版本,类似于Zador定理。
Comments 20 pages
构建传染病建模中的接触矩阵和连通性矩阵
AI总结 本文综述了用于构建接触矩阵的数据类型以及将不确定性和异质性纳入矩阵的方法,并指出了未来研究方向。
修改因果模型以区分瞬时和持久因果效应
AI总结 本文提出一种基于系统和状态的方法,通过定义新的零效应概念来区分时间变化系统中的瞬时和持久因果效应。
Comments 18 pages, 7 figures
统计锥形函数用于集合数据同化中基于相关性的局地化
AI总结 本文提出三种统计锥形函数(广义幂律、逻辑斯蒂和差异型),用于集合数据同化中基于相关性的局地化,以抑制虚假相关并保留有意义的参数-数据关系。
通过边际似然进行联合模型与数据稀疏化
发表机构 * RIKEN Center for AI Project, Tokyo, Japan(日本东京RIKEN人工智能项目中心) ; Department of Computer Science, Johns Hopkins University(约翰霍普金斯大学计算机科学系)
AI总结 提出通过边际似然联合学习特征和样本相关性,实现同时模型与数据稀疏化的贝叶斯方法,在保持共轭性和闭式更新的同时提升鲁棒性。
Comments 36 pages, 8 figures, 12 tables (incl. appendix); published at ICML 2026
开放问题:通过凯莱表完成分离几何压缩与算法压缩
发表机构 * Dongsung Huh
AI总结 提出凯莱表完成作为测试缺失的算法复杂度最小化归纳偏置的规范问题,并挑战社区将连续平坦性先验推广以自主发现离散算法公理。
Comments 6 pages. Submitted to the Conference on Learning Theory (COLT) 2026 Open Problem track
拓扑稳定性指数:一种基于方差的持久性条形码度量
AI总结 提出拓扑稳定性指数(TSI),一种基于方差的持久性条形码标量度量,量化持久性寿命的离散程度,并建立其基本性质及与Rényi熵的联系。
Comments 31 pages, 14 figures
CB-SLICE: 基于概念的可解释错误切片发现
发表机构 * Department of Computer Science and Technology, University of Cambridge, Cambridge, UK(计算机科学与技术系,剑桥大学,剑桥,英国) ; Trinity College, University of Oxford, Oxford, UK(牛津大学三一学院,牛津,英国) ; Cambridge Institute for Technology and Humanity, Cambridge, UK(剑桥技术与人类研究所,剑桥,英国)
AI总结 提出CB-SLICE方法,利用概念瓶颈模型的概念预测失败来发现错误切片,并通过关键词概念解释失败模式,优于现有方法。
Comments 20 pages, 7 figures, 12 tables, to be published at Proceedings of the 43rd International Conference on Machine Learning (ICML 2026)
具有特征交互的多因素创新模型
AI总结 提出一个基于印度自助餐过程的多因素创新模型,引入特征交互机制,分析参数对渐近行为的影响,并建立强律和中心极限定理。
Fisher的思想与农学和植物育种中的田间试验设计
AI总结 回顾Fisher在实验设计中的关键思想,并联系当前农业田间试验中的系统设计、行列设计、多环境试验等方法。
Comments 31 pages, 2 tables
实例依赖的随机Lipschitz bandit
发表机构 * Crest (Fairplay joint team)(Crest(Fairplay联合团队)) ; EDF R&D(EDF研发) ; Criteo AI Lab(Criteo人工智能实验室)
AI总结 针对Lipschitz bandit问题,提出一种基于水平集次优性间隙积分的算法,实现比传统缩放维度更优的实例依赖遗憾界。
基于Jensen-Shannon散度的$k$--$NN$算法用于成分数据缺失值插补
AI总结 提出一种基于Jensen-Shannon散度和Fr\'echet均值的$k$--$NN$非参数方法,用于成分数据缺失值插补,具有自适应性且适用于含零值数据。
Comments This is the preprint of the paper that was published in the Journal of Applied Statistics. https://www.tandfonline.com/doi/full/10.1080/02664763.2026.2677908
贝叶斯深度神经网络中的核重整化:比例机制下的等效Wishart假设
发表机构 * INFN, Sezione di Milano Bicocca(意大利国家研究所(INFN),米兰Bicocca分所) ; INFN, Gruppo Collegato di Parma(意大利国家研究所(INFN),帕尔马联合小组) ; Dipartimento di Scienze Matematiche, Fisiche e Informatiche, Università degli Studi di Parma(帕尔马大学数学、物理和信息科学系) ; Istituto dei Materiali per l’Elettronica ed il Magnetismo (IMEM-CNR), Parco Area delle Scienze(电子与磁性材料研究所(IMEM-CNR),帕尔马科技园区)
AI总结 针对固定深度L的贝叶斯多层感知机,提出等效Wishart假设来捕捉层次经验核的随机涨落,通过大偏差分析得到重正化NNGP核描述,在比例极限下用至多L个标量序参数刻画表示学习,并扩展到CNN揭示局部核重整化机制。
Comments 45 pages, 21 figures
多类别和稀疏上下文赌博机的样本复杂度
发表机构 * Tel Aviv University(特拉维夫大学) ; Massachusetts Institute of Technology(麻省理工学院) ; Google Research Tel Aviv(谷歌研究特拉维夫) ; Technion—Israel Institute of Technology(技术学院—以色列理工学院)
AI总结 针对随机i.i.d.上下文赌博机,提出基于决策估计系数和低方差探索的算法,在稀疏奖励下实现接近最优的样本复杂度,并匹配下界。
异构带宽预算下的联邦探针-逻辑蒸馏匹配率与最优分配
发表机构 * H. Milton Stewart School of Industrial and Systems Engineering, Georgia Institute of Technology, Atlanta, GA 30332, U.S.A(H. Milton Stewart工业与系统工程学院,佐治亚理工学院,亚特兰大,GA 30332,美国)
AI总结 针对联邦探针-逻辑蒸馏(FPLD)中带宽项速率紧性及异构节点带宽分配问题,提出匹配下界、多轮改进方案及闭合形式最优分配规则。
分层预测:信息的作用
AI总结 本文提出信息组合(IComb)方法,通过结合不同信息集的基础预测来改进分层时间序列预测,并证明信息组合与聚合约束对预测改进的独立贡献。
通过离线策略评估进行保险定价优化
发表机构 * Department of Mathematics, ETH Zurich(苏黎世联邦理工学院数学系)
AI总结 本文提出基于离线策略评估和随机控制的保险定价方法,利用核化逆倾向得分估计器降低方差,并通过数据共享Lasso和神经网络两种策略优化方法实现最优定价。
用高级统计方法量化责任保险中的社会通胀
AI总结 本研究利用美国陪审团裁决与和解数据库,通过滚动窗口逻辑回归和分位数回归等方法,量化了责任保险中社会通胀的多渠道影响,发现裁决严重性是主要驱动因素,且社会通胀不仅影响极端判决也影响中等损失。
功能结果因果效应的半参数推断
AI总结 针对离散观测的功能数据,提出基于双重差分的半参数推断框架,通过有效影响函数、去偏估计和均匀置信带解决识别、推断和观测三大挑战。
具有多项式改进近似因子的 $2 \rightarrow q$ 范数算法及其应用
发表机构 * MIT(麻省理工学院)
AI总结 本文针对 $q>2$ 时的 $2 \rightarrow q$ 范数,提出了首个多项式时间近似算法,其近似因子在多项式级别上优于基线 $d^{1/4}$,例如 $q=4$ 时达到 $d^{1/8}$,并构造了平方和证书,从而改进了鲁棒均值估计、协方差估计、回归和聚类等问题的算法。
Comments v2 corrected minor typos
TabPFN-3: 技术报告
发表机构 * Prior Labs
AI总结 本文提出TabPFN-3,通过扩展训练数据和优化推理,在表格数据上实现最先进性能,并支持时间序列、关系数据和表格文本数据。
极端多类监督对比表示学习的精细泛化分析
发表机构 * School of Computing and Information Systems, Singapore Management University(新加坡国立管理学院计算机与信息系统学院)
AI总结 针对对比表示学习在有限标注数据中构造元组导致依赖性的问题,提出改进的U-统计量分析,得到与类别数R同阶的样本复杂度,并设计新估计器在长尾分布下实现O(k)的样本复杂度。
Comments Accepted at ICML 2026
缺失数据下的顺序无关自回归建模
发表机构 * Technical University of Denmark(丹麦技术大学) ; Pioneer Centre for AI(先锋人工智能中心) ; Universidad Carlos III de Madrid(马德里卡洛斯三世大学)
AI总结 本文通过缺失数据视角重新审视顺序无关自回归模型,提出缺失感知训练框架,并利用其条件密度估计进行主动信息获取,在多个基准上优于传统插补方法。
高斯-柯西卷积模型的精确似然推断与鲁棒滤波
AI总结 本文推导了Voigt分布(高斯与柯西卷积)的解析表达式,用于重尾测量噪声建模,并基于此提出GCC滤波器,在状态空间模型中实现鲁棒滤波,实证中优于高斯、t分布等滤波器。
相信我,我是医生?
AI总结 利用嵌套在观察性队列中的随机试验数据,推导医生个人策略优于试验平均推荐策略的比例的严格界限。
贝叶斯推断的重要性采样:多项式维数依赖的误差界
AI总结 本文在随机观测视角下,通过引入链接函数,证明了重要性采样的L2误差界在任意维数下以标准蒙特卡洛速率收敛,并给出了多项式维数依赖的误差分析。
贝叶斯希尔伯特空间中的测度流路径恢复
发表机构 * Rice University(里士大学)
AI总结 针对有限移动局部传感器恢复概率测度流的不适定问题,提出基于贝叶斯希尔伯特框架的变分理论,通过构造最小能量传输实现和线性化观测算子,分析可恢复性条件,并发展有限维约化方法实现稳定重建。
使用正态模型对标一级方程式赛车成绩
AI总结 本文使用单变量和双变量正态模型,区分精英与非精英车队,量化车手和车队层面的合理性能预期,并应用于2025赛季数据。
非欧几里得梯度下降在稳定性边缘运行
发表机构 * University of Basel(巴塞尔大学) ; George Mason University(乔治·马歇尔大学) ; Flatiron Institute(Flatiron研究所)
AI总结 本文通过方向光滑性解释梯度下降中的稳定性边缘现象,并将其推广到非欧几里得范数,定义广义尖锐度,实验表明非欧几里得梯度下降也表现出渐进尖锐化和阈值振荡。
GICDM: 缓解枢纽性以实现可靠的基于距离的生成模型评估
发表机构 * Inria, Palaiseau, France(法国帕莱索研究所)
AI总结 针对生成模型评估中高维嵌入空间的枢纽性现象,提出GICDM方法(基于迭代上下文不相似度度量),通过多尺度扩展校正邻域估计,恢复可靠度量并与人类评估对齐。
Comments Forty-third International Conference on Machine Learning, 2026
粗粒度玻尔兹曼生成器
发表机构 * Professorship of Multiscale Modeling of Fluid Materials, Department of Engineering Physics and Computation, TUM School of Engineering and Design, Technical University of Munich, Germany(多尺度流体材料建模教授职位,工程物理与计算系,TUM工程与设计学院,慕尼黑技术大学,德国) ; Atomistic Modeling Center, Munich Data Science Institute, Technical University of Munich, Germany(原子建模中心,慕尼黑数据科学研究所,慕尼黑技术大学,德国)
AI总结 提出粗粒度玻尔兹曼生成器(CG-BGs)框架,结合基于流的生成模型与重要性采样,利用学习到的平均力势(PMF)进行重加权,在降低计算成本的同时实现大分子系统的平衡采样。
Comments Accepted at ICML 2026
通过噪声查询实现不可分割物品的无嫉妒分配
发表机构 * Meta(Meta公司) ; National University of Singapore(国立新加坡大学) ; Nanyang Technological University(南洋理工大学)
AI总结 针对不可直接观测估值、仅能通过噪声查询获取信息的不可分割物品分配问题,在双智能体高斯噪声和有界估值设定下,推导了实现无嫉妒分配所需查询次数的上下界,并证明了当最优分配负嫉妒值Δ不太小时最优查询次数与m^{2.5}/Δ^2成比例。
Comments ICML 2026
离散扩散采样器与桥:离策略算法及其在潜在空间中的应用
发表机构 * University of Edinburgh(爱丁堡大学) ; CIFAR Fellow(卡尔·弗里德里希·列文森研究员)
AI总结 提出离策略训练技术改进离散扩散采样器性能,并首次引入离散域的数据到能量薛定谔桥训练,应用于图像生成模型的离散潜在空间中的无数据后验采样。
Comments ICML 2026. Code: https://github.com/mmacosha/offpolicy-discrete-diffusion-samplers-and-bridges
扩散可微重采样
发表机构 * Department of Information Technology, Uppsala University, Sweden(乌普萨拉大学信息科技系,瑞典)
AI总结 针对序贯蒙特卡洛中的可微重采样问题,提出一种基于无训练扩散模型代理的信息性且即时可微的重采样方法,理论证明其一致性,并在多个滤波和参数估计基准上优于现有方法。
Comments In ICML 2026
E-valuator: 基于序贯假设检验的可靠智能体验证器
发表机构 * Genentech(基因泰克) ; MIT(麻省理工学院) ; Johns Hopkins(约翰霍普金斯大学) ; Stanford(斯坦福大学)
AI总结 提出E-valuator方法,将任意黑盒验证器分数转化为具有可控虚警率的决策规则,通过序贯假设检验实现对智能体轨迹的在线监控,提升统计功效并节省令牌。
可扩展且通信高效的变系数混合效应模型:方法、理论与应用
AI总结 针对大规模分布式数据下的变系数混合模型,提出一种基于贝叶斯分层表示和充分统计量的通信高效推断框架,实现一阶有效估计,并通过SVD增强处理病态协方差,理论证明似然保持、收敛性和渐近效率,模拟和迁移数据验证了可扩展性和动态空间模式恢复。
Comments 3 Figures
仅从噪声和部分测量中进行成像逆问题的贝叶斯模型选择与误设定检验
发表机构 * Heriot-Watt University, MACS \& Maxwell Institute for Mathematical Sciences, EH14 4AS, Edinburgh, United Kingdom
AI总结 提出一种结合贝叶斯交叉验证与数据分裂的通用方法,用于在无真实数据情况下对成像逆模型进行选择与误设定检测,兼容扩散采样器等贝叶斯成像采样器,计算成本低且准确率高。
TabMGP: 基于TabPFN的马氏后验
AI总结 提出TabMGP方法,利用TabPFN作为预测规则构建马氏后验,为表格数据提供具有近名义覆盖率的可信集,优于手工MGP构造和标准贝叶斯基线。
Comments Accepted at ICML 2026. Extra plots in https://drive.google.com/drive/folders/1ct_effOoTEGpiWUf0_1xI3VqLWHtJY16 . Code in https://github.com/weiyaw/tabmgp
凸成对差分估计量的稳健推断
AI总结 针对凸成对差分估计量,本文发展了分布理论和基于自助法的推断方法,通过小带宽渐近理论、广义刀切去偏和调整带宽方差扭曲的自助法,实现了在更弱带宽条件下的有效推断。
基于邻近性的城市减少出行驱动的CO$_2$排放
AI总结 通过分析全球近400个城市的数据,发现服务设施靠近居民的区域人均交通碳排放更低,并量化了优化服务布局可实现的减排潜力。
SpeedCP: 基于核的快速条件共形预测
发表机构 * Department of Statistics University of Chicago(统计学系芝加哥大学)
AI总结 提出一种基于路径追踪的高效算法,在保持RKHS条件共形预测框架理论优势的同时,将计算速度提升40倍,区间长度缩短30%。
检测加权隐藏团
AI总结 研究加权图中隐藏团检测问题,通过假设检验框架,在已知和部分已知分布下推导可检测性统计极限,并给出谱方法算法。
Comments Revision with organised references
用于未知识别的合成非平稳数据流
发表机构 * Wrocław University of Science and Technology(沃拉夫大学科学与技术学院)
AI总结 提出一种同时包含概念漂移和新类出现的合成数据流生成策略,并评估无监督漂移检测器在开放集识别任务中的表现。
rd2d:边界断点设计中的因果推断
AI总结 本文介绍rd2d软件包,用于边界断点设计中基于局部多项式估计的因果效应推断,支持双变量得分或单变量符号距离得分,并提供带宽选择、偏差校正、置信带等功能。
神经逻辑老虎机
发表机构 * Department of Industrial \& Systems Engineering, KAIST ; Department of Mathematical Sciences \& Research Institute of Mathematics, Seoul National University ; Interdisciplinary Program in Artificial Intelligence, Seoul National University
AI总结 针对神经逻辑老虎机问题,利用一种新型的自归一化向量值鞅的Bernstein型不等式,提出两种算法NeuralLog-UCB-1和NeuralLog-UCB-2,分别实现与有效维度相关的遗憾上界,改进了现有结果。
分布式广义线性模型:一种隐私保护方法
AI总结 提出一种隐私保护的分布式广义线性模型方法,通过数据流或分布式计算实现模型训练,并扩展到GLM框架,数值实验验证了其在联邦环境中的有效性。
Comments Total PDF pages: 23 Figures: 7
数据集驱动的Transformer通道掩码用于多变量时间序列
发表机构 * Department of Statistics and Data Science, Yonsei University(延世大学统计与数据科学系) ; LG AI Research(LG人工智能研究)
AI总结 提出部分通道依赖(PCD)概念,通过数据集特定的通道掩码(CMs)改进Transformer中的通道依赖建模,并在多种任务和数据集上验证有效性。
Comments ICASSP 2026. Preliminary version: NeurIPS Workshop on Time Series in the Age of Large Models 2024 (Oral presentation)
将可解释集成树(E2Tree)扩展到回归场景
发表机构 * Department of Economics and Statistics, University of Naples Federico II(那不勒斯费德里科二世大学经济学与统计学系) ; Institute of Psychology, Leiden University(莱顿大学心理学研究所)
AI总结 本文通过引入新的不相似度度量,将可解释集成树方法从分类扩展到回归,并在真实数据集上验证其解释能力。
Journal ref Applied Stochastic Models in Business and Industry, Vol. 42, No. 1, e70064 (2026)
通过案例加权和单元加权实现稳健主成分
AI总结 提出 cellPCA 方法,通过结合两种稳健损失函数和迭代重加权最小二乘算法,同时处理案例异常值、单元异常值和缺失数据,实现稳健的主成分分析。
多项随机向量分量累积和的联合生存函数的正态积分表示
AI总结 本文通过将多项随机向量分量累积和的联合生存函数与Dirichlet概率联系起来,推导出其正态积分表示,为多元KMT逼近提供潜在工具。
Comments 15 pages, 0 figures, 4 tables
生态研究中多物种标记错误的贝叶斯建模
AI总结 提出贝叶斯分层模型,结合稀疏专家标注以改进鸟类物种分类并提供不确定性量化,同时评估专家表现。
行业层面的会计报表分析:组合方法的温和介绍
AI总结 本文介绍组合数据分析方法在行业层面财务报表分析中的应用,通过几何均值计算行业财务比率均值,利用组合主成分分析、聚类分析和回归模型进行可视化与建模,并以西班牙酒庄为例演示杜邦分析。
检验函数自回归模型的拟合优度
AI总结 针对函数型时间序列中的线性自相关模型,提出基于经验过程的拟合优度检验,推导了经验过程收敛到时间变换的Wiener过程的函数中心极限定理,并验证了检验在简单和复合原假设下的大样本性质及一致性。
数值模拟器的二级全局灵敏度分析及其在钠冷快堆事故场景中的应用
AI总结 针对输入分布不确定对全局灵敏度分析结果的影响,提出基于加权HSIC估计量的单环蒙特卡洛方法,实现计算预算有限的二级全局灵敏度分析,并应用于核反应堆严重事故场景。
Comments This work was intended as a replacement of arXiv:1902.07030 and any subsequent updates will appear there
基于LoRA的贝叶斯推理中低损失谷的构造与启示
发表机构 * HTWG Konstanz(康斯坦茨应用科学大学) ; LMU Munich(慕尼黑大学) ; Munich Center for Machine Learning (MCML)(慕尼黑机器学习中心)
AI总结 本文提出LoRA-Curve方法,通过分段贝塞尔曲线参数化在LoRA空间中连接独立最优解,形成连续低损失谷,并结合平坦极小扰动和JS散度正则化,在不牺牲性能的前提下提高预测分布的互信息,实现功能多样性。
基于Copula马尔可夫模型的威布尔时间序列变点估计
AI总结 针对具有非线性序列依赖的时间序列,提出基于Copula的马尔可夫链模型(威布尔边缘分布),通过Clayton和Joe copula捕捉非对称尾部依赖,利用牛顿-拉夫逊算法进行最大似然估计变点,并采用参数自助法构建置信区间。
主动学习策略用于功能模拟器输出的超越集置信区域
AI总结 提出结合主成分分析和高斯过程回归的代理模型,并引入基于最大-最小准则的主动学习策略,高效估计具有随机输入和功能输出的函数的超越集置信区域。
`pandemonium`: 链接空间中的高维分析
AI总结 提出R包pandemonium,通过聚类分析和链接可视化探索预测变量与响应变量之间的关系,核心方法包括非线性降维和动画游览,主要贡献在于提供了一种在双空间中同时可视化和分析高维数据结构的工具。
双变量生存结局的深度最优个体化治疗规则:基于自适应预测驱动学习
发表机构 * Department of Biostatistics, City University of Hong Kong(香港城市大学生物统计学系) ; Center for Data Science, Zhejiang University(浙江大学数据科学中心)
AI总结 针对随机试验中的双变量生存结局,提出一种基于深度神经网络的自适应预测驱动方法,通过随机策略建模治疗规则并耦合边际加速失效时间模型,以最大化联合生存概率。
显微镜散射分析中的无模型估计
AI总结 提出一种基于概率框架的无模型方法MF-AIUQ,通过中间散射函数与均方位移的关系,利用边际最大似然估计从显微镜视频中直接估计均方位移,无需粒子追踪或参数模型。
Comments 18 pages, 6 figures
使用共轭梯度法构建理想观察者的高效通道
发表机构 * University of Arizona, Wyant College of Optical Sciences(亚利桑那大学光学科学学院) ; University of Arizona, Department of Radiology & Imaging Sciences(亚利桑那大学放射科与成像科学系)
AI总结 针对医学成像系统图像质量的任务评估,提出基于共轭梯度(CG)的方法构建高效通道,以近似贝叶斯理想观察者(IO)和霍特林观察者(HO)的性能。
Comments Submitted to the Journal of Medical Imaging (JMI) Special Issue Honoring Dr. Harrison H. Barrett
从经典优化到贝叶斯整合:系统性投资组合管理的全面分析
AI总结 本文通过十只美国股票在2023年9月至2025年12月期间的数据,比较了均值-方差优化、约束优化、Fama-French五因子回归、蒙特卡洛模拟和Black-Litterman模型等现代投资组合构建方法,分析了约束、风险因子、模拟近似和市场观点对投资组合配置、绩效和稳定性的影响。
马尔可夫边界在表格预测中的好、坏与丑
发表机构 * Arizona State University(亚利桑那州立大学)
AI总结 研究马尔可夫边界在表格预测中的实际效用,发现理论上最优的边界在实践中有条件地提升预测性能,但因果发现方法难以实现其潜力。
Comments 11 pages, 9 figures, 2 tables. Preprint
使用广义矩方法对含时变协变量的纵向研究进行功效估计
AI总结 本文针对含时变协变量的纵向研究,提出基于广义矩方法(GMM)的两种功效估计方法(Wald法和距离度量法),填补了GMM框架下缺乏实用功效分析工具的空白。
Comments 27 pages with appendix, 16 pages main manuscript, 3 figures in main manuscript, 7 figures including figures in appendix
低秩排序:稀疏成对比较下不确定性感知的任务特定大语言模型排名
AI总结 提出一种低秩框架,通过稀疏成对比较进行任务特定的大语言模型排名,利用任务-模型能力矩阵的低秩结构实现跨任务信息共享,并开发了不确定性量化方法以提供置信区间和排名证书。
神经缩放定律的优化器依赖性
发表机构 * Department of Computer Science and Engineering, Indian Institute of Technology Delhi(计算机科学与工程系,印度理工学院德里)
AI总结 通过随机特征回归实验,发现优化器类型系统性地影响神经缩放定律中的缩放指数α,预条件优化器产生更陡峭的缩放,并提供了光谱诊断预测高级优化器的收益。
基于核的势均场博弈与无偏随机傅里叶 $U$-统计量
发表机构 * Department of Mathematical and Computing Science, Institute of Science Tokyo(东京科学研究院数学与计算科学系)
AI总结 针对运行交互成本和终端目标成本均由再生核最大均值差异(MMD)惩罚表示的势均场博弈子类,提出一种利用核结构的计算框架,通过无偏随机傅里叶U-统计量估计成本,并证明样本级几乎必然收敛定理和显式收敛速率。
注意力作为上下文经验贝叶斯:通过粒子动力学的两阶段视角
发表机构 * Lewis-Sigler Institute for Integrative Genomics(利斯-西格尔整合基因组研究所) ; Princeton University(普林斯顿大学) ; Department of Mathematics(数学系) ; Rutgers University(罗格斯大学) ; Department of Physics and Astronomy(物理与天文学系) ; Center for Computational Quantum Physics and Center for Computational Mathematics(计算量子物理中心和计算数学中心) ; Flatiron Institute(Flatiron研究所) ; Simons Foundation(西蒙斯基金会)
AI总结 本文通过粒子动力学将最小注意力仅变换器解释为两阶段经验贝叶斯过程,揭示了深度和注意力残差的统计角色,并证明无需显式噪声调度即可实现有效去噪。
Comments 52 pages, 5 figures
基于样本分割的广义谱检验
AI总结 提出一种样本分割广义谱检验方法,用于评估线性与非线性时间序列模型的条件均值设定,通过分割样本估计参数并计算残差,避免了参数估计效应,实现了与不可行检验等价的极限分布,并通过简单乘子自助法近似。
函数型时间序列的保形预测:应用于年龄别死亡率
AI总结 针对模型不确定性,提出无模型、无分布的保形预测方法,用于构建函数型时间序列的预测区间,并通过澳大利亚年龄别死亡率数据验证其有效性。
Comments 27 pages, 4 figures, 7 tables
克里金法的快速近似预测
AI总结 针对大规模空间数据,提出一种通过局部邻域稀疏线性组合近似协方差向量的快速克里金预测方法,显著降低计算复杂度并保持精度。
Comments 11 figures, 38 pages
支付网络中的因果标签恢复
发表机构 * Mastercard(麦star卡)
AI总结 针对支付网络中标签存在的四种系统偏差,提出序列三重稳健(STR)估计器,同时纠正所有偏差并达到半参数效率界,实现基于数天而非数月数据的训练。
Comments 49 pages
结果校准回归与基于预测结果的推断
AI总结 针对OLS预测在结果条件上存在偏差的问题,提出结果校准回归(OCR)方法,通过直接强制结果校准消除条件预测偏差,实现基于预测结果的有效推断。
跨任务预测驱动推理在AI评估与社会科学研究中的应用
发表机构 * MIT(麻省理工学院)
AI总结 提出多任务预测驱动推理框架,通过跨任务重校准利用共享结构,在标签稀缺时提升统计推断效率,并证明非线性结构是跨任务增益的必要条件。
有效且高效的可能性融合
AI总结 针对推断模型(IM)框架下的可能性测度融合问题,提出一种基于排序-验证构造的通用有效性保持框架,并研究在独立性、任意依赖性和可交换性下的实现,揭示效率考量。
Comments 28 pages, 7 figures
船舶涂层破损预测与检查规划
AI总结 采用幂律非齐次泊松过程(PL-NHPP)和分层贝叶斯方法,解决数据稀缺下船舶涂层缺陷预测问题,并优化检查规划以降低生命周期成本。
用于污染溯源的排水罐中液位轨迹的贝叶斯反演
AI总结 针对污染事件中未知初始液位的反问题,提出基于贝叶斯统计反演的框架,结合托里拆利定律物理模型和经验偏差函数,从最终液位和排水时长推断初始液位并量化不确定性。
概率前向逐步框架中的贝叶斯多重校正
AI总结 本文在回归问题的概率前向逐步模型空间先验表示中,提出一种自然的贝叶斯多重校正先验分布,通过类比Holm过程实现,并与Matryoshka doll先验行为一致,论证了多重校正为回归模型空间先验设定提供了原则性且透明的标准。
Comments 2 Figures
具有个体特异性变点的响应时间潜变量模型
AI总结 提出一种包含个体特异性变点的对数响应时间潜变量模型,通过边际最大似然估计参数,并利用后验分布量化个体变点位置的不确定性。
空间个体级流行病模型的神经后验估计
AI总结 针对空间个体级流行病模型,提出使用神经后验估计(NPE)进行摊销贝叶斯推断,通过条件归一化流直接近似后验,避免推断时的似然计算,并比较了两种嵌入架构,其中图神经网络(GNN)嵌入在空间传播参数上误差更低且置信区间更窄。
深度网络会忘记初始化吗?实用归纳偏见的遗忘时间视角
发表机构 * MIT(麻省理工学院) ; Northwestern University(西北大学)
AI总结 通过引入初始化记忆度量,研究随机初始化对训练后预测器的影响,发现低学习率SGD保留初始化记忆而Adam族方法遗忘,且遗忘动力学与泛化正则化相关。
Comments 39 pages, 9 figures
私有随机决策理论在线学习的最优间隙相关遗憾
发表机构 * School of Electrical Engineering and Computer Science University of Ottawa(电气工程与计算机科学学院,渥太华大学) ; School of Mathematics University of Bristol(数学学院,布里斯托尔大学)
AI总结 针对完全信息、事件级纯差分隐私的随机决策理论在线学习,提出一种无水平线的纯差分隐私算法,并证明遗憾界为O(log K / Δ_min + log K / ε)。
面向LLM群体的任意有效联邦共形RAG
发表机构 * H. Milton Stewart School of Industrial and Systems Engineering, Georgia Institute of Technology(H.米尔顿·斯图尔特工业与系统工程学院,佐治亚理工学院)
AI总结 提出Anytime-FC-RAG,通过可累积的逐步校准偏差预算和截断投注e过程,将联邦共形RAG扩展到任意停止时间均有效的序贯覆盖,并保证时间均匀报警有效性、Hoeffding拼接累积误覆盖包络及自适应控制下的安全性。
估计广义可加指标模型的高效一阶方法
AI总结 针对广义可加指标模型(GAIM)的序贯估计计算效率低的问题,提出基于基展开的梯度下降和变分不等式算法,实现同时估计,并证明收敛到稳定点,数值实验显示优于经典方法。
分层疾病监测模型中混合与传播异质性的贝叶斯推断
AI总结 提出一种贝叶斯潜变量扩展的内生-流行病模型,用于从分层疾病监测数据中推断未观测的个体传播性、疾病发生率与流行率的分离以及人口组间混合结构。
高斯最大值的一个无尺度密度界
AI总结 针对中心化高斯向量的最大值,推导了一个无尺度密度界,该界非均匀、对数依赖于维数且适用于任意协方差矩阵,并应用于高维假设检验和反集中性等。
策略感知模拟器学习的理论基础与有效算法
发表机构 * Google Research(谷歌研究) ; Tel Aviv University(特拉维夫大学) ; Courant Institute of Mathematical Sciences(数学科学学院)
AI总结 针对模型强化学习中模拟器利用问题,提出以策略鲁棒性为目标,通过零和极小极大博弈学习模拟器,并给出理论保证与有效算法。
检查集成PCA的最大似然估计存在性的算法
AI总结 基于不变理论与统计学的桥梁,利用箭图半不变技术,提出并验证了集成PCA模型中最大似然估计存在的充要条件,并开发了易于使用的软件。
Comments 6 pages
高维稀疏更新下随机动量的动力学
发表机构 * Google DeepMind & MIT(谷歌DeepMind及麻省理工学院) ; McGill University & Mila(麦吉尔大学及MILA)
AI总结 本文通过最小二乘和逻辑回归模型,理论分析了稀疏更新下动量的动力学,揭示了由动量保留时间尺度与学习时间尺度之比决定的相结构,并发现不同令牌稀疏度下的振荡动力学存在谱冲突。
Conf-Gen: 生成模型的共形不确定性量化
发表机构 * layer6ai-labs(layer6ai实验室)
AI总结 提出Conf-Gen框架,通过共形风险控制适配生成任务,统一并扩展了共形预测在大型语言模型等生成模型中的应用,并在图像生成、对话AI和AI代理等新领域提供了形式化保证。
Comments ICML 2026
鞍点网络:凸-凹函数的结构保持架构
AI总结 提出一种结构保持的分离分解方法,并基于混合Monge型凸性条件证明一维逼近定理,进而设计出通过构造保持凸-凹几何的实用鞍点网络架构,在光滑、非光滑和高秩凸-凹测试函数上实现高精度。
迈向连续时间因果基础模型
发表机构 * National University of Singapore(新加坡国立大学) ; Imperial College London(帝国理工学院伦敦分校) ; Department of Mathematics, Centre for Quantitative Finance, Risk Management Institute, National University of Singapore(新加坡国立大学数学系、量化金融中心、风险管理研究所)
AI总结 提出轨迹律对观测时间表不变的连续性准则,通过细网格积分与解耦观测实现连续时间因果先验模型,并在线性与非线性先验上验证其优于离散方法。
Comments ICML 2026 2nd Workshop on Foundation Models for Structured Data (FMSD)
桥接最大似然与最优传输:随机块模型中的高效推理与模型选择
发表机构 * Université Côte d’Azur(法国蔚蓝海岸大学) ; Inria(法国国家信息与自动化技术研究院) ; CNRS LJAD(法国国家科学研究中心LJAD实验室) ; Maasai Nice, France(法国尼斯马萨伊研究所) ; EPFL Lausanne, Switzerland(瑞士洛桑联邦理工学院) ; CNRS CEPAM(法国国家科学研究中心CEPAM实验室)
AI总结 本文通过最优传输视角研究随机块模型,提出正则化与未正则化的半松弛Gromov-Wasserstein估计器,实现聚类与模型参数的联合推断及簇数自动选择。
Comments 10 pages, 8 figures
通过工具变量交互作用的结构性加速失效时间模型的识别与推断
AI总结 针对存在未测量混杂的右删失时间-事件结局,提出一种利用工具变量交互作用进行识别和推断的框架,无需经典工具变量有效性假设,并采用增强逆概率删失加权和广义经验似然方法实现稳健推断。
现代Hopfield网络中的持续学习及其在扩散模型中的应用
发表机构 * Graduate School of Arts and Science, The University of Tokyo(东京大学艺术与科学研究生院) ; Artificial Intelligence Research Center, AIST(AIST人工智能研究中心)
AI总结 通过现代Hopfield能量分析扩散模型中的持续学习,证明高能量异常样本更容易被遗忘,并基于能量选择重放样本以缓解遗忘。
任意协方差依赖下自适应单调逐步多重检验程序的可容许性
AI总结 针对任意协方差依赖下多元正态均值的同步检验问题,建立了一类基于残差的自适应单调逐步下降多重检验程序的可容许性定理,证明其关于向量值损失函数是可容许的。
停止抑制尾部:极端事件的因果推断
发表机构 * Eichi Uehara
AI总结 针对重尾结果,提出一种平均剂量-响应函数(ADRF)估计器,通过基于中位数中心化的尾部诊断(PDHTE+JK)打破循环依赖,输出结构化尾部形状和深层尾部风险指标,在极端事件预测中显著优于传统方法。
Comments 22 pages, 6 figures, 13 tables. Keywords: double machine learning, dose-response, heavy tails, extreme value theory, causal inference
基于树引导特征聚合的非参数回归
AI总结 针对协变量具有层次树结构的回归问题,提出一种基于惩罚的Nadaraya-Watson型估计器KR-TEXAS,通过自适应惩罚权重同时实现模型选择和特征聚合,并证明了模型选择一致性。
非线性时间序列中的函数值因果影响
发表机构 * Lucy Family Institute for Data \& Society, University of Notre Dame, Notre Dame, Indiana, USA. ; Department of Political Science, University of Notre Dame, Notre Dame, Indiana, USA
AI总结 针对非线性时间序列因果发现中常用标量评分掩盖状态依赖函数效应的问题,提出基于个体条件期望的框架从神经加性向量自回归模型直接估计因果响应函数,揭示标量评分无法区分的多种函数行为。
Comments 26 pages, 6 tables, 8 figures
异方差误差和聚类测量下Michaelis-Menten模型的方差感知估计与推断
AI总结 针对Michaelis-Menten模型,提出一种基于条件矩约束的方差感知估计与推断方法,通过简单条件高斯工作模型实现单曲线和聚类数据的参数估计,改善了异方差和聚类结构下的推断效率。
自监督拉普拉斯近似用于贝叶斯不确定性量化
发表机构 * Rational Intelligence Lab, CISPA Helmholtz Center for Information Security Department of Statistics, LMU Munich(理性智能实验室,CISPA海德堡信息安全中心统计学系,慕尼黑大学) ; Department of Statistics, LMU Munich(统计学系,慕尼黑大学) ; Department of Computer Science, The University of Manchester(计算机科学系,曼彻斯特大学)
AI总结 提出自监督拉普拉斯近似(SSLA),通过重新拟合自预测数据直接近似后验预测分布,实现确定性、无采样的贝叶斯不确定性量化,并在回归任务中优于经典拉普拉斯近似。
Comments Accepted for publication in TMLR (https://openreview.net/forum?id=T8w8L2t3JG), v2: fixed typos and added a deceased-author footnote with a dedication to Thomas Augustin
Journal ref Transactions on Machine Learning Research (TMLR). ISSN 2835-8856 (2026)
大规模和在线高斯过程预测问题的快速且精确的条件化方法
AI总结 提出一种通过精心设计的线性组合进行条件化的方法,以指数级收敛速度实现大规模高斯过程预测,并支持在线预测。
使用两阶段核岭回归估计连续治疗效果
发表机构 * Department of IEOR, Columbia University(哥伦比亚大学工业工程与运营研究系) ; Department of IEOR and Data Science Institute, Columbia University(哥伦比亚大学工业工程与数据科学研究所)
AI总结 针对连续治疗的效果函数估计问题,提出两阶段核岭回归方法,通过第一阶段建模响应与治疗和协变量的关系,第二阶段构造伪结果校正分布偏移,无需估计条件治疗密度即可达到最优学习界,并实现数据驱动的模型选择。
基于离模型训练和重要性采样的自适应学习用于完全非马尔可夫最优随机控制(完整版)
发表机构 * Departamento de Matemática, Universidade de Brasília(数学系,巴西利亚大学) ; Università di Pisa, DEM(比萨大学,DEM) ; Université Paris Cité, LPSM(巴黎Cité大学,LPSM)
AI总结 针对完全非马尔可夫且依赖未知模型参数的连续时间随机控制问题,提出一种基于离散骨架和重要性采样的蒙特卡洛学习方法,实现离模型训练架构和自适应参数更新,并给出非渐近误差界。
Comments Typos are fixed. Numerical experiment is revised
MEC:基于机器学习的广义熵校准用于半监督均值估计
发表机构 * Texas A\&M University(德克萨斯A&M大学) ; Iowa State University(爱荷华州立大学)
AI总结 提出MEC方法,通过交叉拟合校准加权改进预测驱动推断,在半监督均值估计中实现半参数效率界,并提升置信区间覆盖率和精度。
随机饱和设计中估计簇内和簇间溢出效应
AI总结 针对随机饱和设计中单位跨簇交互导致簇间溢出效应的问题,基于潜在结果框架提出估计簇内和簇间溢出效应的因果推断方法,并建立估计与推断的统计理论。
Comments To appear in Social Networks
聚合模型而非解释:改进特征重要性估计
发表机构 * Roche Pharma Research \& Early Development, Roche Innovation Center Basel, F. Hoffmann-La Roche Ltd, Basel, Switzerland ; Universite Paris-Saclay, Inria, CEA, Palaiseau, France
AI总结 针对特征重要性估计不准确的问题,本文通过理论分析证明模型级集成比解释级集成能更有效地降低误差,并在基准和蛋白质组学数据上验证。
选择树提升的超参数
发表机构 * Seminar for Statistics, ETH Zurich(苏黎世联邦理工学院统计研究所)
AI总结 本文通过59个数据集比较了多种超参数优化方法,发现SMAC方法显著优于其他方法,并揭示了超参数调优的关键因素。
黎曼环境流:面向从损坏数据同时进行流形学习和生成建模
发表机构 * Department of Mathematics, University of California, Los Angeles(数学系,加州大学洛杉矶分校) ; Department of Statistics and Data Science, University of California, Los Angeles(统计与数据科学系,加州大学洛杉矶分校)
AI总结 提出Riemannian AmbientFlow框架,通过变分推断和数据驱动黎曼几何,从损坏观测中同时学习概率生成模型和非线性数据流形,并理论保证误差可控与双Lipschitz流形参数化。
BITS for GAPS:用于层次高斯过程代理的贝叶斯信息论采样
发表机构 * Department of Chemical and Biomolecular Engineering, University of Notre Dame, Notre Dame, IN 46556, USA(化学与生物分子工程系,诺特大学)
AI总结 提出BITS for GAPS框架,通过贝叶斯层次建模将超参数不确定性传播到采样准则中,实现基于高斯过程代理模型的信息论实验设计,并在汽液平衡案例中验证其提升预测精度和信息增益的效果。
Journal ref Computers & Chemical Engineering, 197, 109041 (2026)
超越准确性:时间序列基础模型是否良好校准?
发表机构 * Department of Computer Science(计算机科学系) ; Department of Statistics(统计学系) ; Google, Irvine(谷歌(伊文斯堡))
AI总结 本文系统评估了五个时间序列基础模型和两个基线的校准特性,发现基础模型校准优于基线且无系统性过度自信或信心不足。
Comments Published as a conference paper at ICLR 2026
Journal ref Proceedings of ICLR 2026
解耦赌博机的跟随扰动领导者:两全其美与实用性
发表机构 * Seoul National University, Seoul, Korea(首尔国立大学,韩国首尔) ; Korea Institute of Science and Technology, Seoul, Korea(韩国科学技术院,韩国首尔)
AI总结 针对解耦多臂赌博机问题,提出一种高效的跟随扰动领导者策略,在随机环境下实现常数遗憾,在对抗环境下实现最优O(√KT)遗憾,且避免了凸优化和重采样过程,显著降低计算成本。
Comments Accepted to ICML 2026, 31 pages
高斯从属过程的极值理论
AI总结 本文研究高斯从属过程的极值理论,通过改进方法、推广到多元设置并引入m-极值依赖概念,建立了点过程弱收敛和多元极值极限定理。
Comments 32 pages; revised based on reviewer's comments
生成模型的分布约束校准
发表机构 * Stanford University, Palo Alto, CA USA(斯坦福大学)
AI总结 针对生成模型采样分布统计量偏离期望的校准问题,提出将校准形式化为受约束优化问题,并通过松弛损失和奖励损失两种替代目标进行微调,在蛋白质设计、图像生成和语言建模等应用中显著降低了数百个同时约束下的校准误差。
Comments To appear at the International Conference on Machine Learning (ICML), 2026. Codebase accompanying the paper is available at: https://github.com/smithhenryd/cgm
SADA:半监督学习中多个黑箱预测的安全自适应聚合
发表机构 * Department of Biostatistics & Medical Informatics, University of Wisconsin-Madison(生物统计与医学信息学系,威斯康星大学麦迪逊分校) ; Department of Statistics, University of Wisconsin-Madison(统计学系,威斯康星大学麦迪逊分校)
AI总结 提出一种安全自适应聚合多个不确定质量黑箱预测的方法,保证不劣于仅用标注数据,并在存在完美预测时实现更快收敛或半参数效率界。
先规定后选择:面向情境随机优化的自适应策略选择
AI总结 针对情境随机优化中候选策略在协变量空间表现异质的问题,提出Prescribe-then-Select模块化框架,通过构建可行策略库并基于最优策略树集成学习元策略实现数据驱动的自适应选择,在单阶段报童和两阶段运输规划问题中优于单一最优策略。
风险规避的公平多类分类
发表机构 * Department of Mathematical sciences(数学科学系) ; Stevens Institute of Technology(史蒂文斯理工学院)
AI总结 基于一致风险度量与系统性风险理论,提出一种适用于噪声、稀缺和标签不可靠数据的风险规避多类分类框架,并通过非线性聚合的系统方法设计两阶段随机规划及正则化分解算法,同时实现公平性增强。
从次线性到线性:通过局部Polyak-Lojasiewicz区域在有限宽度网络中的局部收敛
发表机构 * Stanford University(斯坦福大学) ; University of Louisiana at Lafayette(路易斯安那州立大学拉法叶分校) ; Presidency College Kolkata, India(印度科利切斯特 Presidency 学院)
AI总结 本文研究有限宽度前馈网络在平方经验损失下梯度下降的局部线性收敛,通过局部Polyak-Lojasiewicz不等式和NTK正定性条件,证明了在局部拟凸区域内可实现线性收敛。
轨道几何监测的传感器融合:通过卡尔曼滤波集成车载状态监测与退化模型
AI总结 本研究提出一种通过卡尔曼滤波融合低成本车载传感器振动信号与退化模型的方法,以提升轨道几何预测的可靠性,并实验验证了频繁传感器数据能显著降低预测不确定性。
用可解释的特征归因解释概念漂移
发表机构 * Carnegie Mellon University(卡内基梅隆大学)
AI总结 提出SGShift方法,通过将概念漂移建模为特征选择任务,利用广义加性模型、敲除和吸收等统计工具识别导致源域与目标域模型性能差异的稀疏漂移特征。
合作方差估计与贝叶斯神经网络用于分离偶然不确定性和认知不确定性
发表机构 * Faculty of Mechanical Engineering, Delft University of Technology, Mekelweg 2, Delft, 2628 CD, The Netherlands(代尔夫特理工大学机械工程学院) ; School of Engineering, Brown University, 184 Hope St., Providence, RI 02912, USA(布朗大学工程学院)
AI总结 提出通过合作训练方差估计网络与贝叶斯神经网络,实现偶然不确定性与认知不确定性的分离,并提升均值估计性能。
Comments 38 pages, 26 figures
不变图像重参数化:连接符号与数值方法进行可辨识性分析、模型简化与预测
AI总结 本文提出不变图像重参数化(IIR)方法,通过将符号重参数化条件替换为单参考点的数值导数计算,实现模型降维、可辨识性分析与预测。
Comments 41 pages incl. supplementary material (main text approx. 28 pages)
噪声感知的差分隐私变分推断
发表机构 * University of Helsinki(赫尔辛基大学)
AI总结 针对差分隐私导致下游推断不可靠的问题,提出一种基于随机梯度变分推断的噪声感知近似贝叶斯推断方法,可应用于高维和非共轭模型,并改进了后验评估精度。
Comments 26 pages, 4 figures
具有泛化鲁棒性的认证因果防御
发表机构 * Case Wester Reserve University(凯斯西储大学) ; University of Virginia(弗吉尼亚大学)
AI总结 提出GLEAN框架,通过可认证因果因子学习解耦因果关系与虚假相关性,并设计因果认证防御策略,实现跨分布偏移域的鲁棒性泛化。
Comments Accepted by AAAI 2025
贝叶斯结构化中介分析:存在未观测混杂因素
AI总结 针对具有空间平滑结构的高维中介变量(如脑成像数据)中未观测混杂因素影响的问题,提出贝叶斯结构化中介分析(BASMU)框架,通过引入潜在个体效应作为未观测混杂因素来去偏中介效应,并建立模型可识别性条件与两阶段估计算法。
固定边概率网络模型的参数自助法
AI总结 针对Chung-Lu模型下的网络统计量不确定性量化问题,提出一种两层自助法以消除参数自助法的偏差,并构建更精确的置信区间。
物理信息神经网络的贝叶斯推理
发表机构 * Institute for Theoretical Physics, University of Wroc aw(沃拉夫大学理论物理研究所) ; Institute of Low Temperature and Structure Research(低温与结构研究所) ; Polish Academy of Sciences(波兰科学院)
AI总结 提出一种基于证据驱动的贝叶斯物理信息神经网络方法,通过拉普拉斯近似高效计算模型证据,自动优化偏微分方程残差、边界条件和观测数据之间的损失权重,并在热方程、波动方程和伯格斯方程上验证了其求解精度与不确定性量化能力。
Comments 21 pages, 12 figures, re-edit the description of the Bayesian framework, some of the content moved to Appendix. Discussion of numerical performance added, as well as related approaches
Journal ref Phys. Rev. E 113, 055307 (2026)
微正则哈密顿蒙特卡洛
AI总结 本文提出微正则哈密顿蒙特卡洛(MCHMC),通过固定能量哈密顿动力学和能量守恒的动量反弹实现遍历性,并开发了连续方向保持反弹的欠阻尼朗之万变体(MCLMC),在多个基准问题上性能优于NUTS HMC一个数量级以上。
Comments 34 pages, 11 figures