arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2605.08072 2026-05-11 stat.ML cs.DS cs.LG math.ST stat.TH

A Note on Non-Negative $L_1$-Approximating Polynomials

Jane H. Lee, Anay Mehrotra, Manolis Zampetakis

AI总结本文研究了在高斯分布下具有非负性的 $L_1$-逼近多项式的存在性，这类多项式在逼近指示函数时不仅满足 $L_1$-范数误差要求，还保证输出非负。作者证明了对于具有有限高斯表面面积（GSA）的集合类，存在次数为 $\tilde{O}(Γ^2/\varepsilon^2)$ 的非负多项式，能够以 $\varepsilon$ 的误差逼近其指示函数。该结果在保持 $L_1$-逼近能力的同时，提供了更强的点态保证，并且与当前最优的无非负性约束的高斯 $L_1$-逼近多项式次数相差仅常数因子。

2605.08071 2026-05-11 econ.EM cs.HC stat.ME

Vibe Econometrics and the Analysis Contract

Lydia Ashton

AI总结本文探讨了“vibe方法论”在经济学中的应用，指出人工智能辅助的因果分析（即“vibe计量经济学”）在提升效率的同时，也带来了新的方法与数据不匹配、置信度漂白和隐形分叉等失效模式。文章提出“分析契约”框架，通过预分析计划和因果路线图的改进，为AI辅助下的因果推断提供一种治理机制，以增强结果的可信度和可审查性。

Comments 20 pages, 2 figures. Appendices A-C (fillable templates) provided as ancillary file. Companion materials: https://github.com/lydiaashton/vibe-econometrics-supp . Also posted on SSRN: https://doi.org/10.2139/ssrn.6699999

详情

英文摘要

"Vibe coding" and "vibe analytics" have been framed as a democratization of technical capability. This paper argues that AI-assisted methodology more broadly, or what I call "vibe methodology," also democratizes the failure modes specific to each domain. When AI assists with methods whose validity depends on assumptions that cannot be verified from the output alone (a class I call "vibe inference"), the failure surface is structurally different: the output does not reliably signal invalidity, and when it does, recognizing the signal requires the expertise the workflow bypasses. I focus on "vibe econometrics," the subset of AI-assisted causal analysis where identification can be named faster than it can be audited. The claim of this paper is not that AI invents inferential failures that did not previously exist, but that it changes their incidence, observability, and persuasive force enough to create a practically distinct governance problem. This results in three failure modes: method-data mismatch, where AI bypasses expertise at execution; confidence laundering, where AI amplifies the credibility of formatted output; and invisible forking, which spans both. What is new is not the failure modes but AI's industrialization of their packaging. The barrier between naming a method and executing it has collapsed, and weak foundations, dressed as rigorous analysis, now reach audiences at a scale, speed, and polish that previously required expertise. I propose the Analysis Contract, a pre-commitment framework that adapts the logic of pre-analysis plans and the Causal Roadmap to the AI-assisted setting. The contract imposes three conditions before a causal claim is made: a method-data contract, a data audit, and a pre-commitment statement defining what would count as a disconfirming result. The framework generalizes across domains of vibe inference through domain-specific instantiation.

URL PDF HTML ☆

赞 0 踩 0

2605.08069 2026-05-11 stat.ME stat.ML

Empirical Bayes Rebiasing

Wanyi Ling, Sida Li, Junming Guan, Nikolaos Ignatiadis

AI总结本文研究如何同时分析大量存在噪声和偏差的估计值，并且每个估计值还配有一个更加噪声的偏差估计。为了解决传统去偏方法导致方差增大、置信区间过长的问题，作者提出了一种经验贝叶斯再偏差方法，通过从完全去偏的估计中学习未知的偏差分布，从而合理地重新引入偏差。该方法在预测驱动的推断任务和基于家系的全基因组关联研究中均表现出显著的精度提升。

2605.08051 2026-05-11 astro-ph.SR stat.ML

Inferring Asteroseismic Parameters from Short Observations Using Deep Learning: Application to TESS and K2 Red Giants

Nipun Ghanghas, Siddharth Dhanpal, Shravan Hanasoge, Praneeth Netrapalli, Karthikeyan Shanmugam

AI总结本文利用深度学习方法，从短时间观测数据中推断红巨星的星震学参数，如频率分离（Δν）和最大振幅频率（ν_max），并应用于TESS和K2任务数据。研究提出了一种高效的机器学习方法，在处理TESS单月观测数据时，能够对约23%的恒星可靠推断Δν，而在K2数据中则能对约200颗年轻红巨星可靠推断重力模周期间隔（ΔΠ₁）。该方法为大规模星震学数据分析提供了可行的技术方案。

Comments 43 pages, 22 figures, 5 tables. Under review at ApJ

2605.08046 2026-05-11 stat.ME

Semi-supervised Method for Risk Prediction with Doubly Censored EHR Data

Jie Zhou, Enhao Wang, Xuan Wang

AI总结随着电子健康记录（EHR）数据的快速增长，如何更准确高效地进行临床风险预测成为重要课题。然而，由于临床事件可能发生在记录系统之外，导致数据存在双重截断（左截断和右截断）问题，且高质量的事件时间标签获取困难，仅依赖少量标签数据效率有限。本文提出了一种半监督学习方法，结合少量高质量标签与大量易获取的替代性结局数据，在双重截断条件下进行风险预测，理论分析与模拟实验表明该方法显著提升了预测效率，并在2型糖尿病风险因素分析中验证了其实际应用价值。

2605.08034 2026-05-11 stat.ML cs.LG

Semiparametric Efficient Test for Interpretable Distributional Treatment Effects

Houssam Zenati, Arthur Gretton

AI总结该研究提出了一种名为DR-ME的半参数高效测试方法，用于检测可解释的分布性处理效应。该方法能够在观测数据中识别出处理对结果分布不同位置的影响，而不仅仅是整体差异，通过学习关键结果位置并结合正交的双重稳健核特征，实现了对分布尾部、模式等变化的精确检测。实验表明，DR-ME在控制第一类错误率和检测能力方面表现优异，并能有效定位医学影像研究中的分布性处理效应。

2605.08027 2026-05-11 stat.ME stat.AP

Randomization Tests for Distributions of Individual Treatment Effects via Combined Rank Statistics

David Kim, Yongchang Su, Jake Bowers, Xinran Li

AI总结本文研究如何在随机实验中推断个体处理效应的分布，如受益比例、中位效应等。作者提出了一种自适应结合多个秩统计量的检验方法，在不依赖先验知识的情况下保持有限样本有效性，并针对分层实验设计了有效聚合不同层信息的加权方案。该方法在实际应用中表现出比单一检验更高的功效，例如在教师培训项目的评估中，综合检验显示约一半受训教师受益，而单一检验可能仅显示少数受益。

2605.08018 2026-05-11 stat.ME

BAMIFun: Bayesian Multiple Imputation for Functional Data

Ziren Jiang, Lei Xuan, Eric F. Lock, Erjia Cui

AI总结本文提出了一种用于函数型数据的贝叶斯多重插补方法BAMIFun，旨在解决现代函数型数据中轨迹观测稀疏或不规则导致的缺失值问题。该方法基于贝叶斯低秩模型和惩罚样条表示，有效提升了插补的平滑性和推断可靠性，并通过Gibbs采样算法实现后验计算。此外，研究还扩展了该框架以处理多维函数型数据，通过低秩函数张量奇异值分解（FTSVD）模型实现了现有方法无法支持的场景下的多重插补。实验表明，BAMIFun在插补精度和下游推断的置信度方面均优于现有方法。

Comments 2 Tables, 3 Figures

2605.08011 2026-05-11 cs.AI stat.CO

Abductive Reasoning with Probabilistic Commonsense

Joseph Cotnareanu, Chiara Roverato, Han Zhou, Didier Chetelat, Yingxue Zhang, Mark Coates

AI总结该研究旨在提升大语言模型的推理能力，特别是解决其在处理需要常识推理的问题时的不足。提出了一种概率框架，用于建模不同个体对常识信念的差异，并引入了名为PACS的新算法，通过结合大语言模型与形式化求解器，从多个样本中聚合结论，以判断多数人是否会认为某个陈述为真或假。实验表明，PACS在多个基准测试中优于现有的推理方法。

2605.08006 2026-05-11 math.OC cs.LG stat.ML

Penalty-Based First-Order Methods for Bilevel Optimization with Minimax and Constrained Lower-Level Problems

Yiyang Shen, Yutian He, Weiran Wang, Qihang Lin

AI总结本文研究了一类具有上下层均为极小极大结构的双层优化问题，这类问题在许多新兴应用中具有广泛代表性。为了解决现有方法在处理下层为极小极大问题时的不足，作者提出了一种基于惩罚函数的一阶优化方法，无需假设下层问题强凸，即可高效求解。在确定性设置下，该方法能够以 $\tilde{O}(ε^{-4})$ 的计算复杂度找到 $ε$-KKT 点，并在随机设置下也给出了相应的复杂度分析，显著优于现有结果。

2605.08002 2026-05-11 stat.ME math.ST stat.TH

Cellwise and Casewise Robust Multivariate Regression with Inference

Fabio Centofanti, Mia Hubert, Peter J. Rousseeuw

AI总结本文研究了在存在案例型和单元型异常值、缺失数据及高维特征情况下的多元线性回归问题，提出了一个鲁棒的多元回归估计方法——单元多元回归（cellMR），该方法结合了单元鲁棒协方差估计和岭正则化，能够同时处理多种数据污染问题。此外，作者还提出了一种基于自助法的推断方法cellBoot，能够在存在异常值的情况下提供渐近有效的置信区间，并通过模拟和基因组实际应用验证了方法的有效性。

2605.08001 2026-05-11 math.ST stat.ME stat.TH

Scale selection for geometric medians on product manifolds

Kisung You

AI总结本文研究了在乘积流形上几何中位数的尺度选择问题，指出直接联合优化位置和尺度会导致尺度退化到边界，从而使问题退化为边缘中位数，丢失一个因子的信息。为此，作者提出了三种改进方法，分别从敏感性路径、鲁棒尺度校准和平衡方程等角度出发，确保尺度估计的稳定性、一致性及单位不变性，并通过仿真验证了方法在欧几里得和Bures-Wasserstein空间中的有效性。

2605.07993 2026-05-11 cs.LG stat.ME

Bayesian Sensitivity of Causal Inference Estimators under Evidence-Based Priors

Nikita Dhawan, Daniel Shen, Leonardo Cotta, Chris J. Maddison

AI总结因果推断，尤其是在观察性研究中，依赖于对真实数据生成过程的不可检验假设。本文提出了一种基于现实证据构建先验的贝叶斯敏感性分析方法，用于评估因果估计量对三种常见假设的敏感性，克服了传统最坏情况分析可能过于悲观或与先验知识冲突的问题。该方法引入了贝叶斯敏感性值（BSV），通过蒙特卡洛近似计算估计量在假设违反下的期望敏感性，并在糖尿病治疗对体重影响的观察性研究中验证了其有效性。

Comments TMLR 2026

2605.07980 2026-05-11 cs.LG cond-mat.stat-mech math.ST stat.TH

Susceptibilities and Patterning: A Primer on Linear Response in Bayesian Learning

Chris Elliott, Daniel Murfet

AI总结本文介绍了在神经网络解释中发展的易感性理论，用于分析贝叶斯学习中的线性响应。易感性定义为可观测量对数据扰动的后验期望导数，根据涨落-耗散定理等价于后验协方差。通过不同可观测量的选择，可得到不同对象，如样本损失对应影响矩阵，局部组件可观测量对应结构易感性矩阵，该矩阵与数据模式和模型组件的映射有关，并可用于寻找实现特定结构变化的数据扰动。文章从统计力学基础出发，详细阐述了易感性及其估计方法与损失景观几何的关系。

Comments 34 pages, 3 figures, comments welcome!

2605.07972 2026-05-11 cs.LG cs.AI stat.ML

It Just Takes Two: Scaling Amortized Inference to Large Sets

Antoine Wehenkel, Michael Kagan, Lukas Heinrich, Chris Pollard

AI总结本文研究了如何将免计算推断扩展到大规模观测集合的问题，提出了一个简单且理论基础扎实的方法，将表示学习与后验建模解耦。该方法通过在最多包含两个元素的集合上训练一个均值池化Deep Set模型，生成的编码器能够泛化到任意规模的集合，从而显著降低了训练成本并提升了推断效率。实验表明，该方法在多种高维条件生成任务中表现优异，计算成本仅为传统方法的一小部分。

2605.07970 2026-05-11 math.ST cs.LG stat.TH

Linear Response Estimators for Singular Statistical Models

Chris Elliott, Daniel Murfet

AI总结本文研究了一类统计模型在数据扰动下可观测量的响应特性，定义了用于衡量这种响应的“易感度”指标。作者提出了一种针对这些易感度的估计方法，并证明了在数据量趋于无穷大时，这些估计量具有一致性和渐近无偏性。该研究为理解复杂统计模型对数据变化的敏感性提供了理论基础和实用工具。

Comments 24 pages, comments welcome!

2605.07967 2026-05-11 math.ST stat.TH

Density Estimation Using the Sinc Kernel

Ingrid Kristine Glad, Nils Lid Hjort, Nikolai G. Ushakov

AI总结本文研究了一种基于sinc核（或傅里叶积分核）的密度估计方法，该核函数为 $K(x)=(πx)^{-1}\sin x$。通过详细分析该估计器的渐近性质和有限样本性质，研究发现与普遍看法相反，sinc核密度估计器在多个方面优于其他估计器，包括样本量适中时的精度更高、在非光滑密度情况下的渐近性能更优，以及带宽选择更为方便等。

Comments 20 pages, no figures. Preprint, Department of Mathematical Statistics, Norwegian University of Science and Technology, Trondheim, no. 2, 2007; arXiv'd for broader visibility and for direct use in a forthcoming paper

2605.07939 2026-05-11 math.ST cs.NA math.NA stat.TH

Accelerating Langevin Monte Carlo via Efficient Stochastic Runge--Kutta Methods beyond Log-Concavity

Bin Yang, Xiaojie Wang

AI总结本文研究了如何通过高效的随机Runge-Kutta方法加速高维概率分布采样中的朗之万蒙特卡洛（LMC）算法。提出了一种基于强阶为1.5的随机Runge-Kutta方法的高阶、无需Hessian矩阵的LMC算法，相比现有方法每迭代仅需两次梯度计算，计算效率更高。在非对数凹条件下的非渐近误差界分析表明，该算法具有与现有工作相同量级的收敛速率，数值实验验证了其有效性。

2605.07908 2026-05-11 math.ST cs.AI cs.LG stat.TH

Statistical inference with belief functions: A survey

Fabio Cuzzolin

AI总结本文综述了基于信任函数的统计推断方法，重点探讨了在数据不足的情况下如何从统计数据中学习信任度量的问题。文章回顾了该领域的重要研究成果，总结了相关的核心方法与理论进展，为不确定性建模提供了有效的数学框架。

Comments 9 pages, 0 figures

2605.07907 2026-05-11 stat.ML cs.CV cs.LG

Consistency Regularised Gradient Flows for Inverse Problems

Alessio Spagnoletti, Tim Y. J. Wang, Marcelo Pereyra, O. Deniz Akyildiz

AI总结本文提出了一种基于一致性正则化的梯度流方法，用于解决逆问题，通过统一的欧几里得-沃瑟斯坦2梯度流框架，在潜在空间中联合进行后验采样和提示优化，从而减少计算成本并提升重建质量。该方法结合少量步骤的潜在文本到图像模型，避免了通过自动编码器进行反向传播，显著降低了神经函数评估次数，实验表明其在多个经典成像逆问题中达到了最先进的性能。

2605.07886 2026-05-11 stat.ML cs.LG

Characterizing and Correcting Effective Target Shift in Online Learning

Ziyan Li, Naoki Hiratani

AI总结本文研究了在线学习中由于分布偏移导致的有效目标漂移问题，通过核回归的视角揭示了在线学习与离线学习之间的关系，并推导出在线核回归等价于使用漂移目标输出的离线回归。通过目标校正方法，论文证明了在线学习可以与离线学习达到相同的预测性能，并提出了闭式和迭代式的目标修正方法。实验表明，该方法在持续学习任务中优于使用真实目标的在线梯度下降方法，为非平稳环境下的在线学习提供了分析与改进的理论框架。

Comments 22 pages; 6 figures

2605.07878 2026-05-11 cs.LG stat.ML

Black-box model classification under the discriminative factorization

Hayden Helm, Merrick Ohata, Carey Priebe

AI总结本文研究了在黑盒模型分类任务中如何通过查询集区分模型特性的问题。作者提出了一种判别因子分解方法，用于评估查询集质量，并证明在该框架下，随机分类的概率会随查询预算指数级下降。实验表明，基于估计的判别因子选择的查询集能够有效重现最优查询集的性能排序，为黑盒模型分析提供了新的理论依据和实用工具。

2605.07852 2026-05-11 stat.ME

CHASM: Online Changepoint Detection in Temporal and Cross-Variable Dependence

Victor K. Khamesi, Edward A. K. Cohen, Niall M. Adams, Dean A. Bodenham

AI总结本文提出了一种名为CHASM的在线非参数方法，用于检测多变量时间序列中跨变量和时间依赖关系的变化。该方法通过递归估计动态模式分解算子的截断特征值序列进行监测，有效解决了传统方法在捕捉全局结构时的不足。研究还解决了特征分解的排列不变性问题，并设计了适用于复值时间序列的在线监测方案，理论分析表明其在向量自回归模型下具有良好的性能，实验显示其在合成和实际数据集上均表现优异，且无需分布假设，具有广泛的应用前景。

Comments 11 pages, 5 figures, and supplementary (53 pages total)

2605.07834 2026-05-11 stat.ME stat.AP

GenAI Powered Dynamic Causal Inference with Unstructured Data

Kentaro Nakamura, Kosuke Imai

AI总结本文研究如何利用生成式人工智能（GenAI）模型从非结构化数据（如文本、图像和视频）中进行动态因果推断。作者提出了一种统计框架，通过从GenAI模型中提取内部表示，并结合神经网络架构联合学习去混杂因素，从而估计序列治疗特征的因果效应。该方法能够在有限样本下生成有效的渐近置信区间，并在模拟研究和香港示威活动的随机实验中验证了其有效性与准确性。

2605.07829 2026-05-11 stat.ME math.PR

Parametric ROC Analysis and Optimal Cutoff Selection under Scale Mixtures of Skew-Normal Distributions: A Decision-Theoretic Framework with Asymptotic Inference

Renato de Paula, Helena Mouriño, Tiago Dias Domingues

AI总结本文研究了在二分类问题中，针对连续生物标志物选择最优阈值的问题，提出了一种基于偏斜正态尺度混合分布（SMSN）的参数化ROC分析框架。该方法考虑了疾病流行率和非对称误分类成本的影响，通过最小化加权误分类风险定义最优阈值，并在满足单调似然比条件下证明了其存在性、唯一性和全局最优性。研究表明，该方法在实际应用中可显著降低误分类风险，尤其在非对称决策场景下效果更为明显。

Comments 42 pages, 3 figures

详情

英文摘要

We study an optimal threshold functional arising in binary classification for continuous biomarkers. While the ROC curve summarizes discriminatory performance across all thresholds, practical threshold selection must also account for disease prevalence and asymmetric misclassification costs. The classical Youden index corresponds to a symmetric special case and may therefore be suboptimal in realistic decision settings. In addition, biomarker distributions in serological and immunological studies often display skewness and heavy tails, making Gaussian ROC models inadequate. We develop a parametric framework for ROC analysis and optimal cutoff selection under the family of scale mixtures of skew-normal (SMSN) distributions, including the skew-normal and skew-t models. The ROC curve and AUC are estimated by plug-in maximum likelihood from separate group fits. The optimal cutoff is defined as the minimiser of a weighted misclassification risk, which yields a likelihood ratio equation extending the Youden criterion. Under a monotone likelihood ratio condition, we establish existence, uniqueness, and global optimality of the cutoff. We further study its local regularity as an implicitly defined functional of the model parameter and derive consistency, asymptotic normality, and a closed-form plug-in variance estimator. A central term in this variance is the local slope of the estimating equation at the optimal threshold, which acts as a local identifiability diagnostic. Monte Carlo experiments across six scenarios show that the asymptotic approximation is accurate and that Wald confidence intervals attain near nominal coverage. An application to SARS-CoV-2 serological data illustrates that the proposed cutoff can differ substantially from the Youden threshold and may reduce estimated misclassification risk by up to 63% under asymmetric decision settings.

URL PDF HTML ☆

赞 0 踩 0

2605.07775 2026-05-11 cs.LG cs.AI stat.ML

POETS: Uncertainty-Aware LLM Optimization via Compute-Efficient Policy Ensembles

Nicolas Menet, Andreas Krause, Abbas Rahimi

AI总结 POETS 是一种基于策略集成的不确定性感知大语言模型优化框架，旨在解决序贯决策与黑箱优化中的探索与利用平衡问题。该方法通过隐式编码奖励函数并直接训练策略集成体，避免了传统不确定性感知奖励模型的复杂训练过程，同时利用共享预训练主干与独立低秩适配分支的高效架构，显著降低了计算和内存开销。理论分析表明，POETS 实现了KL正则化的汤普森采样，具有优秀的累积遗憾界，实验显示其在蛋白质搜索、量子电路设计等科学发现任务中表现出领先的样本效率和优化性能。

Comments preprint

2605.07746 2026-05-11 stat.ML cs.LG q-bio.QM

Flow Matching for Count Data

Ganchao Wei, John Pearson

AI总结本文研究了高维计数数据（如单细胞RNA测序和神经脉冲序列）的生成建模问题，提出了一种基于连续时间出生-死亡过程的流匹配框架count-FM。该方法通过模拟自由的方式学习计数空间中的边际转移率，实现了在任意计数分布源和目标之间进行高效的生成与迁移。实验表明，count-FM在样本质量、模型效率和路径可解释性方面优于现有方法，适用于无条件生成、数据迁移和条件生成等多种任务。

2605.07720 2026-05-11 stat.ML astro-ph.CO math.AT

TopoFisher: Learning Topological Summary Statistics by Maximizing Fisher Information

Matteo Biagetti, Mathieu Carrière, Francesco Conti, Enrico Maria Ferrari, Sven Heydenreich, Karthik Viswanathan

AI总结 TopoFisher 是一种基于最大化费舍尔信息的可微分持续同调方法，旨在学习几何与拓扑结构的稳定可解释摘要。该方法无需人工设计过滤器和压缩策略，通过优化可训练参数，在保证拓扑归纳偏置的前提下，提升对参数不确定性的表征能力。实验表明，TopoFisher 在弱引力透镜等高维非高斯宇宙学问题中，相比现有方法能以更少参数实现更高的费舍尔信息，且在模型泛化和后验估计方面表现更优。

Comments 10+21 pages, 3 figures

详情

英文摘要

Persistence diagrams provide stable, interpretable summaries of geometric and topological structure and are useful for simulation-based inference when low-order statistics miss key information. Yet persistence-based pipelines require hand-chosen filtrations, vectorizations, and compressors, typically without an objective tied to parameter uncertainty. We introduce \textbf{TopoFisher}, a differentiable persistent-homology pipeline that learns topological summaries by maximizing local Gaussian Fisher information. Using simulations near a fiducial parameter, TopoFisher optimizes trainable filtrations, diagram vectorizations, and compressors without posterior samples or supervised regression targets, while retaining stable topological inductive bias. We also give sufficient regularity conditions for the log-determinant Fisher loss to be locally Lipschitz in trainable parameters. Controlled experiments on noisy spirals and Gaussian random fields, where total Fisher information is known, show that TopoFisher recovers much of the available information and outperforms fixed topological vectorizations. Our main results are on weak gravitational lensing, a high-dimensional non-Gaussian cosmological field-inference problem. Learned topological summaries reach higher Fisher information than state-of-the-art cosmological summaries and approach an unconstrained Information Maximising Neural Network baseline with up to $\sim80\times$ fewer parameters. The learned filtrations also generalize better: under simulator shift from lognormal to LPT-based maps it retains most Fisher information, while the neural baseline drops, and in neural posterior estimation they give tighter constraints than the neural baseline, and of state-of-the-art cosmological summaries. These results support Fisher-based topological optimization as a robust, parameter-efficient front end for simulation-based inference.

URL PDF HTML ☆

赞 0 踩 0

2605.07665 2026-05-11 stat.ML cs.LG

Debiased Counterfactual Generation via Flow Matching from Observations

Hugh Dance, Johnny Xi, Peter Orbanz, Benjamin Bloem-Reddy

AI总结本文研究了在干预下估计反事实分布的问题，提出了一种基于观测数据的去混淆流匹配方法，通过利用观测分布与反事实分布之间的紧密联系，提高了反事实生成的准确性。该方法通过流匹配框架和半参数高效估计器实现，能够在高维空间中学习最小能量流，有效克服了现有方法的偏差和失败模式。

2605.07654 2026-05-11 stat.ML cs.CL cs.LG

Reliable Chain-of-Thought via Prefix Consistency

Naoto Iwase, Yuki Ichihara, Mohammad Atif Quamar, Junpei Komiyama

AI总结该研究提出了一种名为“前缀一致性”的新方法，用于提升大型语言模型在推理任务中的可靠性。通过观察正确答案的思维链在截断后更可能被重新生成，研究利用这一特性作为可靠性信号，对候选答案进行加权。实验表明，该方法在多个数学和科学基准测试中表现出色，能以更少的计算资源达到与多数投票相当的准确率。

Comments See our project page at https://naoto-iwase.github.io/prefix-consistency-page

2605.07634 2026-05-11 math.OC cs.LG math.ST stat.TH

Robust stochastic first order methods in heavy-tailed noise via medoid mini-batch gradient sampling

Manojlo Vukovic, Dusan Jakovetic

AI总结本文研究了在重尾噪声环境下鲁棒的一阶随机优化方法，提出了一种基于中位数梯度采样的新型随机梯度下降算法（R-SGD-Mini）。该方法通过将数据批次划分为多个子块，计算每个子块的梯度，并选择梯度中位数方向进行参数更新，从而有效降低噪声影响。理论分析表明，该算法在非凸设置下能够以 $\mathcal{O}(T^{-1})$ 的速率收敛，并在已知时间范围时达到 $\mathcal{O}(T^{-1/2})$ 的更快收敛速度，实验结果也验证了其优于传统方法的性能。

2605.07625 2026-05-11 math.ST stat.ML stat.TH

Statistical Convergence of Spherical First Hitting Diffusion Models

Simon Bienewald, Lukas Trottner

AI总结本文研究了球面支持的 Sobolev 光滑数据分布下，首次击中扩散模型（FHDM）在总变分意义下的统计收敛性质。该模型是一种具有随机生成时间的去噪扩散模型，能够高效生成定义在已知流形上的数据。作者证明了 FHDM 在对数因子范围内达到了最小最大最优收敛率，这是首次针对具有随机生成时间的去噪扩散模型的统计最优性结果。

2605.07620 2026-05-11 stat.ME

Operationalizing Allocation Probability Tests: Practical Guidance on Optimized Implementation for Power and Robustness

Stina Zetterstrom, David S. Robertson, Thomas Jaki, Sofía S. Villar

AI总结本文针对响应自适应临床试验中基于分配概率（AP）的检验方法，探讨了其在实际应用中的优化实现问题。研究通过优化分配概率在检验统计量中的使用方式，提升了检验的统计功效，并扩展了该方法至生存终点（指数分布）的应用。同时，提出了一种严格的虚无假设选择策略以确保I型错误率的精确控制，仿真结果表明优化后的AP检验在保持患者目标的前提下显著优于传统频率学派检验。

2605.07588 2026-05-11 cs.LG cs.AI stat.ML

Revisiting Transformer Layer Parameterization Through Causal Energy Minimization

Jin Xu, Camille Couturier, Victor Rühle, Saravan Rajmohan, James Hensman

AI总结本文提出了一种基于因果能量最小化（CEM）的框架，用于重新审视Transformer层的参数化设计。通过将Transformer层视为条件能量函数的优化步骤，CEM揭示了多头注意力和门控MLP等模块在能量视角下的参数化原理，并指出了包括权重共享、低秩交互和递归更新等在内的设计空间。实验表明，基于CEM设计的Transformer层在参数受限的情况下仍能稳定训练并达到与传统Transformer相当的性能，为理解与改进Transformer结构提供了新的视角。

2605.07572 2026-05-11 cs.AI stat.ML

Open-Ended Task Discovery via Bayesian Optimization

Masaki Adachi, Yuta Suzuki, Juliusz Ziomek

AI总结本文提出了一种名为Generate-Select-Refine（GSR）的开放任务发现框架，通过交替生成任务和优化任务，解决科学工作流中任务本身不确定的问题。该方法从用户提供的初始任务出发，逐步生成并优化新任务，最终将评估集中于最优任务，仅产生对单任务贝叶斯优化的对数遗憾开销。实验表明，GSR在新产品开发、化学合成放大、算法分析和专利再利用等任务中优于现有的基于大语言模型的优化器。

Comments 60 pages, 11 figures

2605.07565 2026-05-11 cs.LG cs.AI stat.ML

Ensemble Distributionally Robust Bayesian Optimisation

Tigran Ramazyan, Denis Derkach

AI总结本文研究了在上下文分布不确定条件下的零阶优化问题，提出了一个基于集成的分布鲁棒贝叶斯优化算法。该方法通过使用集成模型作为替代模型，增强了对复杂和噪声数据的鲁棒性，并在保持计算可行性的同时处理连续上下文。理论分析表明该算法具有次线性遗憾界，优于现有先进方法，实验结果也验证了其理论保证的有效性。

2605.07554 2026-05-11 cs.LG cs.AI q-bio.BM stat.ML

ProteinJEPA: Latent prediction complements protein language models

Dan Ofer, Dafna Shahaf, Michal Linial

AI总结本文研究了在蛋白质语言模型中引入潜在空间预测（JEPA）是否能提升模型性能，并在相同训练时间预算下与传统的掩码语言建模（MLM）进行对比。研究发现，在预训练和从头训练的蛋白质序列编码器中，仅在掩码位置进行潜在预测并保留MLM交叉熵损失的方法（称为masked-position MLM+JEPA）表现最佳，显著优于仅使用MLM或仅使用JEPA的方法。该方法在多个下游任务中取得了更好的性能，包括蛋白质稳定性预测、酶分类和结构检索等。

2605.06474 2026-05-11 cs.LG cs.AI stat.ML

Q-MMR: Off-Policy Evaluation via Recursive Reweighting and Moment Matching

Xiang Li, Nan Jiang

AI总结本文提出了一种名为Q-MMR的新型理论框架，用于有限时间马尔可夫决策过程中的离线策略评估。该方法通过递归重加权和矩匹配，学习一组标量权重以近似目标策略下的期望回报，并在无需依赖函数类复杂度的情况下，建立了数据依赖的有限样本保证。研究还揭示了覆盖性在离线强化学习中的本质意义，并与重要性采样和线性FQE等现有方法建立了联系。

2605.05099 2026-05-11 stat.AP cs.MS

Randompack: Cross-Platform Reproducible Random Number Generation and Distribution Sampling

Kristján Jónasson

AI总结本文介绍了一个名为 Randompack 的 C 语言随机数生成库，支持多种现代随机数生成算法和多种连续分布采样方法，并实现了跨平台的可重复性，即在不同编程语言、硬件和编译器下使用相同种子可获得一致结果。该库结构清晰，将随机数引擎与分布层分离，便于灵活组合使用，同时在性能上优于其他同类库，且提供了全面的并行模拟支持和多种语言接口。

Comments 19 pages

2605.01288 2026-05-11 cs.LG cond-mat.dis-nn stat.ML

A Theory of Saddle Escape in Deep Nonlinear Networks

Divit Rawal, Michael R. DeWeese

AI总结本文研究了深度非线性网络在小初始化条件下训练过程中出现的长时间平坦期及突变特征获取现象。通过推导适用于任意平滑激活函数和可微损失函数的矩阵Frobenius范数不平衡恒等式，作者将激活函数分为四类通用类别，并在对称子流形上将矩阵演化简化为标量ODE，得出了临界深度逃逸时间与瓶颈层数相关的解析公式。理论结果与数值模拟高度一致，揭示了深度网络训练动态中瓶颈结构对逃逸时间的关键影响。

2604.25826 2026-05-11 econ.GN q-fin.EC stat.AP

General-Purpose Technology and Speculative Bubble Detection

Haiqiang Chen, Li Chen, Difang Huang, Yuexin Li, Zhengjun Zhang

AI总结本文研究了通用技术采用对资产价格泡沫检测的影响，指出传统泡沫检验方法在考虑技术冲击时存在严重的规模扭曲。作者通过在Campbell-Shiller现值模型中引入驼峰形技术冲击，证明技术采用期间基本价格会出现局部爆炸性增长，从而影响检验的极限分布。为此，提出将价格分解为基本价值与投机成分的方法，实证分析表明该方法能有效区分2020-2025年AI热潮中的投机行为，并确认了1999年12月至2000年3月的互联网泡沫高峰期。

2604.04891 2026-05-11 math.OC cs.AI stat.ML

Muon Dynamics as a Spectral Wasserstein Flow

Gabriel Peyré

AI总结本文研究了深度学习中梯度归一化方法的连续时间动力学，提出了一种基于谱范数的Wasserstein距离，用于描述参数空间上的概率测度演化。核心方法通过引入由不同矩阵范数索引的谱Wasserstein距离，将归一化训练过程解释为梯度流，并建立了与Benamou-Brenier公式等的理论联系。研究贡献包括静态Kantorovich公式、鲁棒成本表示、高斯简化以及在多种模型中的数值验证，为理解归一化训练提供了新的几何视角。

2603.09742 2026-05-11 cs.LG math.DS stat.ML

Upper Generalization Bounds for Neural Oscillators

Zifeng Huang, Konstantin M. Zuev, Yong Xia, Michael Beer

AI总结本文研究了源自二阶常微分方程的神经振荡器在学习复杂非线性结构系统动态映射时的泛化能力。通过Rademacher复杂度框架，推导了其在连续时间函数空间之间逼近因果和一致连续算子，以及逼近一致渐近增量稳定二阶动力系统的上界泛化界，并将其扩展到目标算子与神经振荡器输出之间的平方Wasserstein-1距离。理论分析表明，估计误差随神经网络规模和时间长度多项式增长，避免了参数复杂度的灾难，并指出通过损失函数正则化约束MLP的Lipschitz常数可提升泛化性能。数值实验验证了理论预测的误差幂律关系，并证实了在有限训练数据下约束MLP矩阵和向量范数的有效性。

Comments This manuscript contains 33 pages with 6 figures

2603.00041 2026-05-11 cs.LG cs.AI econ.EM stat.ME

Econometric vs. Causal Structure-Learning for Time-Series Policy Decisions: Evidence from the UK COVID-19 Policies

Bruno Petrungaro, Anthony C. Constantinou

AI总结本文研究了在时间序列政策决策中，计量经济学方法与因果结构学习方法在因果关系发现上的表现差异，以英国新冠疫情政策为案例进行实证分析。研究对比了四种计量经济学方法与十一种因果机器学习算法在图结构、模型维度和因果效应恢复能力方面的表现，发现计量经济学方法在时间结构上提供了明确的规则，而因果机器学习方法则能探索更广泛的图结构空间，从而发现更多可识别的因果关系。研究为因果机器学习从计量经济学中借鉴经验提供了实证依据，并提供了将计量经济学结果转换为贝叶斯网络工具的代码支持。

2602.07390 2026-05-11 stat.ME

Balancing Covariates in Survey Experiments

Pengfei Tian, Jiyang Ren, Yingying Ma

AI总结在调查实验中，如何平衡协变量以提高处理效应估计的准确性是一个重要问题。本文提出了一种分层的拒绝抽样与再随机化设计，以增强协变量的平衡性，并建立了相应的设计基础渐近理论，证明了平均处理效应估计量的一致性及其更优的渐近分布特性。此外，文章还提出了一种协变量调整方法，进一步提升了估计效率，数值研究验证了方法的有效性和优越性。

2602.04774 2026-05-11 cond-mat.dis-nn cs.LG stat.ML

Theory of Optimal Learning Rate Schedules and Scaling Laws for a Random Feature Model

Blake Bordelon, Francesco Mori

AI总结本文研究了深度学习中学习率调度的最优理论，针对随机特征模型在随机梯度下降（SGD）下的训练过程，提出了基于最优控制理论的分析方法。研究发现学习率调度可分为“易相”和“难相”两个阶段，分别对应不同的衰减策略，并揭示了学习率与批量大小联合优化对训练效率的影响。实验表明，该理论在图像分类和语言模型任务中均具有良好的适用性，为学习率调度提供了理论指导和实践参考。

详情

英文摘要

Setting the learning rate (LR) for a deep learning model is a critical part of successful training. Choosing LRs is often done empirically with trial and error. In this work, we explore a solvable model of optimal LR schedules for a powerlaw random feature model trained with stochastic gradient descent (SGD). We consider the optimal schedule $η_T^\star(t)$ where $t$ is the current iterate and $T$ is the training horizon. This schedule is computed both as a numerical optimization problem and also analytically using optimal control theory. Our analysis reveals two regimes which we term the easy phase and hard phase. In the easy phase the optimal schedule is a polynomial decay $η_T^\star(t) \simeq T^{-ξ} (1-t/T)^δ$ where $ξ$ and $δ$ depend on the properties of the features and task. In the hard phase, the optimal schedule resembles warmup-stable-decay with constant initial LR and annealing performed over a vanishing fraction of training steps. We investigate joint optimization of LR and batch size and find batch ramps can improve the wall-clock time in the easy phase. Beyond SGD, we derive optimal schedules for momentum parameter $β(t)$ and show that it improves the loss-scaling exponent in the hard phase. We compare our optimal schedule to various benchmarks including (1) optimal constant learning rates $η_T(t) \sim T^{-ξ}$ (2) optimal power laws $η_T(t) \sim T^{-ξ} t^{-χ}$, finding that our schedule achieves better rates than either of these. Our theory suggests that LR transfer across training horizon depends on the structure of the model and task. For ResNet image classification on CIFAR-5M, the learning curves exhibit hard-phase behavior where optimal base LRs are constant under sufficient annealing. GPT-2 style transformers trained in language modeling exhibit easy-phase behavior where optimal LRs shift even under annealing.

URL PDF HTML ☆

赞 0 踩 0

2601.21951 2026-05-11 stat.ML cs.LG stat.CO

Diffusion Path Samplers via Sequential Monte Carlo

James Matthew Young, Paula Cordero-Encinar, Sebastian Reich, Andrew Duncan, O. Deniz Akyildiz

AI总结本文提出了一种基于扩散路径的采样方法，用于从仅知归一化常数的目标分布中进行采样。研究通过构建一条从简单基础分布到目标分布的扩散路径，并结合序贯蒙特卡洛方法，高效估计时间变化分布的得分函数和密度函数。为降低得分估计的方差，作者还设计了实用的控制变量调度策略，并将该框架应用于多种扩散路径模型，理论分析与实验结果均验证了方法的有效性。

2601.17621 2026-05-11 stat.ME physics.data-an

Non-parametric finite-sample credible intervals with one-dimensional priors: a middle ground between Bayesian and frequentist intervals

Tim Ritmeester

AI总结本文提出了一种统计区间构造方法，旨在在贝叶斯和频率学派区间之间找到一种自然的中间立场。该方法仅需对感兴趣的参数设定一维先验，无需对整个分布进行高维先验设定，即可在观察到区间后赋予其相应的置信度，同时保留贝叶斯方法的许多实用与哲学优势。作者通过两个具体问题的实现与分析，验证了该方法的可行性与潜在优势，为统计方法的发展提供了新的思路。

2601.07247 2026-05-11 stat.ML cs.LG math.ST stat.ME stat.TH

Multi-environment Invariance Learning with Missing Data

Yiran Jia, Jelena Bradic

AI总结本文研究了在存在缺失数据的情况下如何进行多环境不变性学习，以提升模型的因果解释能力和预测鲁棒性。作者提出了一种基于不变性目标的估计方法，并建立了变量选择性质和$\ell_2$误差收敛率的非渐近理论保证，分析了缺失数据比例和插补模型质量对性能的影响。实验表明，即使在使用有偏插补模型的情况下，该方法仍能有效降低预测误差，展现出良好的实用价值。

Comments Added co-author

2512.21411 2026-05-11 math.ST stat.ML stat.TH

Singular Fluctuation as Specific Heat in Bayesian Learning

Sean Plummer

AI总结本文研究了贝叶斯学习中奇异学习理论中的“奇异波动”这一概念，揭示了其在热力学中的精确解释。作者指出，奇异波动等同于贝叶斯自由能对逆温度的曲率，即对数似然可观测值的方差，因此可视为统计意义上的比热容。这一解释阐明了奇异波动在训练误差与泛化误差关系中的作用，并解释了WAIC在奇异模型中成功的本质原因。研究还通过高斯混合模型和低秩回归验证了奇异波动作为热力学响应系数的行为。

Comments Withdrawn by the author. The main thermodynamic identity in this version incorrectly identifies Watanabe's functional variance with the scalar variance of the total log likelihood. A corrected version will distinguish global heat capacity from the pointwise predictive response trace

2510.18843 2026-05-11 stat.ME math.ST stat.ML stat.TH

Inference on Variable Importance for Treatment Effect Heterogeneity: Shapley Values and Beyond

Pawel Morzywolek, Peter B. Gilbert, Alex Luedtke

AI总结本文提出了一种用于评估处理效应异质性中变量重要性的推断框架，特别适用于医疗等高风险领域，以辅助决策者减少对黑箱算法的依赖。该方法基于局部变量重要性度量，同时进行全局推断，检验某变量是否对任何个体具有重要影响，并结合了函数型参数的半参数理论，适用于使用统计机器学习方法估计处理效应异质性的场景。研究还展示了该方法在传染病预防策略中的应用价值。

Comments 41 pages, 8 figures, v1 was called "Inference on Local Variable Importance Measures for Heterogeneous Treatment Effects"

2510.04606 2026-05-11 cs.LG stat.ML

Closed-Form Last Layer Optimization

Alexandre Galashov, Nathaël Da Costa, Liyuan Xu, Philipp Hennig, Arthur Gretton

AI总结本文研究了在平方损失下神经网络最后一层权重的闭式优化方法。作者提出在优化过程中将最后一层视为主干网络参数的函数，仅对主干参数进行优化，从而等价于交替进行主干网络的梯度下降和最后一层的闭式更新。该方法在随机梯度下降框架下进行了改进，并通过理论分析证明了其在神经切线核 regime 下的收敛性，实验表明该方法在多个回归任务中优于标准 SGD 和 Adam。

2508.12258 2026-05-11 math.ST math.OC stat.TH

Identifying Network Hubs with the Partial Correlation Graphical LASSO

Małgorzata Bogdan, Adam Chojecki, Ivan Hejný, Bartosz Kołodziejek, Jonas Wallin

AI总结本文研究了部分相关图LASSO（PCGLASSO）在高维无向图模型中的统计和计算性质。该方法通过惩罚部分相关性而非精度矩阵的直接元素，解决了传统图LASSO（GLASSO）不具有尺度不变性的缺陷。作者提出了一个适用于PCGLASSO的尺度不变不可表示条件，并证明该条件足以保证模型选择的一致性，同时指出该条件比GLASSO的相应条件更弱，解释了PCGLASSO在如网络枢纽结构等场景中表现更优的原因。此外，文章还提出了两种高效算法，并分析了PCGLASSO背后的非凸优化问题，推导了全局唯一性和解的一致性条件。

Comments 59 pages

2507.01064 2026-05-11 physics.data-an cond-mat.stat-mech cs.IT hep-th math.IT stat.ME

Functional Renormalization for Signal Detection: Dimensional Analysis and Dimensional Phase Transition for Nearly Continuous Spectra Effective Field Theory

Riccardo Finotello, Vincent Lahoche, Dine Ousmane Samary

AI总结本文研究了高维信号检测中的关键问题，即在存在近连续信号分布的噪声背景中如何有效识别信号。作者引入功能重整化群（FRG）框架，将经验谱视为有效场论，定义了一个尺度依赖的“规范维度”作为谱几何的敏感序参量，揭示了在低于传统BBP阈值的信噪比下发生的“维度相变”。该方法能够检测谱密度的细微形变，并与最近关于“广泛尖峰模型”的理论结果一致，已在实际数据集上验证了其有效性。

Comments 36 pages; update figures

详情

DOI: 10.1088/1742-5468/ae5a21
Journal ref: J. Stat. Mech. (2026) 043403

英文摘要

Signal detection in high dimensions is a critical challenge in data science. While standard methods based on random matrix theory provide sharp detection thresholds for finite-rank perturbations, such as the known Baik-Ben Arous-Péché (BBP) transition, they are often insufficient for realistic data exhibiting nearly continuous (extensive-rank) signal distributions that merge with the noise bulk. In this regime, typically associated with real-world scenarios such as images for computer vision tasks, the signal does not manifest as a clear outlier but as a deformation of the spectral density's geometry. We use the functional renormalisation group (FRG) framework to probe these subtle spectral deformations. Treating the empirical spectrum as an effective field theory, we define a scale-dependent "canonical dimension" that acts as a sensitive order parameter for the spectral geometry. We show that this dimension undergoes a sharp crossover, interpreted as a "dimensional phase transition", at signal-to-noise ratios significantly lower than the standard BBP threshold. This dimensional instability is shown to correlate with a spontaneous symmetry breaking in the effective potential and a deviation of eigenvector statistics from the universal Porter-Thomas distribution, confirming the consistency of the method. Such behaviour aligns with recent theoretical results on the "extensive spike model", where signal information persists inside the noise bulk before any spectral gap opens. We validate our approach on realistic datasets, demonstrating that the FRG flow consistently detects the onset of this bulk deformation. Finally, we explore a formalisation of this methodology for analysing nearly continuous spectra, proposing a heuristic criterion for signal detection and a method to estimate the number of independent noise components based on the stability of these canonical dimensions.

URL PDF HTML ☆

赞 0 踩 0

2506.22925 2026-05-11 stat.ME math.ST stat.TH

Confidence sequences with informative, bounded-influence priors

Stefano Cortinovis, Valentin Kilian, François Caron

AI总结本文研究了在已知方差的高斯观测下，如何利用具有信息量且影响有界的先验分布构造置信序列。通过结合混合方法与全局先验，并应用扩展的Ville不等式，作者提出了一种在先验正确时比非信息先验更精确、在先验错误时仍保持有界性的置信序列方法，从而在准确性和鲁棒性之间取得了良好平衡。

2506.19554 2026-05-11 stat.ME stat.CO

Modeling the uncertainty on the covariance matrix for probabilistic forecast reconciliation

Chiara Carrara, Dario Azzimonti, Giorgio Corani, Lorenzo Zambon

AI总结在最小迹（MinT）预测协调方法中，基础预测误差的协方差矩阵起着关键作用，但通常被估计后当作已知量处理，这可能导致预测分布方差的低估。本文提出了一种贝叶斯协调模型，考虑协方差矩阵估计的不确定性，采用逆 Wishart 先验和高斯残差假设，使得协调后的预测分布服从闭式表达的多元 t 分布，而非多元高斯分布。实验表明，该方法在三个旅游相关数据集上显著提升了预测区间的准确性。

2506.05668 2026-05-11 cs.LG stat.ML

RNE: plug-and-play diffusion inference-time control and energy-based training

Jiajun He, José Miguel Hernández-Lobato, Yuanqi Du, Francisco Vargas

AI总结本文提出了一种名为RNE的插件式扩散模型方法，用于在推理阶段实现对生成过程的控制，并支持基于能量的训练。RNE基于路径分布之间的密度比概念，建立了边缘密度与转移核之间的基本联系，从而统一了扩散密度估计、推理控制和能量训练等多个任务。实验表明，RNE在推理控制任务中表现出色，同时为能量型扩散模型提供了简单高效的正则化方法，并适用于连续和离散扩散模型。

Comments Accepted at ICLR 2026

2505.11325 2026-05-11 stat.ME cs.AI cs.LG stat.CO stat.ML

Uncertainty Quantification for Prior-Data Fitted Networks using Martingale Posteriors

Thomas Nagler, David Rügamer

AI总结本文研究了如何为先验-数据拟合网络（PFNs）提供不确定性量化方法，这类网络在表格数据预测任务中表现出色但缺乏对预测结果的不确定性估计。作者提出了一种基于鞅后验的采样方法，能够在无需调参的情况下高效构建预测均值、分位数等估计的贝叶斯后验，并证明了该方法的收敛性。实验表明，该方法在多个模拟和实际数据集上表现出良好的效率和校准能力。

2505.07383 2026-05-11 math.ST stat.TH

Bias robustness of depth estimators in multivariate settings

Jorge G. Adrover, Marcelo Ruiz

AI总结本文研究了多元统计模型中深度估计器的偏差鲁棒性问题，重点分析了最深散度矩阵在污染数据下的最大偏差曲线、污染敏感度和破坏点等关键性质。作者提出了一个统一的框架，用于分析Tukey中位数、基于深度的散度矩阵以及多元回归估计器的统计收敛速度和鲁棒性，并指出这些估计器的最大偏差行为可通过不等式的变化进行可视化。此外，文章还揭示了多种半空间深度可由一个统一的概念——残差小深度推导而来，并通过数值实验比较了多元设置下几种鲁棒估计器的有限样本偏差表现。

2503.12285 2026-05-11 cs.LG cs.AI cs.GT cs.SY eess.SY stat.ML

A Resilience Framework for Bi-Criteria Combinatorial Optimization with Bandit Feedback

Vaneet Aggarwal, Shweta Jain, Subham Pokhriyal, Christopher John Quinn

AI总结本文研究了在噪声函数评估下的双目标组合优化问题，提出了一个适用于此类问题的鲁棒性框架。该框架引入了$(α,β,δ,\texttt{N})$-鲁棒性概念，用于描述在有界噪声下近似保证的联合退化情况，并开发了一个通用的黑盒方法，将任何鲁棒的离线算法转化为适用于双目标组合多臂老虎机问题的在线算法。该方法在无需线性、子模性等结构假设的情况下，实现了次线性遗憾和约束违反的累积上界，展示了框架在经典子模优化贪心算法中的适用性。

2502.19275 2026-05-11 stat.ME

Deep Computerized Adaptive Testing

Jiguang Li, Robert Gibbons, Veronika Rockova

AI总结计算机化自适应测试（CAT）在教育评估和行为健康诊断中具有重要作用，传统方法基于单因素项目反应理论（IRT）模型，难以处理现实数据中的多因素结构。本文提出了一种新型的CAT系统，结合多变量潜变量和贝叶斯稀疏多变量IRT模型，通过直接采样潜变量后验分布，显著提升了项目选择效率。同时，引入双重深度Q学习算法优化项目选择策略，实验表明该方法不仅加速了现有方法，还展示了强化学习在CAT中的应用潜力。

详情

DOI: 10.1017/psy.2026.10106
Journal ref: Psychometrika, 2026

英文摘要

Computerized adaptive tests (CATs) play a crucial role in educational assessment and diagnostic screening in behavioral health. Unlike traditional linear tests that administer a fixed set of pre-assembled items, CATs adaptively tailor the test to an examinee's latent trait level by selecting a smaller subset of items based on their previous responses. Existing CAT frameworks predominantly rely on item response theory (IRT) models with a single latent variable, a choice driven by both conceptual simplicity and computational feasibility. However, many real-world item response datasets exhibit complex, multi-factor structures, limiting the applicability of CATs in broader settings. In this work, we develop a novel CAT system that incorporates multivariate latent traits, building on recent advances in Bayesian sparse multivariate IRT. Our approach leverages direct sampling from the latent factor posterior distributions, significantly accelerating existing information-theoretic item selection criteria by eliminating the need for computationally intensive Markov Chain Monte Carlo (MCMC) simulations. Recognizing the potential sub-optimality of existing item selection rules, which are often based on myopic one-step-lookahead optimization of some information-theoretic criterion, we propose a double deep Q-learning algorithm to learn an optimal item selection policy. Through simulation and real-data studies, we demonstrate that our approach not only accelerates existing item selection methods but also highlights the potential of reinforcement learning in CATs.

URL PDF HTML ☆

赞 0 踩 0

2405.15670 2026-05-11 stat.ME

Post-selection inference for quantifying uncertainty in changes in variance

Rachel Carrington, Paul Fearnhead

AI总结本文研究如何准确量化检测到的方差变化点的不确定性。传统方法在检测变化点后直接进行假设检验会导致偏差，而本文借鉴事后选择推断的思想，提出两种适用于方差变化检测的后选择p值构造方法，确保在无变化情况下p值服从均匀分布。该方法适用于多种变化检测方法和假设检验场景，具有广泛适用性。

Comments 25 pages, 12 figures, plus 7 pages supplementary material

2403.05566 2026-05-11 stat.AP

Bringing Age Back In: Accounting for Population Age Distribution in Forecasting Migration

Nathan G. Welch, Hana Ševčíková, Adrian E. Raftery

AI总结该研究探讨了人口年龄结构对国际净迁入率的影响，指出现有模型在预测国家层面的净迁移率时忽略了这一关键因素。研究提出了一种基于年龄标准化的估计方法，结合迁移年龄结构指数（MASI），对1990年至2020年间200个人口大国的净迁移率进行分解与重构，并利用贝叶斯分层模型对未来五十年的净迁移率进行联合概率预测。结果表明，考虑人口年龄结构后，多数国家的预测区间更窄，且能更准确地反映快速老龄化国家的人口变化趋势。

Comments 29 pages, 8 figures, 3 tables

详情

DOI: 10.1215/00703370-12569854
Journal ref: Demography 2026

英文摘要

The link between age and migration propensity is long established, but existing models of country-level net migration ignore the effect of population age distribution on past and projected migration rates. We propose a method to estimate and forecast international net migration rates for the 200 most populous countries, taking account of changes in population age structure. We use age-standardized estimates of country-level net migration rates and in-migration rates over quinquennial periods from 1990 through 2020 to decompose past net migration rates into in-migration rates and out-migration rates. We then recalculate historic migration rates on a scale that removes the influence of the population age distribution. This is done by scaling past and projected migration rates in terms of a reference population and period. We show that this can be done very simply, using a quantity we call the migration age structure index (MASI). We use a Bayesian hierarchical model to generate joint probabilistic forecasts of total and age- and sex- specific net migration rates over five-year periods for all countries from 2020 through 2100. We find that accounting for population age structure in historic and forecast net migration rates leads to narrower prediction intervals by the end of the century for most countries. Also, applying a Rogers & Castro-like migration age schedule to migration outflows reduces uncertainty in population pyramid forecasts. Finally, accounting for population age structure leads to less out-migration among countries with rapidly aging populations that are forecast to contract most rapidly by the end of the century. This leads to less drastic population declines than are forecast without accounting for population age structure.

URL PDF HTML ☆

赞 0 踩 0

2311.08433 2026-05-11 q-bio.QM cs.LG stat.AP

Clinical Characteristics and Laboratory Biomarkers in ICU-admitted Septic Patients with and without Bacteremia

Sangwon Baek, Seung Jun Lee

AI总结该研究旨在探讨重症监护病房内感染性休克患者中是否存在菌血症的临床特征和实验室生物标志物的预测价值。通过回顾性分析218例患者的临床数据，研究发现C反应蛋白（CRP）和降钙素原（PCT）对菌血症具有较好的预测能力，而结合PCT、胆红素、中性粒细胞与淋巴细胞比值（NLR）、血小板、乳酸、红细胞沉降率（ESR）和格拉斯哥昏迷评分（GCS）构建的多变量逻辑回归模型显著提升了预测准确性，AUC达到0.907。研究还发现菌血症与患者死亡率存在显著关联，表明这些生物标志物在临床诊断和预后评估中具有重要应用价值。

Comments This research is not complete

2305.01429 2026-05-11 cs.LG stat.ML

Unsupervised Feature Based Algorithms for Time Series Extrinsic Regression

David Guijo-Rubio, Matthew Middlehurst, Guilherme Arcencio, Diego Furtado Silva, Anthony Bagnall

AI总结本文研究了时间序列外生回归（TSER）问题，即利用一组训练时间序列预测与回归变量无直接关系的连续响应变量。作者扩展了TSER算法比较数据集，从19个问题增加到63个，并对比了多种回归模型，发现基于分类器的回归方法（如旋转森林）表现优异。文中提出两种新的TSER算法——FreshPRINCE和DrCIF，它们通过提取时间序列的统计特征进行预测，在多个数据集上显著优于其他方法，尤其是优于标准的旋转森林回归器。

Comments 19 pages, 21 figures, 6 tables. Appendix included

2301.05636 2026-05-11 stat.ME

Improving Power by Conditioning on Less in Post-selection Inference for Changepoints

Rachel Carrington, Paul Fearnhead

AI总结该研究旨在提高在变点检测后选择推断中的统计检验功效。通过减少条件信息，提出了一种更高效的条件p值计算方法，尽管其形式难以直接求解，但可通过蒙特卡洛方法进行近似。实验表明，即使使用较小的蒙特卡洛样本量，该方法也能显著提升检测能力，在人类基因组GC含量数据上，将检测到的显著变点数量从17个提升至27个。

Comments 32 pages, 14 figures

2605.07448 2026-05-11 stat.ME stat.CO stat.ML

Robust Tensor Regression with Nonconvexity: Algorithmic and Statistical Theory

Zihao Song, Jicai Liu, Heng Lian, Weihua Zhao

AI总结本文研究了在存在重尾噪声和异常值情况下高维张量数据的鲁棒回归问题，提出了一种基于非凸张量管秩松弛的稳健回归方法。该方法在一般优化框架下同时处理损失函数和惩罚项的非凸性，并开发了可实现的估计算法，证明了其在温和条件下的全局收敛性。此外，论文建立了关于平稳点的通用统计理论，涵盖了线性模型、广义线性模型以及一些非凸损失函数，并通过仿真和实际应用验证了方法的有效性。

2605.07434 2026-05-11 stat.OT

Adaptive Subspace Signal Detection and Performance Analysis in Nonzero-Mean Clutter

Weijian Liu, Zhenyu Xu, Jun Liu, Hui Chen, Yongxiang Liu

AI总结本文研究了在非零均值杂波背景下子空间信号的检测问题，提出了基于广义似然比检验（GLRT）、Rao检验、Wald检验等策略的自适应检测器。分析了各检测器的检测概率和虚警概率表达式，揭示了非零均值杂波下自由度和信杂比的性能损失。仿真和实测数据验证了所提检测器的有效性及其在实际雷达系统中的应用价值。

2605.07421 2026-05-11 stat.AP

There to care; not to kill: medical settings, statistics and wrongful convictions

Richard D. Gill

AI总结本文探讨了医疗环境中护士被错误定罪的问题，分析了此类案件中常见的证据薄弱情况，如缺乏直接证据、监控记录或供认，而主要依赖统计关联性作为指控依据。研究指出，警方调查往往受医院顾问的影响，而检方可能将护士的日常行为或私人文字曲解为犯罪证据，动机多为推测。文章强调了统计证据在医疗误判中的关键作用，并呼吁对这类案件进行更审慎的法律与医学评估。

Comments Invited contribution to a volume on miscarriages of justice, in preparation

2605.07409 2026-05-11 cs.CL cs.LG stat.AP

The Proxy Presumption: From Semantic Embeddings to Valid Social Measures

Baishi Li, Ta Yu, Kelvin J. L. Koa, Ke-Wei Huang

AI总结本文探讨了自然语言处理在计算社会科学中的应用中面临的一个核心有效性问题——“代理假设”，即直接使用语义嵌入的几何特性（如余弦距离）来衡量社会概念（如新颖性、创造力等）可能引入偏差。为此，研究提出了“构念效度协议”（CVP），结合因果表征学习和心理测量学方法，构建从概念定义到量化验证的严谨流程，并引入“反事实中和”方法以减少嵌入空间中的混淆因素，为社区提供了一套标准化的效度检验工具，助力将经验性代理指标转化为科学可靠的测量工具。

Comments ACL 2026

2605.07404 2026-05-11 math.ST econ.EM stat.TH

Self-normalized tests for multistep conditional predictive ability

Qitong Chen, Shuwen Lai

AI总结本文提出了一种用于多步条件预测能力比较的自归一化检验方法。通过利用变换后损失差值样本均值的累积和（CUSUM）过程的功能量进行归一化，该方法避免了对长期协方差矩阵的直接估计，从而省去了传统方法中所需的带宽、核函数和滞后截断等人为设定。研究建立了该检验统计量的渐近理论，推导了其在原假设下的极限分布，并证明了检验的一致性。仿真实验表明，该方法有效缓解了传统异方差与自相关一致（HAC）方法在小样本下的显著性扭曲问题，同时保持了对条件可预测性备择假设的强大检验能力。

2605.07383 2026-05-11 cs.CR stat.AP

Combating Organized Platform Abuse: Amplifying Weak Risk Signals with Structural Information

Meng He, Jia Long Loh

AI总结本文针对在线平台面临的有组织滥用行为，提出了一种基于经济约束的欺诈三难困境理论，揭示了有组织欺诈行为的结构性不变特征——集中式提现，并利用简单的统计方法将低精度的弱信号放大为高精度的强决策。该方法无需标注数据、参数极少、可解释性强，且具备“开手”特性，即使攻击者完全知情也难以规避。实验验证表明，该方法在推广滥用和信用卡欺诈两种真实场景中均取得了极高的检测精度和召回率。

Comments 11 pages, 6 figures, 8 tables

详情

英文摘要

Large-scale online service platforms face severe challenges from organized platform abuse: multiple forms such as credit card fraud and promotion abuse continually emerge, characterized by large numbers of involved accounts, rapid outbreaks, and constantly shifting tactics. Existing mainstream approaches, whether heuristic rules limited in precision, supervised learning with insufficient generalization, or graph models that are engineering-heavy and dependent on seed users, have failed to address such threats effectively. This paper returns to first principles and, starting from the economic constraints of fraudulent behavior, proposes the Fraudster's Trilemma: organized attackers cannot simultaneously achieve scale, low cost, and dispersed cash-out. Building on this theory, we derive a robust structural invariant in organized fraud, namely centralized cash-out, and use a simple statistical method to turn low-precision individual weak signals into high-precision strong decisions. The method requires no labels, is nearly parameter-free, white-box interpretable, has linear complexity O(|E|), avoids cold-start issues, and its detection logic possesses the "open-hand" property: attackers cannot evade it even when fully informed. We validate the approach on two real fraud incidents in backtests. In the promotion abuse case, a single near-zero-cost weak signal (global Precision of only 16%) after structural amplification achieves Precision above 91% and Recall exceeding 99% (z=10.0); at a higher threshold (z=40.0), Precision reaches 93.7%. In the credit card fraud case, an infrastructure-layer weak signal (device spoofing) successfully detects payment-layer attacks without any business-logic linkage, revealing the framework's natural MO-agnostic property: it relies more on the structural invariant than on signal semantics.

URL PDF HTML ☆

赞 0 踩 0

2605.07362 2026-05-11 stat.ME

Sufficient Dimension Reduction via Inverse Conditional Mean or Variance Independence

Jicai Liu, Yu Zhang, Jinhong Li

AI总结本文提出了一种统一的充分维数约减（SDR）框架，推广了多种现有SDR方法，并揭示了逆条件矩独立性与维数约减之间的新联系。该框架基于响应向量与预测变量之间的两种逆独立性形式——逆条件均值独立（ICMI）和逆条件方差独立（ICVI），分别构建了两类能够恢复中心子空间的矩阵，从而得到四种不同的估计方法。理论分析表明这些方法在高维条件下具有良好的收敛性质，且对响应变量中的异常值具有鲁棒性，仿真实验和实际数据分析验证了其有效性。

2605.07312 2026-05-11 stat.ME

Incorporating Missing Data Considerations into Sample Size Calculations for Developing Clinical Prediction Models

Glen P. Martin, Sian Bladon, Rebecca Whittle, Molly Wells, Gary S. Collins, Richard D. Riley

AI总结临床预测模型的开发需要足够大的数据集以减少过拟合并确保预测性能的稳健性。现有样本量计算方法假设所有纳入参与者的所有预测变量数据完整，但实际中缺失值普遍存在，可能影响模型性能并增加所需样本量。本研究通过模拟实验和实际案例，探讨了缺失预测变量对模型校准和过拟合的影响，并提出了一种将缺失数据假设和处理策略纳入后验抽样样本量计算框架的方法，为在存在缺失数据的情况下合理确定最小样本量提供了实用的解决方案。

Comments 35 pages, 5 figures (8 supplementary figures), 1 table (1 supplementary table)

详情

英文摘要

Clinical prediction models must be developed using sufficiently large datasets to minimise overfitting and ensure robust predictive performance. Existing sample size calculations assume complete predictor data for all included participants, yet missing values are common and may increase required sample sizes. This study aimed to quantify how missing predictor data and different imputation methods affect overfitting and model degradation, within datasets that adhere to current sample size criteria. We also aimed to explore how a general sample size framework based on anticipated posterior (sampling) distributions can be adapted to incorporate missing data assumptions and handling strategies. Using a simulation study, we found that in development data meeting current minimum sample size requirements, missing data reduced predictive performance, with expected calibration slopes frequently falling below the targeted value of 0.9. Increasing the required sample size to account for missing data reduced overfitting concerns, but the necessary inflation factor was context specific. In some scenarios, up to twice the minimum sample size was needed to achieve performance comparable to models developed using fully observed data. Expected value of perfect information calculations allowed quantification of the expected loss due to finite samples and missingness. Through two applied examples, we illustrate how embedding missing data assumptions and handling within the posterior sampling approach provides a principled way to determine required minimum sample sizes under missing data. Overall, missing predictor data increases minimum sample size requirements to develop stable and well-calibrated models. Our adaptations to recent posterior (sampling) sample size calculations offer a practical approach for incorporating missing data directly into sample size calculations.

URL PDF HTML ☆

赞 0 踩 0

2605.07309 2026-05-11 eess.SY cs.SY stat.AP

Variational PMB filter via coordinate descent Kullback-Leibler divergence minimisation

Ángel F. García-Fernández, Yuxuan Xia

AI总结本文提出了一种新的变分泊松多伯努利（V-PMB）滤波器推导方法，用于多目标估计。该方法通过引入包含目标状态及其轨迹索引的扩展空间，并结合全局假设变量，将V-PMB投影解释为在该空间上进行坐标下降的Kullback-Leibler散度最小化过程，以拟合最佳的PMB密度到PMBM后验分布。研究还表明该方法能够保持后验的概率假设密度，并通过与其他PMB滤波器变体的对比，展示了V-PMB滤波器在目标近距离接近后分离场景中的优势。

Comments Accepted in Proceedings of the 29th International Conference on Information Fusion, 2026. Matlab code available at https://github.com/Agarciafernandez/MTT

2605.07300 2026-05-11 stat.ME stat.AP

A Beta-GAM Hidden Markov Model for Proportion Time Series

Andrea Nigri, Han Lin Shang, Marco Bonetti

AI总结本文提出了一种用于单位比例时间序列的隐马尔可夫模型，该模型通过贝塔分布描述观测值，并利用广义可加模型（GAM）将贝塔均值与协变量联系起来，同时允许每个隐状态具有特定的精度参数，从而灵活建模非线性协变量效应和状态依赖的变异性。通过带罚项的期望最大化算法进行估计，并结合信息准则进行隐状态数量和光滑惩罚的选择，最终通过参数自举方法量化不确定性。该模型在模拟和俄罗斯特定年龄死亡率数据上的应用表明其在捕捉状态转换动态、识别潜在结构变化方面具有良好的表现。

2605.07297 2026-05-11 stat.ML cs.LG

Spectrum-Adaptive Generalization Bounds for Trained Deep Transformers

Mana Sakai, Masaaki Imaizumi

AI总结本文研究了训练好的Transformer模型泛化性能良好的原因，提出了基于谱适配的后验泛化界。通过逐层控制谱范数，作者将泛化界表示为查询-键、值和前馈权重矩阵的Schatten量，这些量可根据训练后的奇异值分布进行自适应选择，从而在谱复杂度与维度、深度相关因素之间取得平衡。实验表明，与基于范数的界相比，本文提出的复杂度代理量随深度和隐藏维度的增长速度更慢，为理解Transformer的泛化能力提供了新的视角。

2605.07225 2026-05-11 stat.AP

Spatiotemporal dynamics of wind-speed volatility

Ariane Nidelle Meli Chrisko, Philipp Otto

AI总结本文研究了风速波动的时空动态特性，利用意大利北部141个站点2016至2021年的每日10米和100米高度风速观测数据，分析了其时空依赖性。研究采用基于GARCH类型的简洁时空波动模型，将条件方差与过去局部冲击及邻近站点的空间信息相结合，并结合基于距离和方向的权重矩阵构建结构化波动模型。结果表明，合理建模空间均值对残差行为和推断可靠性至关重要，且风速波动随高度增加而增强，多变量扩展揭示了不同高度间的相互依赖关系。

Comments Submitted to Environmetrics. 6 figures, 11 tables

2605.07218 2026-05-11 cs.LG stat.ML

Improved Model-based Reinforcement Learning with Smooth Kernels

Kun Long, Yuqiang Li, Xianyi Wu

AI总结本文研究了连续状态-动作空间下的模型基于强化学习问题，提出了一种基于平滑核的改进方法，利用MDP的平滑性进行非参数核平滑估计。通过引入伯恩斯坦风格的探索奖励，该方法在有限时间范围内实现了比现有方法更优的遗憾界，其理论分析还提出了一个可能具有独立价值的新的伯恩斯坦型鞅浓度不等式。

Comments 38 pages, 5 figures

2605.07171 2026-05-11 cs.LG cs.SY eess.SY stat.ML

Cost-Ordered Feasibility for Multi-Armed Bandits with Cost Subsidy

Ishank Juneja, Carlee Joe-Wong, Osman Yağan

AI总结本文研究了在成本补贴约束下的多臂老虎机问题，目标是在保证最小奖励的前提下最小化总成本。针对奖励约束相对于未知最优奖励的情况，作者提出了一个名为Cost-Ordered Feasibility（COF）的算法，该算法通过智能地整合各臂的采样信息，评估低成本臂的可行性，并在理论上证明了其累积成本和质量遗憾的上界。实验表明，COF在理论分析和实际性能上均优于现有方法。

2605.07120 2026-05-11 cs.LG stat.ML

When Symbol Names Should Not Matter: A Logistic Theory of Fresh-Symbol Classification

Wenjie Guan, Jelena Bradic

AI总结该论文研究了在固定标签分类任务中，模型是否能基于抽象模板而非具体符号名称进行推理的问题。作者提出了一种正则化核逻辑分类方法，分析了在训练数据中由于符号偶然重叠引起的扰动，并通过着色碰撞图对这些扰动进行建模。研究证明了在新鲜符号分类任务中，模型的分类边界具有高概率的迁移保证，并揭示了词汇规模与碰撞几何对分类性能的不同影响，为理解符号抽象和泛化提供了新的理论视角。

2605.07119 2026-05-11 stat.ML cs.LG

Classification Fields: Arbitrarily Fine Recursive Hierarchical Clustering From Few Examples

Yicen Li, Ruiyang Hong, Anastasis Kratsios, Haitz Sáez de Ocáriz Borde, Paul D. McNicholas

AI总结该论文提出了一种名为“分类场”的无限深度分层聚类结构，用于从少量样本中学习递归生成细粒度层次化的聚类场。研究通过定义局部的父节点到子节点的细化规则，生成具有无限深度的聚类中心、Voronoi单元和层次结构的有向无环图。论文证明了所学模型在完成单元度量下的指数收敛性，并在实验中验证了其在生成分层结构、保持几何特性与路径度量方面的能力。

2605.07115 2026-05-11 cs.LG stat.ML

Conformal-Style Quantile Analyses for Stochastic Bandits

Chengyu Du, Mengfan Xu

AI总结本文研究了在随机多臂老虎机问题中，如何针对具有强上尾性能的臂进行分析，而非传统的平均奖励准则。作者提出了一种基于符合性（conformal）方法的上尾量化分析框架，并设计了ACPU-CB1算法，该算法结合了自适应的符合性估计与UCB型乐观奖励机制。该方法在保证上尾性能的同时，实现了对数级别的上尾遗憾界，理论分析与实验验证均表明其优于传统UCB算法。

2605.07104 2026-05-11 cs.LG math.OC stat.ML

Almost Sure Convergence Rates of Stochastic Approximation and Reinforcement Learning via a Poisson-Moreau Drift

Xinyu Liu, Zixuan Xie, Shangtong Zhang

AI总结本文研究了在马尔可夫噪声环境下随机逼近和强化学习算法的几乎必然收敛速率问题。针对一类期望更新具有收缩性的算法（如Q学习和线性时序差分学习），作者提出了一种基于泊松方程修正的Lyapunov漂移构造方法，从而获得了对幂律和调和学习率下接近最优的收敛速率结果。该方法为理解强化学习算法在非独立同分布噪声下的收敛行为提供了新的理论分析工具。

2605.07101 2026-05-11 cs.MA stat.ML

Decentralized Diffusion Policy Learning for Enhanced Exploration in Cooperative Multi-agent Reinforcement Learning

Yuyang Zhang, Haldun Balim, Na Li

AI总结本文研究了合作多智能体强化学习中的探索问题，指出现有基于高斯策略的去中心化策略梯度方法在智能体数量增加时探索能力受限。为此，提出了一种基于去噪扩散概率模型的去中心化扩散策略学习方法（DDPL），能够生成多模态动作分布以提升探索效率，并通过重要性采样得分匹配方法实现高效在线训练。实验表明，DDPL在多个连续动作多智能体基准任务中表现优异。

2605.07100 2026-05-11 stat.ML cs.LG

TRACE: Transport Alignment Conformal Prediction via Diffusion and Flow Matching Models

Zhenhan Fang, Aixin Tan, Jian Huang

AI总结 TRACE 是一种基于扩散模型和流匹配模型的符合性预测框架，旨在为多维输出构建有效且信息丰富的预测区间。该方法通过运输对齐来定义非符合性分数，避免了显式似然评估和可逆变换的限制，仅通过沿随机运输轨迹的去噪或速度匹配误差来衡量候选输出与生成动态的契合度。实验表明，TRACE 能在保证边际覆盖率的同时，适应多模态和非凸条件分布，具有良好的实用性和泛化能力。

Comments 22 pages, 5 figures and 5 tables

2605.07097 2026-05-11 stat.ML cs.LG cs.NE math.LO math.ST stat.TH

Every Feedforward Neural Network Definable in an o-Minimal Structure Has Finite Sample Complexity

Anastasis Kratsios, Gregory Cousins, Haitz Sáez de Ocáriz Borde, Bum Jun Kim, Simone Brugiapaglia

AI总结本文证明了在PAC学习模型中，一类广泛的前馈神经网络具有有限样本复杂度：任何固定层数且各层在o-极小结构中可定义的前馈网络，即使参数无界，也具有有限样本复杂度。该结果适用于标准的固定大小的多层感知机、卷积神经网络、图神经网络和固定序列长度的Transformer等现代非循环架构，涵盖了这些结构中常用的各类操作和层。研究指出，现代非循环网络的分布无关可学习性并非依赖于特定激活函数或架构特有VC维论证的例外性质，而是源于其“温顺”的前馈计算特性。

2605.07087 2026-05-11 stat.ME

A Finite-Horizon Mixture Cure Model with Application to Online Flea Market Data

Yuji Komiyama, Yasumasa Matsuda, Masakazu Ishihara

AI总结本文提出了一种有限时间范围的混合治愈模型，用于分析事件在特定时间段内发生的情况，克服了传统模型基于无限时间范围所带来的可识别性和解释性问题。该方法通过关注有限时间内的决策目标，减少了对无限尾部假设的依赖，并在模拟研究和实际应用中展示了其优越性。文章将该模型应用于日本二手交易平台Mercari的交易数据，揭示了该模型在识别用户行为季节性变化方面具有更准确的解释能力。

2605.07072 2026-05-11 cs.LG cs.CR stat.ML

Less Random, More Private: What is the Optimal Subsampling Scheme for DP-SGD?

Andy Dong, Ayfer Özgür

AI总结本文研究了差分隐私随机梯度下降（DP-SGD）中最优的子采样方案，指出传统的泊松子采样虽然便于隐私分析，但其引入的参与方差会削弱隐私增强效果。作者提出了一种结构化的平衡迭代子采样（BIS）方法，通过确保每个样本参与固定数量的迭代，实现了比泊松子采样更强的隐私增强效果，并在噪声趋于零和无穷大的极端情况下达到最优。实验表明，BIS在低噪声场景下能有效减少所需噪声乘数，提升模型实用性和隐私保护水平。

Comments 17 pages, 1 table. Submitted to NeurIPS 2026

2605.07065 2026-05-11 stat.ML cs.AI cs.LG econ.EM

Causal EpiNets: Precision-corrected Bounds on Individual Treatment Effects using Epistemic Neural Networks

Gandharv Patil, Keyi Tang, Raquel Aoki, Leo Guelman

AI总结该研究针对个体处理效应的识别问题，提出了一种基于认知神经网络的因果EpiNets方法，用于在有限样本下更精确地估计个体层面的因果效应。该方法通过设计满足结构约束的神经网络架构，并结合精度校正的交集界推理，有效解决了传统估计方法在结构概率约束和极值偏差上的缺陷。实验表明，该方法在高维场景下能够保持名义覆盖度和约束有效性，优于现有估计器。

2605.07056 2026-05-11 cs.CY cs.HC cs.SI stat.AP

The University AI Didn't Replace -- Rethinking Universities in the AI Era

Karol P. Binkowski, Andrew Hopkins

AI总结本文探讨了人工智能时代下大学教育面临的变革与挑战，指出尽管生成式人工智能正在重塑高等教育，但多数高校仍处于早期应用阶段，缺乏系统性的战略整合。研究提出了一个包含四个层次的AI采纳框架，并通过案例分析展示了高校在课程改革中引入AI的实践动态。核心贡献在于强调高校需从零散的创新转向战略整合，重构以AI支持的推理为核心的学习模式，并调整相关政策与评价体系以推动教育转型。

Comments 8 pages, 1 figure. Position paper on Generative AI and the transition from isolated educational innovation to institutionally supported adoption in higher education

2605.07046 2026-05-11 stat.ML cs.AI cs.LG

An Interpretable and Scalable Framework for Evaluating Large Language Models

Xinhao Qu, Qiang Heng, Hao Zeng, Xiaoqian Liu

AI总结本文提出了一种可解释且可扩展的框架，用于评估大型语言模型（LLM），旨在解决传统基准测试方法忽视模型输出随机性和题目异质性的问题。该方法基于最大-最小化原理，将评估问题转化为一系列约束矩阵分解子问题，从而实现稳定高效的参数估计，并具有理论上的可识别性和收敛性保证。实验表明，该方法在多个合成和真实数据集上表现出更高的可扩展性和解释性，同时在速度和估计精度方面优于现有方法。

2605.07029 2026-05-11 stat.ML cs.AI cs.LG stat.ME

BGM-IV: an AI-powered Bayesian generative modeling approach for instrumental variable analysis

Guyue Luo, Qiao Liu

AI总结该论文提出了一种基于生成模型的贝叶斯方法BGM-IV，用于解决非线性工具变量回归中的因果效应估计问题。该方法通过构建一个具有因果结构的潜在空间，将非线性IV回归问题转化为后验推断问题，从而更有效地处理高维协变量和复杂的非线性关系。BGM-IV通过引入工具变量诱导的伪似然函数，克服了内生性问题，在多个基准数据集上表现出优越的性能，特别是在高维协变量场景中效果显著。

2605.07002 2026-05-11 cs.AI math.ST stat.ML stat.TH

Adaptive auditing of AI systems with anytime-valid guarantees

Siyu Zhou, Patrick Vossler, Venkatesh Sivaraman, Yifan Mai, Jean Feng

AI总结本文研究了如何在有限标注成本下对生成式AI系统进行自适应审计，并保证统计推断的严谨性。作者提出了一种基于“对抗性假设检验”的框架，从模型和审计方两个视角分别设定假设，并利用安全任意时刻有效推理（SAVI）方法，将审计过程转化为一种“投注式检验”，从而实现对两个对立假设的同时检验。研究表明，当审计方法足够强大时，通过严格审计可以证明AI系统具有全局鲁棒性，实验也验证了该方法在控制一类错误和统计效能方面的优越性。

2605.06993 2026-05-11 cs.AI stat.ML

Optimal Experiments for Partial Causal Effect Identification

Tobias Maringgele, Jalal Etesami

AI总结该研究探讨了如何在观测数据中部分识别因果效应的情况下，选择成本受限的最优实验以最大程度地缩小因果效应的置信区间。作者提出了一个称为“最大效用”的问题，并证明其计算复杂度为NP难。通过引入基于因果图的剪枝准则，研究有效减少了候选实验的搜索空间，并在多个基准网络上验证了方法的有效性，展示了其在实际数据中的应用潜力。

2605.06992 2026-05-11 cs.LG stat.ML

Why Does Agentic Safety Fail to Generalize Across Tasks?

Yonatan Slutzky, Yotam Alexander, Tomer Slor, Yoav Nagel, Nadav Cohen

AI总结随着AI代理在多任务环境中应用增多，如何在未知任务中保持安全执行成为一个关键问题。本文理论分析与实验表明，代理安全能力难以跨任务泛化，不仅源于训练方法的局限，更是安全本身固有的复杂性所致。研究通过线性二次控制与$H_{\infty}$鲁棒性分析，证明安全需求会显著增加任务到控制器映射的Lipschitz常数，并在无人机导航和CRM任务中验证了该结论，指出当前提升代理安全性的方法可能存在根本性不足。

2605.06989 2026-05-11 stat.AP cs.AI cs.LG stat.ME

Drawing Lines in Psychological Space: What K-means Clustering Reveals in Simulated and Real Psychometric Data

Pedro Henrique Ramos Pinto, Maria Jullyanna Ferreira Marques, Luiz Carlos Serramo Lopez

AI总结该研究探讨了K均值聚类在心理测量数据中的应用，指出其传统方法虽广泛用于识别心理子群和类型，但并未检验这些群组是否真实存在。通过构建受控的模拟数据集并分析国际心理测量数据集SMARVUS，研究发现即使在没有真实子群结构的连续高斯潜在空间中，K均值仍能生成稳定且视觉上连贯的聚类结果，揭示了其在心理空间划分中的潜在有效性。

Comments Methodological study on K-means clustering in psychometric data using simulated and empirical datasets

2605.06987 2026-05-11 cs.LG cs.GT econ.TH stat.ML

Response Time Enhances Alignment with Heterogeneous Preferences

Federico Echenique, Alireza Fallah, Baihe Huang, Michael I. Jordan

AI总结本文研究了如何在存在异质偏好标签者的情况下，提升大语言模型与人类偏好的对齐效果。传统方法通过聚合二元选择数据构建奖励模型，但忽略了标签者之间的偏好差异，导致模型无法准确学习真实的人群平均偏好。为此，作者提出利用用户响应时间作为补充信号，结合漂移-扩散模型（DDM），设计了一种能够识别异质偏好的新估计方法，有效纠正了传统方法的偏差，并在多种数据集上验证了其优越性。该方法无需用户身份信息，具有实际应用价值。

2605.06979 2026-05-11 cs.LG cs.AI stat.ML

PLOT: Progressive Localization via Optimal Transport in Neural Causal Abstraction

Jonathn Chang, Arya Datla, Ziv Goldfeld

AI总结本文提出了一种名为PLOT的方法，通过最优运输理论实现神经因果抽象中的渐进式因果变量定位。该方法通过在抽象变量与候选神经位置之间建立最优运输耦合，获得全局软对应关系，并据此校准干预句柄，从而高效定位因果变量。实验表明，PLOT在保持高精度的同时显著提升了计算效率，为大规模因果抽象研究提供了有效的定位工具。

2605.06977 2026-05-11 cs.LG cs.AI cs.IT math.IT stat.ML

$f$-Divergence Regularized RLHF: Two Tales of Sampling and Unified Analyses

Di Wu, Chengshuai Shi, Jing Yang, Cong Shen

AI总结本文研究了在强化学习从人类反馈（RLHF）中使用一般$f$-散度正则化的问题，提出了一个统一的理论框架，填补了现有研究在该方向上的理论空白。作者基于两种不同的采样原则设计了两个算法，分别通过优化主义原则和奖励扰动敏感性进行策略优化，理论分析表明这两个算法均可达到$O(\log T)$的遗憾界和$O(1/T)$的次优性间隙，为在线RLHF在一般$f$-散度正则化下的性能提供了首个理论保证。

Comments ICML 2026

2605.06976 2026-05-11 stat.ML cs.LG stat.CO

A Differentiable Bayesian Relaxation for Latent Partial-Order Inference

Dongqing Li, Geoff K. Nicholls, Shiyi Sun, You Luo

AI总结许多排序和代理轨迹数据集以线性顺序记录，但实际上其潜在结构是部分有序的。本文提出了一种可微分的贝叶斯松弛方法，用于从这类轨迹中推断潜在的部分顺序关系。该方法通过引入平滑替代品，将不连续的偏序关系和边界可行性条件转化为连续的后验分布，从而支持基于梯度的MCMC和变分推断，并在实验中表现出良好的推断精度和计算效率。

2605.06959 2026-05-11 stat.ML cs.LG math.ST stat.TH

Locally Near Optimal Piecewise Linear Regression in High Dimensions via Difference of Max-Affine Functions

Haitham Kanj, Kiryung Lee

AI总结本文提出了一种基于自适应块梯度下降（ABGD）算法的参数化分段线性回归方法，其核心思想是将分段线性函数表示为最大仿射函数（DoMA）的差。通过非渐近的局部收敛分析，证明了在子高斯协变量和噪声分布下ABGD的线性收敛性，并展示了其在噪声环境下所需的样本复杂度及无噪声情况下的精确恢复能力。实验结果验证了理论分析，并表明该方法在实际数据集上具有竞争力。

2605.06939 2026-05-11 cs.LG stat.ME stat.ML

Bias and Uncertainty in LLM-as-a-Judge Estimation

James Fiedler

AI总结本文研究了使用大型语言模型作为裁判（LLM-as-a-Judge）进行模型评估时存在的偏差和不确定性问题。作者指出，直接使用裁判输出进行性能估计会引入系统性偏差，现有校正方法的可靠性依赖于裁判质量及跨模型校准稳定性。研究通过理论分析、模拟实验和真实数据案例，揭示了共享校准在模型比较中可能导致严重偏差甚至方向错误的问题，并提出了基于裁判质量（$J$）和跨模型校准不稳定性（$ΔJ$）的诊断指标，以指导更可靠的LLM-as-a-Judge评估实践。

2605.06883 2026-05-11 stat.ML cs.LG

Kernel Selection is Model Selection: A Unified Complexity-Penalized Approach for MMD Two-Sample Tests

Yijin Ni, Xiaoming Huo

AI总结该论文研究了如何通过动态选择核函数来提升最大均值差异（MMD）两样本检验的统计功效。作者提出了一种统一的复杂度惩罚方法（CP-MMD），将核选择视为模型选择问题，并通过引入优化复杂度的惩罚项，使得在连续参数空间上可以直接进行无网格的核优化。该方法在保证第一类错误控制的同时，显著提升了检验能力，适用于包括带宽参数、多项式特征和深度网络在内的多种核类。

2605.06862 2026-05-11 stat.ME stat.ML

Nonparametric estimation of time-varying network connections by multi-stage smoothing

Jeonghwan Lee, Tianxi Li, Adam J. Rothman

AI总结本文研究如何估计在多个时间点观测到的时变网络中的边概率，提出了一种多阶段平滑估计方法。该方法首先对每条边进行时间局部平滑，再利用数据驱动的邻域构造进行节点域平滑，并可选地引入额外的时间平滑步骤以提升整体时间域的估计精度。该方法在不同生成模型下的仿真研究中表现出优越性，并在真实时变网络数据上验证了其对连接关系的平滑时间演化和结构模式的有效捕捉。

2605.06845 2026-05-11 math.ST stat.TH

Convergence Rates for Latent Mixing Measures in Infinite Homoscedastic Location-Scale Mixture Models

Nicola Bariletto, Dung Le, Alessandro Rinaldo, Nhat Ho

AI总结本文研究了在具有无限多个组件的同方差位置-尺度混合模型中，潜在混合测度的后验收敛速率问题。由于位置和尺度参数均未知，确保混合测度的收敛比密度层面的收敛更具挑战性。作者通过建立新的下界，将混合密度之间的$L^1$距离与混合测度及尺度矩阵之间的Wasserstein距离和算子范数差异联系起来，从而得到了一系列通用不等式，并进一步针对多元正态、柯西和拉普拉斯核等常见混合模型给出了具体的收敛速率结果，为共享未知尺度参数的Dirichlet过程混合模型提供了首次的收敛速率分析。

2605.06843 2026-05-11 stat.AP stat.ME

Nonlinear Amplification of Finite-Sample Uncertainty in Capability-Based Decisions

Fei Jiang, Lei Yang

AI总结本文研究了在统计决策系统中，有限样本不确定性在非线性变换下的传播机制，特别关注用于制造过程评估的能力指数。研究发现，能力指数的估计误差虽然随过程波动近似线性变化，但缺陷概率等风险指标却因尾部曲率的影响，导致小误差被显著放大，从而引发决策不确定性。该机制解释了为何在能力指数空间看似稳定的判断，在缺陷风险空间可能表现出较大波动，为提高决策可靠性提供了理论依据，并通过仿真和工业数据分析验证了其实际意义。

Comments 10 pages, 2 figures and 2 tables

2605.06826 2026-05-11 stat.ML cs.IT math.IT math.SP

How Does Attention Help? Insights from Random Matrices on Signal Recovery from Sequence Models

Mohamed El Amine Seddik

AI总结本文研究了从序列模型中构建的样本协方差矩阵的谱特性，其中词嵌入来自固定两类高斯混合分布，并通过固定注意力权重进行池化。在高维极限下，作者推导了特征值分布、异常特征值以及特征向量与隐藏信号对齐的精确刻画，揭示了信号恢复过程中两个与注意力权重和位置相关矩阵相关的相变现象。研究还表明，最大化信噪比的注意力权重应为位置相关矩阵的主特征向量，并验证了因果自注意力在特定参数设置下能提升信号恢复性能。

2605.06821 2026-05-11 cs.LG cs.AI math.OC stat.ML

A Rod Flow Model for Adam at the Edge of Stability

Eric Regis, Sinho Chewi

AI总结本文研究了Adam优化器在稳定性边缘的行为，提出了一种称为“杆流”（rod flow）的连续时间模型。该方法将参数和一阶矩构成的联合相空间中的连续迭代过程建模为一个扩展的一维对象——“杆”，并将二阶矩作为平滑的辅助变量进行处理。该模型不仅适用于Adam，还推广到多种动量优化方法，并在多个典型机器学习任务中验证了其在稳定性边缘区域对离散迭代过程的更精确追踪能力。

2605.06818 2026-05-11 stat.ME q-fin.ST

Modeling Dynamic Correlation Matrices with Shrinkage Priors

Daniel Andrew Coulson, David S. Matteson, Martin T. Wells

AI总结本文研究了如何估计随时间变化的相关矩阵，并提出了一个基于低秩因子表示的贝叶斯方法，利用动态收缩先验对相关结构进行局部自适应正则化，并结合多变量因子随机波动模型处理观测误差。该方法不仅能够更准确地捕捉相关性变化，还首次建立了动态正则化贝叶斯模型的后验收缩理论结果。此外，文章还引入信息论中的总相关概念，为跨截面依赖性提供了一个标量度量，应用于金融市场的压力时期，有效评估了投资组合分散化效益的变化。

Comments 88 pages, 4 figures, 5 tables

2605.06749 2026-05-11 stat.ME cs.AI

A Statistical Framework for Algorithmic Collective Action with Multiple Collectives

Claudio Battiloro, Pietro Greiner, Dario Rancati, Bret Nestor, Oumaima Amezgar, Francesca Dominici

AI总结随着学习系统在日常决策中扮演越来越重要的角色，算法集体行动（ACA）作为一种用户协调修改共享数据以引导模型行为的方式，为监管政策和企业模型设计提供了补充。现有研究多聚焦于单一集体的场景，而现实中多个集体往往在共享总体目标的同时，因规模、策略和行动目标的不同而分散存在。本文首次提出一个多集体算法集体行动的统计框架，研究多个集体如何共同影响分类器的行为，并提供了基于集体规模和目标对齐程度的定量统计界限，且允许每个集体仅需部分了解其他集体的信息即可计算这些界限。通过模拟智慧城市中气候适应干预的场景，验证了该框架的有效性。

Comments 27 pages, 16 figures

2605.06742 2026-05-11 stat.ME stat.AP

Bayesian Modeling and Prediction of Generalized Contact Matrices

Shozen Dan, David A. van Dyk, Zhi Ling, Swapnil Mishra, Oliver Ratmann

AI总结该研究提出了一种贝叶斯建模框架，用于推断超越年龄维度的广义接触矩阵，以更细致地刻画人群间的接触模式。该方法结合张量结构和光滑约束，既满足接触矩阵的基本结构假设，又提升了高维矩阵估计的计算可行性和统计稳定性。研究还揭示了多维矩阵分层与列联表理论的联系，从而有效应对实际数据中接触特征缺失的问题，并通过两个真实数据集验证了方法的有效性。

2605.06710 2026-05-11 cs.IT cs.LG math.IT math.ST stat.TH

Information-theoretic Limits of Learning and Estimation

Abbas El Gamal, Maxim Raginsky

AI总结本文介绍了信息论在学习与估计问题中的基本极限，探讨了无论计算能力如何，任何学习或估计算法所能达到的性能边界。文章从集中不等式、度量熵、Rademacher复杂度等工具入手，推导了泛化误差的上界，并结合互信息与相对熵分析了学习理论框架。随后，通过Fano不等式建立了最小最大估计风险的下界，为理解学习与估计的理论极限提供了重要分析工具。

2605.06688 2026-05-11 q-fin.CP math.PR math.ST stat.TH

American Options Pricing under Heston Model via Curriculum Learning in Coupled PINNs

Rohan, Siddanth Shetty, Amit N. Kumar

AI总结本文研究了在Heston模型下对美式期权进行定价的问题，该问题由于存在提前行权特性，需要同时确定一个未知的时变行权边界，因此难以用解析方法求解。文章提出了一种基于耦合物理信息神经网络（PINNs）的新方法，结合课程学习和自适应重采样策略，同时预测期权价格和自由边界，有效提升了模型训练的稳定性与准确性。该方法为美式期权在随机波动率环境下的定价提供了高效且鲁棒的深度学习解决方案。

Comments 25 pages, 22 figures

2605.06686 2026-05-11 cs.LG econ.EM stat.AP stat.ML

Robustness of Refugee-Matching Gains to Off-Policy Evaluation Choices

Kirk Bansak, Elisabeth Paulson, Dominik Rothenhäusler, Jeremy Ferwerda, Jens Hainmueller, Michael Hotard

AI总结本文研究了在美国难民匹配政策中，反事实影响评估结果对离线策略评估方法的稳健性。通过应用逆概率加权（IPW）和增强型逆概率加权（AIPW）等多种评估方法，并结合不同的模型结构和分配程序，研究发现无论采用何种方法，影响估计结果在数量级上均保持一致，且在多数情况下具有统计显著性。这些结果与Bansak等人（2018）最初的研究结论也高度一致。

Comments 13 pages, 2 figures, 10 tables

2605.06685 2026-05-11 cs.SD eess.AS stat.AP

An audio-to-analysis pipeline with certified transcription for information-theoretic profiling of the piano repertoire

Fred Jalbert-Desforges

AI总结本文提出了一种从音频直接生成作曲家层面信息论特征的分析流程，通过认证的乐谱转录层（在MAESTRO数据集上F1值达0.9791）提取和声音阶分布，并利用香农熵、非对称KL散度和齐普夫模型进行分析。研究揭示了作曲家在和声可预测性上的可解释排序，重现了已知的风格传承关系，并区分出现代极简主义作曲家与历史作曲家在和声过渡分布上的显著差异。

Comments 25 pages, 4 figures, 25 references

2605.06678 2026-05-11 cs.LG q-fin.RM stat.AP

A Wasserstein GAN-based climate scenario generator for risk management and insurance: the case of soil subsidence

Antoine Heranval, Olivier Lopez, Didier Ngatcha, Daniel Nkameni

AI总结本文提出了一种基于Wasserstein GAN的气候情景生成框架SwiGAN，用于生成未来气候指数的时空演变轨迹，以支持风险管理与保险策略制定。该方法聚焦于法国用于评估干旱程度的关键指标——土壤湿润指数（SWI），并模拟其到2050年的可能演变路径，帮助理解气候变化下的干旱动态。该模型不仅有助于制定适应性风险应对策略，还可推广至其他气候相关风险及精算应用。

2604.18972 2026-05-11 stat.ML cs.LG math.OC

Beyond Bellman: High-Order Generator Regression for Continuous-Time Policy Evaluation

Yaowei Zheng, Richong Zhang, Shenxi Wu, Shirui Bian, Haosong Zhang, Li Zeng, Xingjian Ma, Yichi Zhang

AI总结本文研究在时间非齐次动力学下，如何从离散闭环轨迹进行有限时间连续时间策略评估问题。传统Bellman方法仅具有一阶精度，本文提出通过多步转移估计时间依赖的生成器，并结合矩匹配系数消除低阶截断误差，从而实现更高阶的回归估计。理论分析给出了误差分解及适用条件，实验表明该方法在多种基准测试中优于Bellman基线，验证了高阶生成器回归在连续时间策略评估中的有效性与稳定性。

Comments The authors are withdrawing this paper due to an unresolved dispute concerning authorship and the attribution of intellectual contributions

2604.15439 2026-05-11 stat.ML cs.LG math.PR

One-Shot Generative Flows: Existence and Obstructions

Panos Tsimpos, Daniel Sharp, Youssef Marzouk

AI总结本文研究了生成模型中的动态测度传输问题，重点探讨了通过积分速度场将源分布 $P_0$ 转换为目标分布 $P_1$ 的传输映射。研究核心在于判断何时该过程能产生“直线流”，即点加速度为零、可被任意一阶方法精确积分的流动。文章通过偏微分方程刻画了直线流的特征，并证明了在端点独立条件下，直线流存在与否存在明显二分现象：一方面，对任意高斯端点可构造显式直线流；另一方面，对于具有足够分离模态的目标分布，直线流则根本不存在。这些结果揭示了生成流结构存在的条件与限制。

2604.05241 2026-05-11 math.ST stat.TH

Information Geometry and Asymptotic Theory for SMML Estimators

Enes Makalic, Daniel F. Schmidt

AI总结本文研究了严格最小消息长度（SMML）估计器的信息几何性质及其渐近理论。作者将SMML目标分解为断言熵和条件交叉熵，揭示了其在模型选择与数据编码之间的平衡机制，并证明在高分辨率条件下，最优SMML划分可由最大似然估计器拉回参数空间中的加权费舍尔-拉奥沃罗诺伊划分得到。研究还表明，对于正则指数族，SMML码点满足矩匹配条件，可解释为KL/Bregman中心，为信息几何下的编码理论提供了新的几何解释。

2603.25806 2026-05-11 stat.ME math.ST stat.CO stat.TH

Context Tree Prior Distributions based on Node Weighting with exact Bayes Factors

Thiago Paulichen, Victor Freguglia

AI总结该研究提出了一种基于节点加权的上下文树先验分布方法，用于构建变量长度马尔可夫链（VLMC）模型。通过在节点上直接指定权重函数，该方法能够直观地将结构假设融入先验分布，克服了传统分支过程方法在结构控制方面的局限性。研究还引入了精确的贝叶斯因子计算方法，支持模型比较与假设检验，并展示了该方法在模拟研究中的灵活性与有效性。

Comments 31 pages, 9 figures

2602.10512 2026-05-11 cs.LG cs.LO stat.ML

Exponential Sample Complexity Separation between Flat and Hierarchical Agentic Theorem Provers

Sho Sonoda, Shunta Akiyama, Yuya Uezato

AI总结本文研究了平铺式与分层式智能定理证明器在样本复杂度上的指数级差异。作者通过将定理证明过程建模为确定性有限时间马尔可夫决策过程，并基于教师证明器生成的验证证明轨迹进行离线模仿学习，分析了两种学习方式在样本效率上的区别。结果表明，分层式学习器通过复用证明结构，能够以指数级更少的样本完成验证，从而揭示了可复用证明结构对基于验证的定理证明的重要作用。

2602.09457 2026-05-11 stat.ML cs.DS cs.LG

From Average Sensitivity to Small-Loss Regret Bounds under Random-Order Model

Shinsaku Sakaue, Yuichi Yoshida

AI总结本文研究了随机顺序模型下的在线学习问题，其中损失函数集由对手选定但以随机顺序呈现。通过扩展现有的批量到在线转换方法，作者提出了一种新的分析框架，将离线算法的近似保证、平均敏感度和稳定性转化为在线设置下的小损失遗憾界。该方法适用于包括在线聚类和低秩近似在内的多种问题，并在子模函数最小化和ℓ₁回归等任务中取得了具体的应用结果，展示了稀疏化技术在无需损失函数结构性假设下实现小损失遗憾界的有效性。

2602.01642 2026-05-11 cs.LG cs.AI math.OC stat.CO stat.ML

The Effect of Mini-Batch Noise on the Implicit Bias of Adam

Matias D. Cattaneo, Boris Shigida

AI总结本文研究了在Adam优化器中，小批量噪声对隐式偏差的影响，特别是其如何影响模型在损失函数景观中趋向更尖锐或更平坦区域的倾向，进而影响泛化性能。研究发现，当批量较大时，增大β₂会加剧记忆项的反正则化效应，损害泛化；而当批量较小时，β₂对正则化的影响方向相反，β₁的单调性变化也呈现类似趋势。该理论分析还揭示了批量大小与临界批量规模之间的关系，并通过实验验证了这些结论。

2602.00716 2026-05-11 stat.ML cond-mat.dis-nn cs.LG

Emergence of Distortions in High-Dimensional Guided Diffusion Models

Enrico Ventura, Beatrice Achilli, Luca Ambrogioni, Carlo Lucibello

AI总结该论文研究了在高维引导扩散模型中，分类器无关引导（CFG）方法导致生成样本失真的现象。通过统计物理工具，作者分析了CFG采样分布与真实条件分布之间的不匹配问题，并在可解析处理的设定中，揭示了数据维度和类别数量对失真程度的影响。研究发现，当类别数随数据维度指数增长时，高维高斯混合模型中会出现显著失真，而在次指数增长情况下，失真则因动力学相变而消失。此外，作者提出了一种新的引导调度策略，有效提升了模型的类别可分性和样本多样性。

Comments 41 pages, 21 figures

2602.00474 2026-05-11 stat.ML cs.LG cs.NA math.NA

Persistent-Transient Policy Evaluation for Markov Chains via Minimal Peripheral Quotients

Yang Xu, Vaneet Aggarwal

AI总结本文研究了用于有限马尔可夫链的固定策略评估问题，特别是针对可能存在不可约性和周期性的情况。传统的方法在分解收益和偏差时无法准确区分持久性行为和瞬态效应，本文通过识别转移矩阵的实外周不变子空间，提出了一种最小外周商空间分解方法，从而消除了非衰减模式，使得剩余动态严格稳定。该方法将奖励唯一分解为持久模式部分和瞬态部分，能够准确重构有限时间回报，并在生成模型下提供稳定的估计。

2512.23927 2026-05-11 stat.ML cs.LG

Stationary Reweighting Yields Local Convergence of Soft Fitted Q-Iteration

Lars van der Laan, Nathan Kallus

AI总结本文研究了软Fitted Q-Iteration（soft FQI）在无Bellman完备性条件下的稳定性机制，提出了一种基于局部平稳分布对齐的稳定性分析方法。通过分析软Bellman算子在软最优固定点附近的收敛行为，作者发现其在平稳状态-动作范数下具有收缩性质，并据此设计了基于平稳重加权的软FQI算法，该方法在有限样本下能够实现局部线性收敛。研究还表明，普通软FQI在策略平稳采样下也具有局部稳定性，并解释了温度退火作为收敛区域的延续策略的作用。

2512.23805 2026-05-11 stat.ML cs.LG

Fitted $Q$ Evaluation Without Bellman Completeness via Stationary Weighting

Lars van der Laan, Nathan Kallus

AI总结本文研究了一种无需依赖Bellman完备性条件的拟合Q评估（FQE）方法，通过在回归步骤中引入目标策略的平稳状态-动作分布权重，改进了传统FQE在行为分布范数下的投影方式。该方法在保持模块化监督学习形式的同时，使拟合投影与目标策略诱导的$L^2$范数下的收缩算子对齐，从而在有限样本下实现了对平稳投影Bellman不动点的线性收敛，并分离了迭代、统计、近似和权重估计误差，实验表明该方法能有效稳定FQE并降低价值估计误差。

2512.23694 2026-05-11 stat.ML cs.LG econ.EM

Bellman Calibration for $V$-Learning in Offline Reinforcement Learning

Lars van der Laan, Nathan Kallus

AI总结在离线强化学习中，长期价值预测的可靠性面临挑战，因为拟合价值方法涉及引导、函数逼近和分布偏移，而标准保证通常需要贝尔曼完备性或可实现性。本文提出贝尔曼校准，一种较弱的可靠性准则，要求预测值相近的状态具有一致的贝尔曼目标平均值，并基于此提出迭代贝尔曼校准方法，通过拟合原始预测的一维映射对价值预测器进行后处理校准。该方法无需贝尔曼完备性或价值函数可实现性，即可在有限样本下保证校准误差以一维非参数速率控制，并将价值误差分解为统计估计、有限迭代和逼近误差，明确了校准在何时能提升预测性能。

2512.12116 2026-05-11 cs.LG stat.ML

Neural CDEs as Correctors for Learned Time Series Models

Muhammad Bilal Shahid, Zhanhong Jiang, Prajwal Koirala, Soumik Sarkar, Cody Fleming

AI总结本文提出了一种预测-校正框架，用于改进时间序列模型的多步预测性能。该框架中，预测器生成多步预测，而校正器采用神经控制微分方程来修正预测误差，能够处理不规则采样的时间序列，并兼容连续和离散时间预测器。研究还引入了两种正则化策略以提升校正器的外推能力和训练效率，并提供了理论上的稳定性与收敛性保证。实验表明，该方法在多种预测模型上均能有效提升预测精度，具有预测器无关的广泛适用性。

2512.01279 2026-05-11 stat.ME

A Dynamical Model for Spatio-Temporal Processes Motivated by Second-Order Partial Differential Equations

Yutong Zhang, Xiao Liu

AI总结本文提出了一种基于二阶随机偏微分方程（SPDE）的时空过程动态模型，通过构建无限维线性状态空间表示，并利用伽辽金方法将其转化为有限维近似，从而实现计算与参数估计的可行性。该模型能够准确描述时空协方差结构，并量化近似误差，通过多种实际场景的数值实验验证了其有效性与适用性。

2511.23216 2026-05-11 stat.ME

Comparing Variable Selection and Model Averaging Methods for Logistic Regression

Nikola Sekulovski, František Bartoš, Don van den Bergh, Giuseppe Arena, Henrik R. Godmann, Vipasha Goyal, Julius M. Pfadt, Maarten Marsman, Adrian E. Raftery

AI总结本文研究了在逻辑回归中处理模型不确定性时，变量选择与模型平均方法的相对表现。通过预注册的模拟实验，比较了28种常用方法在不同数据条件下的性能，发现当数据不存在分离现象时，基于g先验的贝叶斯模型平均方法（尤其是g = max(n, p²)）表现最佳；而当出现分离时，LASSO等惩罚似然方法更为稳定，局部经验贝叶斯先验的BMA方法在两种情况下均具有竞争力。研究为实际研究者提供了在逻辑回归中有效应对模型不确定性的实用指导。

2511.09024 2026-05-11 stat.ME

Instrumental variables system identification with $L^p$ consistency

Simon Kuang, Xinfan Lin

AI总结该研究提出了一种基于数据合成工具变量的系统辨识方法，用于消除动态系统在噪声数据下最小二乘估计的偏差。该方法在离散和连续时间模型中均建立了有限样本下的 $L^p$ 一致性，并恢复了非参数 $\sqrt{n}$ 收敛速率。实验表明，该方法在强制洛伦兹系统中显著降低了参数偏差和均方误差，适用于现代稀疏性促进的动力学学习模型。

Comments To appear at Learning for Decision and Control 2026

2510.18242 2026-05-11 math.ST stat.ME stat.ML stat.TH

Fast and Efficient Parallel Sampling Using Higher Order Langevin Dynamics

Jaideep Mahajan, Kaihong Zhang, Feng Liang, Jingbo Liu

AI总结本文研究了从高维强对数凹分布中进行快速并行采样的方法。传统基于朗之万动力学的采样方法在连续时间下收敛迅速，但其离散化版本通常需要多项式时间步数，限制了并行效率。本文提出了一种结合高阶朗之万动力学与分块拉格朗日插值的方法，显著减少了并行采样所需的处理器数量，同时保持对数多项式的时间复杂度，适用于包括贝叶斯逻辑回归和两层神经网络在内的多种模型，提升了现有并行采样方法的空间效率。

2509.24789 2026-05-11 cs.LG stat.ML

Fidel-TS: A High-Fidelity Multimodal Benchmark for Time Series Forecasting

Zhijian Xu, Wanxu Cai, Xilin Dai, Zhaorong Deng, Qiang Xu

AI总结本文提出Fidel-TS，一个用于时间序列预测的高保真多模态基准数据集，旨在解决现有数据集在规模、频率、数据污染和信息泄露等方面存在的问题。该基准遵循数据来源完整性、无泄露设计和结构清晰性等核心原则，揭示了先前基准的局限性，并为评估多种单模态和多模态预测模型及大语言模型提供了新的见解。

Comments new version

2509.21172 2026-05-11 cs.LG econ.EM math.OC stat.ML

Inverse Reinforcement Learning with Just Classification and a Few Regressions

Lars van der Laan, Nathan Kallus, Aurelien Bibaut

AI总结本文研究了逆强化学习中在最大熵模型下的奖励函数恢复问题，提出了一种新的通用方法GenPQR，该方法通过分类和少量回归即可实现，无需依赖特定神经网络结构或锚定动作限制。GenPQR 模块化地估计行为策略、计算软Q函数并恢复归一化奖励，理论分析表明其在函数逼近下具有有限样本保证，并通过实验验证其在奖励恢复效果上优于 DeepPQR，同时具备更高的灵活性和模块性。

2509.03738 2026-05-11 cs.LG cs.AI eess.SP stat.ML

Mechanistic Interpretability with Sparse Autoencoder Neural Operators

Bahareh Tolooshams, Ailsa Shen, Anima Anandkumar

AI总结本文提出了一种新型稀疏自编码神经算子（SAE-NO），它在函数空间而非固定维度的欧几里得空间中进行操作，用于提升机制可解释性。通过引入功能表示假设，SAE-NO 将概念参数化为函数，从而不仅捕捉概念的存在，还描述其在输入域中的表达方式和位置。基于傅里叶神经算子实现的 SAE-FNO 在处理具有空间结构或频率结构的数据时表现出优越的性能，能够学习局部模式、高效利用概念，并在不同分辨率和领域规模下保持稳定性与泛化能力。

Comments Tolooshams and Shen has equal contribution. Preprint. Earlier version was presented as Oral and Extended Abstract at the Workshop on Unifying Representations in Neural Models (UniReps 2025) at NeurIPS

2509.03512 2026-05-11 stat.ME

Bayesian Multivariate Sparse Functional Principal Components Analysis

Joseph Sartini, Scott Zeger, Ciprian Crainiceanu

AI总结本文提出了一种全贝叶斯推断框架MSFAST，用于处理多变量、稀疏观测的函数型数据，旨在更准确地建模并量化主成分的不确定性。该方法基于FAST方法进行扩展，通过标准化变量、改进正交基函数、优化计算稳定性等策略，提升了模型在稀疏数据下的表现。研究通过模拟实验验证了MSFAST在低信噪比情况下的优越性，并将其应用于儿童生长研究，展示了其在实际分析中的有效性。

Comments 23 pages, 6 figures for main text. Appendix contains supplemental material

2509.02826 2026-05-11 cs.LG cs.AI stat.AP stat.CO

Ensemble Learning for Healthcare: A Comparative Analysis of Hybrid Voting and Ensemble Stacking in Obesity Risk Prediction

Towhidul Islam, Md Sumon Ali

AI总结该研究比较了混合多数投票和集成堆叠两种方法在肥胖风险预测中的性能，旨在评估其准确性与效率。通过两个数据集的实验分析，发现集成堆叠在复杂数据分布下表现出更强的预测能力，而混合多数投票则是一种稳健的替代方案。研究还探讨了不同机器学习算法在集成方法中的互补优势，为医疗健康领域的模型选择提供了参考。

Comments There are some errors found

2508.02965 2026-05-11 stat.ME

Two Tunable Gini-Type Measures with U-Statistic Estimation: Theory, Simulation, and an Empirical Application to GDP per Capita in the Americas

Roberto Vila, Helton Saulo

AI总结本文提出两种可调节的基尼系数型不平等度量方法 $G_p$ 和 $H_q$，它们在参数 $p, q$ 趋于无穷时收敛于经典基尼系数。通过引入调节参数 $p>1$ 和 $q>0$，可以灵活控制观测值差异的影响。作者为每种指标推导了闭式 $U$-统计量估计量，并在较弱矩条件下证明了其强一致性与渐近正态性。通过蒙特卡洛模拟和美洲人均GDP的实证分析，展示了这些参数对不平等度量的影响。

Comments 17 pages, 9 figures

2507.18147 2026-05-11 stat.ML

Learning graphons from data: Random walks, transfer operators, and spectral clustering

Stefan Klus, Jason J. Bramburger

AI总结本文研究了如何从数据中学习图论中的图元（graphon），将信号的随机过程与图元上的随机游走过程建立联系。通过引入转移算子（如Koopman算子和Perron-Frobenius算子），作者提出了从信号数据中估计这些算子的方法，并利用其特征值和特征函数进行聚类分析，从而将传统的图谱聚类方法推广到图元上。此外，研究还展示了如何仅通过信号数据重建转移概率密度以及在可逆情况下重构图元本身，并将该方法应用于多种合成和实际信号数据中。

2410.21213 2026-05-11 stat.ME

Spatial causal inference in the presence of preferential sampling to study the impacts of marine protected areas

Dongjae Son, Brian J. Reich, Erin M. Schliep, Shu Yang, David A. Gill

AI总结本文研究了在存在偏好采样情况下，如何评估海洋保护区（MPAs）对生物多样性的影响。作者提出了一种空间因果推断方法，能够同时考虑采样过程和处理分配中的未测量空间混杂因素，从而更准确地估计因果效应。通过模拟研究和实际数据分析，验证了该方法在识别因果效应方面的有效性，并发现偏好采样对结果估计具有显著影响。

2405.10742 2026-05-11 stat.ME stat.AP

Efficient Sampling in Disease Surveillance through Subpopulations: Sampling Canaries in the Coal Mine

Ivo V. Stoepker

AI总结本文研究了在流行病监测中如何通过选择性采样子群体提高疫情检测效率的问题。作者提出，相较于均匀采样，优先采样基线疾病风险较高的子群体能够提升检测效果，并证明了两个子群体之间的采样效率与它们基线风险的比值成反比。研究还分析了二项式检验的统计功效曲线随样本量变化的非单调特性，并通过荷兰新冠病例的案例验证了理论结论。

Comments Contains slightly more detailed exposition than journal version

2308.02480 2026-05-11 math.ST stat.TH

Statistical Inference for Linear Functions of Eigenvectors with Small Eigengaps

Joshua Agterberg

AI总结本文研究了在特征值间隔较小的情况下，对特征向量线性函数进行统计推断的问题。作者提出了去偏线性形式的近似高斯性，并基于此构造了具有近似有效置信区间的估计方法，这些置信区间的宽度达到最小最大最优。该方法无需样本分割，可直接从数据中计算，适用于矩阵去噪和尖峰主成分分析模型。

2303.04754 2026-05-11 stat.ME stat.CO

Estimation of Long-Range Dependent Models with Missing Data: to Impute or not to Impute?

Guilherme Pumi, Gladys Choque Ulloa, Taiane Schaedler Prass

AI总结本文研究了在存在缺失数据的情况下，如何估计长记忆时间序列模型ARFIMA$(p,d,q)$中的长程依赖参数$d$。文章比较了两种主要方法：一种是先对缺失数据进行插补再进行估计，另一种是直接设计适用于缺失数据的估计方法。通过大量蒙特卡洛模拟实验，作者在不同缺失比例和依赖程度下对35种方法进行了系统比较，为实际应用提供了参考依据。