arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2605.10934 2026-05-12 cs.LG cs.AI cs.CV cs.RO stat.ML

Variational Inference for Lévy Process-Driven SDEs via Neural Tilting

Yaman Kindap, Manfred Opper, Benjamin Dupuis, Umut Simsekli, Tolga Birdal

AI总结该论文研究了如何利用变分推断方法对由Lévy过程驱动的随机微分方程（SDEs）进行建模，以准确捕捉金融、气候等领域的极端事件和重尾现象。传统方法要么计算开销大，要么依赖高斯假设而无法处理跳跃特性。为此，作者提出了一种基于神经网络的指数倾斜框架，通过神经网络对Lévy测度进行指数加权，构建灵活的变分族，在保留跳跃结构的同时保证计算可行性。实验表明，该方法在合成和真实数据上均能有效捕捉跳跃动态，并在高斯变分方法失效的情况下提供可靠的后验推断。

Comments The associated project page which contains the official implementation can be found in https://circle-group.github.io/research/NeuralTilting/

2605.10915 2026-05-12 math.ST stat.TH

A Generative High Quantile Homogeneity Test Using Bahadur Representation for Heteroskedastic High Quantile Regression of Tail Dependent Time Series

Ting Zhang, Fangwei Wu, Jingying Gao

AI总结本文研究了在尾部依赖时间序列的异方差高分位数回归中，解释变量对响应变量不同高分位数的影响是否具有同质性的问题。为此，作者提出了一种基于Bahadur表示的新型高分位数同质性检验方法，该方法适用于异方差情形，并能够将非线性高分位数回归估计问题转化为具有显式误差界的线性形式问题。该方法不仅为高分位数回归提供了理论基础，还在实际数据中的应用展示了其有效性。

Comments 31 pages, 1 figure

2605.10914 2026-05-12 stat.CO

gemlib.mcmc: composable kernels for Metropolis-within-Gibbs sampling schemes

Alin Morariu, Jess Bridgen, Chris Jewell

AI总结该研究针对流行病学和生态学中状态转移模型的统计推断难题，提出了一种名为 gemlib.mcmc 的 MCMC 模块，旨在简化 Metropolis-within-Gibbs 采样方案的实现。通过引入范畴论中的 writer monad，该框架实现了参数估计与数据增强核的可组合性，无需手动管理状态，从而提升了代码的可扩展性与复用性。基于 JAX 和 TensorFlow Probability，gemlib.mcmc 提供了高效且易用的接口，使复杂推断算法能够简洁表达并跨应用复用，降低了实现门槛，推动了方法研究与实际应用的结合。

详情

英文摘要

State-transition models are essential across epidemiology and ecology, but statistical inference remains challenging owing to high-dimensional latent state spaces, temporal dependence, and intractable likelihood functions. Bayesian inference via Markov Chain Monte Carlo (MCMC) enables joint estimation of model parameters and missing event times through data augmentation, but Metropolis-within-Gibbs (MWG) schemes that combine multiple specialised kernels are notoriously difficult to implement. Current probabilistic programming frameworks face a trade-off: automation sacrifices extensibility, whilst flexibility demands substantial implementation overhead. This divide has created a software landscape characterised by tightly coupled, model-specific implementations that resist reuse and extension. We introduce gemlib.mcmc, an MCMC module designed to bridge methodological and applied communities through principled, composable kernel abstractions. The framework employs writer monads from category theory to formalise kernel composition, enabling seamless integration of parameter-estimation and data-augmentation kernels without manual state management. Built on JAX and TensorFlow Probability for high-performance computation, gemlib.mcmc provides an ergonomic interface -- leveraging Python's right-shift operator for intuitive kernel chaining -- whilst maintaining statistical rigour and transparency. Developers can extend the library by implementing only two methods; composition and hardware acceleration are automated. We demonstrate the framework through parameter inference on partially observed epidemic models, showing how complex inference algorithms can be expressed concisely and reused across applications. By reducing implementation burden we provide access to sophisticated MCMC methods and enable applied researchers to employ state-of-the-art algorithms without reimplementation overhead.

URL PDF HTML ☆

赞 0 踩 0

2605.10911 2026-05-12 math.PR cs.CC cs.DS math.CO math.ST stat.TH

The stochastic block model has the overlap graph property for modularity

Shankar Bhamidi, David Gamarnik, Remco van der Hofstad, Nelly Litvak, Pawel Pralat, Fiona Skerman, Yasmin Tousinejad

AI总结本文研究了随机块模型（SBM）中基于模块度的聚类算法的理论极限，指出模块度在SBM中具有重叠间隙性质（OGP）。这一性质表明，基于模块度的局部算法在恢复隐藏的社区结构时存在困难，并且相关马尔可夫链的混合时间较慢。该研究扩展了Bickel和Chen的结论，证明了在高概率下，任何接近最优模块度的划分都与隐藏的社区划分接近，为理解SBM中算法性能的瓶颈提供了理论依据。

Comments 28 pages, 2 figures

2605.10909 2026-05-12 cs.LG stat.ML

Revisiting Policy Gradients for Restricted Policy Classes: Escaping Myopic Local Optima with $k$-step Policy Gradients

Alex DeWeese, Guannan Qu

AI总结本文重新审视了在受限策略类中使用的标准策略梯度方法，发现其容易陷入次优临界点，主要原因在于策略梯度本身具有短视性，仅依赖于一步Q函数进行优化。为此，作者提出了一种基于$k$-步策略梯度的通用方法，通过结合$k$步时间窗口内的随机性，能够逃离受限策略类中的短视局部最优解。理论分析表明，该方法在性能上可以指数级接近最优确定性策略，并且在仅假设价值函数光滑可微的前提下，投影梯度下降和镜像下降方法能在$O(1/T)$次迭代内实现这一保证，适用于状态聚合和部分可观测协作多智能体等之前难以求解的问题。

2605.10842 2026-05-12 econ.EM math.ST stat.TH

Higher-Order Neyman Orthogonality in Moment-Condition Models

Stéphane Bonhomme, Koen Jochmans, Whitney K. Newey, Martin Weidner

AI总结本文研究了在参数矩条件模型中构造高阶Neyman正交矩函数的方法，旨在降低对 nuisance 参数估计误差的敏感性，从而为广泛计量经济模型提供统一且可行的高阶去偏方法。所提出的构造方式所需新增的 nuisance 参数数量与正交化阶数无关，并可根据需要减少为一个标量。

2605.10805 2026-05-12 cs.AI cs.CL stat.ML

Reasoning Is Not Free: Robust Adaptive Cost-Efficient Routing for LLM-as-a-Judge

Wenbo Zhang, Lijinghua Zhang, Liner Xiang, Hengrui Cai

AI总结本文研究了在LLM作为裁判的场景下，推理能力带来的收益与成本之间的平衡问题。研究发现，推理在需要结构化验证的任务中显著提升判断准确性，但在简单任务中可能带来有限甚至负面效果，并伴随更高的计算成本。为此，作者提出了RACER方法，在固定预算下通过分布鲁棒优化动态选择是否启用推理，有效应对分布偏移，并在实验中展现出优越的准确率与成本平衡能力。

Comments Accepted at ICML 2026

2605.10795 2026-05-12 stat.ML cond-mat.dis-nn cond-mat.stat-mech cs.LG

Factual recall in linear associative memories: sharp asymptotics and mechanistic insights

Alessio Giorlandino, Sebastian Goldt, Antoine Maillard

AI总结本文研究了线性联想记忆网络在存储和检索输入-输出关联时的基本限制，揭示了其存储容量的精确渐进行为及机制。通过引入一个解耦模型，作者证明该模型在存储容量、权重谱和存储机制方面与原模型等价，并利用统计物理工具分析得出其最大存储量与输入维度之间的关系。研究还揭示了最优解如何超越传统赫布学习规则，为理解神经网络的记忆机制提供了新见解。

2605.10774 2026-05-12 math.ST stat.ML stat.TH

When Are Trade-Off Functions Testable from Finite Samples?

Kaining Shi, Qiaosen Wang, Cong Ma

AI总结本文研究了从有限样本中对两个未知概率分布的权衡函数进行统计检验的问题，该函数描述了二分类测试中类型一和类型二错误的最优边界。作者提出了一种精确可实现的框架，指出在该框架下，若可测集合类的Vapnik-Chervonenkis维数有限，则可实现非渐近的有限样本检验。文中构造了具有非渐近误差保证的检验方法，并通过检验逆过程得到了整个权衡曲线的同时置信带，还分析了方法的尖锐性和鲁棒性。

2605.10716 2026-05-12 cs.LG stat.ML

What should post-training optimize? A test-time scaling law perspective

Muheng Li, Jian Qian, Wenlong Mou

AI总结该论文研究了大语言模型在部署时常用的“最佳中选N”策略与后训练目标之间的不匹配问题。作者提出，在训练资源有限的情况下，可以通过对奖励分布的上尾统计量进行外推，近似最佳中选N的目标梯度，从而设计出高效的后训练优化方法。文中提出的Tail-Extrapolated Advantage（TEA）及其改进版本Prefix-TEA，在多种语言模型和数据集上均能有效提升最佳中选N的性能。

2605.10713 2026-05-12 stat.ML cs.IT cs.LG math.IT math.ST stat.TH

Price of Quality: Sufficient Conditions for Sparse Recovery using Mixed-Quality Data

Youssef Chaabouni, David Gamarnik

AI总结本文研究了在混合质量数据源下的稀疏恢复问题，即少量高质量低噪声测量与大量低质量高噪声测量共同存在的情况。作者提出了“质量代价”这一概念，给出了信息论和算法层面的样本数量条件，揭示了高质量样本与低质量样本之间的替代关系。研究发现，在无先验信息的设定下，高质量样本的价值有限，而在有先验信息的设定下，其价值可能无限放大；同时，LASSO算法在混合噪声下的恢复阈值与均匀噪声情况一致，表现出对数据异质性的强鲁棒性。该工作首次为混合质量数据下的稀疏恢复提供了理论条件，并揭示了信息论与算法恢复阈值对数据质量变化的不同适应方式。

Comments Published as a conference paper at ICLR 2026

2605.10671 2026-05-12 cs.LG math.OC stat.ML

Natural Policy Gradient as Doubly Smoothed Policy Iteration: A Bellman-Operator Framework

Phalguni Nanda, Zaiwei Chen

AI总结本文将强化学习中的自然策略梯度算法表示为一种双重平滑策略迭代（DSPI）形式，并将其嵌入到贝尔曼算子的框架中。该框架通过在历史 Q 函数的加权平均上应用正则化贪心步骤来生成策略，涵盖了策略迭代、双平均策略迭代等多种方法。作者证明了 DSPI 在无需修改 MDP 或使用轨迹依赖步长的情况下，具有分布无关的全局几何收敛性，并给出了自然策略梯度和策略双平均方法的迭代复杂度上界。此外，该框架还可扩展至具有线性函数逼近的折扣 MDP 和随机最短路径问题。

2605.10668 2026-05-12 cs.LG math.OC math.ST stat.TH

A Spectral Framework for Closed-Form Relative Density Estimation

Francis Bach

AI总结本文提出了一种用于线性参数化概率模型（包括未归一化和条件模型）中相对对数密度估计的闭式谱框架。该方法通过将KL散度表示为加权卡方散度的积分，将KL估计转化为一系列最小二乘问题，并基于一阶和二阶特征矩导出了显式的谱公式，从而得到闭式散度和对数密度势估计。该框架适用于广泛的f散度，并可与核方法或神经网络特征学习结合，理论证明了估计器的收敛性，并在合成数据上与基于优化的变分方法进行了实验对比。

2605.10659 2026-05-12 cs.CL cs.AI cs.SI stat.ML

When Can Digital Personas Reliably Approximate Human Survey Findings?

Mumin Jia, Yilin Chen, Divya Sharma, Jairo Diaz-Rodriguez

AI总结本文探讨了大型语言模型（LLM）生成的数字人像在何种程度上能够可靠地模拟人类在调查中的回答。研究利用LISS调查数据集构建数字人像，并与真实受访者后续的回答进行对比，评估其在不同任务和层次上的表现。结果表明，数字人像在稳定属性和价值观相关的领域表现较好，但在个体预测和多维结构恢复方面仍存在局限，且其效果更多依赖于人类回答的结构而非模型选择。

2605.10651 2026-05-12 cs.LG cs.AI stat.ML

A Recursive Decomposition Framework for Causal Structure Learning in the Presence of Latent Variables

Zheng Li, Feng Xie, Shenglan Nie, Xichen Guo, Ruxin Wang, Hao Zhang

AI总结本文提出了一种名为DiCoLa的递归分解框架，用于在存在潜在变量的情况下进行因果结构学习。该方法通过递归分解全局学习任务为更小的子问题，并通过原理化的重构步骤整合子问题的解，从而恢复全局因果结构。该框架在理论上保证了其正确性和完备性，并在合成数据和真实数据上的实验表明，它显著提升了多种因果发现算法的计算效率。

2605.10618 2026-05-12 stat.ME

Indirect Comparisons For Health Technology Assessment: A Practical Methodological Guide And Tips With Insights From The French Transparency Commission

Louise Baschet, Ana Jarne, Matthias Monnereau, Clémence Fradet, Axel Benoist

AI总结本文针对健康技术评估中缺乏直接头对头证据时的间接治疗比较（ITC）方法，提供了实用的指导建议。文章结合法国国家卫生局透明委员会的经验，探讨了如何在实际应用中确保ITC的可靠性，包括对相似性、传递性假设的严格评估，以及网络Meta分析中证据网络结构的合理设计。研究强调了在不同医疗决策背景下，选择合适方法对提升ITC质量与决策支持能力的重要性。

Comments 9 pages, 1 figure

详情

英文摘要

Context: Indirect treatment comparisons (ITC) are essential when direct head-to-head evidence is unavailable. Their reliability depends on rigorous methodological choices and careful assessment of underlying assumptions. Appropriate methodological choices can help address challenges such as cross-country variations in treatment practices, ethical constraints, and evolving treatment landscapes during trial conduct. This opinion and perspective paper provides practical guidance to strengthen the quality, robustness and accuracy of ITCs in the context of health technology assessment (HTA) in France. Methods: A panel of experts in ITCs and French market access environment developed the present strategic guidance, informed by previous work reviewing HTA methodological guidelines and complemented by a systematic review of Transparency Committee opinions from the French National Authority for Health (HAS). Results: Key considerations include early anticipation of ITCs, justification of potential confounding factors, and rigorous assessment of similarity and transitivity in randomized trial-based comparisons. In network meta-analysis, the structure of the evidence network should be adapted to the specific decision context. Population-Adjusted Indirect Comparisons require careful reporting and interpretation of the effective sample size. When evidence relies on non-randomized clinical trials, comparisons between single-arm studies and external control arms may be appropriate under different scenarios, depending on the feasibility of conducting subsequent randomized studies. Conclusions: Robust and reliable ITCs require methods consistent with the validity of their assumptions and the strength of the available evidence. This practical guidance supports the development of rigorous ITCs to inform decision-making in complex medical contexts where direct comparisons are not feasible.

URL PDF HTML ☆

赞 0 踩 0

2605.10590 2026-05-12 stat.ML cs.LG

Amortizing Causal Sensitivity Analysis via Prior Data-Fitted Networks

Emil Javurek, Dennis Frauen, Marie Brockschmidt, Jonas Schweisthal, Stefan Feuerriegel

AI总结该论文提出了一种用于因果敏感性分析的 amortized 方法，旨在在存在未观测混杂因素的情况下，高效估计因果效应的置信区间。研究通过引入基于先验数据拟合的神经网络，将传统的逐实例计算方式转化为上下文学习框架，大幅提升了计算效率。该方法通过构建通用的先验数据集，并利用拉格朗日标量化的优化目标生成训练标签，避免了模型特定的分析推导，同时在标准凸性和线性条件下能够恢复完整的帕累托前沿解。实验表明，该方法在多种数据集和敏感度设置下均表现出显著的加速效果。

2605.10566 2026-05-12 stat.ML cs.LG cs.NA math.NA

Affine Tracing: A New Paradigm for Probabilistic Linear Solvers

Disha Hegde, Marvin Pförtner, Jon Cockayne

AI总结本文提出了一种新的概率线性求解器框架——仿射追踪（Affine Tracing），旨在解决线性系统求解中的不确定性量化问题。研究指出，传统的贝叶斯概率线性求解器实际上是非平稳仿射概率迭代方法（PIMs）的一个特例，并证明了所有现实的仿射PIMs都是校准良好的。为了解决手动实现仿射PIMs的困难，作者引入了仿射追踪算法，该方法能够自动从标准仿射迭代方法的实现中构建概率迭代求解器，从而显著降低了实现难度，并通过实例展示了其在高斯过程近似中的应用效果。

2605.10553 2026-05-12 stat.ME

Estimation of the Risk Measure under a Nuisance Autoregression

Jana Jurečková, Jan Picek

AI总结本文研究在存在干扰自回归过程的情况下，如何估计不可观测误差项的分位数函数，以衡量损失或相关经济指标的风险。作者提出了一种基于R估计量和自回归分位数的估计方法，仅利用可观测的序列数据进行推断。该方法为在未知自回归系数情形下准确评估风险提供了有效途径，具有重要的理论与应用价值。

Comments 11 pages, 1 figure, 4 tables

2605.10498 2026-05-12 cs.CV cs.AI stat.ML

Simultaneous Long-tailed Recognition and Multi-modal Fusion for Highly Imbalanced Multi-modal Data

Heegeon Yoon, Heeyoung Kim

AI总结该研究针对高度不平衡的多模态数据，提出了一个同时处理长尾识别与多模态融合的新框架。该方法通过引入多专家架构，结合模态特异性网络估计各模态的信息量，并利用置信度引导的权重动态调整融合过程，从而更有效地整合多源数据。实验表明，该方法在多个基准和真实数据集上优于现有方法，展示了其在长尾分类任务中的鲁棒性和泛化能力。

2605.10495 2026-05-12 stat.ME econ.TH

Robust Bayes Acts under Prior Perturbations: Contamination, Stability, and Selection Paths

Christoph Jansen, Georg Schollmeyer

AI总结本文提出了一种定量框架，用于评估有限决策问题中贝叶斯最优决策在模型不确定性下的稳健性。通过引入稳健性半径和污染需求两个互补的稳定性概念，研究刻画了贝叶斯最优行动在先验扰动下的保持或转变条件，并利用线性规划和二分法高效计算这些指标。基于稳定性度量，文章进一步提出一种结合稳健性与选择成本的调整准则，构建了一组由正则化参数索引的决策规则，并分析了最优行动选择随参数变化的路径，揭示了稳健性驱动与成本驱动决策之间的结构转变。该框架应用于经济制度不确定下的投资组合选择问题，并基于历史ETF收益率数据对六种投资策略的稳健性和污染特性进行了实证分析。

2605.10491 2026-05-12 math.PR math.ST stat.TH

Zero-couplings of infinite measures with cyclically monotone support and multivariate regular variation

Alexandre Reber, Anne Sabourin, Johan Segers, Cees de Valk

AI总结本文研究了在无限测度之间具有循环单调支撑的零耦合问题，特别关注多变量正则变差情形下的指数测度。作者引入了零耦合的概念，并证明了在特定条件下，任意两个无限测度之间存在唯一的循环单调零耦合，推广了经典的Brenier-McCann定理。此外，文章还展示了此类耦合与闭凸函数梯度的关系，并将其应用于正则变差概率测度，揭示了其尾部行为与指数测度之间零耦合的联系。

Comments This paper supersedes arXiv:1811.12061 "Tails of optimal transport plans for regularly varying probability measures" by Cees de Valk and Johan Segers

2605.10385 2026-05-12 stat.ML cs.LG

Regret Analysis of Guided Diffusion for Black-Box Optimization over Structured Inputs

Masaki Adachi, Anita Yang, Yakun Wang, Song Liu

AI总结本文研究了引导扩散模型在结构化输入的黑箱优化中的遗憾行为，针对现有分析方法在现代扩散优化框架下不适用的问题，提出了一种基于证书的期望简单遗憾分析框架。核心方法围绕“质量提升”这一概念，衡量预训练生成器对近最优设计的概率质量增加，揭示了指数级收敛与多项式加速可能源自同一机制。研究还提供了从有限候选池估计搜索指数的实用诊断方法，并提出了一个完全认证的采样器构造方案。

Comments 48 pages, 12 figures

2605.10383 2026-05-12 stat.ML cs.LG

Multifidelity Gaussian process regression for solving nonlinear partial differential equations

Fatima-Zahrae El-Boukkouri, Josselin Garnier, Olivier Roustant

AI总结本文提出了一种基于协同克里金法的多保真度高斯过程回归方法，用于求解非线性偏微分方程。该方法利用多保真度仿真数据，首先拟合一个可微的非平稳核函数，再结合估计的超参数构建高保真度核函数和均值函数，从而在高斯过程框架下求解PDE。实验在Burgers方程上验证了该方法的有效性，展示了其在物理信息引导下的优越性能。

Comments 31 pages, 20 figures

2605.10378 2026-05-12 stat.ML astro-ph.CO astro-ph.GA hep-ex hep-ph

Uncertainty in Physics and AI: Taxonomy, Quantification, and Validation

Manuel Haußmann, Ramon Winterhalder, Maria Ubiali

AI总结本文探讨了在物理领域中使用机器学习时不确定性量化的重要性，提出了一个统一的不确定性分类体系，并澄清了在频率学派和贝叶斯框架下预测不确定性和推断不确定性的含义。研究介绍了多种原理性的验证工具，如覆盖率、校准度、偏差测试和适当评分规则，并通过简单的回归和分类示例加以说明，为物理中的机器学习应用提供了可靠的不确定性评估方法。

2605.10330 2026-05-12 stat.ML cs.LG stat.ME

Fast Training of Mixture-of-Experts for Time Series Forecasting via Expert Loss Integration

Btissame El Mahtout, Florian Ziel

AI总结本文提出了一种新的自适应专家混合（MoE）框架，用于时间序列预测，通过在训练过程中直接引入专家特定的损失信息，增强专家的专业化能力。该方法将基础预测损失与专家特定损失结合，使专家级别的预测误差能够与全局预测损失共同影响模型训练，并结合部分在线学习策略，实现对门控机制和专家参数的增量更新，从而显著降低计算成本。实验表明，该方法在多个经济、旅游和能源数据集上优于传统统计方法和先进神经网络模型，具有更高的预测精度和计算效率。

2605.10291 2026-05-12 econ.GN cs.AI cs.ET q-fin.EC stat.AP

Generative AI Fuels Solo Entrepreneurship, but Teams Still Lead at the Top

Hyunso Kim, Hyo Kang, Jaeyong Song

AI总结近年来生成式人工智能的发展正在改变创业者的参与方式，但并未改变高质量创业成果的分布格局。研究利用Product Hunt平台上超过16万次产品发布的数据发现，ChatGPT-3.5发布后，个人创业者进入创业领域的比例显著上升，尤其在以往更倾向于团队创业的领域更为明显。然而，这种增长主要体现在低投入、实验性创业活动上，而高质量成果仍由团队创业主导，表明生成式AI虽降低了个人创业的门槛，但团队在顶尖成果中仍具优势。

2605.10290 2026-05-12 stat.ML cs.LG math.ST stat.TH

Characterizing the Generalization Error of Random Feature Regression with Arbitrary Data-Augmentation

Lucas Morisset, Alain Durmus, Adrien Hardy

AI总结本文研究了在协变量数量与样本数量成比例的场景下，数据增强对监督回归方法正则化效果的影响。通过仅依赖真实数据的总体统计量以及数据增强方案的一阶和二阶统计量，给出了测试误差（以均方误差衡量）的精确刻画。研究适用于任意网络结构，只要仅训练最后一层输出层，其余部分固定或随机初始化，并且在高斯数据情况下验证了所提出理论的紧致性。

2605.10285 2026-05-12 stat.ML cs.LG

Scalable Gaussian process inference via neural feature maps

Anthony Stephenson

AI总结本文提出了一种基于神经特征映射的理论支撑高斯过程框架，用于构建表达能力强的核函数。通过将学习到的特征映射解释为隐含再生核希尔伯特空间中格拉姆矩阵的最优低秩近似，建立了高斯过程后验的一致性。该方法还分析了所诱导核的谱特性，并引入乘积特征映射核以缓解过平滑问题，从而实现了快速、可扩展且准确的高斯过程推理，适用于回归和分类任务，并在多个基准数据集上表现出优越的性能。

Comments 27 pages

2605.10277 2026-05-12 cs.LG math.AP stat.ML

Generalization Error Bounds for Picard-Type Operator Learning in Nonlinear Parabolic PDEs

Koichi Taniguchi, Sho Sonoda

AI总结本文研究了基于Duhamel-Picard迭代的非线性抛物型偏微分方程（PDE）解算子的学习问题，提出了一个抽象的状态转移模型框架，并推导了与实现无关的泛化误差界，将实现误差与估计误差分离。核心贡献在于揭示了增加Picard迭代深度可以减少截断误差，同时避免熵估计误差的无界增长，并将该理论应用于环面上非线性热方程的Picard型傅里叶神经算子实现中。

Comments 39 pages

2605.10249 2026-05-12 stat.ME

Diffeomorphic registration distances for Bayesian calibration of infinite-dimensional computer models

Paul Lartaud, Gwenaël Salin

AI总结本文研究了如何利用微分同胚配准距离进行无限维计算机模型的贝叶斯标定问题。作者提出采用大形变微分同胚配准（LDDMM）框架中的距离度量，以处理计算机模型输出的无限维特性，如标量场或函数图。该方法通过能量最小变形来定义形状之间的距离，具有良好的可解释性，并与贝叶斯推断兼容，从而能够在无限维空间中建立预测后验分布，为参数标定提供了可靠的不确定性量化方法。

2605.10206 2026-05-12 math.ST cs.LG stat.ML stat.TH

Extended Wasserstein-GAN Approach to Causal Distribution Learning: Density-Free Estimation and Minimax Optimality

Shu Tamano, Masaaki Imaizumi

AI总结该论文研究了因果分布学习中的分布性因果推断问题，旨在估计干预后的结果分布，包括分位数和尾部风险等。为解决现有生成对抗网络（GAN）方法在理论保证和稳定性方面的不足，作者提出了GANICE方法，通过引入扩展的Wasserstein距离和单元批评机制，实现了对条件干预分布的精确估计，并在Besov空间理论基础上证明了其最小最大最优性。实验表明，GANICE在多个任务中优于现有方法。

2605.10164 2026-05-12 cs.LG stat.ML

Hyperparameter Transfer for Dense Associative Memories

Roi Holtzman, Dmitry Krotov, Boris Hanin

AI总结该论文研究了如何将超参数迁移方法应用于密集联想记忆（DenseAM）模型，这类模型通过神经网络在能量景观上进行时间动态操作，具有层内和层间权重共享的结构特点。由于DenseAM使用了在传统前馈网络中较少见的快速峰值激活函数，使得现有超参数迁移方法难以直接应用。本文提出了针对DenseAM的超参数迁移方法，推导了从小规模模型迁移至大规模模型的明确超参数设置规则，并通过实验验证了理论分析与实际结果的一致性。

2605.10163 2026-05-12 stat.ML cs.AI cs.LG

Coarsening Linear Non-Gaussian Causal Models with Cycles

Francisco Madaleno, Francisco C Pereira, Alex Markham

AI总结本文研究了在存在循环的线性非高斯因果模型中，如何从高维数据中学习低维因果结构的问题。作者提出了一种方法，在不假设高维结构无环的前提下，仍能恢复出低维的有向无环图（DAG），并将其与现有可识别性结果联系起来。该方法具有较低的时间复杂度和明确的样本复杂度界，为高维因果模型的抽象提供了更广泛适用的解决方案。

2605.10137 2026-05-12 stat.ML cs.LG

PFN-TS: Thompson Sampling for Contextual Bandits via Prior-Data Fitted Networks

Yan Shuo Tan, Kenyon Ng, Ruizhe Deng, Sumetha Loganathan, Qiong Zhang, Bibhas Chakraborty

AI总结本文提出了一种基于先验数据拟合网络（PFN）的汤普森采样算法PFN-TS，用于上下文老虎机问题。该方法通过子采样预测中心极限定理，将PFN的后验预测分布转化为对奖励函数均值的采样，从而在保持不确定性估计的同时提升采样效率。相比传统方法，PFN-TS通过几何网格上的数据前缀估计后验方差，减少了计算复杂度，并复用TabICL的缓存表示以提高效率。实验表明，PFN-TS在多个基准测试中表现优异，具有较高的策略价值和竞争力。

2605.03573 2026-05-12 stat.ML cs.LG

Stochastic Schrödinger Diffusion Models for Pure-State Ensemble Generation

Jian Xu, Wei Chen, Shigui Li, Chao Li, Jingyuan Zheng, Delu Zeng, John Paisley, Qibin Zhao

AI总结在量子机器学习中，如何从纯态集合中生成新的量子态是一个重要问题。本文提出了一种基于黎曼几何的生成模型——随机薛定谔扩散模型（SSDMs），用于直接在复射影空间上生成量子纯态。该模型通过引入福比尼-斯图迪度量，结合随机薛定谔方程和黎曼分数梯度，解决了传统扩散模型在非欧几里得空间中的扩展难题，并通过局部欧几里得近似实现了无需显式转移密度的训练。实验表明，SSDMs能够准确捕捉目标纯态集合的统计特性，并提升量子机器学习任务的泛化性能。

2604.26055 2026-05-12 stat.ME stat.AP

Extending Evidence Accumulation Models to Bounded Continuous Self-report Data

Yufei Wu, Tamás Szűcs, Agnes Moors, Francis Tuerlinckx

AI总结本文将证据积累模型（EAM）扩展到有界连续自我报告数据，以解决传统EAM仅适用于二元选择的局限性。研究提出了两种适用于有界连续数据的模型：半圆扩散模型（HCDM）和贝塔漂移扩散模型（BDDM），并利用 amortized Bayesian 推断方法进行模型拟合与比较。实验表明，两种模型均能有效捕捉反应和反应时间的联合分布，并通过实证数据验证了其参数可解释性和可靠性，为连续响应的认知动力学建模提供了实用工具。

2604.19530 2026-05-12 cs.LG cs.CE stat.ML

Calibrating Scientific Foundation Models with Inference-Time Stochastic Attention

Akash Yadav, Taiwo A. Adebiyi, Ruda Zhang

AI总结本文研究了如何为科学基础模型提供校准良好的预测不确定性，提出了一种名为“随机注意”的轻量级推理时修改方法，通过在注意力权重中引入随机性来生成预测集成，无需重新训练模型。该方法通过一个校准目标来调整随机性参数，实现了高效的后校准。实验表明，该方法在天气预测、时间序列和回归任务中表现出更优的校准性能和更窄的预测区间，且计算成本显著低于现有方法。

2603.15917 2026-05-12 cs.CE stat.ML

Data-efficient Bayesian-guided design selection from large candidate sets: Application to hyperelastic stochastic metamaterials

Hooman Danesh, Henning Wessels

AI总结本文研究如何从大量候选设计方案中高效选择满足特定宏观应力响应的结构，尤其适用于无法参数化几何且高精度评估代价高昂的情况。提出了一种基于贝叶斯引导的框架，通过统计特征工程降维，并利用多输出高斯过程代理模型进行主动学习，以最小的高精度评估次数筛选出最优设计。该方法在包含5万候选结构的数值实验中表现出高效性，仅需少量评估即可达到预定误差目标。

2603.02563 2026-05-12 math.ST math.PR stat.TH

Graph Disjointness with Applications to Reversible Markov Chains

Yang Xiang, Kevin McGoff, Andrew B. Nobel

AI总结本文研究了无向加权图与可逆马尔可夫链之间的结构差异，通过图联接（graph joinings）的概念，探讨了图之间的强弱不相容性。文章建立了图联接、不相容性与图因子之间的紧密联系，并利用马尔可夫转移矩阵的谱重叠特性，刻画了图的弱不相容性；同时证明了无自环图强不相容当且仅当其弱不相容且其中一个是树；此外，图的强弱不相容性主要由顶点和边集决定，与边权重无关。这些结果为理解可逆马尔可夫链的耦合结构提供了新的视角。

2603.00541 2026-05-12 cs.LG stat.ML

Spectral Condition for $μ$P under Width-Depth Scaling

Chenyu Zheng, Rongzhen Wang, Xinyu Zhang, Chongxuan Li

AI总结随着生成式基础模型在宽度和深度上同时扩展，稳定特征学习和可靠的超参数迁移面临挑战。本文提出了一种统一的谱域框架，用于在联合宽度-深度缩放下实现最大更新参数化（$μ$P），明确了权重及其每步更新的范数应如何随宽度和深度变化，并揭示了从单变换（$k=1$）到多变换（$k\geq 2$）的转变。该框架适用于多种优化器，实验表明其在GPT-2类语言模型中能实现稳定的特征学习和鲁棒的超参数迁移，优于传统参数化和$ k=1 $情况下的$ μ $P方法。

Comments 76 pages, 13 figures, 40 tables

2602.18866 2026-05-12 cs.LG stat.ML

$(α,β)$-Stability for Boosting Vector-Valued Prediction

Jian Qian, Shu Ge

AI总结本文研究了向量值预测中的提升（boosting）方法，提出了基于几何中位数的$(α,β)$-稳定性概念，用于分析聚合过程如何将弱预测器的性能提升为强预测器。作者在多种自然散度度量下刻画了该稳定性性质，并基于此提出了一种通用的提升框架\geomedboost，该框架通过指数重加权和几何中位数聚合实现，能够在弱学习器条件下保证经验散度误差的指数衰减，并进一步推导出总体误差的上界。

2602.17274 2026-05-12 eess.IV stat.ML

Gaussian Surrogates for Poisson Imaging: Some Theoretical and Empirical Results

Alexandra Spitzer, Lorenzo Baldassari, Valentin Derbanot, Ivan Dokmanić

AI总结在泊松分布测量的成像逆问题中，通常使用泊松似然函数构建目标函数，但实际性能常通过均方误差（MSE）评估。本文研究了在泊松噪声下，泊松目标函数与高斯替代目标函数在MSE上的表现差异，发现未正则化的泊松最大似然估计在低剂量下可能导致较大的MSE，而泊松MAP通过正则化可缓解这一问题。文章提出两种高斯替代目标函数，并证明它们在低剂量条件下可达到与泊松MAP相当的MSE，数值实验进一步验证了这些结论的广泛适用性。

2602.04189 2026-05-12 cs.LG stat.CO

Beyond Accuracy: Evaluating Posterior Fidelity of Diffusion Inverse Solvers

Xiaoyu Qiu, Taewon Yang, Zhanhao Liu, Guanyang Wang, Liyue Shen

AI总结本文研究了扩散逆解器（DIS）在科学与工程反问题中的后验分布保真度问题，指出现有基准主要关注重建精度而忽视了不确定性量化。为此，作者提出了一种无需真实后验的评分核Stein分歧（score-KSD）指标，用于评估扩散采样器生成样本与目标后验分布的一致性。实验表明，该指标能有效揭示重建精度与后验一致性之间的差异，为更全面的模型评估提供了新方法。

2601.21739 2026-05-12 cs.LG cs.AI stat.ML

Why Adam Works Better with $β_1 = β_2$: The Missing Gradient Scale Invariance Principle

Alberto Fernández-Hernández, Cristian Pérez-Corral, Jose I. Mestre, Manuel F. Dolz, Enrique S. Quintana-Ortí

AI总结本文研究了Adam优化器中为何当动量参数满足 $β_1 = β_2$ 时表现更优这一长期未被解释的现象。作者提出并形式化了一个名为“梯度尺度不变性”的结构性质，证明当 $β_1 = β_2$ 时，Adam 优化器具有一阶梯度尺度不变性。该发现不仅解释了Adam在平衡参数设置下的优越性能，也为设计鲁棒性更强的优化算法提供了理论指导。

Comments 23 pages, 8 figures. Preprint

2601.20756 2026-05-12 cs.LG stat.ML

Supervised Guidance Training for Infinite-Dimensional Diffusion Models

Elizabeth L. Baker, Alexander Denker, Jes Frellsen

AI总结本文研究了如何在无限维函数空间中对扩散模型进行监督引导训练，以解决来自偏微分方程的贝叶斯反问题。作者提出了一种基于无限维Doob $h$-变换的条件化方法，并将条件分数分解为无条件分数和引导项，进而设计了一种无需模拟的分数匹配目标（称为监督引导训练），实现了高效稳定的后验采样。该方法为在函数空间中微调扩散模型以准确采样后验分布提供了首个系统性方案。

2601.14013 2026-05-12 math.ST stat.TH

Robustness for free: asymptotic size and power of max-tests in high dimensions

Anders Bredahl Kock, David Preinerstorfer

AI总结本文研究了在高维情况下，存在对抗性污染和重尾分布时，检验高维随机向量均值是否为零的问题。为了解决标准最大值检验方法对异常值高度敏感的问题，作者提出了一种基于分位数 winsorization 的最大值检验方法，该方法在维度指数增长的情况下仍能控制渐近显著性水平，并仅需二阶以上矩条件。研究表明，与标准最大值检验相比，该方法在保持相同渐近功效的同时提升了鲁棒性，且在某些情况下使用 bootstrap 临界值还能进一步提升检验功效。

2512.16875 2026-05-12 cs.DS cs.LG math.ST stat.ML stat.TH

Learning Confidence Ellipsoids and Applications to Robust Subspace Recovery

Chao Gao, Liren Shan, Vaidehi Srinivas, Aravindan Vijayaraghavan

AI总结本文研究了在高维空间中为任意分布寻找置信椭球的问题，目标是在给定置信参数α的情况下，找到包含至少1−α概率质量的最小体积椭球。为了解决高维下传统方法难以高效近似的问题，作者提出了一种多项式时间算法，能够在体积近似因子与椭球条件数β的多项式关系下，保证覆盖足够概率质量，并给出了相应的计算复杂性下界。该方法基于最小体积外接椭球的对偶结构和几何Brascamp-Lieb不等式，为鲁棒子空间恢复问题提供了首个具有最坏情况近似保证的多项式时间算法。

2511.01292 2026-05-12 stat.ML cs.LG

Optimal Attention Temperature Improves the Robustness of In-Context Learning under Distribution Shift in High Dimensions

Samet Demir, Zafer Dogan

AI总结该研究探讨了如何通过调整注意力温度来提升预训练Transformer模型在分布偏移情况下的上下文学习（ICL）鲁棒性。在高维线性回归框架下，作者分析了一种具有近似softmax注意力机制的Transformer，并推导出分布偏移下ICL泛化误差的闭式表达式，发现存在一个最优注意力温度可最小化该误差。实验表明，调整注意力温度不仅能提升理论性能，还能在实际预训练大语言模型中有效增强对噪声上下文示例的鲁棒性。

Comments ICML 2026, 24 pages, 7 figures

2510.22202 2026-05-12 stat.ME stat.ML

Causal Effect Estimation with TMLE: Handling Missing Data and Near-Violations of Positivity

Christoph Wiederkehr, Christian Heumann, Michael Schomaker

AI总结本文研究了在存在缺失数据和近似违反正则性假设的情况下，使用目标最大似然估计（TMLE）估计平均处理效应的性能。通过模型和设计驱动的模拟实验，比较了八种缺失数据处理方法与TMLE结合的效果，发现非多重插补方法，特别是结合结果缺失模型的完整案例方法，在减少偏差和提高对正则性违反的鲁棒性方面表现更优；而多重插补结合分类与回归树（CART）则在均方根误差和置信区间覆盖率方面具有优势。研究揭示了偏差与覆盖率之间的权衡，并为不同优先目标提供了相应的推荐方法。

Comments 35 Pages, 7 Figures

详情

DOI: 10.1002/bimj.70134
Journal ref: Biometrical Journal, 68(3): e70134, 2026

英文摘要

We evaluate the performance of targeted maximum likelihood estimation (TMLE) for estimating the average treatment effect in missing data scenarios under varying levels of positivity violations. We employ model- and design-based simulations, with the latter using undersmoothed highly adaptive lasso on the 'WASH Benefits Bangladesh' dataset to mimic real-world complexities. Five missingness-directed acyclic graphs are considered, capturing common missing data mechanisms in epidemiological research, particularly in one-point exposure studies. These mechanisms include also not-at-random missingness in the exposure, outcome, and confounders. We compare eight missing data methods in conjunction with TMLE as the analysis method, distinguishing between non-multiple imputation (non-MI) and multiple imputation (MI) approaches. The MI approaches use both parametric and machine-learning models. Results show that non-MI methods, particularly complete cases with TMLE incorporating an outcome-missingness model, exhibit lower bias compared to all other evaluated missing data methods and greater robustness against positivity violations across. In Comparison MI with classification and regression trees (CART) achieve lower root mean squared error, while often maintaining nominal coverage rates. Our findings highlight the trade-offs between bias and coverage, and we recommend using complete cases with TMLE incorporating an outcome-missingness model for bias reduction and MI CART when accurate confidence intervals are the priority.

URL PDF HTML ☆

赞 0 踩 0

2510.13397 2026-05-12 cs.LG stat.ML

Assessing the robustness of heterogeneous treatment effects in survival analysis under informative censoring

Yuxin Wang, Dennis Frauen, Jonas Schweisthal, Maresa Schröder, Stefan Feuerriegel

AI总结在临床研究中，由于患者提前退出（dropout）现象普遍，且退出可能与生存时间相关（即信息性删失），导致治疗效果估计存在偏差。本文提出了一种假设较少的框架，用于在信息性删失下评估条件平均处理效应（CATE）估计的稳健性，通过部分识别方法推导出CATE的置信区间，从而识别出在存在信息性删失情况下治疗仍有效的患者子群。此外，作者还提出了一种新型的模型无关元学习方法SurvB-learner，能够与任意机器学习模型结合使用，具有双重稳健性和近似最优效率等良好理论性质，并通过仿真和真实数据实验验证了其有效性。

2510.10730 2026-05-12 cs.LG cs.AI stat.ML

Provable Anytime Ensemble Sampling Algorithms in Nonlinear Contextual Bandits

Jiazheng Sun, Weixin Wang, Pan Xu

AI总结本文提出了一种统一的算法框架，用于非线性上下文老虎机中的集成采样，并针对广义线性老虎机和神经网络上下文老虎机两种常见场景，分别给出了广义线性集成采样（GLM-ES）和神经网络集成采样（Neural-ES）方法，并证明了它们的高概率频繁主义遗憾界。研究通过在随机扰动数据上使用最大似然估计维护多个奖励模型参数估计器，解决了非线性模型中的理论挑战，并提供了无需固定时间步长的任意时间版本算法，具有较强的实用性和理论保证。实验结果表明，所提方法在实际中表现优异。

Comments 58 pages, 5 figures, 1 table

2510.08117 2026-05-12 cs.IT math.IT stat.ML

Near-optimal Rank Adaptive Inference of High Dimensional Matrices

Frédéric Zheng, Yassir Jedra, Alexandre Proutiere

AI总结本文研究了从线性测量中估计高维矩阵的问题，重点设计能够自适应调整有效秩的最优算法。该方法通过估计矩阵的奇异值和对应奇异向量，自适应地确定有效秩，并分析了有效秩选择中的基本权衡关系。作者提出了一种结合最小二乘估计和通用奇异值阈值化的算法，提供了有限样本下的误差界，并证明其性能接近理论下限，研究成果在多元回归和线性动态系统识别中得到了验证。

Comments AISTATS 2026

2509.20294 2026-05-12 cs.LG math.ST stat.TH

Alignment-Sensitive Minimax Rates for Spectral Algorithms with Learned Kernels

Dongming Huang, Zhifan Li, Yicheng Li, Qian Lin

AI总结本文研究了在核函数从数据中学习的背景下谱算法的泛化性能，引入了一个新的复杂度度量——有效跨度维度（ESD），该度量考虑了信号、谱和噪声水平的联合影响，适用于任意核和信号，无需依赖特征值衰减条件。研究证明，当序列模型的ESD不超过$K$时，最小最大超额风险与$σ^2 K$成比例，并分析了过参数化梯度流如何降低ESD，从而提升谱算法的泛化能力。该框架拓展到了线性模型和再生核希尔伯特空间回归，并通过数值实验验证了理论结果，为理解自适应特征学习与泛化性能的关系提供了新视角。

2509.06172 2026-05-12 stat.AP cs.LG

Robust Analysis for Resilient AI System

Yu Wang, Ran Jin, Lulu Kang

AI总结本文针对制造工业互联网（MII）系统中操作风险导致的数据异常问题，提出了一种新的鲁棒回归方法DPD-Lasso，结合密度幂散度与Lasso正则化，以处理AI韧性实验中的污染数据。该方法通过高效的迭代算法克服了计算瓶颈，并在气溶胶喷射打印的MII测试平台中验证了其在干净数据和含异常值数据下的可靠性和稳定性，为构建和验证韧性工业AI系统提供了重要工具。

Comments 10 pages, 3 figures

2507.22867 2026-05-12 stat.ME

Hawkes Processes with Variable Length Memory: Existence, Inference and Application to Neuronal Activity

Sacha Quayle, Anna Bonnet, Maxime Sangnier

AI总结本文提出了一类具有可变长度记忆的非线性霍克斯过程，用于建模神经元活动中的激发与抑制效应。该模型扩展了传统霍克斯过程，允许事件发生的概率根据其最后一次事件前后的历史信息不同而变化，从而更灵活地描述神经元记忆重置的现象。研究证明了该过程的存在性，并提出了有效的似然最大化方法，能够在合成数据和真实神经活动数据中成功识别经典及可变记忆动态。

2507.15437 2026-05-12 stat.ME q-fin.ST stat.AP

Prediction of linear fractional stable motions using codifference, with application to non-Gaussian rough volatility

Matthieu Garcin, Karl Sawaya, Thomas Valade

AI总结本文研究了如何利用共差（codifference）预测线性分数稳定运动（LFSM）的未来增量，并将其应用于非高斯粗糙波动率的建模。与传统依赖协方差的方法不同，该方法适用于具有无限协方差的α-稳定增量过程，通过条件期望或半度量投影实现预测。研究表明，该方法在模拟数据和实际波动率数据中均表现出良好的预测性能，并揭示了分数过程在序列依赖性中可能存在第四种记忆机制。

2507.07969 2026-05-12 cs.LG cs.AI cs.RO stat.ML

Reinforcement Learning with Action Chunking

Qiyang Li, Zhiyuan Zhou, Sergey Levine

AI总结本文提出了一种名为Q-chunking的方法，旨在提升强化学习在长期任务和稀疏奖励场景下的性能。该方法通过引入动作分块技术，使智能体能够在离线数据的指导下进行更有效的在线探索，并结合无偏的n步备份机制，提高时差学习的稳定性与效率。实验表明，Q-chunking在多个长期稀疏奖励的操控任务中表现出优越的离线性能和在线样本效率。

Comments The Thirty-Ninth Annual Conference on Neural Information Processing Systems (NeurIPS 2025); 29 pages, 17 figures

2506.20928 2026-05-12 stat.ML cs.LG

Active Learning for Manifold Gaussian Process Regression

Yuanxing Cheng, Lulu Kang, Yiwei Wang, Chun Liu

AI总结本文提出了一种用于流形高斯过程回归的主动学习框架，将流形学习与策略性数据选择相结合，以提升高维空间中的预测精度。该方法联合优化一个用于降维的神经网络和潜空间中的高斯过程回归器，并通过主动学习准则最小化全局预测误差。实验表明，该框架在合成数据上的表现优于随机顺序学习，能够高效处理复杂且不连续的函数，同时保持计算可行性，具有重要的科学与工程应用价值。

Comments 13 pages, 6 figures

2505.06452 2026-05-12 math.ST stat.TH

Semiparametric semi-supervised learning for general targets under distribution shift and decaying overlap

Lorenzo Testa, Qi Xu, Jing Lei, Kathryn Roeder

AI总结在现代科学应用中，协变量数据丰富，但结果标签往往稀缺且可能面临分布偏移。本文提出了一种半参数半监督学习框架D2S3，适用于标签在随机缺失（MAR）且样本间重叠可能随样本量增加而消失的情形。该方法支持多种平滑统计目标的估计与推断，如均值、线性回归系数、分位数和因果效应，并在高维干扰估计和分布偏移下保持有效性。理论分析表明，该方法在保持双重稳健性、渐近正态性和半参数效率的同时，修正了传统根号n收敛率在重叠消失情况下的失效问题。

Comments 21 pages, 4 figures

2505.02562 2026-05-12 math.OC math.ST stat.TH

Marginal minimization and sup-norm expansions in perturbed optimization

Vladimir Spokoiny

AI总结本文研究了在存在干扰变量的情况下如何求解目标函数的边际最小化问题，探讨了插值方法和交替优化方法的收敛性条件，并分析了边际优化与上范数估计之间的联系。通过合理的假设，文章给出了精确的闭式结果，并以BTL模型的数值例子加以说明。

Comments arXiv admin note: substantial text overlap with arXiv:2503.15045

2504.20941 2026-05-12 cs.CR math.DG stat.OT

Conformal-DP: A Density-Aware Mechanism for Differential Privacy over Riemannian Manifolds via Conformal Transformation

Peilin He, Liou Tang, M. Amin Rahimian, James Joshi

AI总结该论文提出了一种针对黎曼流形数据的差分隐私机制Conformal-DP，旨在解决现有方法在处理非均匀数据分布时扰动偏差和隐私-效用权衡不佳的问题。该方法通过共形变换校准扰动，使隐私扰动与局部数据密度相关，从而在流形上诱导出密度平衡的几何结构。理论分析表明该机制在温和正则条件下满足ε-差分隐私，实验结果验证了其在异构数据分布下相比现有方法具有更优的隐私-效用平衡。

Comments Submitted, under review

2504.11848 2026-05-12 stat.ME math.ST stat.ML stat.TH

Proximal Inference for Indirect and Intervening Effects in Population Interventions

Yang Bai, Yifan Cui, Baoluo Sun

AI总结该论文研究了在存在未测量混杂因素的情况下，如何准确估计群体干预的间接效应（PIIE）以及干预变量的因果效应。作者提出了一种基于近似因果推断框架的统一识别与估计方法，利用观测协变量作为代理变量，构建了三种不同的识别策略，并推导了目标估计量的半参数效率界，开发了多重稳健且局部高效的估计方法。研究通过模拟实验验证了方法的有效性，并应用于分析酒精摄入通过去人格化症状对抑郁风险的间接影响。

2502.16120 2026-05-12 math.OC stat.ML

A Fenchel-Young Loss Approach to Data-Driven Inverse Optimization

Zhehao Li, Yanchen Wu, Jian Chen, Xiaojie Mao

AI总结本文研究了从优化解观测中估计优化模型未知参数的数据驱动逆优化问题。作者提出了一种基于Fenchel-Young损失函数的新方法，将逆优化与结构化预测中的FY损失联系起来，该方法能够高效地进行梯度优化，显著优于现有方法。理论分析和实验结果表明，该方法在参数估计精度、决策误差和计算速度方面具有明显优势。

2502.10760 2026-05-12 cs.CL cs.LG stat.ML

Why is prompting hard? Understanding prompts on binary sequence predictors

Li Kevin Wenliang, Anian Ruoss, Jordi Grau-Moya, Marcus Hutter, Tim Genewein

AI总结本文探讨了为何在二元序列预测模型中设计有效的提示（prompt）具有挑战性，认为最优提示的寻找应基于接近最优的序列预测器进行条件设置。通过大量受控实验，研究发现结合预训练分布可以更好地理解非直观的最优提示，而即使使用穷举搜索，实际神经预测模型的最优提示也难以可靠识别。研究还指出，一些流行的提示方法如使用目标任务的示例可能效果不佳，并揭示了前沿模型中最优提示的规律与二元示例及先前研究存在相似性。

2412.09226 2026-05-12 stat.AP econ.EM

The Global Carbon Budget as a cointegrated system

Mikkel Bennedsen, Eric Hillebrand, Morten Ørregaard Nielsen

AI总结本文研究全球碳预算的四个年度时间序列，包括大气CO₂浓度、人为CO₂排放以及陆地和海洋的CO₂吸收量，将其作为协整系统进行分析。研究发现这四个序列具有三阶协整关系，其中人为排放是驱动系统非平稳动态的单一随机趋势。文章进一步构建了一个符合物理关系的误差修正模型，并通过似然比检验验证了该模型的合理性，可用于样本内和样本外分析，并在共享社会经济路径情景下展示了与气候科学一致的预测结果。

2409.03410 2026-05-12 math.ST stat.TH

Error bounds of Median-of-means estimators with VC-dimension

Yuxuan Wang, Yiming Chen, Hanchao Wang, Lixin Zhang

AI总结本文研究了在重尾分布和数据污染情况下，使用中位数-均值（MOM）方法对均值向量进行鲁棒估计的误差上界问题。通过引入VC维而非Rademacher复杂度来度量统计复杂度，该方法仅需有限二阶矩的假设，比许多现有方法更弱。研究还提出了一种基于MOM的半空间深度估计器，并给出了在任意范数下均值估计的误差界，拓展了MOM方法在协方差估计中的应用。

2408.15701 2026-05-12 stat.ME stat.CO

Robust discriminant analysis

Mia Hubert, Jakob Raymaekers, Peter J. Rousseeuw

AI总结判别分析（DA）是一种广泛用于分类的统计方法，因其概念简单、计算成本低且性能稳定而受到青睐。传统DA通过算术均值和样本协方差矩阵估计各类别的中心和散布，但这种方法对异常值和误标数据非常敏感。本文综述了鲁棒判别分析的技术，介绍基于稳健位置和散布估计的DA方法，并提供了用于可视化分析结果的图形诊断工具，提高了在存在偏离数据时的可靠性。

Comments Accepted for publication in WIREs Computational Statistics (Wiley Interdisciplinary Reviews)

2405.17642 2026-05-12 cs.LG cs.AI stat.ME

Unifying Perspectives: Plausible Counterfactual Explanations on Global, Group-wise, and Local Levels

Oleksii Furman, Patryk Wielopolski, Łukasz Lenkiewicz, Jerzy Stefanowski, Maciej Zięba

AI总结随着人工智能系统日益复杂，可解释性需求日益迫切。本文提出一种基于梯度优化的统一方法，能够同时生成局部、全局和群体级反事实解释，弥补了现有方法在不同粒度层面缺乏整合的不足。通过将实例分组与反事实生成结合为单一高效流程，并引入可信性准则，提升了群体级反事实的合理性与实用性，实验验证了该方法在有效性、贴近性与可信性之间的良好平衡。

2102.09448 2026-05-12 stat.ME math.ST stat.TH

A Generative Approach to Joint Modeling of Quantitative and Qualitative Responses

Xiaoning Kang, Lulu Kang, Wei Chen, Xinwei Deng

AI总结在许多科学领域，常常需要同时处理定量和定性响应变量，并且预测变量数量庞大。本文提出了一种生成模型方法，用于联合建模定量与定性响应变量及其预测变量的联合分布。该方法在惩罚似然框架下实现了高效的参数估计，能够在保证计算效率的同时，准确分类定性响应并预测定量响应。理论分析表明，在一定正则条件下，该方法在分类和预测方面具有渐近最优性，模拟和实际案例研究验证了其有效性。

2008.06525 2026-05-12 stat.ME

Bayesian Auxiliary Variable Model for Birth Records Data with Qualitative and Quantitative Responses

Xiaoning Kang, Shyam Ranganathan, Lulu Kang, Julia Gohlke, Xinwei Deng

AI总结本文提出了一种贝叶斯辅助变量模型，用于同时分析具有定性与定量响应的数据，旨在更准确地捕捉两者之间的依赖关系。该方法通过引入潜在变量建立响应之间的联系，并采用高效的MCMC算法进行参数后验分布估计。研究应用于弗吉尼亚州健康部门的出生记录数据，分析了早产与婴儿出生体重之间的相互依赖关系，验证了模型在预测性能上的优势。

Comments 27 pages, 3 figures. 3 tables

2008.06476 2026-05-12 stat.ME

Locally Optimal Design for A/B Testing in the Presence of Covariates and Network Connection

Qiong Zhang, Lulu Kang

AI总结本文研究了在存在协变量和网络连接的情况下，如何设计更有效的A/B测试实验。作者将处理分配、协变量和网络结构纳入条件自回归模型，提出了一种基于方差最小化的设计准则，并采用局部最优设计方法应对网络相关参数的不确定性。实验表明，考虑网络依赖性的设计能显著提升A/B测试的效果，并且所提方法对参数选择具有鲁棒性。

Comments 19 pages, 8 figures

2008.06475 2026-05-12 stat.ME

A Maximin $Φ_{p}$-Efficient Design for Multivariate GLM

Yiou Li, Lulu Kang, Xinwei Deng

AI总结本文研究了在多元广义线性模型（GLM）中如何设计高效实验方案，以应对模型参数和结构的不确定性。提出了一种新的最大化最小 $Φ_p$-效率（Mm-$Φ_p$）设计方法，旨在在模型不确定性下保证设计效率的最差情况也尽可能高。基于该准则的理论性质，作者开发了一种具有良好收敛性的高效算法，并通过数值例子验证了该设计方法的有效性。

2008.05578 2026-05-12 stat.ME

Covariate Balancing Based on Kernel Density Estimates for Controlled Experiments

Yiou Li, Lulu Kang, Xiao Huang

AI总结该论文研究了在受控实验中如何通过协变量平衡来提高因果效应估计的准确性。作者提出了一种基于核密度估计的协变量平衡准则，用于在实验前对实验单元进行分组，以减少协变量在处理组之间的差异。该方法通过最小化处理组协变量核密度估计的差异来实现更均衡的分组，数值实验表明该方法相比完全随机化和再随机化方法能更有效地提升均值差异估计的精度。

Comments 26 page, 2 figures, 1 table

2004.09887 2026-05-12 stat.CO

Is a Transformed Low Discrepancy Design Also Low Discrepancy?

Yiou Li, Lulu Kang, Fred J. Hickernell

AI总结本文研究了将低差异设计通过变量变换应用于任意目标分布后，是否仍保持低差异的问题。作者分析了不同核函数对差异度量的影响，指出在满足特定条件时变换后的设计仍具有低差异，但在实际应用中这些条件可能难以满足，导致差异增大。为此，文章提出了两种改进方法：一种是确保原始设计具有一维最优投影，适用于高密度设计；另一种是将变换后的设计作为输入，通过坐标交换算法优化目标差异，适用于各类设计。

详情

DOI: 10.1007/978-3-030-46161-4_5
Journal ref: 2020, Book Chapter in Fan J., Pan J. (eds) Contemporary Design of Experiments, Multivariate Analysis and Data Mining--Festschrift in Honor of Professor Kai-Tai Fang. Springer, Cham

英文摘要

Experimental designs intended to match arbitrary target distributions are typically constructed via a variable transformation of a uniform experimental design. The inverse distribution function is one such transformation. The discrepancy is a measure of how well the empirical distribution of any design matches its target distribution. This chapter addresses the question of whether a variable transformation of a low discrepancy uniform design yields a low discrepancy design for the desired target distribution. The answer depends on the two kernel functions used to define the respective discrepancies. If these kernels satisfy certain conditions, then the answer is yes. However, these conditions may be undesirable for practical reasons. In such a case, the transformation of a low discrepancy uniform design may yield a design with a large discrepancy. We illustrate how this may occur. We also suggest some remedies. One remedy is to ensure that the original uniform design has optimal one-dimensional projection, but this remedy works best if the design is dense, or in other words, the ratio of sample size divided by the dimension of the random variable is relatively large. Another remedy is to use the transformed design as the input to a coordinate-exchange algorithm that optimizes the desired discrepancy, and this works for both dense or sparse designs. The effectiveness of these two remedies is illustrated via simulation.

URL PDF HTML ☆

赞 0 踩 0

2004.06443 2026-05-12 stat.ML cs.LG

Particle-based Energetic Variational Inference

Yiwei Wang, Jiuhai Chen, Chun Liu, Lulu Kang

AI总结本文提出了一种基于能量耗散律的变分推断新框架——能量变分推断（EVI），能够统一并推导出多种现有的粒子型变分推断方法，如Stein变分梯度下降（SVGD）。在此框架下，作者还提出了一种新的粒子型EVI方法，采用“先近似后变分”的策略，在每一步迭代中显著降低KL散度，数值实验表明该方法在保持目标分布忠实度方面优于现有方法。

Comments 17 pages, 7 figures

1910.03120 2026-05-12 stat.ME

Gaussian Process Assisted Active Learning of Physical Laws

Jiuhai Chen, Lulu Kang, Guang Lin

AI总结在科学与工程领域，从噪声实验数据中发现控制微分方程是一个关键挑战。本文提出一种主动学习方法，通过结合D-最优性与最大化最小空间填充准则，以减少实验数据量准确估计未知微分方程。该方法利用高斯过程回归模型对未知解及其导数进行估计，并结合变量选择回归方法从实验数据中学习微分方程，多个案例研究表明该方法在模型精度和数据效率方面优于传统设计方法。

Comments 27 pages, 5 figures, 10 tables

1902.00482 2026-05-12 stat.ME

D-optimal Design for Network A/B Testing

Victoria Pokhiko, Qiong Zhang, Lulu Kang, D'arcy P. Mays

AI总结本文研究了在网络环境下进行A/B测试时如何优化实验设计的问题，提出了基于条件自回归模型的方法，以捕捉网络结构对处理效应的影响。通过构建D-最优设计准则，并利用混合整数规划方法求解最优实验方案，有效提升了网络A/B测试的统计效率。该方法在合成网络和真实社交网络上的数值实验验证了其有效性。

Comments 24 pages, 5 figures, 2 tables

2605.10069 2026-05-12 stat.AP

Estimating Consensus Epidemic Trajectories via a Constrained Power Fréchet Mean with Functional Registration

Yui Tomo, Shu Tamano, Daisuke Yoneoka

AI总结本文提出了一种在函数空间中总结SEIR型传染病模型多种解的方法，通过计算带有功能注册的约束幂Fréchet均值，以获得具有部分机制可解释性的共识疫情轨迹。该方法将暴露和传染群体对视为希尔伯特空间中的对象，共识轨迹通过包含微分方程和人口约束的优化问题定义，从而保留对传染群体的部分机制解释。研究还开发了一种高效的分块优化算法，并利用模拟和文献中的新冠疫情数据进行了验证，为传染病模型的模型平均和集成预测提供了通用的轨迹汇总框架。

2605.10042 2026-05-12 stat.ME math.PR stat.AP

A Statistical Framework for Learning Preferences from the Past

Tamojit Sadhukhan, Moulinath Banerjee, Krishanu Maulik, Parthanil Roy

AI总结本文提出了一种统计框架，用于从用户过去的重复选择中学习其潜在偏好，以提升个性化推荐和选择预测的准确性。该方法基于一个自然的单调性假设，即过去被选择频率或强度更高的选项在未来更可能再次被选择，并对原有参数模型进行了非参数扩展。研究还提出了在单调性约束下的最大似然估计方法，并通过理论分析和实验验证了方法的有效性。

Comments 31 pages, 2 figures

2605.10019 2026-05-12 cs.LG cs.AI cs.CC stat.ML

The two clocks and the innovation window: When and how generative models learn rules

Binxu Wang, Emma Lucia Byrnes Finn, Bingbin Liu

AI总结该论文研究了生成模型在有限数据下学习规则时所面临的基本矛盾，即模型的训练目标使其更倾向于拟合经验分布而非目标分布。通过引入两个关键时间点——规则生效时间 $τ_{\mathrm{rule}}$ 和记忆重现时间 $τ_{\mathrm{mem}}$，论文分析了生成模型何时开始生成符合规则的样本以及何时开始复制训练数据。研究发现，这两个时间点受规则复杂度、模型容量和数据规模等因素影响，并定义了“创新窗口”作为模型真正创新的时期，揭示了生成模型在不同架构下学习规则的共性与差异。

Comments 48 pages, 28 figures. Earlier versions are presented in NeurIPS2025 SPIGM workshop as oral presentation https://openreview.net/forum?id=LjqX8OhPPi

2605.10015 2026-05-12 stat.ML cs.CR cs.LG

Differentially Private Sampling from Distributions via Wasserstein Projection

Shokichi Takakura, Seng Pei Liew, Satoshi Hasegawa

AI总结本文研究了在差分隐私约束下从分布中采样的问题。与以往基于密度比的效用度量方法不同，本文提出以Wasserstein距离作为效用指标，克服了传统方法在捕捉分布支持几何结构和处理不同支持分布方面的不足。作者提出了基于Wasserstein投影的最小最大最优机制（WPM），并设计了相应的高效近似算法，提供了收敛性保证，为差分隐私采样提供了新的理论框架和实用方法。

2605.09953 2026-05-12 stat.ME

Generalized Boundary FDR Control under Arbitrary Dependence: An Approach on Closure Principle

Yifan Zhang, Wentao Zhang, Changliang Zou, Haojie Ren

AI总结本文针对多重假设检验中边界发现的可靠性问题，提出了一种新的误差度量 $k$-bFDR，用于控制最不显著的 $k$ 个发现的错误概率。基于闭包原则，作者构建了名为 Domino 的统一框架，在任意依赖性下实现 $k$-bFDR 控制，适用于 p 值和 e 值。理论分析与数值实验表明，Domino 能有效保证 $k$-bFDR 控制并提升边界发现的可靠性，实际数据分析也验证了其在提高拒绝集质量与实用价值方面的优势。

2605.09880 2026-05-12 math.NA cs.NA stat.CO stat.ME

Parameter Estimation for Partially Observed Time-Changed SDEs

Ke Zhao, Ajay Jasra

AI总结本文研究了对部分观测的时变随机微分方程（SDEs）进行参数估计的问题，观测数据在离散时间点给出。作者提出了新的马尔可夫链蒙特卡洛（MCMC）算法，结合无偏得分型随机逼近方法，用于构造似然型参数估计器，并进一步用于多层级贝叶斯参数估计。该方法在数值实验中展示了良好的性能，理论分析表明其均方误差为 $\mathcal{O}(ε^2)$，计算成本为 $\mathcal{O}(ε^{-2}\log(ε)^2)$。

2605.09857 2026-05-12 stat.ML cs.LG

Unified Approach for Weakly Supervised Multicalibration

Futoshi Futami, Takashi Ishida

AI总结该论文研究了弱监督学习下多校准（multicalibration）的问题，即在缺乏干净标签的情况下，如何使模型预测的分数与真实标签概率在不同子群和评分相关测试中保持一致。为解决这一问题，作者提出了一种统一框架，结合污染矩阵风险重写和基于见证的校准约束，实现了在弱监督设置下的多校准误差估计与后处理修正，并提出了一个通用的弱标签多校准提升算法（WLMC）。实验表明该方法在多种弱监督场景下有效，为不确定性估计提供了新的实证见解。

2605.09849 2026-05-12 stat.ME

Proximal Causal Inference for Hidden Outcomes

Helen Guo, Ilya Shpitser, Elizabeth L. Ogburn

AI总结本文研究了在存在隐藏结果的情况下如何进行因果推断，提出了一种基于近似因果推理的方法。该方法利用特征值-特征向量结构重建潜在分布，并在此基础上构建了基于影响函数的因果效应估计器。该方法无需依赖无偏代理测量或部分观测，实现了多重稳健性和较高的估计效率，是该领域的一项重要进展。

2605.09834 2026-05-12 stat.ML cs.LG

Supercharging Bayesian Inference with Reliable AI-Informed Priors

Jongwoo Choi, Sean O'Hagan

AI总结本文研究了如何利用现代预测系统提供的信念作为统计推断的先验信息，以提升数据有限情况下的推断性能。为了解决预测模型误差可能传播到后验分布的问题，作者提出了一种修正AI生成数据规律的框架，用于构建更可靠的AI先验。该方法显著降低了偏差，提高了可信区间覆盖率，并在实际皮肤疾病分类任务中验证了其有效性。

2605.09757 2026-05-12 cs.LG stat.ML

On Uniform Error Bounds for Kernel Regression under Non-Gaussian Noise

Johannes Teutsch, Oleksii Molodchyk, Marion Leibold, Timm Faulwasser, Armin Lederer

AI总结本文研究了在非高斯噪声环境下基于核回归的函数估计的非保守不确定性量化问题，提出了新的非渐近概率统一误差界。与以往仅适用于次高斯噪声的界不同，本文的界适用于更广泛的非高斯噪声分布，包括次高斯、有界、次指数以及方差/矩有界噪声，并且适用于相关和不相关噪声。通过与现有结果在不确定性区域和安全控制性能上的对比，验证了所提出误差界的紧致性。

Comments This paper has been accepted at the 43rd International Conference on Machine Learning (ICML) 2026

2605.09755 2026-05-12 math.NA cs.DS cs.LG cs.NA stat.ML

Accelerating Power Method with Fast Sketching for Stronger Low-Rank Approximation

Shabarish Chenakkod, Michał Dereziński

AI总结本文研究如何加速幂法以实现更强的低秩近似，针对传统幂法在高秩目标下计算成本高的问题，提出了一种基于快速随机投影的加速框架。该方法在奇异值分解、低秩分解和Nystrom近似等任务中表现出高效且稳定的数值性能，其核心创新在于引入了正则化谱近似理论，为幂法的推广提供了更灵活的分析工具。

2605.09741 2026-05-12 stat.ME

Adaptive discovery of effect modification in matched observational studies

Yu Gui, Dylan S Small, Zhimei Ren

AI总结本文研究了在配对观察性研究中发现效应修饰的问题，即治疗效果在不同子群体中的差异。作者提出了一种有限样本下有效的子群发现方法，能够精确控制子群层面的错误发现率，并考虑了未测量混杂因素的影响。该方法通过利用多个匹配的对照组提升统计功效，在模拟研究和实际应用中均表现出优于现有方法的性能。

2605.09740 2026-05-12 econ.EM stat.ME stat.ML

LGB+: A Macroeconomic Forecasting Road Test

Philippe Goulet Coulombe

AI总结本文提出了一种名为LGB+的梯度提升方法，旨在提高宏观经济时间序列的预测性能。该方法通过在每一步同时评估树模型和线性模型，并选择表现更优的模型进行更新，从而在保持非线性建模能力的同时更高效地捕捉数据中的线性关系。LGB+能够将预测分解为线性和非线性部分，有助于理解变量重要性和历史影响权重，在具有显著自回归特征或混合线性-非线性信号的宏观经济指标预测中表现出色。

2605.09718 2026-05-12 stat.ML cs.LG math.PR math.ST stat.TH

Learning stochastic multiscale models through normalizing flows

Anan Saha, Arnab Ganguly

AI总结该论文研究了如何从单一观测轨迹中学习多尺度随机系统的有效动力学模型。作者提出了一种基于轨迹的框架，通过耦合多尺度随机微分方程建模系统动力学，并利用随机平均方法进行模型降阶。为了解决降阶模型中依赖于难以求解的快变量不变分布的问题，作者引入了归一化流来参数化该分布，并通过端到端优化学习模型参数，同时采用变分贝叶斯推断方法进行不确定性量化，从而实现了对多尺度系统中认识不确定性的有效刻画。

Comments 17 pages, 4 figures

详情

英文摘要

Many systems in physics, engineering, and biology exhibit multiscale stochastic dynamics, where low-dimensional slow variables evolve under the influence of high-dimensional fast processes. In practice, observations are often limited to a single trajectory of the slow component, while the fast dynamics remain unobserved, making statistical learning challenging. Approaches based on partial differential equations (PDE), such as Fokker-Planck formulations, aim to characterize the evolution of probability densities, typically requiring dense space-time data or grid-based solvers. In contrast, we adopt a trajectory-based perspective and develop a data-driven framework for learning effective stochastic dynamics from a single observed path. We model the dynamics by coupled multiscale stochastic differential equations (SDEs) and first obtain a principled model reduction through stochastic averaging. Unlike generic model reduction techniques such as PCA, this respects the dynamical structure of the original system and explicitly incorporates the interaction between slow and fast scales. A central challenge, however, is that the reduced model depends on the invariant distribution of the fast process, which is a solution to an intractable and often unknown PDE. We introduce a novel learning framework that parameterizes the invariant distribution using normalizing flows, enabling expressive density modeling in the latent fast-variable space. The flow is trained end-to-end by optimizing a penalized likelihood objective induced by the reduced stochastic dynamics. Furthermore, we develop a Bayesian variational inference procedure for uncertainty quantification, employing a second normalizing flow to approximate the posterior distribution over model parameters. This yields a scalable approach to capturing epistemic uncertainty in multiscale systems.

URL PDF HTML ☆

赞 0 踩 0

2605.09717 2026-05-12 math.ST stat.TH

The general regularisation scheme applied to conditional density estimation

Gilles Germain

AI总结本文将通用正则化方法应用于条件密度估计，提出了一种统一的框架，并推导出具有严格收敛速率保证的新估计器。该方法采用计算更高效的Landweber正则化，实验表明其在多种场景下表现优于或不低于Nadaraya-Watson估计器，包括时间序列模型。

Comments 15 pages, 0 figures

2605.09712 2026-05-12 econ.EM q-fin.PM stat.ML

Quantifying the Risk-Return Tradeoff in Forecasting

Philippe Goulet Coulombe

AI总结本文研究了在预测领域中风险与收益的权衡问题，提出将预测误差相对于基准的差异视为收益序列，并采用金融领域的风险调整绩效指标对其进行评估。研究引入了Edge Ratio等新指标，用于衡量模型提供独特信息预测的能力，并将该框架应用于美国宏观经济预测，比较了计量经济模型、机器学习方法及专业预测者的绩效，发现尽管机器学习在平均准确性上可能优于专业预测者，但在风险调整后的表现上专业预测者更具优势，体现出其在风险控制和情境判断上的价值。

2605.09702 2026-05-12 stat.ME cs.CL

Calibrate, Don't Curate: Label-Efficient Estimation from Noisy LLM Judges

Yanran Li

AI总结本文研究了在存在噪声标签的多评委评估体系中，如何高效估计大型语言模型的性能。传统方法倾向于通过筛选高准确率的评委来提升评估效果，但作者发现，当目标是校准后的概率评估时，保留全部评委反而表现更优。研究表明，即使某些评委的准确率低于平均水平，只要其偏差可学习且信息不冗余，就能为校准带来帮助，因此在有标注校准数据的情况下，应避免仅依据准确率剔除弱评委。

2605.09673 2026-05-12 stat.ME

On the Need for Spatial Random Effects in Bayesian Regression Models for Multilevel Areal Data

Shuqi Lin, Joshua L. Warren

AI总结本文研究了在多层级区域数据的贝叶斯回归模型中是否需要引入空间随机效应的问题。作者在高斯响应的分层贝叶斯框架下，利用Leroux条件自回归（CAR）先验分布，推导出一个样本量阈值 $m^*$，用于判断空间模型对回归系数推断的影响程度。研究发现，当样本量低于该阈值时，空间建模对推断有显著影响，而当样本量高于该阈值时，非空间模型即可得到相近结果。该阈值依赖于空间相关参数、区域间与区域内方差比以及协变量与空间模式的对齐程度，为实际研究设计提供了实用指导。

2605.09654 2026-05-12 stat.ML cs.LG stat.CO

Metropolis-Adjusted Diffusion Models

Kevin H. Lam, Tyler Farghly, Christopher Williams, Jun Yang, Yee Whye Teh, Arnaud Doucet

AI总结本文研究了基于分数的扩散模型中的采样偏差问题，提出了一种基于Metropolis-Hastings（MH）或Barker接受-拒绝步骤的修正方法，以减少时间离散化和分数函数近似带来的偏差。作者引入了一种基于双硬币伯努利工厂算法的精确修正方法，并提出了一种基于辛普森法则的高效近似方法，显著提升了采样质量。实验表明，该方法在合成数据和图像数据集上均取得了更好的样本生成效果，尤其在FID指标上表现突出。

2605.09562 2026-05-12 stat.ME

Laplace Variational Inference for Dirichlet Process Mixtures of Marked Poisson Point Processes

Minsung Choi, Seonghyun Jeong

AI总结本文研究具有标记的泊松点过程数据的聚类问题，提出了一种基于狄利克雷过程的标记泊松点过程混合模型，能够同时推断潜在的聚类结构、聚类数量以及连续的标记特异性强度表面。为实现高效后验推断，作者设计了一种变分贝叶斯算法，并采用约束拉普拉斯近似处理非共轭部分，有效解决了平方链模型中的符号歧义和节点线问题。实验表明，该方法在合成数据和实际数据分析中均表现出良好的性能。

2605.09552 2026-05-12 math.OC cs.LG stat.ML

Phases of Muon: When Muon Eclipses SignSGD

Elliot Paquette, Noah Marshall, Lucas Benigni, Guangyuan Wang, Atish Agarwala, Courtney Paquette

AI总结本文研究了Muon及其相关的谱优化方法在高维矩阵最小二乘问题中的行为，揭示了其与SignSVD和SignSGD等随机优化方法之间的关系。通过推导确定性动态模型，分析表明Muon在大批次时相当于对数据协方差谱进行平方根预处理，而小批次时则表现出类似SGD的行为，收敛速度变慢。研究还发现，在各向异性数据下，SignSVD和SignSGD的性能存在显著差异，并在协方差幂律模型中识别出三种不同的性能相态。

2605.09525 2026-05-12 stat.ME

Simultaneous false discovery rate control in location families

Zijun Gao, Wenjie Hu, Qingyuan Zhao

AI总结在使用来自位置族的数据进行多个统计假设检验时，除了控制零假设的错误发现率（FDR）外，还希望对其他被认为在实践中不显著的参数值进行FDR控制。本文将FDR视为一个关于位置参数的曲线，并提出了一种对Benjamini-Hochberg程序的简单推广方法，以确保该FDR曲线低于任意用户指定的水平。作为主要结果的一个推论，标准的Benjamini-Hochberg程序在控制零假设FDR的同时，实际上也免费实现了对整个FDR曲线的同步控制。

Comments 11 pages, 3 figures

2605.09509 2026-05-12 stat.ML cs.LG stat.ME

Empirical Bayes 1-bit matrix completion

Takeru Matsuda

AI总结本文研究了二值矩阵中未观测条目预测的问题，即1比特矩阵补全，该问题在推荐系统等领域有广泛应用。受Efron-Morris估计器启发，作者提出了一种经验贝叶斯方法，通过收缩奇异值来利用二值矩阵的低秩结构，方法在预测精度、不确定性量化和计算效率方面优于现有方法。

2605.09506 2026-05-12 stat.ME q-bio.QM stat.CO

Accelerating Bayesian Phylogenetic Inference via Delayed Acceptance Sequential Monte Carlo with Random Forest Surrogates

Wentao Yu, Shijia Wang

AI总结在贝叶斯系统发育分析中，研究旨在估计系统发育树的后验分布。本文提出了一种基于随机森林的代理模型，用于预测标准MCMC方法中树结构变化（如eSPR、stNNI）对似然函数的影响，从而设计出一种延迟接受MCMC核，显著减少似然函数的计算次数。该方法进一步集成到序贯蒙特卡洛采样框架中，实验表明其在保持估计精度的同时大幅提升了计算效率。

2605.09485 2026-05-12 cs.LG stat.ML

SEMASIA: A Large-Scale Dataset of Semantically Structured Latent Representations

Mario Edoardo Pandolfo, Enrico Grimaldi, Lorenzo Marinucci, Leonardo Di Nino, Simone Fiorellino, Sergio Barbarossa, Paolo Di Lorenzo

AI总结本文介绍了SEMASIA，一个大规模的语义结构潜在表示数据集，包含从约1700个预训练视觉模型中提取的潜在表示，覆盖八个标准图像分类基准。该数据集配以描述模型架构、训练方式、预训练来源等结构化元数据，旨在解决不同模型潜在空间几何结构不兼容的问题。研究通过分析潜在空间的概念组织、对齐映射性能以及预训练数据与模型特性对表示的影响，展示了SEMASIA在可解释性、迁移学习等任务中的应用价值。

2605.09471 2026-05-12 math.ST stat.TH

The Statistical Cost of Adaptation in Multi-Source Transfer Learning

Abhinav Chakraborty, Subha Maity

AI总结本文研究了多源迁移学习中适应未知源到目标偏差所带来的统计代价。作者引入了“适应的内在代价”这一概念，用于衡量在不了解偏差的情况下，任意估计器与理想 oracle 估计器之间的风险比。研究发现，在参数估计场景下，多源迁移与单源迁移有本质区别，适应并非总能实现，且随着源数量增加，适应代价会提升。此外，当无法在全部偏差空间中进行适应时，某些结构假设可显著降低代价，文中提出了针对不同场景的估计方法并提供了理论与实验支持。

2605.09462 2026-05-12 stat.ME math.ST stat.ML stat.TH

Proximal Path-Specific Inference

Yang Bai, Sihan Wu, Baoluo Sun, Yifan Cui

AI总结本文研究了因果中介分析中路径特异性效应的估计问题，旨在在存在未观测混杂因素的情况下，准确分离特定中介路径上的处理效应。作者提出利用可观测协变量作为代理变量，构建近端混杂桥函数，发展了四种非参数识别策略，并设计了一种四重稳健且局部高效的估计方法，同时提出了适用于高维 nuisance 参数的近端去偏机器学习方法。理论分析表明该估计方法在 nuisance 函数估计速率较慢时仍具有根号n一致性与渐近正态性，实际应用验证了其有效性。

2605.09456 2026-05-12 stat.ML cs.LG math.AP math.OC

Quantitative Local Convergence of Mean-Field Stein Variational Gradient Flow

Lénaïc Chizat, Maria Colombo, Roberto Colombo, Xavier Fernández-Real

AI总结本文研究了均场Stein变分梯度流（SVGD）在局部区域内的定量强收敛性。针对$d$维环面上的Riesz型交互核，作者在初始密度与目标分布在$L^2$范数下接近且光滑的条件下，给出了明确的多项式收敛速率，并证明了这些速率在某些情形下是紧致的。研究还表明，当核具有库仑奇异性时，可恢复先前工作的全局指数收敛结果，理论分析受到核均值差异Wasserstein梯度流研究的启发。

2605.09454 2026-05-12 stat.ML cs.LG

Optimal Regret for Single Index Bandits

Devdan Dey, Sujoy Bhore, Avishek Ghosh

AI总结本文研究单索引老虎机问题，其中奖励依赖于高维上下文的未知一维投影，且投影函数未知。该模型扩展了线性及广义线性老虎机到非参数设置，适用于奖励函数未知的情形。作者提出了一种两阶段算法ZoomSIB-UCB，通过归一化Stein估计器估计投影方向，再将其转化为一维老虎机问题并使用UCB策略，从而在无需额外假设的情况下实现了最优的$\tilde{\mathcal{O}}(T^{2/3})$ regret上界，并证明了匹配的下界$\tildeΩ(T^{2/3})$，给出了单索引老虎机问题的精确regret刻画。

Comments 27 pages, 9 figures

2605.09439 2026-05-12 cs.LG stat.ML

Inverse Design for Conditional Distribution Matching

Ori Meidler, Shaul Tolkovsky, Or Zuk

AI总结该论文提出了一种新的逆设计问题——条件分布匹配（CDM），旨在从给定的联合分布 $\mathcal{P}(X, Y)$ 中找到输入 $x^*$，使得其诱导的条件分布 $\mathcal{P}(Y \mid X = x^*)$ 与目标分布 $\mathcal{G}(Y)$ 匹配。为了解决这一问题，作者提出了 MLGD-F 算法，结合预训练的扩散模型和快速条件采样器，在无需额外训练的情况下实现高效求解。实验表明，该方法在多种任务中能够可靠地恢复出满足用户指定分布目标的输入。

2605.09408 2026-05-12 cs.LG cs.SI stat.ML

GravityGraphSAGE: Link Prediction in Directed Attributed Graphs

Riccardo Porcedda, Francesca Chiaromonte, Fabrizio Lillo, Andrea Vandin

AI总结本文研究了有向属性图中的链接预测问题，即预测图中节点之间缺失或未来的连接关系。为了解决现有方法在处理有向图和节点属性时的不足，作者提出了基于引力机制的改进版GraphSAGE模型——GravityGraphSAGE（GG-SAGE），首次将GraphSAGE应用于有向链接预测任务。实验表明，该模型在多个基准数据集和真实网络数据上优于现有最先进的图深度学习链接预测方法，展示了其在复杂图结构中的有效性与扩展性。

2605.09396 2026-05-12 cs.IT cs.LG math.IT math.ST stat.ML stat.TH

Universal Feature Selection with Noisy Observations and Weak Symmetry Conditions

Dier Tang, Guangyue Han

AI总结本文放宽了现有研究中对对称性的严格限制，提出了一种适用于噪声观测和具有方向偏好属性结构的通用特征选择框架。通过引入由二阶矩距离度量的弱球对称性概念，允许在旋转不变性上存在可控偏差，并基于噪声数据计算的典型依赖矩阵的奇异值分解构建特征选择方法。研究证明，所选特征在渐近情况下可达到接近最优的误差指数，其性能依赖于对称性偏差和噪声水平，当这些参数较小时，结果与已有研究一致，表明精确球对称性并非必要。该成果展示了框架对二阶矩偏差和观测噪声的鲁棒性，拓展了其在多种推理任务中的适用性。

Comments 6 pages, 0 figures. This work has been submitted to the 2026 IEEE Information Theory Workshop (ITW) for possible publication

2605.09305 2026-05-12 stat.ME cs.HC cs.LG stat.CO stat.ML

Reinforcement Learning Measurement Model

Wenqian Xu, Feng Ji

AI总结本文提出了一种新的强化学习测量模型（RLMM），用于处理交互式评估中产生的序列过程数据，克服了传统项目反应模型和现有基于马尔可夫决策过程的测量模型在处理大规模任务时的计算效率问题。该模型通过共享参数化的动作价值函数，将个体选择敏感性与任务价值表示解耦，从而提高了估计效率，并引入了玻尔兹曼选择规则、软贝尔曼一致性惩罚和块坐标MAP估计方法，实现了对行为关键决策的诊断。实验表明，RLMM在复杂任务中具有更高的估计精度和更低的运行时间，并能有效反映个体决策能力与任务表现之间的关系。

2605.09300 2026-05-12 stat.ME

Causal Stability Selection

Falco J. Bargagli-Stoffi, Omar Melikechi

AI总结本文研究如何识别影响治疗效果的协变量这一因果推断中的核心问题。作者提出了一种新的因果稳定性选择方法，将交叉拟合的条件平均处理效应估计与路径稳定性选择相结合，能够在有限样本下有效控制假阳性数量，提高发现结果的可重复性。该方法适用于任意的处理效应估计器和基础选择器，并在标准假设下保证估计的收敛性，建立了处理效应估计与效应修饰变量发现之间的直接联系。

2605.09291 2026-05-12 cs.LG stat.AP

dFlowGRPO: Rate-Aware Policy Optimization for Discrete Flow Models

Zhengyan Wan, Yidong Ouyang, Panwen Hu, Qiang Sun

AI总结本文提出了一种名为dFlowGRPO的强化学习框架，用于离散流模型，支持更广泛的概率路径和非掩码源分布。该方法通过推导离散流模型的完整轨迹概率，将去噪过程建模为马尔可夫决策过程，从而在强化学习中结合条件转移率和后验模型的信息。实验表明，dFlowGRPO在文本到图像生成任务中优于现有的GRPO方法，并在理解任务中展现出强大的能力。

2605.09264 2026-05-12 stat.ME

Nested Sensitivity Envelopes for Transported Quantile Treatment Effects

Pengyun Wang

AI总结本文研究在存在未测量混杂因素和目标人群不可推广性的情况下，如何估计目标人群的分位数处理效应。作者提出了一种嵌套敏感性包络方法，结合源人群的处理分配敏感性约束和源到目标潜在结果分布的条件似然比约束，推导出针对每个处理组和分位点的闭式分位数反事实累积分布函数包络。该方法在保持标准化的同时提升了传统似然比放松方法的精度，并发展了相应的半参数理论，实现了对分位数效应的精确置信区间估计。

2605.09257 2026-05-12 stat.ME

Regularity, Phase Transitions, and Uniform Inference for Proximal Counterfactual Quantile Processes

Pengyun Wang

AI总结本文研究了在未测量混杂因素下，利用近端负控制代理变量对反事实分布、分位数和下尾风险过程进行半参数推断的理论问题。通过建立连续的逆问题框架，作者提出了原桥方程和对偶桥方程，并揭示了反事实累积分布函数可微性的精确正则性边界。研究还给出了典型梯度表达式，分析了根号n可估性的相变条件，并提出了高效的CDF过程推断和分位数带估计方法，为因果推断提供了新的理论工具和计算方法。

2605.09256 2026-05-12 cs.LG cs.AI stat.ML

Improving Generalization by Permutation Routing Across Model Copies

Shuhei Kashiwamura, Timothee Leleu

AI总结本文提出了一种利用 $M$-cover 变换来提升机器学习模型泛化能力的方法。该方法通过复制模型 $M$ 次，并利用结构化的混合核 $Q$ 对模型参数进行排列路由，从而在不同副本之间传递局部学习信息，而非传统的参数平均或显式吸引力机制。这种方法通过结构化的消息共享机制，有效改善了模型的泛化性能，适用于从感知机到多层感知机等多种模型结构。

2605.07964 2026-05-12 stat.ML cs.LG

Asymptotically Log-Optimal Bayes-Assisted Confidence Sequences for Bounded Means

Valentin Kilian, Stefano Cortinovis, François Caron

AI总结该论文提出了一种基于贝叶斯预测模型的置信序列构造方法，用于对有界独立同分布观测的均值进行时间统一的不确定性量化。核心方法通过在每一步选择最大化预测期望对数增长的合法鞅更新因子，从而在保持有效性的同时利用先验信息提升效率。研究证明，当预测分布满足Wasserstein一致性时，该方法在渐近意义上达到对数最优，实验表明其在减少置信区间宽度和采样努力方面具有显著优势。

Comments Valentin and Stefano are joint first authors

2605.05743 2026-05-12 stat.ML cs.AI cs.LG

Fourier Feature Methods for Nonlinear Causal Discovery: FFML Scoring, TRFF Scoring, and FFCI Testing in Mixed Data

Joseph D. Ramsey

AI总结该论文提出三种基于傅里叶特征的实用方法，用于解决非线性因果发现中的大规模计算问题。FFML 评分通过有限维特征表示近似高斯过程边缘似然，降低了计算复杂度并支持混合数据；TRFF 评分采用带惩罚的Student-t回归，具有更强的鲁棒性和更快的运行速度；FFCI 检验则是一种适用于混合数据的快速非参数条件独立性检验方法。这些方法在不同数据场景下表现出互补的优势，提升了因果发现的准确性和效率。

Comments 18 pages, 2 figures, 3 tables

2605.04915 2026-05-12 quant-ph cs.IT math.IT math.ST stat.TH

Optimal Error Exponents for Composite Sequential Quantum Hypothesis Testing

Jacob Paul Simpson, Efstratios Palias, Sharu Theresa Jose

AI总结本文研究复合序贯量子假设检验问题，旨在从一组备择量子态中区分零假设量子态。作者提出了一种混合序贯量子似然比检验方法，根据当前对备择集合的混合估计自适应选择测量，并在混合对数似然比首次越过阈值时停止。该方法在期望样本数量受限的条件下，同时达到了类型一和（最坏情况）类型二错误的最优指数，该指数由零假设与备择集合之间的最小测度相对熵表征，并证明了相应的最优性界。研究还表明，在复合序贯量子假设检验中实现趋于零的错误概率，所需的期望样本复杂度至少与两个固定态之间的序贯检验相当。

Comments Under Review

2605.04589 2026-05-12 stat.ML cs.LG math.ST stat.TH

Multiscale Euclidean Network Trajectories: Second-Moment Geometry, Attribution, and Change Points

Haruka Ezoe, Ryohei Hisano

AI总结本文研究动态网络随时间演变的几何表征问题，提出了一种基于二阶矩几何的多尺度欧几里得网络轨迹框架（MENT）。通过引入各向同性归一化处理，消除节点嵌入中的线性变换模糊性，从而保留几何结构并支持轨迹与节点层面的时间变化分析。该方法能够进行模式分解、变化归因和变点检测，并在合成与真实动态网络实验中展现出良好的结构恢复与变点检测性能。

2605.02326 2026-05-12 stat.AP q-fin.PM

Large-Scale Asset Selection via Metric Dependence with Enriched High Frequency Information

Yangzhou Chen, Shuaida He, Xin Chen

AI总结本文研究了如何利用高频率数据进行大规模资产选择，以提高投资组合的绩效。作者提出了一种名为度量依赖筛选（MDS）的方法，通过将每只资产的日收益率与日内风险状态曲线结合为点-曲线对象，并引入加权乘积度量，保留收益信息和日内风险动态。MDS通过Fréchet变分依赖分数对资产进行排序，从而筛选出最优投资标的，最终结合传统均值-方差或最小方差方法进行资产配置。实证研究表明，MDS在保留日内风险动态的前提下，显著提升了投资组合的样本外表现。

2604.27569 2026-05-12 stat.ME

Robust Nonparametric Testing Approaches for Spatial Regression

Kanghyun Wi, Hyoeun Kim, Tomáš Mrkvička, Jorge Mateu, Jaewoo Park

AI总结本文针对空间回归模型中的可靠推断问题，提出了一种基于随机位移的稳健非参数蒙特卡洛检验框架，避免了传统参数方法对空间依赖结构、均值趋势和误差分布的严格假设。该方法通过构建残差与目标协变量之间的依赖性统计量，评估协变量的显著性，适用于多种模型且无需参数假设或检验统计量的显式分布形式。研究还证明了该检验在样本协方差作为统计量时的渐近精确性，并通过数值实验验证了其在保持名义显著性水平的同时具有良好的检验效能。

2604.23904 2026-05-12 stat.ME cs.AI stat.ML

Generative Synthetic Data for Causal Inference: Pitfalls, Remedies, and Opportunities

Yichen Xu

AI总结该论文研究了生成合成数据在因果推断中的有效性问题，指出传统生成模型虽在预测性能上表现良好，但可能扭曲平均处理效应（ATE）估计。文章分析了生成模型在保留协变量分布与准确处理效应之间的结构性矛盾，并提出了一种混合生成框架，将协变量生成与处理和结果机制建模分离，以提升因果推断的准确性。实验表明，该方法在多种场景下相比全生成模型能显著提高因果推断的保真度。

2604.20172 2026-05-12 cs.LG math.ST stat.ML stat.TH

Cover meets Robbins while Betting on Bounded Data: $\ln n$ Regret and Almost Sure $\ln\ln n$ Regret

Shubhada Agrawal, Aaditya Ramdas

AI总结本文研究在有界数据序列上进行投注时的策略设计，旨在同时应对随机数据和对抗性数据。提出了一种结合Robbins和Cover思想的混合投注策略，该策略在几乎所有路径上实现了$O(\ln \ln n)$的对数对数级遗憾，而在少数路径上则保持$O(\ln n)$的对数级遗憾。该方法首次展示了通过策略对冲实现对随机数据和对抗数据的自适应性，具有重要的理论价值和应用前景。

Comments Improved a regret bound. New regret bound for a classical mixture

2604.17676 2026-05-12 stat.ME econ.EM math.ST stat.TH

Subsample-Based Estimation under Dynamic Contamination

Yukai Yang, Rickard Sandberg

AI总结本文研究了动态时间序列模型中基于子样本估计在数据污染情况下的结构性失效问题。即使已知污染位置，剔除污染观测也无法恢复无污染的目标函数，因为污染会通过残差滤波传播并扭曲估计准则，导致子样本估计量对干净数据参数不一致。为此，作者提出了一种基于补丁移除算子的传播兼容性变换，能够在污染存在时恢复估计一致性，且不影响无污染模型下的估计性能，该方法适用于广泛的残差型估计器，无需对污染过程进行建模。

Comments 42 pages, 2 figures, 6 tables, 1 algorithm. Code available at https://github.com/yukai-yang/Robust_Experiments

2604.08789 2026-05-12 eess.SY cs.SY stat.AP

Quantifying the resilience benefits of undergrounding a circuit with utility data

Arslan Ahmad, Ian Dobson, Anne Kimber

AI总结本文利用历史停电数据，量化了将架空线路改为地下线路所带来的韧性提升效益。通过对比线路在过去若为地下线路时的运行表现，研究分析了停电次数、受影响用户数、停电时长和用户停电小时数等指标，结果显示两种选定线路的年用户停电小时数分别减少了75%和78%。此外，还评估了加快10%停电恢复速度所带来的额外效益。

2604.03928 2026-05-12 cs.LG cs.AI cs.CV stat.ML

Supervised Dimensionality Reduction Revisited: Why LDA on Frozen CNN Features Deserves a Second Look

Indar Kumar, Girish Karhana, Sai Krishna Jasti, Ankit Hemant Lade

AI总结本文重新审视了在冻结的预训练卷积神经网络特征上应用监督降维方法的有效性，特别是线性判别分析（LDA）。研究对比了多种降维策略在多个视觉任务上的表现，发现LDA在粗粒度分类任务中能显著提升分类准确率并大幅降低特征维度，但在细粒度任务中效果较差。实验表明，LDA在类间结构较明显时表现优异，而对需要细微区分的任务则可能适得其反，为冻结特征分类流程中的降维应用提供了实用指导。

Comments 11 pages, 5 figures, 5 tables. Code available at https://github.com/IndarKarhana/lda-image-classification

2604.03883 2026-05-12 cs.LG cs.AI cs.SY eess.SY stat.ML

Regime-Calibrated Fleet Repositioning with a Spatial Queue-Regret Decomposition

Indar Kumar, Akanksha Tiwari

AI总结本文研究了网约车和自动驾驶按需出行运营商在未完全观测未来需求前对闲置运力进行再分配的问题，提出了一种基于历史需求模式校准的预测-优化方法。核心方法包括训练一个能减少需求误差、接单位置偏差和排队短缺风险的相似性门控，并构建了空间排队遗憾分解模型，以稳定队列代理模型分析需求场误差对等待时间的影响。实验表明，该方法在纽约市多个场景中有效降低了平均等待时间，优于传统调优方法和分布型基线。

Comments 13 pages, 4 figures, 8 tables. Code: https://github.com/IndarKarhana/regime-calibrated-dispatch

2603.28254 2026-05-12 cs.LG stat.ML

MuonEq: Balancing Before Orthogonalization with Lightweight Equilibration

Da Chang, Qiankun Shi, Lvgang Zhang, Yu Li, Ruijie Zhang, Yao Lu, Yongxiang Liu, Ganzhao Yuan

AI总结本文提出了一种名为MuonEq的轻量级预正交化均衡方法，用于改进矩阵参数优化中的正交化更新策略。该方法在正交化之前对动量矩阵进行行或列归一化，从而提升正交化过程中的几何特性，改善训练效果。实验表明，MuonEq在多个大规模语言模型的预训练任务中表现优于原有方法，具有更快的收敛速度和更低的验证困惑度。

2603.02678 2026-05-12 cs.LG cs.ET cs.HC stat.ME stat.ML

Causal Discovery Should Embrace the Wisdom of the Crowd

Ryan Feng Lin, Yuantao Wei, Huiling Liao, Xiaoning Qian, Shuai Huang

AI总结本文提出了一种基于“群体智慧”的因果学习新范式，主张通过整合多人提供的分散且可能带有噪声的因果知识来构建全局因果结构。研究引入了众包平台、专家知识获取与聚合技术以及大语言模型辅助的信息获取等手段，构建了一个涵盖知识获取、建模、聚合与优化的群体因果学习框架。该方法为因果学习提供了新的研究方向，同时也带来了跨学科合作的机遇与挑战。

2602.05946 2026-05-12 cs.LG stat.ML

f-GRPO and Beyond: Divergence-Based Reinforcement Learning Algorithms for General LLM Alignment

Rajdeep Haldar, Lantao Mei, Guang Lin, Yue Xing, Qifan Song

AI总结本文研究了如何通过基于散度的强化学习算法实现大语言模型的一般对齐，包括基于可验证奖励的强化学习（RLVR）等场景。作者提出了 $f$-GRPO 和 $f$-HAL 两种方法，分别用于基于策略的奖励优化和结合策略与偏好监督的混合对齐损失，证明了它们能够估计奖励对齐与不对齐分布之间的 $f$-散度，并在实验中展示了其在数学推理任务和安全对齐中的优越性。

2601.23252 2026-05-12 stat.CO cs.LG stat.ML

Nested Slice Sampling: Vectorized Nested Sampling for GPU-Accelerated Inference

David Yallup, Namu Kroupa, Will Handley

AI总结本文提出了一种名为嵌套切片采样（Nested Slice Sampling, NSS）的算法，旨在提高嵌套采样在GPU上的可扩展性和计算效率。该方法通过引入切片采样的击中-运行策略，实现了对约束更新的向量化处理，并给出了一个简单且近似最优的切片宽度设置规则，提升了高维问题下的性能和并行计算的可预测性。实验表明，NSS在复杂模型比较、高维贝叶斯推断和高斯过程超参数边缘化等任务中，能够保持准确的证据估计和高质量的后验样本，尤其在多模态问题上表现出优于现有方法的鲁棒性。

Comments 58 pages, 13 figures, Accepted to Transactions on Machine Learning Research

2601.22320 2026-05-12 cs.LG stat.ML

Matrix Factorization for Practical Continual Mean Estimation Under User-Level Differential Privacy

Nikita P. Kalinin, Ali Najar, Valentin Roth, Christoph H. Lampert

AI总结本文研究了在用户级差分隐私保护下的连续均值估计问题，即在数据向量依次到达的情况下，如何持续准确地估计累积均值。为了解决这一问题，作者采用近似差分隐私框架，并结合矩阵分解机制，提出了一种专门用于均值估计的矩阵分解方法，该方法在保证隐私的同时，能够显著降低均值估计的均方误差，提升了实际应用中的估计精度与效率。

2512.04366 2026-05-12 stat.ME stat.AP

Sequential Randomization Tests Using e-values: Applications for trial monitoring

Fernando G Zampieri

AI总结本文提出了一类基于e值的非参数序贯随机化检验方法（e-RT），用于随机试验的序贯监测，适用于二分类、事件型和连续型终点。该方法利用随机化机制保证检验的正确性，通过构建测试鞅来实现对治疗效应的持续监控，无需依赖参数假设或渐近近似。研究还展示了方法的校准性和功效，并探讨了不同结局类型下下注策略的原理性差异，为序贯分析提供了一种保守且假设较少的补充方法。

2512.00175 2026-05-12 stat.ME cs.LG stat.ML

Comparing Two Proxy Methods for Causal Identification

Helen Guo, Elizabeth L. Ogburn, Ilya Shpitser

AI总结本文比较了两种用于因果识别的代理变量方法：桥接方程方法和数组分解方法。前者通过求解积分方程来恢复因果目标，后者则通过特征分解任务识别潜在因子以估计反事实效应。研究分析了两种方法的模型限制及其假设条件，明确了各自的适用范围，为因果效应识别提供了理论指导。

Comments 10 pages; 5 figures

2510.22351 2026-05-12 math.ST stat.ME stat.ML stat.TH

Design Stability in Adaptive Experiments: Implications for Treatment Effect Estimation

Saikat Sengupta, Koulik Khamaru, Suvrojit Ghosh, Tirthankar Dasgupta

AI总结本文研究了在顺序自适应治疗分配机制下估计平均处理效应（ATE）的问题，与传统完全随机设计不同，治疗分配概率可能依赖于之前的分配和观测结果。文章提出了两种自然的ATE估计器——逆概率加权（IPW）估计器和增强型IPW（AIPW）估计器，并引入“设计稳定性”这一核心概念，保证了估计量的渐近正态性。研究建立了IPW和AIPW估计器的中心极限定理，给出了其渐近方差的显式表达式，并提出了方差估计方法，从而能够构建渐近有效的置信区间，理论结果在Wei自适应硬币设计和Efron偏倚硬币设计中得到了验证。

2509.22196 2026-05-12 cs.LG stat.ML

Mechanistic Independence: A Principle for Identifiable Disentangled Representations

Stefan Matthes, Zhiwei Han, Hao Shen

AI总结本文提出了一种基于“机制独立性”的统一框架，用于实现可识别的解耦表征，其核心在于通过潜变量对观测变量的作用方式来刻画潜在因素，而非依赖潜变量的分布特性。该方法在潜变量密度变化甚至引入统计依赖的情况下仍保持不变性，并提出了多种独立性准则，证明了即使在非线性和非可逆混合条件下，也能实现潜空间的可识别性。研究还建立了这些准则之间的层次关系，并从图论角度对潜空间进行了结构表征，为解耦表征的可识别性提供了新的理论基础。

2509.18484 2026-05-12 stat.ML cs.LG

Estimating Heterogeneous Causal Effect on Networks via Orthogonal Learning

Yuanchen Wu, Yubai Yuan

AI总结本文研究了在网络数据中估计异质性因果效应的问题，即处理不仅影响自身节点，还可能对邻居节点产生溢出效应，且不同节点和边的因果效应可能存在差异。为此，作者提出了一种两阶段正交学习框架，第一阶段利用图神经网络估计与协变量和网络结构相关的干扰因素，第二阶段通过可解释的注意力机制模型估计直接和溢出效应，并提供了边级、节点级和群体级的因果效应估计。该方法通过正交化和交叉拟合降低对第一阶段估计误差的敏感性，并结合自助法进行不确定性量化，实验表明其在异质效应估计和后续可解释分析方面具有优势。

2509.02510 2026-05-12 cs.CL cs.AI stat.ML

Top-H Decoding: Adapting the Creativity and Coherence with Bounded Entropy in Text Generation

Erfan Baghaei Potraghloo, Seyedarmin Azizi, Souvik Kundu, Massoud Pedram

AI总结本文提出了一种名为Top-H的解码方法，旨在解决大语言模型在开放文本生成中创造力与连贯性之间的平衡问题。通过建立熵约束下的最小化散度理论框架，并将其转化为熵约束质量最大化问题，作者设计了一种高效的贪心算法来实现该目标。实验表明，Top-H在创意写作任务上优于现有方法，提升了约25.63%，同时在问答任务中也保持了良好的连贯性，具有实际应用价值。

详情

英文摘要

Large language models (LLMs), despite their impressive performance across a wide range of tasks, often struggle to balance two competing objectives in open-ended text generation: fostering diversity and creativity while preserving logical coherence. Existing truncated sampling techniques, including temperature scaling, top-\$p\$ (nucleus) sampling, and min-\$p\$ sampling, aim to manage this trade-off. However, they exhibit limitations, particularly in the effective incorporation of the confidence of the model into the corresponding sampling strategy. For example, min-\$p\$ sampling relies on a single top token as a heuristic for confidence, eventually underutilizing the information of the probability distribution. Toward effective incorporation of the confidence of the model, in this paper, we present **top-H** decoding. We first establish the theoretical foundation of the interplay between creativity and coherence in truncated sampling by formulating an **entropy-constrained minimum divergence** problem. We then prove this minimization problem to be equivalent to an **entropy-constrained mass maximization** (ECMM) problem, which is NP-hard. Finally, we present top-H decoding, a computationally efficient greedy algorithm to solve the ECMM problem. Extensive empirical evaluations demonstrate that top-H outperforms the state-of-the-art (SoTA) alternative of min-\$p\$ sampling by up to **25.63%** on creative writing benchmarks, while maintaining robustness on question-answering datasets such as GPQA, GSM8K, and MT-Bench. Additionally, an *LLM-as-judge* evaluation confirms that top-H indeed produces coherent outputs even at higher temperatures, where creativity is especially critical. In summary, top-H advances SoTA in open-ended text generation and can be *easily integrated* into creative writing applications. The code is available at https://github.com/ErfanBaghaei/Top-H-Decoding.

URL PDF HTML ☆

赞 0 踩 0

2507.14453 2026-05-12 stat.ME

Generalized optimal parameter-transfer learning through Mallows-type model averaging

Fen Jiang, Wenhui Li, Xinyu Zhang

AI总结在许多经济应用中，虽然存在多个源数据集，但由于数据集之间的异质性，有效整合这些数据具有挑战性。本文提出了一种参数迁移学习框架，仅共享源模型的参数估计，并引入一种基于Mallows型准则的模型平均方法，用于在参数设定下结合目标模型与源模型。该方法在目标预测风险的无偏估计方面具有优势，并在目标模型误设时保证权重的渐近最优性，且无需任何源模型正确设定。研究还拓展了该框架至半参数和面板数据场景，并通过模拟研究和房价应用验证了方法的有效性。

Comments Substantially revised and expanded version of arXiv:2507.14453v1, extending the original SAR-model framework to a broader class of parametric models

2506.19230 2026-05-12 stat.ME stat.CO

gcor: A Python Implementation of Categorical Gini Correlation and Its Inference

Sameera Hewage

AI总结本文介绍了gcor，一个用于计算分类Gini相关系数（CGC）的Python实现，该系数用于衡量数值变量与分类变量之间的依赖关系。CGC相比现有方法具有更优越的统计性质，如零相关意味着变量独立，并在分类特征筛选中表现出更好的性能。本文提供了高效的算法实现，包括置信区间构建和独立性检验，并通过向量化和并行化优化了计算效率。

Comments Added Computational Performance section and 4 figures

2506.05967 2026-05-12 cs.AI cs.LG stat.ML

Preference Learning for AI Alignment: a Causal Perspective

Katarzyna Kobalczyk, Mihaela van der Schaar

AI总结本文从因果视角探讨了基于偏好数据的奖励建模问题，旨在提升大语言模型与人类价值观的一致性。研究指出了因果误识别、偏好异质性及用户特定因素带来的混淆等关键挑战，并借鉴因果推断领域的理论，明确了实现可靠泛化的必要假设。通过分析朴素奖励模型的失效模式，文章展示了因果启发方法在提升模型鲁棒性方面的潜力，并提出了未来研究和实践应关注的方向。

2505.22873 2026-05-12 econ.GN q-fin.EC stat.ML

Forecasting Residential Heating and Electricity Demand with Scalable, High-Resolution, Open-Source Models

Stephen J. Lee, Cailinn Drouin

AI总结本文提出了一种基于概率深度学习模型的高分辨率住宅供暖和非供暖用电需求预测框架。该方法利用建筑层面的多模态数据，如建筑面积、高度、周边环境及高分辨率天气信息，实现了对住宅用电和供暖需求的精细化预测。相比现有标准模型ResStock，该方法在建筑层面的预测精度显著提升，RMSE分别降低18.8%和27.6%，为政策制定者和电网规划者提供了开放、可扩展的高精度预测工具，有助于推动美国建筑领域的低碳转型。

Comments 11 pages, 4 figures, 2 tables. Published version (Energy and AI 24 (2026) 100726). Supplementary material available at the publisher: https://doi.org/10.1016/j.egyai.2026.100726

详情

DOI: 10.1016/j.egyai.2026.100726
Journal ref: Energy and AI 24 (2026) 100726

英文摘要

We present a novel framework for high-resolution forecasting of residential heating demand and non-heating electricity demand using probabilistic deep learning models. Because our models are trained on electricity consumption from a predominantly gas-heated region, the learned electricity demand patterns primarily reflect non-heating end uses such as lighting, appliances, and cooling. We focus specifically on providing hourly building-level electricity and heating demand forecasts for the residential sector. Leveraging multimodal building-level information -- including data on building footprint areas, heights, nearby building density, nearby building size, land use patterns, and high-resolution weather data -- and probabilistic modeling, our methods provide granular insights into demand heterogeneity. Validation at the building level underscores a step change improvement in performance relative to NREL's ResStock model, which has emerged as a research community standard for residential heating and electricity demand characterization. In building-level heating and electricity estimation backtests, our probabilistic models respectively achieve RMSE scores 18.8% and 27.6% lower than those based on ResStock, with probabilistic forecast quality measured via WIS improving by 59% for both applications. By offering an open-source, scalable, high-resolution platform for demand estimation and forecasting, this research advances the tools available for policymakers and grid planners, contributing to the broader effort to decarbonize the U.S. building stock and meeting climate objectives.

URL PDF HTML ☆

赞 0 踩 0

2505.18269 2026-05-12 cs.LG math.OC math.PR stat.ML

Representative Action Selection for Large Action Space Bandit Families

Quan Zhou, Mark Kozdoba, Shie Mannor

AI总结本文研究了从共享动作空间的多个老虎机问题中选择代表性动作子集的问题。在实际场景中，尽管动作空间较大，但不同动作在不同环境中的奖励高度相关，因此无需保留全部动作。作者提出了一种简单有效的算法，通过随机采样并求解每个老虎机实例，收集其最优动作，从而显著减少动作空间。该方法无需预先了解动作间的相关性结构，并在理论上保证了性能，实验也验证了其优于多种基准方法。

2505.06835 2026-05-12 cs.LG stat.CO stat.ME stat.ML

Streaming Sliced Optimal Transport

Khai Nguyen

AI总结本文提出了一种用于流式数据的切片沃谢尔距离估计方法——Streaming Sliced Wasserstein（Stream-SW），旨在提升切片最优传输在计算效率和内存消耗方面的表现。该方法基于对一维沃谢尔距离的流式估计，结合分位数近似技术，实现了对流式样本的高效处理。实验表明，与随机子采样方法相比，Stream-SW 在保持较低内存消耗的同时，能够更准确地逼近切片沃谢尔距离，并在点云分类、梯度流和流式变化点检测等任务中展现出优越的性能。

Comments Accepted to ICML 2026, 22 pages, 8 figures, 7 tables

2504.01781 2026-05-12 math.ST stat.ML stat.TH

Proper scoring rules for estimation and forecast evaluation

Kartik Waghmare, Johanna Ziegel

AI总结本文综述了适当评分规则的数学基础及其在统计学和机器学习中的应用。适当评分规则不仅用于概率预测的评估，还可用于概率分布的估计，文章介绍了其一般性理论结果和重要类别，并探讨了其在估计与预测评价中的作用。此外，还评论了其在实际应用中的最新发展。

2409.15645 2026-05-12 quant-ph stat.ML

Quantum Machine Learning in Drug Discovery: Applications in Academia and Pharmaceutical Industries

Anthony M. Smaldone, Yu Shee, Gregory W. Kyro, Chuzhi Xu, Nam P. Vu, Rishab Dutta, Marwa H. Farag, Alexey Galda, Sandeep Kumar, Elica Kyoseva, Victor S. Batista

AI总结本文综述了量子机器学习在药物发现领域的应用，重点探讨了基于量子门的量子神经网络在学术界和制药工业中的潜力。文章介绍了量子机器学习的理论基础，包括数据编码、变分量子电路和混合量子-经典方法，并展示了其在分子性质预测和分子生成等任务中的应用。同时，文章也客观分析了该领域面临的挑战与未来发展方向。

2407.16239 2026-05-12 cs.LG stat.ML

Identifiable Latent Bandits: Leveraging observational data for personalized decision-making

Ahmet Zahid Balcıoğlu, Newton Mwai, Emil Carlsson, Fredrik D. Johansson

AI总结本文研究了如何利用观测数据实现可识别的潜在变量多臂老虎机模型，以提升个性化决策效率。提出了一种基于非线性独立成分分析的框架，能够从历史决策和结果中学习到足够表征潜在问题结构的表示，从而在较短的探索时间内做出最优决策。该方法在模拟和半合成环境中验证有效，相比传统在线和离线学习方法表现出显著优势。

Comments 35 pages, 21 figures

2406.13111 2026-05-12 stat.ME

Nonparametric Motion Control in Functional Connectivity Studies in Children with Autism Spectrum Disorder

Jialu Ran, Sarah Shultz, Benjamin B. Risk, David Benkeser

AI总结该研究旨在解决自闭症谱系障碍（ASD）儿童功能连接分析中因头部运动引起的伪影问题。研究提出了一种非参数的运动校正方法MoCo，无需剔除运动较大的参与者，而是通过机器学习集成方法灵活建模运动及其他特征对功能连接的影响，从而更准确地估计ASD与非ASD儿童之间的功能连接差异。该方法在大样本下具有高效性和多重稳健性，有效减少了运动伪影，同时提高了数据利用效率并降低了选择偏差的风险。

2307.09077 2026-05-12 q-fin.TR stat.ML

Estimation of an Order Book Dependent Hawkes Process for Large Datasets

Luca Mucciante, Alessio Sancetta

AI总结本文研究了高频交易中事件到达的点过程建模问题，提出了一种结合Hawkes过程与订单簿协变量高维函数的模型。为处理大规模数据集，文中设计了一种高效估计算法，并证明了其收敛性与一致性。实证部分应用于纽约证券交易所四只股票的数据，结果表明，捕捉订单簿信息的非线性特征有助于提升模型对高频交易事件自激发特性的刻画能力。

2011.04135 2026-05-12 stat.ME stat.AP

Mixture of Finite Mixtures Model for Basket Trial

Junxian Geng, Tianjian Zhou, Ruitao Lin, Guanyu Hu

AI总结随着癌症药物研发从细胞毒性药物向靶向治疗和免疫肿瘤学治疗转变，篮子试验允许具有相同分子靶点的不同癌症亚型患者参与。本文提出一种两步方法，在分层分析与完全数据合并之间取得平衡：首先利用混合有限混合（MFM）模型对具有相似治疗效应的队列进行聚类，其次在每个聚类内使用贝叶斯分层模型的收缩估计方法进行治疗效应估计。该方法在模拟研究和Vemurafenib篮子试验数据分析中得到了验证，有效避免了传统方法中因可交换性假设失效导致的过度收缩问题。

Comments 18 pages, 1 figure

2005.04721 2026-05-12 stat.AP stat.ME

Decision Making in Drug Development via Inference on Power

Geoffrey S Johnson

AI总结本文探讨了药物开发过程中基于统计功效的决策问题，指出传统做法是用外部研究结果替代功效公式中的未知参数，而贝叶斯方法则通过先验或后验分布计算成功概率以反映不确定性。作者提出应将这两种方法视为对功效的不同点估计，并指出仅依赖这些点估计进行“继续/终止”决策无法充分量化和控制风险，主张采用基于功效的统计推断方法以提升决策的科学性和风险管理水平。

1706.00476 2026-05-12 math.OC cs.LG stat.ML

The Mixing method: low-rank coordinate descent for semidefinite programming with diagonal constraints

Po-Wei Wang, Wei-Cheng Chang, J. Zico Kolter

AI总结本文提出了一种用于解决具有对角约束的结构化半定规划问题的低秩坐标下降方法，称为“Mixing方法”。该方法实现简单、无需调参，并在优化性能上相比现有方法有显著提升。研究证明该方法严格递减、收敛于临界点，且在足够秩的条件下所有非最优临界点均为不稳定的。此外，该方法在随机初始化下几乎肯定以局部线性速率收敛到全局最优解，这是首个无需假设即可在球面流形上达到全局最优的低秩半定规划方法。作者将该算法应用于最大割问题和最大可满足性问题的松弛求解，并在多个方面展示了优于现有方法的显著改进。

Comments The proof has been updated to match the version presented in the 2021 thesis: https://ml.cmu.edu/research/phd-dissertation-pdfs/thesis_poweiw.pdf

2605.09235 2026-05-12 cs.LG cs.AI stat.ML

On Variance Reduction in Learning Mean Flows

Juanwu Lu, Ziran Wang

AI总结本文研究了在学习均值流（MeanFlow）过程中方差减少的问题，指出当前训练方法因错误使用条件速度场而导致损失不降和梯度方差无界。作者提出了一种理论分析，明确了最优的系数设置，并表明已有多种改进方法实际上对应于同一最优解的不同实现。实验表明，使用最优系数可显著提升样本质量，并揭示了梯度方差最小化与FID指标优化之间的不匹配现象。

Comments 25 pages, 7 figures, 6 tables

2605.09214 2026-05-12 cs.LG cs.AI cs.IT math.IT math.ST stat.ML stat.TH

Fast Rates for Offline Contextual Bandits with Forward-KL Regularization under Single-Policy Concentrability

Qingyue Zhao, Kaixuan Ji, Heyang Zhao, Quanquan Gu

AI总结本文研究了在单策略可集中性条件下，使用前向KL正则化的离线上下文老虎机问题，提出了首个达到 $\tilde{O}(ε^{-1})$ 的上界分析，显著优于以往 $\tilde{O}(ε^{-2})$ 的慢速率结果。通过引入一种新的凸分析方法，结合悲观原则，统一了表格和一般函数逼近场景，并避开了基于平均值定理的传统证明方法。此外，作者还给出了匹配的下界，证明了所获上界在统计速率上的最优性，并揭示了前向KL正则化在低正则化区域与无正则化方法具有一致的慢速率表现。

Comments 31 pages, comments are welcome

2605.09193 2026-05-12 stat.AP stat.ME

Quantifying Time-Varying Physical Activity Intervention Effects via Functional Regression

Nidhi Pai, Yu Lu, Kristin A. Linn, Erjia Cui

AI总结该研究旨在量化体力活动干预效果随时间的变化，提出了一种基于函数回归的方法，将整个体力活动轨迹作为函数观测进行建模，从而更准确地捕捉干预效果的动态变化。相较于传统方法，该方法在方法论和实际应用中均展现出优势，并进一步扩展为函数-函数回归以分析不同时间段体力活动之间的关联。研究应用该方法分析了STEP UP研究中的每日步数数据，揭示了三种干预策略在体力活动上的不同时间变化效应及其持续性差异，展示了函数数据分析在高维终点干预研究中的应用潜力。

2605.09147 2026-05-12 cs.CL cs.AI stat.AP

From Traditional Taggers to LLMs: A Comparative Study of POS Tagging for Medieval Romance Languages

Matthias Schöffel, Esteban Garces Arias

AI总结本文对比研究了传统词性标注工具与大型语言模型（LLMs）在中世纪罗曼语（包括中世纪奥克语、加泰罗尼亚语和法语）词性标注任务中的表现。研究发现，基于LLM的方法在零样本、少样本、单语微调和跨语言迁移等设置下均优于传统标注工具，其中微调和多语训练效果最佳。研究还指出，跨语言迁移对资源匮乏的语言尤为有效，而有针对性的双语训练在特定目标语言上可能优于更广泛的多语配置，为历史自然语言处理提供了重要的实践指导。

Comments Accepted at NLP4DH @ ACL 2026

2605.09116 2026-05-12 stat.ME stat.AP stat.ML

Fit CATE Once: Model-Assisted Randomization Tests Without Sample Splitting

Fangnan Zheng, Yao Zhang

AI总结本文提出了一种无需样本分割的模型辅助随机化检验方法，旨在结合随机化检验和灵活处理效应模型的优势，以更有效地分析随机面板实验数据。核心思想是从残差化结果的协方差结构中估计无符号条件平均处理效应（CATE），并利用实际分配结果进行随机化推断，从而在保持统计有效性的同时提升检验功效。该方法在合成和半合成实验中表现出更好的类型I错误控制和更高的检验功效，并可用于识别异质子群体及检验子群体特定的处理效应。

Comments 48 pages, 7 figures

2605.09075 2026-05-12 stat.ML cs.LG

Optimality of Sub-network Laplace Approximations: New Results and Methods

Swarnali Raha, Kshitij Khare, Rohit K Patra

AI总结本文研究了子网络拉普拉斯近似方法在深度神经网络不确定性量化中的最优性问题。现有方法通常依赖于对参数子集的启发式选择，忽略了参数间的交叉作用，且缺乏理论保证。作者通过理论分析证明，所有子网络拉普拉斯方法都会系统性低估全拉普拉斯后验的预测方差，且该偏差随保留参数子矩阵的增大而减小。基于这一发现，本文提出了两种基于梯度和贪心策略的子网络拉普拉斯近似方法，并证明其在理论上的优越性，实验也表明其性能优于现有方法。

Comments 34 Pages, 8 Figures, 2 Tables

2605.09064 2026-05-12 stat.AP

Bayesian decision theory for wildlife management under uncertainty: from inference to action

Olivier Gimenez, Abby Keller, Cyril Milleret

AI总结该研究探讨了在不确定性条件下，如何利用贝叶斯决策理论将生态学推断结果有效应用于野生动物管理决策。研究提出了一种基于标准贝叶斯工具的实用工作流程，并通过法国狼群管理和荷兰麝鼠防控两个案例展示了其应用。结果表明，该方法能够明确权衡不同目标，提升决策的透明性与实用性，为生态模型与管理决策的整合提供了灵活框架。

Comments 3 figures

详情

英文摘要

Ecologists are increasingly expected to inform management decisions under uncertainty, yet most analytical workflows stop at statistical inference. This disconnect limits the practical impact of ecological modelling, particularly in high-stakes contexts such as wildlife management, where decisions must balance ecological, economic and social objectives. Bayesian decision theory provides a coherent framework to bridge this gap. It propagates uncertainty from posterior distributions to quantify the consequences of alternative actions through utility functions. Despite its strong theoretical foundations, it remains underused in ecology. Here, we present a practical workflow for implementing Bayesian decision theory using standard Bayesian tools. We illustrate the approach with two case studies. First, wolf management in France, where the decision consists of selecting the number of wolves that can be removed under uncertainty about population dynamics. Second, invasive muskrat management in the Netherlands, where the decision involves allocating a fixed control effort across space. In both cases, expected utility is computed from posterior simulations, explicitly accounting for uncertainty and trade-offs. Results show that optimal decisions emerge as a compromise between competing objectives. In the wolf case, optimal harvest balances removal benefits and population risk. In the muskrat case, optimal effort increases with the importance of population reduction and is unevenly allocated across provinces. These examples show that Bayesian decision theory can be implemented as a direct extension of standard inference. By making trade-offs explicit, it enhances transparency, reproducibility, and relevance for management. More broadly, it provides a flexible basis for integrating ecological modelling with decision-making.

URL PDF HTML ☆

赞 0 踩 0

2605.08995 2026-05-12 stat.ME

Semiparametric Elliptical Mixture Clustering for High-Dimensional Data

Long Feng, Dan Zhuang

AI总结本文提出了一种用于高维数据的半参数椭球混合聚类方法，旨在解决在分布具有重尾且近似椭球结构时聚类的挑战。该方法通过引入簇特定中心、未知的公共径向生成函数和稀疏的公共精度-形状矩阵，结合数据驱动的聚类数选择规则，构建了一个灵活的聚类框架。研究开发了一种基于变换半径估计、径向得分中心更新和Tyler-POET-GLASSO算法的广义期望最大化（GEM）算法，实现了高维下的计算可行性，并在模拟研究和手写数字应用中验证了其优越的聚类性能和鲁棒性。

2605.08980 2026-05-12 cs.LG math.OC stat.ML

Muon Does Not Converge on Convex Lipschitz Functions

Tetiana Parshakova, Ahmed Khaled, Michael Crawshaw, Guillaume Garrigos, Robert M. Gower

AI总结本文研究了Muon优化算法在凸Lipschitz函数上的收敛性问题，指出尽管Muon及其变体在深度学习中表现出色，但其收敛性分析通常依赖于平滑性假设，而凸Lipschitz函数类却是许多优化方法的基础。研究发现，Muon在凸Lipschitz函数上无法收敛，无论学习率如何选择。虽然误差反馈机制可以恢复其收敛性，但在图像分类和语言建模任务中却会损害其性能，表明Muon的成功可能源于凸Lipschitz模型所缺乏的结构，最可能是与平滑性相关。

2605.08963 2026-05-12 stat.ML cs.LG

Survey-aware Machine Learning: A Guideline for Valid Population Health Inference based on Scoping Review

YongKyung Oh, Henry W. Zheng, Jeffrey Feng, Alex A. T. Bui

AI总结该研究针对基于复杂健康调查数据（如NHANES）的机器学习模型中常忽略调查设计信息的问题，提出了一个九步指南——Survey-aware Machine Learning（SaML），以确保人口健康推断的有效性。通过综述16篇方法学论文，总结了加权模型训练、基于设计的交叉验证和调查调整性能评估等现有方法，并指出现有研究在超参数调优和部署方面的不足。SaML为不同分析目标提供了具体的步骤指导，有助于提升模型的公平性和推断准确性。

2605.08928 2026-05-12 math.OC stat.ML

Learning Generative Dynamics with Soft Law Constraints: A McKean-Vlasov FBSDE Approach

Samer El Boustany, Samy Mekkaoui, Yadh Hafsi, Alexandre Alouadi, Huyên Pham

AI总结本文提出了一种基于 McKean-Vlasov 前向-后向随机微分方程（FBSDE）的生成框架，用于从终端和中间分布观测中学习随机动力学。该方法通过软能量约束强制终端和时间边缘分布，将生成过程建模为一个受均场目标驱动的控制问题，从而提供了一种不同于硬插值或最优传输映射的生成方式。实验表明，该方法能够生成符合给定边缘分布的平滑随机路径，并在高维人体运动数据上展示了其对结构化分布学习的有效性。

2605.08873 2026-05-12 cs.LG stat.AP stat.ML

CoDistill-GRPO: A Co-Distillation Recipe for Efficient Group Relative Policy Optimization

Soo Min Kwon, Ziteng Sun, Ananda Theertha Suresh, Himanshu Jain, Sanjiv Kumar

AI总结 Group Relative Policy Optimization（GRPO）是一种提升语言模型推理能力的有效算法，但在处理困难任务时，由于稀疏奖励的问题，难以提升小型模型的性能。为此，本文提出CoDistill-GRPO，一种通过联合训练大模型和小模型的协同蒸馏方法，利用精心设计的GRPO目标，使两者相互学习，从而提升小模型的表现并降低训练成本。实验表明，CoDistill-GRPO在多个数学基准测试中显著优于传统GRPO，同时在大模型训练中也实现了效率提升。

2605.08871 2026-05-12 math.OC cs.DC cs.LG stat.ML

Rennala MVR: Improved Time Complexity for Parallel Stochastic Optimization via Momentum-Based Variance Reduction

Zhirayr Tovmasyan, Artavazd Maranjyan, Peter Richtárik

AI总结本文研究了在异构计算集群中如何通过方差缩减技术提升并行随机优化算法的时间复杂度。作者提出了一种基于动量的方差缩减方法Rennala MVR，改进了原有的Rennala SGD算法，并在均方平滑假设下证明了其时间复杂度的优越性。实验表明，该方法在理论分析和实际应用中均能有效提升优化效率。

2605.08866 2026-05-12 stat.ML cs.LG math.OC

Tight Generalization Bounds for Noiseless Inverse Optimization

Pouria Fatemi, Hoomaan Maskan, Suvrit Sra, Peyman Mohajerin Esfahani

AI总结本文研究了无噪声逆优化问题，旨在从观测到的上下文-动作数据中推断决策者的优化目标参数。作者提供了高概率下的 $O(\frac{d}{T})$ 通用化界，并在特定条件下进一步加强了这一界，使其与强化学习中的最佳臂识别结果相一致。此外，作者证明了该界在所考虑的一致估计器中是紧致的，并将结果扩展到瞬时和累积遗憾分析，实验验证了理论结果的有效性。

Comments 29 pages, 2 figures

2605.08864 2026-05-12 cs.LG math.ST stat.TH

Higher-Order Equilibrium Tracking for EM-Compressible Online Estimation

ZhiMing Li, Yue Song

AI总结本文研究了潜在变量模型中的在线估计问题，将其重新表述为追踪一个移动的实证均衡。作者提出了一种新的分析框架，将在线估计分解为当前运行统计量对应的冻结批量均衡和追踪滞后误差，并证明了在一定条件下，在线估计器可以继承批量估计的中心极限定理和精确的一阶风险常数。研究还引入了EM压缩性及相关概念，为在线追踪提供了理论支持，并在潜在线性高斯协方差估计中验证了该方法的有效性。

Comments 41 pages, 6 figures

2605.08850 2026-05-12 math.OC cs.LG stat.ML

Local LMO: Constrained Gradient Optimization via a Local Linear Minimization Oracle

Peter Richtárik, Kaja Gruntkowska, Hanmin Li

AI总结本文提出了一种新的无投影梯度优化方法 Local LMO，用于解决约束优化问题。其核心思想是用局部线性最小化预言替代传统 Frank-Wolfe 方法中的全局线性最小化预言，通过在当前迭代点周围的小球区域内进行约束集的交集最小化操作，从而实现更高效的优化过程。Local LMO 在多个重要场景下继承了投影梯度下降的收敛速率，并在无需约束集有界、无需曲率假设等条件下，获得了凸函数、强凸函数以及非凸、随机和非光滑问题的多种收敛性保证。

Comments 71 pages, 8 figures

2605.08811 2026-05-12 stat.ML cs.LG

Learning Theory of Transformers: Local-to-Global Approximation via Softmax Partition of Unity

Zhongjie Shi, Wenjing Liao

AI总结本文研究了Transformer网络在紧致欧几里得域和紧致黎曼流形上的回归任务中的学习理论，提出了一种基于softmax分区统一性的构造性逼近框架，通过注意力机制实现局部逼近的全局聚合。研究表明，仅包含两个编码器块和标准单隐藏层前馈网络的密集型Transformer，能够以$\mathcal{O}(\varepsilon^{-d/α})$参数数量实现对α-Hölder连续函数的均匀ε逼近。进一步分析表明，该模型的泛化误差界达到近似最小最大最优，为$\mathcal{O}\big(n^{-\frac{2α}{2α+d}} \log n\big)$，其中$n$为训练样本数量。

2605.08793 2026-05-12 cs.MS cs.AI cs.LG stat.CO stat.ML

cuRegOT: A GPU-Accelerated Solver for Entropic-Regularized Optimal Transport

Yixuan Qiu

AI总结最优传输（OT）已成为现代机器学习中的基础工具，但在大规模应用中其计算成本仍是一个显著瓶颈。为提升计算效率，本文提出 cuRegOT，一种针对熵正则化最优传输问题的高性能 GPU 求解器。该方法结合了多种算法与架构优化策略，包括摊销符号分析、异步 Sinkhorn 迭代生成机制以及融合内核设计，有效提升了 GPU 上的计算效率与收敛速度，并在多个基准任务中展现出优于现有方法的性能。

2605.08777 2026-05-12 stat.ML cs.LG math.PR

Measuring and Decomposing Mode Separation via the Canonical Diffusion

Shaul Tolkovsky, Ori Meidler, Or Zuk

AI总结本文研究了密度分布中模式分离的度量问题，即分布如何形成被势垒分隔的簇状结构，这一特性在高维空间中难以量化。作者提出了一种基于密度平稳分布的可逆扩散过程，通过其自协方差矩阵提取两个指标：SSA（平方自相关和）用于衡量势垒敏感的分离程度，DA（主导自相关方向）用于捕捉元稳态结构。该方法仅需样本和分数函数，适用于高维数据，并在合成混合高斯、文本到图像生成和分子动力学等场景中验证了其有效性。

2605.08773 2026-05-12 stat.ME

Prediction-Powered Linear Regression: A Balance Between Interpretation and Prediction

Fuzhi Xu, Xingyu Yan, Xinyu Zhang

AI总结在经济学研究中，如何有效利用大量未标记数据提升预测精度是一个挑战，尤其当观测结果难以获得时。本文提出了一种预测驱动的统一模型平均（PUMA）框架，将线性回归与机器学习方法结合，兼顾模型的解释性与预测能力。该方法通过模型平均同时处理模型误设、功率调节和算法选择带来的不确定性，在理论和实证上均表现出优越的预测性能和估计一致性。

2605.08753 2026-05-12 cs.CV stat.ML

Simultaneous Monitoring of Shape and Surface Color via 4D Point Clouds: A Registration-free Approach

Mariafrancesca Patalano, Giovanna Capizzi, Kamran Paynabar

AI总结本文提出了一种无需配准的4D点云框架SMAC，用于同时监测物体的形状和表面颜色变化。该方法利用拉普拉斯-贝尔特拉米算子的谱特性，捕捉形状与颜色之间的关系，并通过联合监测策略有效检测形状变形和颜色异常。此外，该方法还引入了空间感知的后信号诊断过程，以定位异常来源，具有计算高效、无需配准和网格重建的优势，实验表明其在细微缺陷检测方面表现优异。

Comments 38 pages, 11 figures

2605.08705 2026-05-12 math.ST math.PR stat.ME stat.ML stat.TH

Minimax Optimal Estimation of Transport-Growth Pairs in Unbalanced Optimal Transport

Donlapark Ponnoprat, Noboru Isobe, Masaaki Imaizumi

AI总结本文研究了非平衡最优运输（UOT）中运输-增长对的最小最大最优估计问题。不同于传统的最优运输，UOT 允许源和目标测度具有不同的总质量，作者指出其自然的总体目标应为运输-增长对而非单一映射。为此，他们提出了两种估计方法，并证明了估计误差达到了最小最大最优速率，主要技术贡献在于通过UOT间隙条件将目标函数扰动转化为运输与增长风险，为非平衡最优运输中的Monge型估计提供了统计理论基础。

Comments 70 pages

2605.08681 2026-05-12 stat.ML cs.AI cs.LG cs.NA math.NA

Core-Halo Decomposition: Decentralizing Large-Scale Fixed-Point Problems

Haixiang, Yang Xu, Jiefu Zhang, Xudong Wu, Zihan Zhou, Jun He, Jiayu Chen

AI总结本文研究如何通过分解方法求解大规模固定点方程 $x^\star = \bar{F}(x^\star)$。传统严格分解方法将变量分配给不同代理，但会导致依赖关系被截断，引入结构性偏差。为此，作者提出核心-边缘（Core-Halo）分解方法，将变量的写操作与读操作分离，使每个代理更新自己的核心变量，同时读取重叠的边缘变量，从而忠实实现原固定点问题。实验表明，该方法在保持去中心化优势的同时，性能接近集中式求解。

2605.08677 2026-05-12 math.ST stat.TH

Bridging Theory and Practice: Statistical Inference for Latent Space Models of Networks

Yuang Tian, Jiajin Sun, Yinqiu He

AI总结该论文研究了网络数据的潜在空间模型的统计推断问题，旨在弥合理论分析与实际算法之间的差距。作者提出了一种统一的分析框架，放宽了现有理论中的谱多重性约束，并开发了新的自适应准则和理论工具，以去除对未知真实参数的依赖。研究还明确建立了投影梯度下降和奇异值阈值算法的输出与最大似然估计之间的联系，为网络分析中的实用且统计严谨的推断提供了理论基础。

2605.08672 2026-05-12 math.ST cs.NA math.NA stat.ML stat.TH

Posterior Concentration of Bayesian Physics-Informed Neural Networks for Elliptic PDEs

Yuxuan Zhao, Yulong Lu

AI总结本文研究了贝叶斯物理信息神经网络（PINNs）在求解一类椭圆偏微分方程（PDEs）时的后验收缩速率。针对具有非齐次狄利克雷边界条件的椭圆方程，利用域内和边界上的噪声观测数据进行学习，假设方程的精确解属于霍尔德空间，并构造合适的先验分布，证明了后验分布以近似最优速率围绕真实解集中。所选先验具有速率自适应性，无需预先知道精确解的光滑程度即可实现几乎最优的收敛速率，为通过贝叶斯PINNs进行PDE不确定性量化提供了统计保证。

2605.08656 2026-05-12 stat.ME

Bias Correction for Semiparametric Regression Models

Yuming Zhang, Yanyuan Ma, Xuming He, Stéphane Guerrier

AI总结本文研究了一类广义的半参数回归模型，其中响应变量的条件分布形式已知，但包含一个高维参数 $\boldsymbolβ$、一个光滑函数 $m(\cdot)$ 和一个离散参数 $\phi$。现有研究多关注 $\boldsymbolβ$ 的半参数效率，而忽视了 $\phi$ 和 $m(\cdot)$ 的有限样本偏差及其对推断的影响。为此，作者提出了一种基于模拟的偏差校正框架 SABRE，能够在不增加方差的前提下有效降低 $\boldsymbolβ$ 和 $\phi$ 的估计偏差，并通过仿真和实际数据分析验证了其有效性。

2605.08637 2026-05-12 stat.ME

Spherical Mixture Integration for Latent Embedding Alignment across Multi-Source Feature Spaces

Yuming Zhang, Congyuan Duan, Dong Xia, Doudou Zhou, Tianxi Cai

AI总结本文研究了如何对来自不同医疗机构的电子健康记录（EHR）数据进行整合分析，以提升模型的鲁棒性和泛化能力。面对不同机构间数据编码不一致和语义碎片化的问题，作者提出了SMILE方法，通过球面混合模型对异源特征空间中的潜在嵌入进行对齐，实现临床概念的语义统一。该方法利用稀疏的辅助关系对潜在空间进行弱监督，并建立了非渐近误差界，理论分析表明多源数据与辅助知识的融合能带来统计上的增益，实验验证了其在对齐与同义词聚类方面的有效性。

2605.08561 2026-05-12 stat.ML cs.LG

CONTRA: Conformal Prediction Region via Normalizing Flow Transformation

Zhenhan Fang, Aixin Tan, Jian Huang

AI总结本文提出了一种名为CONTRA的新方法，用于生成多维输出的可靠预测区域。该方法通过归一化流的潜在空间定义非一致性评分，从而克服传统方法在高维空间中预测区域模糊的问题。CONTRA不仅能够生成更精确的预测区域，还支持与现有预测模型结合使用，提升其预测可靠性，适用于多种数据集，具有广泛的适用性。

Comments 18 pages, 7 figures and 5 tables

2605.08552 2026-05-12 stat.ML cs.LG

Learnability and Competition in High-Dimensional Multi-Component ICA

Eser Ilke Genc, Samet Demir, Zafer Dogan

AI总结本文研究了高维多分量独立成分分析（ICA）中的可学习性与竞争机制，提出了一个渐近精确的平均场理论，揭示了在线学习过程中估计方向与真实成分之间的耦合关系。研究发现，在高维极限下，估计值与真实成分的重叠矩阵满足一个闭合的常微分方程系统，并据此发现了由初始化驱动的两种相态：解耦态和竞争态。该理论给出了学习率、数据矩和初始化之间的显式可学习边界与竞争条件，并通过实验验证了理论预测的轨迹和相变行为。

Comments 56 pages, 9 figures

2605.08551 2026-05-12 econ.EM math.ST stat.ME stat.TH

Nonparametric Empirical Bayes Confidence Intervals

Zhen Xie

AI总结本文提出了一种非参数经验贝叶斯置信区间（NP-EBCI），用于在正态均值模型中对不可观测的个体效应进行推断。该方法基于点识别的全非参数先验构建置信区间，通过后验分位数或其非参数估计实现可行的区间估计，其条件和边际覆盖率在渐近下均收敛于目标水平。尽管非参数方法具有灵活性，但也面临非参数去卷积带来的严重病态问题，导致估计速率仅为对数速率，但仿真结果表明该方法在非高斯先验下仍能保持较好的覆盖率并显著缩短区间长度。

2605.08546 2026-05-12 stat.ML cs.LG math.OC

Sliced Inner Product Gromov-Wasserstein Distances

Xiaoyun Gong, Gabriel Rioux, Ziv Goldfeld

AI总结本文研究了高维数据下内积成本的格罗莫夫-瓦瑟斯坦（IGW）距离的可扩展性问题，提出了一种具有自然旋转不变性质的切片IGW距离，解决了其在一维情况下缺乏闭式解的难题。该方法在理论分析和数值实验中得到了验证，并应用于文本数据的异构聚类和语言模型表示比较任务中。

Comments 49 pages, 8 figures

2605.08532 2026-05-12 stat.AP stat.ME

Accounting for variable detection functions in temporal abundance modeling via transfer learning

Kevin M. Collins, Erin M. Schliep, Tyler Wagner, Christopher K. Wikle

AI总结该研究旨在解决在利用相对丰度（如单位采样努力捕获的动物数）监测鱼类和野生动物种群时，因检测概率变化带来的建模挑战。研究提出通过迁移学习方法，将从捕获-再捕获（CR）数据中学习到的检测概率函数应用于更广泛可用的相对丰度数据（CPUE）模型中，从而提高对种群数量变化的估计精度。该方法在模拟研究和实际案例中均显示出对种群动态趋势检测能力的提升，为生态监测提供了新的分析工具。

2605.08509 2026-05-12 stat.ME

An Object-Oriented Spatial Statistics Approach for Human Activity Space Estimation

Haoyang Wu, Yen-Chi Chen, Adrian Dobra

AI总结本文提出一种基于面向对象空间统计的方法，用于从GPS数据中估计人类活动空间，综合考虑个体移动行为与建成环境的影响。该方法通过时间在空间区域和道路网上的分布来刻画日常活动模式，并开发了时间加权估计器以处理不规则采样的GPS观测。研究还推导了误差界并构建了地图增强的活动模式表示，仿真和实际数据分析表明该框架能够有效识别稳定活动中心、可解释的出行走廊及活动与移动成分的稳定行为。

Comments 53 pages, 16v figures

2605.08505 2026-05-12 cs.LG cs.AI math.PR math.ST stat.TH

Scaling Limits of Long-Context Transformers

Giuseppe Bruno, Shi Chen, Zhengjiang Lin, Yury Polyanskiy, Philippe Rigollet

AI总结本文研究了固定查询和随机上下文下的长上下文Transformer的注意力机制，分析了逆温度参数 $β_n$ 对注意力行为的影响，揭示了选择性出现的临界尺度由距离分布的局部指数决定，而非全局特征。研究还刻画了不同 $β_n$ 区域下注意力权重和输出的极限分布，包括亚临界、临界和超临界情形，并指出在亚临界情况下，当值矩阵为单位矩阵时，注意力映射近似实现了反向热方程。

Comments 40 pages, 4 figures

2605.08485 2026-05-12 stat.ML cs.LG math.ST stat.ME stat.TH

Sinkhorn Treatment Effects: A Causal Optimal Transport Measure

Medha Agarwal, Alex Luedtke

AI总结本文提出了一种名为Sinkhorn处理效应的因果最优运输度量，用于衡量反事实分布之间的差异。该方法基于熵正则化的最优运输理论，能够捕捉整个分布层面的差异，而不仅仅是平均处理效应。通过将其表示为反事实均值嵌入的平滑变换，作者建立了该度量的路径可微性，并构造了去偏估计量，从而提出了用于检验分布处理效应的渐近有效检验方法。实验表明该方法在模拟和图像数据中具有良好的实际效果。

Comments 55 pages, 6 figures

2605.08483 2026-05-12 math.NA cs.NA stat.CO

Randomized quasi-Monte Carlo for walk on spheres

Valerie N. P. Ho, Art B. Owen

AI总结本文研究了在“球面行走”算法中使用随机准蒙特卡洛（RQMC）方法，用于求解具有狄利克雷边界条件的实数空间中的边值问题。针对二维调和函数，作者分析了在环面区域上周期性指示函数的积分特性，并给出了边界满足特定闵可夫斯基内容条件的充分条件，从而可以应用已有理论结果。实验表明，RQMC方法在多个测试案例中表现出比传统蒙特卡洛方法更优的方差收敛率，且不同RQMC方法在性能上各有优劣。

2605.08453 2026-05-12 cs.LG cs.AI stat.ML

Sink vs. diagonal patterns as mechanisms for attention switch and oversmoothing prevention

Peter Súkeník, Cristina López Amado, Christoph H. Lampert, Marco Mondelli

AI总结本文研究了sink（汇点）和对角模式在注意力切换和防止过度平滑中的作用。通过分析几何条件，揭示了sink表示所需的嵌入对齐特性，并进一步明确了sink在防止过度平滑中的作用机制，证明了密集注意力在某些条件下比稀疏注意力更易导致平滑，并通过实验验证了这一条件在实际中常被满足。文章还建立了sink与硬注意力切换之间的等价关系，并通过引入自通信机制对硬注意力切换进行了放松，分析了sink与对角模式在表示成本上的差异，解释了为何预训练Transformer更倾向于使用sink结构。这些研究填补了防止过度平滑需求与sink功能之间的差距，并阐明了注意力层在无需token通信时为何可能表现出类似MLP的行为。

2605.06375 2026-05-12 cs.LG cs.AI math.ST stat.TH

A Unified Pair-GRPO Family: From Implicit to Explicit Preference Constraints for Stable and General RL Alignment

Hao Yu

AI总结该论文针对基于人类偏好强化学习（RLHF）中的大语言模型对齐问题，提出了一种统一的Pair-GRPO方法家族，旨在解决策略更新不稳定、梯度方向模糊、可解释性差和梯度方差高等问题。研究通过引入Soft-Pair-GRPO和Hard-Pair-GRPO两种变体，分别在保留GRPO结构的基础上引入二元偏好奖励和显式概率约束，理论证明了其梯度稳定性，并提供了单调策略改进、确定梯度方向等理论保证。实验表明，该方法在多个基准任务中优于现有先进方法，显著提升了对齐质量与训练稳定性。

详情

英文摘要

Large language model (LLM) alignment via reinforcement learning from human preferences (RLHF) suffers from unstable policy updates, ambiguous gradient directions, poor interpretability, and high gradient variance in mainstream pairwise preference learning paradigms. To systematically address these limitations, we establish a unified theoretical framework for preference-based RL optimization centered on the Pair-GRPO family, comprising two tightly coupled variants: Soft-Pair-GRPO and Hard-Pair-GRPO. Soft-Pair-GRPO is a minimal modification of Group Relative Policy Optimization (GRPO) that replaces group-normalized scalar rewards with binary pairwise preference rewards, retaining GRPO's clipped surrogate and KL-regularized structure. We prove a critical gradient equivalence theorem: under first-order Taylor expansion around the current policy, Soft-Pair-GRPO's gradient is a positive scalar multiple of standard GRPO's gradient, explaining its empirical stability despite discarding continuous reward magnitudes. Building on this foundation, we propose Hard-Pair-GRPO, an advanced variant introducing explicit local probability constraints and constrained KL-fitting optimization to further suppress gradient noise and global policy drift. We provide comprehensive theoretical guarantees for both variants--including monotonic policy improvement, deterministic gradient direction, gradient-variance reduction, and dynamic step-size convergence. Extensive experiments on standard LLM alignment benchmarks (HH-RLHF,UltraFeedback) and the MuJoCo continuous control task HalfCheetah-v4 demonstrate that our Pair-GRPO family consistently outperforms state-of-the-art baselines in alignment quality, human preference win rate, training stability, and generalization to general reinforcement learning. Ablation studies validate the critical contributions of each core component.

URL PDF HTML ☆

赞 0 踩 0

2605.06135 2026-05-12 stat.ME stat.AP

Linked-Tucker Factorized Individualized Regression for Paired Multivariate Categorical Outcomes

Arkaprava Roy, Jeremy T. Gaskins, Steven Levy, Somnath Datta

AI总结该研究提出了一种联合个体化截断-序数回归模型，用于分析配对的零膨胀序数结果，如龋齿和氟斑牙，数据来源于爱荷华州氟化物研究。模型结合了截断部分和比例优势部分，分别描述疾病是否存在以及严重程度，并引入链接 Tucker 张量分解以高效处理高维协变量效应，同时考虑个体和空间异质性。研究揭示了早期氟化物和饮食暴露与两种牙科结果在不同牙齿位置、年龄和亚人群中的异质性关联。

详情

英文摘要

We propose a joint individualized hurdle-ordinal regression model for paired zero-inflated ordinal outcomes with subject-specific, spatially varying, and time-varying covariate effects, motivated by the Iowa Fluoride Study (IFS). The two outcomes, dental caries and dental fluorosis, are measured repeatedly across ages at fine spatial resolution, yielding nested longitudinal data with substantial zero inflation, ordinality, and heterogeneity across individuals and locations. For each outcome, a hurdle component models disease presence, while a proportional-odds component models severity among positive observations. To parsimoniously represent the high-dimensional coefficient arrays, we introduce a linked Tucker tensor factorization. Shared subject-mode factors induce dependence between the caries and fluorosis coefficient tensors, while separate spatial factors accommodate the distinct measurement grids of tooth surfaces and tooth zones. A horseshoe prior on the core tensor elements encourages sparsity, and posterior computation is performed using the No-U-Turn Sampler in NumPyro. Population-level effect summaries are obtained by projecting individualized posterior linear predictors onto the design space, and Wasserstein barycenters aggregate these summaries across tooth locations and anatomical classes. Applied to the IFS, the model reveals spatially heterogeneous associations between early-life fluoride and dietary exposures and both outcomes. Fluoride exposure is associated with increased odds and severity of fluorosis, while soda intake consistently increases caries risk. These associations differ between presence and severity components and vary across tooth locations, ages, and subpopulations defined by prior caries status, highlighting the importance of the joint hurdle-ordinal framework for disentangling disease occurrence from disease progression in multilevel dental data.

URL PDF HTML ☆

赞 0 踩 0

2605.04274 2026-05-12 cs.LG cs.AI stat.ML

A Mean Curvature Approach to Boundary Detection: Geometric Insights for Unsupervised Learning

Alexandre L. M. Levada

AI总结本文提出了一种基于平均曲率的边界检测方法——平均曲率边界点（MCBP），用于高维数据中的无监督学习。该方法通过局部k近邻邻域估计形状算子的离散近似，直接建模数据流形的内在曲率，从而无需显式参数化即可计算点的平均曲率，作为边界结构的原理性描述。研究揭示了高曲率区域与聚类过渡、几何不规则性和低密度界面之间的对应关系，并引入自适应百分位阈值策略实现多尺度边界提取，同时提出基于曲率的数据分解方法，提升聚类可分性和下游算法的鲁棒性。实验表明，MCBP在合成和真实数据集上显著提升了聚类性能，尤其在复杂高维场景中表现突出。

Comments 30 pages, 6 tables, 8 figures

详情

英文摘要

Accurate boundary detection in high-dimensional data remains a central challenge in unsupervised learning, particularly in the presence of non-linear structures and heterogeneous densities. In this work, we introduce Mean Curvature Boundary Points (MCBP), a novel geometric framework grounded in Geometric Machine Learning that departs from traditional density-based approaches by explicitly modeling the intrinsic curvature of the data manifold. The method relies on a discrete approximation of the shape operator, estimated from local k-nearest neighbor patches, to compute pointwise mean curvature without requiring explicit manifold parametrization. The key insight of MCBP is to use mean curvature as a principled descriptor of boundary structure: high-curvature regions naturally correspond to transitions between clusters, geometric irregularities, and low-density interfaces. This yields a unified geometric interpretation of boundary, outlier, and transition points. We further introduce an adaptive percentile-based thresholding scheme that enables multiscale boundary extraction without relying on ad hoc density parameters. Beyond detection, we propose a curvature-driven data decomposition that separates samples into smooth (low-curvature) and boundary (high-curvature) subsets, effectively acting as a non-linear geometric filtering mechanism. This representation enhances cluster separability and improves the robustness of downstream unsupervised algorithms. Extensive experiments on synthetic and real-world datasets demonstrate that MCBP consistently improves clustering performance, particularly in complex and high-dimensional scenarios. These results position MCBP as a concrete contribution to Geometric Machine Learning, highlighting the potential of curvature-aware analysis as a unifying paradigm bridging differential geometry and data-driven modeling.

URL PDF HTML ☆

赞 0 踩 0

2605.04124 2026-05-12 stat.ME econ.EM

Design-Based Variance Estimation for Modern Heterogeneity-Robust Difference-in-Differences Estimators

Isaac Gerber

AI总结本文研究了现代异质性稳健双重差分（DiD）估计方法在复杂调查设计下的方差估计问题。作者指出，尽管现有方法通常基于独立同分布或固定设计框架，但在实际应用中常用于分层聚类设计的全国性调查，导致标准误估计不准确。通过理论分析和蒙特卡洛模拟，本文证明了在常规条件下，使用分层聚类方差公式可获得设计一致的标准误，并展示了忽略调查设计会严重降低置信区间覆盖率。研究还提供了适用于多种现代DiD估计器的开源Python工具包，以支持设计一致的方差估计。

Comments 38 pages, 1 figure, 8 tables. Companion software: diff-diff v3.3.2 (https://doi.org/10.5281/zenodo.19803705), public replication archive (https://github.com/igerber/design-based-did-replication; Zenodo DOI 10.5281/zenodo.20097360)

2605.00247 2026-05-12 stat.CO cs.DC cs.MM econ.EM

$2B$ or Not $2B$: A Tale of Three Algorithms for Streaming: Covariance Estimation after Welford and Chan-Golub-LeVeque

Felix Reichel

AI总结本文将三种用于流式和分布式环境下计算无偏样本协方差矩阵的算法——Gram算法、Welford算法和Chan-Golub-LeVeque（CGL）算法——统一在一个代数、数值和统计基础上，分析了它们的运行机制、数值稳定性及适用场景。研究提出了一种基于符合性预测的框架，为流式协方差估计提供了分布无关的有限样本置信区间，并通过实验验证了各算法在不同场景下的性能优势。

Comments 20 pages, 10 figures, 3 tables

2604.26326 2026-05-12 cs.LG cs.CL stat.ML

Addressing Performance Saturation for LLM RL via Precise Entropy Curve Control

Bolian Li, Yifan Wang, Yi Ding, Anamika Lochab, Ananth Grama, Ruqi Zhang

AI总结本文研究了大语言模型（LLM）在强化学习（RL）中遇到的性能饱和问题，并提出了一种名为Entrocraft的新方法，通过精确控制熵曲线来解决这一问题。该方法基于偏差优势分布的拒绝采样，无需正则化且适用于任意优势估计器。理论分析表明，该方法能够解释现有RL方法和熵保持方法的行为，并揭示了线性退火策略在熵调度中的优越性。实验表明，Entrocraft有效缓解了性能饱和，显著提升了模型的泛化能力、输出多样性和长期训练表现。

2604.14345 2026-05-12 cs.LG cs.AI stat.ML

PAC-MCTS: Bias-Aware Pruning for Robust LLM-Guided Search and Planning

Tianhao Qian

AI总结在自主推理和具身规划中，随着搜索深度增加，候选动作空间呈指数级扩展，导致计算资源消耗巨大。本文提出PAC-MCTS，一种基于偏差感知的剪枝框架，通过将节点扩展建模为有界偏差下的最佳臂识别问题，推导出样本复杂度上界和信息论下界，明确了安全剪枝的条件。实验表明，PAC-MCTS在Blocksworld和ALFWorld任务中显著提升了搜索效率和鲁棒性，减少了API调用次数并提高了样本效率。

Comments 18 pages, 4 figures

2604.12062 2026-05-12 stat.ME

Is There an AI Bubble? Robust Date-Stamping for Periods of Exuberance

Abir Sarkar, Martin T. Wells

AI总结本文探讨了人工智能相关企业估值飙升是否引发了新的投机性泡沫，并提出了一种稳健的日期标记方法，用于识别价格在持续变动波动率下的泡沫形成与破裂时期。研究扩展了传统的单位根检验，构建了能够适应持久波动性的SV-ADF检验方法，提升了泡沫检测的准确性与稳定性。实证分析显示，包括“七巨头”和主要半导体企业在内的AI相关股票存在显著的过度投机现象，其中谷歌和台积电在当前周期中表现出尤为强烈的泡沫特征。

2604.06689 2026-05-12 cs.LG stat.ML

Generative Cross-Entropy: A Strictly Proper Loss for Data-Efficient Classification

Qipeng Zhan, Zhuoping Zhou, Li Shen

AI总结本文提出了一种名为生成交叉熵（GenCE）的新分类损失函数，旨在提高数据稀缺场景下的样本效率。该方法通过引入生成学习的思想，在不改变网络结构或拟合额外密度模型的前提下，对传统交叉熵损失进行改进。GenCE 基于贝叶斯重写条件似然，并在小批量近似下实现跨类样本的训练信号耦合，理论证明其在一定条件下是严格正确的评分规则，实验表明其在多个数据集和不同场景下均优于传统损失函数，且具有更好的概率校准和分布外检测能力。

2603.08308 2026-05-12 math.ST cs.IT math.IT math.PR stat.TH

Weighted Chernoff information and optimal loss exponent in context-sensitive hypothesis testing

Mark Kelbert, El'mira Yu. Kalimulina

AI总结本文研究了在乘积型上下文权重下的独立同分布二元假设检验问题，提出了加权切诺夫信息（weighted Chernoff information）作为最优加权总损失的指数衰减率。通过将加权几何混合分布嵌入到似然比指数族中，并利用其对数归一化因子确定衰减速率，证明了最优加权总损失的渐近形式。研究还推导了倾斜加权对数似然的集中界，并给出了高斯、泊松和指数模型下的闭式解，同时将结果推广到有限多个假设的情形。

Comments 30 pages, 3 figures, 1 table

2602.16596 2026-05-12 cs.LG cs.CR math.ST stat.ML stat.TH

Sequential Membership Inference Attacks

Thomas Michel, Debabrota Basu, Emilie Kaufmann

AI总结本文研究了针对现代动态AI模型的序列成员推理攻击（SeMI），旨在通过利用模型更新序列信息，提高隐私审计的准确性。作者提出了一种最优攻击方法SeMI*，能够通过控制插入时间并分析模型序列中的统计特性，更有效地识别目标样本是否被包含在训练数据中。实验表明，与仅依赖最终模型的基线方法相比，SeMI攻击在多种数据集和基于（差分隐私）随机梯度下降训练的模型上表现出更高的攻击效果和更严格的隐私评估能力。

Comments 32 pages, 14 figures

2602.09317 2026-05-12 cs.LG cs.AI stat.ML

SnareNet: Flexible Repair Layers for Neural Networks with Hard Constraints

Ya-Chi Chu, Alkiviades Boukas, Madeleine Udell

AI总结 SnareNet 是一种用于神经网络的可控修复架构，旨在解决模型输出违反物理、操作或安全约束的问题。其核心方法是在网络中引入可微分的修复层，通过在约束空间中进行迭代调整，使输出满足用户指定的约束条件。该方法采用自适应松弛训练策略，确保端到端训练的稳定性，并在多个基准任务中表现出更高的目标优化质量与更强的约束满足能力，尤其在处理非凸约束时具有显著优势。

2602.07144 2026-05-12 cs.LG cs.AI stat.ML

BONSAI: Bayesian Optimization with Natural Simplicity and Interpretability

Samuel Daulton, David Eriksson, Maximilian Balandat, Eytan Bakshy

AI总结 BONSAI 是一种面向默认配置的贝叶斯优化方法，旨在在优化过程中尽量减少对默认参数的偏离，从而提升结果的可解释性与实用性。该方法通过控制获取函数的损失，有效剪枝低影响的参数变化，并兼容多种获取函数如预期改进和上置信界。理论分析表明，BONSAI 在保证优化性能的同时，能够以零获取成本恢复关键参数坐标，优于现有稀疏贝叶斯优化方法，并在多个实际应用中验证了其在减少非默认参数数量方面的显著优势。

Comments 32 pages

详情

英文摘要

Bayesian optimization (BO) is a popular technique for sample-efficient optimization of black-box functions. In many applications, the parameters being tuned come with a carefully engineered default configuration, and practitioners only want to deviate from this default when necessary. Standard BO, however, does not aim to minimize deviation from the default and, in practice, often pushes weakly relevant parameters to the boundary of the search space. This makes it difficult to distinguish between important and spurious changes and increases the burden of vetting recommendations when the optimization objective omits relevant operational considerations. We introduce BONSAI, a default-aware BO policy that prunes low-impact deviations from a default configuration while explicitly controlling the loss in acquisition value. BONSAI is compatible with a variety of acquisition functions, including expected improvement and upper confidence bound (GP-UCB). We theoretically bound the regret incurred by BONSAI, showing that, under certain conditions, it enjoys the same no-regret property as vanilla GP-UCB. Moreover, assuming known ARD lengthscales -- the same assumption underlying GP-UCB regret bounds -- BONSAI provably recovers the relevant-coordinate set at zero acquisition cost, yielding a method that matches the GP-UCB regret rate while recovering the minimal-$\ell_0$ solution -- a guarantee not provided by prior sparse-BO methods. Across many real-world applications, we empirically find that BONSAI substantially reduces the number of non-default parameters in recommended configurations while maintaining competitive optimization performance, with little effect on wall time -- averaging only $1.5\times$ the candidate-generation cost of standard BO, compared to $7$-$34\times$ on average for prior sparse-BO methods (IR, ER, and SEBO).

URL PDF HTML ☆

赞 0 踩 0

2602.00834 2026-05-12 cs.LG cs.AI stat.ML

A Minimum Variance Path Principle for Accurate and Stable Score-Based Density Ratio Estimation

Wei Chen, Jiacheng Li, Shigui Li, Zhiqi Lin, Junmei Yang, John Paisley, Delu Zeng

AI总结本文针对基于分数的密度比估计方法在实践中存在的路径依赖性问题，提出了一种最小方差路径（MVP）原则，通过推导分数函数路径方差的闭式表达式，实现了对路径方差的优化。该方法利用可灵活参数化的库马拉吉混合模型自动学习低方差路径，无需人工设定，从而提升了估计的准确性和稳定性，并在多个基准任务上取得了新的最优结果。

2601.21410 2026-05-12 stat.ML cs.LG

Learning When to Trust LLM Priors: A Validated Framework for Semantic Prior Integration

Erica Zhang, Naomi Sagan, Danny Tse, Fangzhao Zhang, Mert Pilanci, Jose Blanchet

AI总结该研究探讨了如何在监督学习中可靠地利用大语言模型（LLM）的语义先验知识。作者提出了一种名为Statsformer的验证框架，能够动态判断何时信任LLM生成的语义先验，并将其融入到不同类型的预测模型中。通过交叉验证机制，Statsformer自动调整各模型对先验信息的依赖程度，从而在提升预测性能的同时抑制不可靠的先验信号，为LLM辅助的统计学习提供了一种可靠性导向的解决方案。

2601.21061 2026-05-12 cs.LG stat.ML

Signal from Structure: Exploiting Submodular Upper Bounds in Generative Flow Networks

Alexandre Larouche, Audrey Durand

AI总结本文研究了生成流网络（GFlowNets）在奖励函数具有子模结构时的优化问题，提出了一种基于子模上界的新训练方法SUBo-GFN。该方法利用子模性推导出未观测组合对象的奖励上界，并基于不确定性乐观原则进行训练，显著提升了生成样本的质量和数量。实验表明，SUBo-GFN在合成和现实子模任务中表现出优越的分布匹配能力和候选生成效果。

2601.20251 2026-05-12 stat.ML cs.LG

Efficient Evaluation of LLM Performance with Statistical Guarantees

Skyler Wu, Yash Nair, Emmanuel J. Candès

AI总结本文研究如何在有限查询预算下高效且准确地评估大量大语言模型的性能。提出了一种名为Factorized Active Querying（FAQ）的方法，结合贝叶斯因子模型、自适应采样策略和有限总体主动推理，以在保证统计置信度的同时减少所需的评估样本数量。实验表明，FAQ在多个基准测试中相比现有方法可提升有效样本量达5倍，显著提高了评估效率。

Comments 27 pages, 12 figures

2601.19553 2026-05-12 stat.ME stat.CO

A Fast, Closed-Form Bandwidth Selector for the Beta Kernel Density Estimator

Johan Hallberg Szabadváry

AI总结该研究提出了一种快速、闭式带宽选择方法——“Beta参考规则”，用于Beta核密度估计器，解决了其在单位区间数据应用中因缺乏可靠带宽选择方法而受限的问题。该方法基于无权重的渐近均方积分误差（AMISE）推导，通过矩估计近似将带宽选择复杂度从迭代优化降至常数级别，显著提升了计算效率。实验表明，该方法在保持估计精度的同时，相比传统数值优化方法速度提升了35000倍以上，并有效避免了高斯核方法中常见的边界消失和肩部伪影问题。

Comments v3: Added Appendix detailing Python, R, and Julia software implementations. Accepted for publication in the Journal of Computational and Graphical Statistics (JCGS)

2601.11242 2026-05-12 stat.ME

Deriving Complete Constraints in Hidden Variable Models

Michael C. Sachs, Erin E. Gabriel, Robin J. Evans, Arvid Sjölander

AI总结本文研究了隐藏变量图模型中可观测分布所隐含的完整约束条件，这些问题通常比简单的条件独立关系更为复杂。作者提出了一种系统的方法，用于在观测变量为类别型且联合分布由线性关系描述的模型中推导出所有可观测约束，从而提升统计估计的效率。该方法在多个新场景中得到应用，能够同时处理不等式和等式约束。

2601.10899 2026-05-12 stat.ME

On the use of cross-fitting in causal machine learning with correlated units

Salvador V. Balkus, Hasan Laith, Nima S. Hejazi

AI总结在因果机器学习中，研究者通常将数据划分为不同部分分别用于拟合和评估模型，这种方法称为交叉拟合，可消除黑箱预测算法引入的偏差。本文指出，即使研究单位之间存在相关性（如空间、聚类或时间序列数据），无需特别设计交叉拟合方式以降低折叠间的相关性，仍能有效消除关键偏差项。通过多种相关结构的仿真实验验证，基于独立假设的交叉拟合在偏差和精度方面表现优异，甚至优于专门消除折叠间相关性的方法。

Comments 14 pages, 8 figures

2601.09371 2026-05-12 stat.ME

White noise testing for functional time series via functional quantile autocorrelation

Ángel López-Oriona, Ying Sun, Hanlin Shang

AI总结本文提出了一类基于函数分位数自相关框架的新型非线性检验方法，用于检测函数型时间序列中的序列依赖性。该方法通过分位数基的 excursion 集合，能够稳健地捕捉无限维函数数据中的时间依赖性，适用于存在异常值和复杂非线性关系的情形。研究提出了统一的检验统计量，分析了其在已知和估计分位数曲线下的渐近性质，并通过大量仿真和高频金融数据应用验证了方法的有效性，表现出比现有方法更强的检验能力。

2512.04475 2026-05-12 cs.LG cs.AI cs.NE stat.ML

GraphBench: Next-generation graph learning benchmarking

Timo Stoll, Chendi Qian, Ben Finkelshtein, Ali Parviz, Darius Weber, Fabrizio Frasca, Hadar Shavit, Antoine Siraudin, Arman Mielke, Marie Anastacio, Erik Müller, Maya Bechler-Speicher, Michael Bronstein, Mikhail Galkin, Holger Hoos, Mathias Niepert, Bryan Perozzi, Jan Tönshoff, Christopher Morris

AI总结随着图机器学习在分子性质预测和芯片设计等领域取得进展，当前的基准测试方法仍存在碎片化问题，依赖于任务特定的数据集和不一致的评估协议，限制了研究的可复现性和整体进展。为应对这一挑战，本文提出 GraphBench，一个涵盖多种现实领域和任务场景的综合性基准测试套件，提供标准化的评估协议和统一的超参数调优框架，旨在推动图学习模型的全面评估与未来发展。

2511.17994 2026-05-12 cs.LG stat.ML

Learning Rate Scheduling with Matrix Factorization for Private Training

Nikita P. Kalinin, Joel Daniel Andersson

AI总结本文研究了在学习率调度和相关噪声背景下进行差分隐私模型训练的问题。作者通过矩阵分解方法引入相关噪声以提升模型精度，并针对实际中广泛使用的非固定学习率调度策略，推导了单轮和多轮训练场景下的一般误差上界和下界。基于理论分析，提出了一种学习率感知的矩阵分解方法，在多种误差指标下均优于传统的前缀和分解方法，并在CIFAR-10和IMDB数据集上的实验验证了其有效性。

Comments Accepted at FORC 2026

2511.14091 2026-05-12 stat.ME stat.AP

State-Space Representation of INGARCH Models and Their Application in Insurance

Jae Youn Ahn, Hong Beng Lim, Mario V. Wüthrich

AI总结本文研究了整数值广义自回归条件异方差（INGARCH）模型在保险领域的应用，并提出了边际化状态空间模型（M-SSM）以克服传统INGARCH模型在理论解释、协变量引入和缺失数据处理方面的不足。通过将INGARCH模型嵌入到M-SSM框架中，论文展示了其对协变量和缺失数据的自然兼容性，并进一步证明在适当假设下，M-SSM可以转化为观测驱动的状态空间模型（O-SSM），从而为弱平稳性分析提供理论支持。研究通过泊松和负二项分布的INGARCH(1,1)模型实例，展示了该方法在保险数据预测中的有效性。

2511.01196 2026-05-12 stat.ML cs.AI cs.LG

An Interdisciplinary and Cross-Task Review on Missing Data Imputation

Jicong Fan

AI总结本文系统综述了缺失数据填补这一跨学科、跨任务的研究领域，探讨了缺失机制、填补方法及在不同应用场景下的问题特性。文章全面梳理了从传统统计方法到现代深度学习模型（如自编码器、生成对抗网络、图神经网络等）的各类填补技术，并重点分析了复杂数据类型（如张量、时间序列、图结构数据等）的处理方法。此外，还探讨了填补方法与下游任务（如分类、聚类、异常检测）的结合方式，并指出了未来研究的关键挑战与发展方向。

详情

DOI: 10.1108/FTSIG-11-2025-0139
Journal ref: Foundations and Trends in Signal Processing, Vol. 20, No. 3, pp. 185-317, 2026

英文摘要

Missing data is a fundamental challenge in data science, significantly hindering analysis and decision-making across a wide range of disciplines, including healthcare, bioinformatics, social science, e-commerce, and industrial monitoring. Despite decades of research and numerous imputation methods, the literature remains fragmented across fields, creating a critical need for a comprehensive synthesis that connects statistical foundations with modern machine learning advances. This work systematically reviews core concepts-including missingness mechanisms, single versus multiple imputation, and different imputation goals-and examines problem characteristics across various domains. It provides a thorough categorization of imputation methods, spanning classical techniques (e.g., regression, the EM algorithm) to modern approaches like low-rank and high-rank matrix completion, deep learning models (autoencoders, GANs, diffusion models, graph neural networks), and large language models. Special attention is given to methods for complex data types, such as tensors, time series, streaming data, graph-structured data, categorical data, and multimodal data. Beyond methodology, we investigate the crucial integration of imputation with downstream tasks like classification, clustering, and anomaly detection, examining both sequential pipelines and joint optimization frameworks. The review also assesses theoretical guarantees, benchmarking resources, and evaluation metrics. Finally, we identify critical challenges and future directions, emphasizing model selection and hyperparameter optimization, the growing importance of privacy-preserving imputation via federated learning, and the pursuit of generalizable models that can adapt across domains and data types, thereby outlining a roadmap for future research.

URL PDF HTML ☆

赞 0 踩 0

2510.26470 2026-05-12 stat.ME econ.EM

Valid Inference when Testing Violations of Parallel Trends for Difference-in-Differences

Jonas M. Mikhaeil, Christopher Harshaw

AI总结本文研究了双重差分法（DID）中平行趋势假设的检验问题，指出传统预检验方法在估计和推断中存在功效低、偏差大和置信区间覆盖率不足等问题。作者提出了一种改进的预检验方法和相应的置信区间构造方式，在较弱的分离条件下，该方法具有一致性且置信区间在通过检验的条件下具有有效覆盖率。研究还引入了条件外推假设，用于连接前处理时期的平行趋势偏差与后处理时期的未识别偏差，并通过合成数据和越南公共服务再中心化、弗吉尼亚州持枪权法律等实际数据验证了方法的有效性。

2510.09877 2026-05-12 cs.LG cs.AI stat.ML

Batch Bayesian Active Learning with Partial Batch Label Sampling

Kangping Hu, Stephen Mussmann

AI总结本文研究了批量贝叶斯主动学习中标签采样的问题，针对现有方法在大批次场景下计算复杂或性能下降的挑战，提出了一种基于贝叶斯决策理论的局部批量标签采样方法ParBaLS，专门用于改进EPIG算法。实验表明，该方法在固定预算下相比其他方法具有更优的性能，尤其在结合大预训练模型嵌入的贝叶斯逻辑回归任务中表现突出。

2510.08972 2026-05-12 stat.ME

Robust and Efficient Semiparametric Inference for the Stepped Wedge Design

Fan Xia, K. C. Gary Chan, Emily Voldal, Avi Kenny, Patrick J. Heagerty, James P. Hughes

AI总结该论文针对阶梯楔形设计（SWD）中干预效果估计的挑战，提出了一种统一的半参数推断框架，能够处理时间变化的干预效应以及集群内相关观测、集群规模变化和治疗分配依赖性等问题。所提方法在协方差结构误设的情况下仍保持估计的一致性和渐近正态性，并通过利用治疗分配的排列结构设计了适用于小样本的方差估计方法，提升了推断的稳健性和效率。研究还展示了该方法在处理效应修饰和不平衡协变量调整方面的灵活性，并通过模拟和实际公共卫生试验验证了其有效性。

2509.22531 2026-05-12 stat.ML cs.LG

Debiased Front-Door Learners for Heterogeneous Effects

Yonghan Jung

AI总结在观察性研究中，当处理变量和结果变量存在未观测的混杂因素，但中介变量不受混杂影响时，可通过前门（FD）调整识别因果效应。本文研究了在FD识别框架下异质处理效应（HTE）的估计问题，提出了两种去偏学习方法：FD-DR-Learner和FD-R-Learner。在明确的样本分割、重叠界、矩条件和分阶段学习假设下，这两种方法分别满足乘积误差界和阶段误差分解，从而在 nuisance 项较小时实现条件准oracle性质。实验表明，这些方法在合成数据和基于FARS数据集的真实案例中均表现出良好的稳健性和估计效率。

Comments 26 pages, 3 figures. Revised theory statements, notation, and proof presentation; conclusions unchanged. Code available at https://github.com/yonghanjung/FD-CATE

2508.15016 2026-05-12 stat.ME

Untangling Sample and Population Level Estimands in Bayesian Causal Computation

Arman Oganisian

AI总结本文探讨了在贝叶斯因果计算中样本层面和总体层面因果效应估计量之间的区别，指出了在识别、建模、计算和解释上的关键差异。研究指出，常见的样本层面估计量需要跨世界的贝叶斯建模和反事实的显式MCMC采样，而总体层面估计量通常只需参数的后验分布及事后蒙特卡洛近似。通过多个例子，作者展示了看似相似的计算方法可能得出本质不同的估计量，从而导致错误推论，并总结了选择估计量时应注意的常见错误和因素。

2507.00795 2026-05-12 econ.EM stat.ME

Randomization Inference with Sample Attrition

Xinran Li, Peizan Sheng, Zeyang Yu

AI总结本文研究了在存在样本流失（即部分单位的结局数据缺失）的情况下，如何进行有效的随机化推断。作者提出了一种计算高效的新方法，能够在广泛的信息性缺失机制下保持推断的有效性，即使单位的缺失情况依赖于其未观测的潜在结果。该方法通过构造基于最坏情况的p值，支持对处理效应的尖锐和有界零假设进行检验，并利用分布自由的检验统计量实现闭式解，同时结合潜在结果和潜在缺失指示符，提升了推断的统计功效。

2506.12542 2026-05-12 cs.LG cs.AI cs.CV stat.ML

PLD: A Choice-Theoretic List-Wise Knowledge Distillation

Ejafa Bassam, Dawei Zhu, Kaigui Bian

AI总结本文提出了一种基于选择理论的知识蒸馏方法PLD，将教师网络的logit值解释为类别“价值”得分，并在Plackett-Luce模型框架下构建了一个加权列表级排序损失函数。PLD直接优化教师模型的完整排序结构，将真实标签置于首位，其余类别按教师置信度降序排列，从而生成一个凸且平移不变的替代损失函数。实验表明，PLD在多个数据集和不同架构的师生对中均能实现稳定提升，适用于多种蒸馏目标。

2505.23113 2026-05-12 stat.ME math.ST stat.AP stat.TH

Valid F-screening in linear regression

Olivia McGough, Daniela Witten, Daniel Kessler

AI总结本文研究了在线性回归中，当整体零假设被拒绝后，如何进行有效的条件推断问题。作者提出了一种基于F检验的筛选方法（F-screening），并开发了一套在拒绝整体零假设条件下仍具有良好统计性质的推断工具，包括选择性p值、置信区间和点估计。这些方法无需原始数据，仅依赖于回归的标准输出，适用于对已发表研究的回顾性分析，并在模拟和实际数据中验证了其有效性。

2505.17204 2026-05-12 stat.ML cs.LG math.PR math.ST stat.CO stat.TH

Liouville PDE-based sliced-Wasserstein flow

Jayshawn Cooper, Pilhwa Lee

AI总结本文将切片沃瑟斯坦流（SWF）转化为基于刘维尔偏微分方程（PDE）的形式，提出了一种新的非参数隐式生成梯度流方法。通过将基于福克-普朗克方程的随机扩散项重新表述为无扩散项的刘维尔PDE运输方程，并结合神经ODE的标准化流进行密度估计，提升了模型的收敛效率与稳定性。该方法在生成沃瑟斯坦中心时引入柯纳托维奇势函数，有效降低了方差，并在公平回归任务中展现出优于标准SWF的准确率与公平性平衡能力。

Comments 24 pages, 10 figures. arXiv admin note: substantial text overlap with arXiv:1806.08141 by other authors

2505.16741 2026-05-12 cs.LG math.OC stat.ML

Meta-reinforcement learning with minimum attention

Shashank Gupta, Pilhwa Lee

AI总结该论文将最小注意原理应用于强化学习，通过在奖励函数中引入最小注意正则化，旨在提升智能体在高维非线性动态环境中的学习效率和稳定性。研究结合模型基于的元学习框架，交替进行模型学习与元策略优化，实验表明该方法在少量样本下的适应能力和对模型与环境扰动的鲁棒性方面优于现有先进算法，并在能量效率方面也表现出改进。

Comments 30 pages, 22 figures

2504.14697 2026-05-12 cs.LG math.AP math.DS stat.ML

Quantitative Clustering in Mean-Field Transformer Models

Shi Chen, Zhengjiang Lin, Yury Polyanskiy, Philippe Rigollet

AI总结本文研究了平均场变换器模型中令牌的长期聚类行为，揭示了在适当参数假设下，模型会以指数速率收敛到一个狄拉克点质量。作者通过定量分析给出了明确的收敛速率，为理解变换器模型中的同步现象提供了理论依据。

Comments 50 pages, 4 figures; We have updated the introduction and added sketches of the proofs of the main theorems

2503.16027 2026-05-12 stat.CO stat.AP stat.ME

Deep Gaussian Process Emulation with gradient Information and Sequential Design for Simulators with Sharp Variations

Yiming Yang, Deyu Ming, Serge Guillas

AI总结该论文研究了如何利用深度高斯过程（DGP）对具有剧烈变化特性的仿真模型进行高效建模，并提出了梯度不确定性量化方法。作者通过局部线性化和链式法则，推导出两层DGP梯度的均值和协方差的闭式表达，实现了快速的梯度评估与不确定性估计。基于梯度不确定性，论文进一步提出了一种用于剧烈变化区域的序列设计方法，通过熵驱动的采样策略提升模型在复杂非平稳场景下的拟合精度。

2503.00982 2026-05-12 stat.ME physics.soc-ph

Multivariable Behavioral Change Modeling of Epidemics in the Presence of Undetected Infections

Caitlin Ward, Rob Deardon, Alexandra M. Schmidt

AI总结该论文提出了一种新的贝叶斯传染病建模框架，旨在更准确地刻画疫情传播过程，特别考虑了人类行为变化和未被检测的感染者对疫情的影响。研究通过引入医院收治和死亡数据，结合多种数据源动态影响人群行为变化，提升了模型对疫情传播复杂性的刻画能力。该方法在模拟实验和实际疫情数据（如蒙特利尔和迈阿密的新冠数据）中的应用验证了其有效性，为传染病防控提供了更精确的分析工具。

Comments 21 pages, 7 figures

2502.06096 2026-05-12 stat.ML cs.AI cs.LG stat.ME

Post-detection inference for sequential changepoint localization

Aytijhya Saha, Aaditya Ramdas

AI总结本文研究了序贯变点分析中一个基础但尚未充分探索的问题：在检测到变化后进行统计推断。作者提出了一种通用的非参数框架，能够在任意序贯检测算法判定变化的停时点，仅基于该时刻之前观测到的数据，构建未知变点的置信集。该方法无需对变点后的观测分布、观测空间或检测过程做任何假设，且具有非渐近有效性，适用于多种实际场景，并提供了置信区间的宽度理论保证。

2502.03414 2026-05-12 stat.ME

Efficient nonparametric estimation with difference-in-differences in the presence of network dependence and interference

Michael Jetsupphasuk, Didong Li, Michael G. Hudgens

AI总结本文研究了在存在网络依赖和干扰的情况下，如何高效地进行非参数差分-in-差分（DiD）因果效应估计。作者扩展了传统的DiD方法，允许处理效应异质性、单位间相互影响以及潜在变量相关性，并提出了一个双重稳健估计器，能够在条件平行趋势假设下实现一致、渐近正态且高效的估计。该方法通过模拟验证，并应用于研究燃煤电厂采用排放控制技术对心血管疾病死亡率的影响。

2501.04721 2026-05-12 stat.AP cs.LG physics.med-ph

A Shape-Based Functional Index for Objective Assessment of Pediatric Motor Function

Shashwat Kumar, Arafat Rahman, Robert Gutierrez, Sarah Livermon, Allison N. McCrady, Silvia Blemker, Rebecca Scharf, Anuj Srivastava, Laura E. Barnes

AI总结该研究提出了一种基于形状的函数指标，用于客观评估儿童神经肌肉疾病患者的运动功能。通过可穿戴传感器采集数据，结合形状主成分分析和偏最小二乘法，识别出与运动速度变化和不对称性相关的运动模式，并构建了一个与肌肉脂肪浸润、运动功能评分及年龄相关退化变化高度相关的新型运动功能指数。该方法可应用于家庭环境，有助于长期追踪治疗效果，为儿科神经肌肉疾病提供更客观的评估手段。

Comments 13 pages

2404.18779 2026-05-12 stat.ME math.ST stat.CO stat.TH

Semiparametric fiducial inference for Cox models

Yifan Cui, Jan Hannig, Paul Edlefsen

AI总结本文提出了一种用于半参数统计模型的新型 fiducial 推断方法，并以纪念已故的戴维·考克斯爵士而选取其提出的 Cox 比例风险模型作为实例，展示了该方法在生存数据分析中的应用。该方法在最大似然估计失效的情况下表现出色，为半参数模型的统计推断提供了新的思路和工具。

2403.04131 2026-05-12 stat.ME econ.EM

Extracting Mechanisms from Heterogeneous Effects: An Identification Strategy for Mediation Analysis

Jiawei Fu

AI总结本文提出了一种新的识别策略，用于同时识别和估计处理效应与中介效应，克服了传统方法对多重忽略假设或复杂研究设计的依赖。该方法结合显性和隐性中介分析，利用处理效应的异质性，无需处理部分未观测的混杂因素，提高了估计的准确性与精确性。通过蒙特卡洛模拟和两个不同数据结构的实证研究，验证了该方法的有效性与实用性。

2401.02694 2026-05-12 stat.ME

Nonconvex High-Dimensional Time-Varying Coefficient Estimation for Noisy High-Frequency Observations with a Factor Structure

Minseok Shin, Donggyu Kim

AI总结本文研究了在存在噪声且具有因子结构的高维高频观测数据下，如何估计时间变化的系数问题。为应对噪声和强相关性，作者首先对观测过程进行平滑处理，并利用主成分分析降低协变量的高维相关性，再结合非凸惩罚回归方法估计局部系数，通过去偏和阈值处理得到最终的估计结果。提出的FATEN-LASSO估计方法在理论上有良好的集中性质，并适用于高维非凸优化问题。

Comments 104 pages, 8 figures

2305.00207 2026-05-12 stat.AP stat.ME

Mixed-Response State-Space Model for Analyzing Multi-Dimensional Digital Phenotypes

Tianchen Xu, Yuan Chen, Donglin Zeng, Yuanjia Wang

AI总结该研究针对多维数字表型数据建模中的挑战，提出了一种混合响应状态空间模型（MRSS），用于联合分析来自帕金森病患者的多模态、多维度数字表型及其测量过程。该模型通过有限个潜在状态时间序列捕捉个体健康状态的动态变化和个性化治疗效应，能够有效调整信息性测量带来的偏差。研究还提出了适用于高斯和非高斯表型的计算方法，并通过仿真和实际数据验证了模型的有效性。

Comments 59 pages, 14 figures, 8 tables

2208.00552 2026-05-12 econ.EM stat.ME

The Effect of Omitted Variables on the Sign of Regression Coefficients

Matthew A. Masten, Alexandre Poirier

AI总结本文研究了被忽略变量对回归系数符号的影响，指出在某些情况下，被忽略变量更容易导致系数符号翻转，而非使其趋近于零。作者基于“Oster's delta”这一稳健性指标，提出了一种改进的衡量方法，以更准确地反映被忽略变量对估计结果的影响。研究通过四个实证案例和两次元分析进行了验证，并提供了相应的Stata模块以供应用。

Comments Main paper 32 pages. Appendix 32 pages

2205.13469 2026-05-12 math.ST stat.ME stat.TH

Proximal Estimation and Inference

Alberto Quaini, Fabio Trojani

AI总结本文构建了一个统一的凸分析框架，用于刻画一大类惩罚估计器在正则和非正则设计下的统计性质。核心方法是将惩罚估计器解释为通过近端算子作用于初始估计器的近端估计器，并推导了其渐近分布的闭式表达式，该分布仅依赖于初始估计器的渐近分布、惩罚函数的子梯度极限以及近端算子的内积结构。研究还揭示了近端估计器的Oracle性质，并据此构建了适用于线性回归场景的新近端估计器，具有根号n一致性和渐近正态性，且在实际蒙特卡洛实验中表现出良好性能。

2111.05243 2026-05-12 econ.EM stat.ME

Bounding Treatment Effects by Pooling Limited Information across Observations

Sokbae Lee, Martin Weidner

AI总结本文提出了一种在无混淆假设下对处理效应进行约束的新方法，适用于处理变量取值多或重叠条件不满足等挑战性场景。该方法通过有限地跨观测信息整合，构建出基于样本平均的处理效应边界，既避免了Manski边界的信息完全不整合问题，也不同于传统的逆概率加权方法。研究通过蒙特卡洛实验和实证应用验证了该方法在实际中的稳健性和有效性。

2110.12907 2026-05-12 stat.ML cs.LG math.PR math.ST stat.TH

Hamiltonian Monte Carlo with Asymmetrical Momentum Distributions

Soumyadip Ghosh, Yingdong Lu, Tomasz Nowicki

AI总结本文研究了哈密顿蒙特卡洛（HMC）算法在使用非对称动量分布时的收敛性问题。传统HMC依赖对称的高斯动量变量，而本文通过新的动力学和概率分析，提出了在更弱条件下保证收敛的理论框架，并指出普通HMC在非对称动量下会破坏自伴随性要求。为此，作者提出了一种改进的AD-HMC算法，能够在Wasserstein距离下实现几何收敛，并通过数值实验验证了其相对于传统高斯辅助HMC的优越性。

1902.00772 2026-05-12 stat.ME stat.ML

High-dimensional semi-supervised learning: in search for optimal inference of the mean

Yuqian Zhang, Jelena Bradic

AI总结本文研究了高维半监督学习中对缺失结果数据进行均值估计的最优推断问题。作者提出了一种新的k折交叉拟合双重稳健估计方法，能够在仅需一致估计结果（可能以比根号n更慢的速度收敛）的情况下，实现对结果均值的根号n精度推断。该方法适用于线性和非线性结果模型，尤其适合高维、非参数或半参数模型，文中还将其应用于异质处理效应的估计。

1811.01198 2026-05-12 cs.LG math.OC stat.ML

Provable Exactness for Asymmetric Low-Rank SDP Learning

Enliang Hu

AI总结本文研究了一种统一的正则化非对称低秩半定规划（aBMF）框架，旨在解决机器学习中的结构化优化问题。通过引入一个二次惩罚项，该方法在保持目标函数双凸性的同时，确保了在足够大的惩罚参数下，非对称方法与对称方法具有相同的临界点，从而保证解的精确性。该研究为非对称松弛方法提供了理论保证，解决了关于是否存在精确惩罚的开放问题。

1808.09448 2026-05-12 stat.ME stat.AP

Estimating the distribution of marks of a homogeneous marked Poisson process

Dragi Anevski, Vladimir Pastukhov

AI总结本文研究了如何估计齐次标记泊松过程中不同类型事件的分布。作者提出了该分布的最大似然估计方法，并给出了其强一致性与渐近正态性。此外，还提出了一个满足序约束的估计方法，并分析了其一致性与渐近分布。该方法被应用于瑞典隆德欧洲散裂中子源新型中子探测器中的中子检测问题。

2605.08432 2026-05-12 cs.CL cs.AI stat.ML

A Semantic-Sampling Framework for Evaluating Calibration in Open-Ended Question Answering

Zhanliang Wang, Jiancong Xiao, Ruochen Jin, Shu Yang, Bojian Hou, Li Shen

AI总结该论文提出了一种用于评估开放域问答中大语言模型校准性能的语义抽样框架Sem-ECE。该方法通过从模型中采样答案并按语义分类，利用分类频率作为置信度，解决了现有方法在开放域场景下评估校准的不足。研究引入了两种估计器Sem₁-ECE和Sem₂-ECE，并证明其在大样本下无偏，且在难问题上表现出更小的校准误差，为问题难度诊断提供了依据。实验表明，Sem-ECE在多个基准测试中优于现有方法，具有重要的实际应用价值。

Comments Preprint

2605.08429 2026-05-12 stat.ML cs.LG stat.ME

Active Multiple-Prediction-Powered Inference

Nicholas Brawand, Nima Leclerc, Anhthy Ngo, Matthew Peterson, Sriram Vishwanath, Laith Alhussein, Ben Wellner

AI总结在医疗AI的部署后监控中，如何以较少的标注数据实现统计有效的推断是一个重要问题。本文提出了一种主动多预测器驱动推断（AM-PPI）方法，通过将每个样本路由到适合其成本的预测器子集，并根据所选预测器的残差不确定性按比例采样标注标签，从而在有限预算下降低估计方差。该方法扩展了单一预测器的预测驱动推断和主动统计推断，实现了多预测器的全局分配到实例级自适应路由的转变，并在理论和实验上验证了其有效性与优越性。

2605.08423 2026-05-12 cs.LG cs.CL stat.ML

Queryable LoRA: Instruction-Regularized Routing Over Shared Low-Rank Update Atoms

Omatharv Bharat Vaidya, Connor T. Jerzak, Nhat Ho, Chandrajit Bajaj

AI总结本文提出了一种数据自适应的参数高效微调方法，用于大神经网络的优化。该方法通过引入一个共享的、可查询的低秩更新原子记忆库，替代传统的层内适配器，使得模型能够根据输入内容和网络计算过程动态选择适合的更新组件，从而在保持低秩适应效率的同时实现更灵活的参数更新。此外，通过引入指令正则化机制，模型能够偏向语义相关方向进行更新，提升训练稳定性与最终性能。

2605.08422 2026-05-12 stat.ME econ.EM stat.CO

Rolling-Origin Conformal Prediction under Local Stationarity and Weak Dependence

Stanisław M. S. Halkiewicz

AI总结本文提出并分析了一种基于滚动起始点的共形预测方法，用于时间序列预测，旨在应对序列相关性、波动聚集和分布漂移等问题。在Hölder-β局部平稳性和α-混合条件下，作者建立了覆盖误差的四部分分解，并推导出最优校准窗口大小及相应的误差收敛速率，证明该方法在该模型类中具有最小最大最优性。实证结果显示，该方法在多个实际数据集上表现优于传统全历史校准方法，验证了理论分析的有效性。

2605.08400 2026-05-12 math.ST cs.IT cs.LG math.IT stat.ML stat.TH

On Observation Time for Recovering Latent Hawkes Networks

Jonas Linkerhägner, Michele Bortolasi, Lorenzo Baldassari, Maarten V. de Hoop, Ivan Dokmanić

AI总结本文研究了从基于事件的观测中恢复潜在交互网络所需的最小观测时间问题，该问题在金融、地震学和神经科学等领域具有重要意义。针对一类具有稀疏、弱交互的平稳Hawkes过程，作者证明了观测时间在数量级上需为$\log d$，其中$d$为交互实体的数量，这一时间尺度既是充分条件也是必要条件。研究提出了一个两阶段估计方法，并结合泊松簇表示的浓度界与Fano不等式及Jacod公式，给出了理论保证。

2605.08395 2026-05-12 stat.ME stat.AP

Statistical Design of Pragmatic Trials Using Electronic Health Record Data when Outcome Assessments are Uncontrolled and Irregular

Jennifer F. Bobb, Sungtaek Son, Melissa L. Anderson, Noorie Hyun, Lynn L. DeBar, Katharine A. Bradley

AI总结本文研究了在使用电子健康记录数据进行实际临床试验时，如何设计统计方法以应对不规则且不受控的结局评估问题。研究提出了一种基于模拟的方法，用于评估不同统计模型在处理稀疏和干预依赖型评估时的效果，并应用于MI-CARE实际试验中。结果表明，考虑随访时间的灵活模型能够无偏地估计治疗效应，而线性混合模型在多种调整下表现出最强的统计效力，为实际试验的分析方法选择提供了重要参考。

Comments 24 pages, 2 figures; includes supplementary material

详情

英文摘要

Pragmatic trials increasingly define outcomes using real-world data such as electronic health records, where assessments are collected during routine care rather than at fixed timepoints. Consequently, these uncontrolled assessments may be irregular, sparse, and affected by the intervention (intervention-dependent assessments), which can lead to biased treatment effect estimates. We developed a simulation study to inform the statistical approach for trials with uncontrolled assessments, which we applied to the MI-CARE pragmatic trial. Using a pre-trial cohort mimicking eligibility and outcome measurement, we estimated assessment frequency and timing and combined these estimates with assumptions about how the intervention effects might impact assessment. We simulated sparse and intervention-dependent assessments and compared single-measure approaches with longitudinal models using all scores. Under intervention-dependent assessments, we found that naive methods such as using the best score or using a randomly selected score without adjusting for measurement timing produced substantial bias. Models that adjusted flexibly for the follow-up timing estimated time-point specific or time-averaged treatment effects without bias. Simulation results informed the selection of the statistical approach for the MI-CARE trial. Among unbiased methods, the most powerful was a linear mixed model with exponential correlation structure, adjustment for time since baseline, and a time-varying intervention effect to estimate the intervention effect at the end of the intervention window. Future studies can use pre-trial data to conduct a simulation study tailored to the trial's data features to inform the analytic approach. Trials with uncontrolled assessments should consider the potential for intervention-dependent assessments and select an appropriate method to avoid bias.

URL PDF HTML ☆

赞 0 踩 0

2605.08379 2026-05-12 stat.AP cs.LG

Transfer Learning for Dead Fuel Moisture Prediction Using Time-Warping Recurrent Neural Networks

Jonathon Hirschi, Jan Mandel, Adam Kochanski

AI总结本文提出了一种基于时间扭曲的迁移学习方法，通过调整长短期记忆网络（LSTM）的时间尺度，实现不同燃料含水率类别之间的任务迁移。研究针对燃料含水率预测问题，利用天气站传感器获取的大量10小时燃料数据训练模型，并迁移预测1小时、100小时和1000小时燃料的含水率。该方法在俄克拉荷马州的一项标志性实地研究数据上进行了验证，有效提升了稀疏观测条件下的预测性能。

Comments Preprint. Related to PhD thesis work that is also available for preprint at https://doi.org/10.48550/arXiv.2604.02474

2605.08377 2026-05-12 cs.LG stat.ML

Embedding Dimension Lower Bounds for Universality of Deep Sets and Janossy Pooling

Ali Syed, Aditya Nambiar, Jonathan W. Siegel

AI总结本文研究了在点云数据中实现排列对称性的深度神经网络架构的通用性问题，重点分析了Deep Sets和Janossy Pooling方法所需的嵌入维度下界。通过提出一种新方法，作者证明了保证这些架构通用性的嵌入维度的新的下界，其中对于Deep Sets，结果在维度大于1时给出了正确的最小嵌入维度（相差常数因子），而对于$k$-元Janossy Pooling，这是首次证明了$k > 1$时的非平凡下界。

2605.08272 2026-05-12 stat.AP

Quantifying Exposure Information Uncertainty in Regional Risk Assessment

Chenhao Wu, Henry Burton

AI总结该研究旨在量化区域风险评估中因暴露信息不完整所带来的偏差和不确定性。通过结合分析与模拟方法，提出了一种将总不确定性分解为暴露信息不完整及其他来源（如灾害和损害特征）贡献的方法，从而更清晰地揭示缺失信息对风险评估的影响路径。研究还应用了该方法于桥梁和区域风险评估，并利用数据增强框架构建了高分辨率的桥梁暴露信息库存。

2605.08263 2026-05-12 stat.ML cs.IT cs.LG eess.SP math.IT stat.ME

Decentralized Conformal Novelty Detection via Quantized Model Exchange

Kyle Loh, Yu Xiang

AI总结本文研究了在保护隐私和节省带宽的前提下，如何在异构复合零假设分布下实现去中心化的异常检测，并控制全局错误发现率（FDR）。研究提出了一种基于量化模型交换的框架，使各独立代理能够共享本地学习的非一致性评分函数的低精度表示。该方法在保证条件交换性的同时，提供了严格的有限样本FDR控制保障，实验验证了其在保持统计效力的同时显著降低了通信成本。

2605.08237 2026-05-12 cs.LG stat.ML

Distributional Spectral Diagnostics for Localizing Grokking Transitions

Ziyue Wang, Yufeng Ying, Takafumi Kanamori

AI总结该研究探讨了机器学习模型在“grokking”现象中从记忆训练数据到泛化的转变过程，并提出了一种基于分布谱分析的方法来定位这一转变。通过将任务相关的观测值映射到 Wasserstein/分位数坐标，并结合 Hankel 动态模态分解，研究构建了用于诊断的残差、谱特征和有效秩等指标。实验表明，该方法在模块加法 Transformer 模型中能够有效区分 grokking 与非 grokking 运行，并在固定阈值下实现提前预警，具有较高的检测性能和实用性。

2605.08230 2026-05-12 cs.LG stat.AP

Social Determinants of Health and Fentanyl Overdose Mortality Across US Counties: An XGBoost and SHAP Analysis Identifying Silent Risk Counties and Treatment Deserts

Kabi Raj Tiruwa, Abhisan Ghimire, Anuj Kumar Shah

AI总结该研究利用XGBoost和SHAP方法，分析美国各县的社 hội决定因素与芬太尼过量死亡率之间的关系，旨在识别高风险但未被关注的“沉默风险县”和“治疗荒漠县”。研究整合了多项公共卫生数据，发现残疾率、高血压、吸烟和交通不便等因素是预测过量死亡的关键指标，并揭示治疗荒漠县的死亡风险显著升高。研究结果为制定针对性干预措施提供了依据，强调应优先扩展药物使用障碍治疗资源，并对高风险地区进行早期干预。

Comments 21 pages, 7 figures, 4 tables

2605.08155 2026-05-12 stat.AP math.PR physics.data-an physics.flu-dyn

Structural and Lagrangian properties of analogue ensembles to characterize multifractality of stochastic processes

Carlos Granero-Belinchon

AI总结本文提出了一种在重构的有限维相空间中表征随机过程标度不变性的框架。该方法基于Takens嵌入重构，通过定义类似状态的集合，分析相空间的结构和动力学特性，并将目标状态的最近邻作为其类似状态。研究发现，类似状态的体积分布及其随时间的扩散特性能够反映随机过程的标度不变性，适用于如正则分数布朗运动和正则多重分形随机游走等一类具有标度不变性的平稳耗散过程。

2605.08111 2026-05-12 cs.LG cs.AI stat.ME

TTCD:Transformer Integrated Temporal Causal Discovery from Non-Stationary Time Series Data

Omar Faruque, Sahara Ali, Xue Zheng, Jianwu Wang

AI总结该论文提出了一种名为TTCD的新型端到端框架，用于从非平稳时间序列数据中发现瞬时和滞后因果关系。TTCD结合了Transformer架构，引入了非平稳特征学习模块和自定义因果结构学习模块，通过重建引导的因果信号蒸馏方法，有效抑制噪声和虚假相关性，从而在无需强统计假设的前提下推断出潜在的因果图。实验表明，TTCD在多种合成和真实数据集上均优于现有方法，展现出在复杂现实场景中进行因果发现的有效性。

Comments 18 Pages

2605.08102 2026-05-12 cs.LG stat.ML

Path-Based Gradient Boosting for Graph-Level Prediction

Claudio Meggio, Johan Pensar, Riccardo De Bin

AI总结本文提出了一种名为PathBoost的梯度树提升方法，用于图级别的分类与回归任务，能够直接从图结构中学习具有判别性的路径特征。该方法在原有针对化学应用的工作基础上进行了三项关键扩展，包括对二分类任务的适配、多节点和边属性的融合以及自动选择锚点节点。实验表明，PathBoost在多个基准数据集上表现优异，尤其在节点数量较多的图上效果更佳，展示了基于路径的提升方法在复杂图任务中的竞争力。

Comments 20 Pages, 1 figure

2604.02474 2026-05-12 cs.LG stat.ML

Time-Warping Recurrent Neural Networks for Transfer Learning

Jonathon Hirschi

AI总结本文研究了如何利用时间拉伸方法在循环神经网络（RNN）中实现迁移学习，以应对物理系统在不同环境条件下演化速度变化的问题。提出的方法基于对时间尺度的重新标定，证明了LSTM可以高精度逼近一类线性微分方程模型，并在保持精度的前提下进行时间拉伸。该方法在预测燃料含水率的应用中得到验证，实验表明，仅调整少量参数即可实现对不同时间尺度数据的准确预测，效果与现有迁移学习方法相当。

2603.10960 2026-05-12 cs.LG math.ST stat.TH

Ranking Reasoning LLMs under Test-Time Scaling

Mohsen Hariri, Michael Hinczewski, Jing Ma, Vipin Chaudhary

AI总结本文研究了在测试时缩放（test-time scaling）条件下对推理大语言模型（LLMs）进行排名的问题，提出了一个名为Scorio的开源库，实现了多种统计排名方法，如配对比较模型、项目反应理论模型等。实验表明，在多个数学基准测试中，多数方法的排名结果与贝叶斯黄金标准高度一致，且部分方法在单次试验下仍能保持较高一致性。研究为不同预算下的模型排名提供了可靠的解决方案。

Comments Code is available at https://github.com/mohsenhariri/scorio

2509.21484 2026-05-12 cs.LG stat.ML

High-probability zeroth-order online convex optimisation beyond Euclidean geometry

David Janz, El-Mahdi El-Mhamdi, Arya Akhavan

AI总结本文研究了在非欧几里得几何框架下的零阶在线凸优化问题，考虑了具有$\ell_q$-Lipschitz损失函数和$\ell_p$-正则化FTRL算法的优化方法，并基于$\ell_r$-球上的锥测度采样构造了随机两点有限差分梯度估计器。作者给出了适用于所有$p,q,r \in [1,\infty]$的高概率统一后悔界，并通过分析梯度估计器在对偶FTRL范数下的所有矩界，实现了时间一致的二次变分控制。该算法具有任意时刻有效和数据驱动的特点，其收敛速率在已有研究中得到了强化，并揭示了在$q > 2$时存在与估计器本身相关的性能瓶颈。

2508.21146 2026-05-12 cs.LG stat.ML

Privacy Auditing Synthetic Data Release through Local Likelihood Attacks

Joshua Ward, Chi-Hua Wang, Guang Cheng

AI总结本文研究了合成数据发布中的隐私泄露问题，提出了一种基于局部似然比的新型无模型成员推理攻击方法——生成似然比攻击（Gen-LRA），该方法无需模型访问或知识，通过评估测试样本对合成数据局部似然比估计的影响来检测训练数据是否被泄露。理论分析表明，Gen-LRA 能在局部过拟合条件下有效区分成员与非成员样本，并在多个数据集和模型架构上表现出优于现有方法的性能，突显了生成模型过拟合对隐私安全的潜在威胁。

2508.12776 2026-05-12 cs.LG cs.AI stat.ML

Randomized PCA Forest for Unsupervised Outlier Detection

Muhammad Rajabinasab, Farhad Pakdaman, Moncef Gabbouj, Peter Schneider-Kamp, Arthur Zimek

AI总结本文提出了一种基于随机主成分分析（RPCA）的无监督异常检测方法，利用RPCA森林的内在特性计算异常分数，以实现高效的异常检测。该方法在多个数据集上表现出优于传统及最新方法的性能，同时具有良好的鲁棒性和计算效率，适用于无监督场景下的异常检测任务。

2507.17921 2026-05-12 stat.ML cs.LG eess.IV math.ST stat.CO stat.ME stat.TH

Sliding Window Informative Canonical Correlation Analysis

Arvind Prasadan

AI总结本文提出了一种适用于流数据场景的新型典型相关分析方法——滑动窗口信息典型相关分析（SWICCA），用于实时发现两个数据集之间的相关特征。该方法结合流式主成分分析算法与滑动窗口样本，实现了对CCA成分的在线估计，具有高维数据处理能力和良好的可扩展性。文中通过数值模拟和实际数据案例验证了方法的有效性，并提供了理论性能保证。

Comments 11 pages (double column), submitted; revised with updated simulations

2504.14127 2026-05-12 econ.EM stat.ME

Finite Population Identification and Design-Based Sensitivity Analysis

Brendan Kline, Matthew A. Masten

AI总结本文提出了一种用于有限总体中量化不确定性的新方法，通过设计分布校准敏感性参数，从而得到可解释为识别集、稳健贝叶斯可信集或统一频率学派设计置信集的不确定性区间。研究聚焦于平均处理效应的不确定性量化，其方法无需依赖渐近理论即可处理异质性处理效应，同时为协变量平衡的分析提供了新视角，并对随机化的作用进行了形式化分析。文中通过三个实证应用展示了该方法的有效性。

2502.06044 2026-05-12 stat.ML cs.LG

Differentially Private Hyperparameter Tuning using Local Bayesian Optimization

Getoar Sopa, Juraj Marusic, Marco Avella Medina, John P. Cunningham

AI总结本文研究了在验证数据包含敏感用户信息时，如何实现差分隐私的超参数调优问题。针对现有方法依赖近似随机搜索或全局贝叶斯优化导致效率低下的问题，提出了一种基于局部贝叶斯优化的差分隐私框架DP-GIBO，利用高斯过程代理模型私密地近似梯度。该方法在适当条件下可保证收敛到局部最优超参数配置，并在中高维超参数空间中表现出优于非隐私随机搜索和全局贝叶斯优化的性能。

Comments 26 pages, 6 figures

2410.01656 2026-05-12 math.ST cs.DS cs.LG stat.CO stat.ML stat.TH

Efficient Statistics With Unknown Truncation, Polynomial Time Algorithms, Beyond Gaussians

Jane H. Lee, Anay Mehrotra, Manolis Zampetakis

AI总结本文研究了在样本仅来自未知集合 $S \subseteq \mathbb{R}^d$ 的情况下，如何高效估计分布参数的问题。作者提出了一种多项式时间算法，适用于满足特定结构条件的指数族分布，并能处理由低次多项式近似表示的未知截断集 $S$，从而扩展了对高斯分布参数估计的现有结果。此外，针对截断集为半空间或轴对齐矩形的情况，作者设计了运行时间为 $\mathrm{poly}(d/\varepsilon)$ 的算法，为截断数据下的参数估计提供了更高效的解决方案。

Comments Appeared at the 65th IEEE Symposium on Foundations of Computer Science (FOCS), 2024; abstract shortened for arXiv

详情

英文摘要

We study the estimation of distributional parameters when samples are shown only if they fall in some unknown set $S \subseteq \mathbb{R}^d$. Kontonis, Tzamos, and Zampetakis (FOCS'19) gave a $d^{\mathrm{poly}(1/\varepsilon)}$ time algorithm for finding $\varepsilon$-accurate parameters for the special case of Gaussian distributions with diagonal covariance matrix. Recently, Diakonikolas, Kane, Pittas, and Zarifis (COLT'24) showed that this exponential dependence on $1/\varepsilon$ is necessary even when $S$ belongs to some well-behaved classes. These works leave the following open problems which we address in this work: Can we estimate the parameters of any Gaussian or even extend beyond Gaussians? Can we design $\mathrm{poly}(d/\varepsilon)$ time algorithms when $S$ is a simple set such as a halfspace? We make progress on both of these questions by providing the following results: 1. Toward the first question, we give a $d^{\mathrm{poly}(\ell/\varepsilon)}$ time algorithm for any exponential family that satisfies some structural assumptions and any unknown set $S$ that is $\varepsilon$-approximable by degree-$\ell$ polynomials. This result has two important applications: 1a) The first algorithm for estimating arbitrary Gaussian distributions from samples truncated to an unknown $S$; and 1b) The first algorithm for linear regression with unknown truncation and Gaussian features. 2. To address the second question, we provide an algorithm with runtime $\mathrm{poly}(d/\varepsilon)$ that works for a set of exponential families (containing all Gaussians) when $S$ is a halfspace or an axis-aligned rectangle. Along the way, we develop tools that may be of independent interest, including, a reduction from PAC learning with positive and unlabeled samples to PAC learning with positive and negative samples that is robust to certain covariate shifts.

URL PDF HTML ☆

赞 0 踩 0

2410.01244 2026-05-12 stat.ML cs.LG math.PR

Equivariant score-based generative models provably learn distributions with symmetries efficiently

Ziyu Chen, Markos A. Katsoulakis, Benjamin J. Zhang

AI总结本文研究了如何高效学习具有对称性的数据分布，提出了首个关于等变分数生成模型（SGMs）的理论分析与保证。通过改进Wasserstein-1距离下的泛化界，并结合哈密顿-雅可比-贝尔曼理论，论文证明了在不进行数据增强的情况下，使用等变向量场即可有效学习对称化分布的分数函数。研究还表明，若未在模型中引入等变结构，将导致更差的泛化性能，突显了等变先验在对称数据建模中的重要性。