arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2605.13840 2026-05-14 stat.ML cs.DS cs.LG math.ST stat.CO stat.TH

What is Learnable in Valiant's Theory of the Learnable?

Steve Hanneke, Anay Mehrotra, Grigoris Velegkas, Manolis Zampetakis

AI总结本文重新审视了Valiant在1984年提出的可学习性模型，探讨了其中哪些概念类是可以被学习的。研究发现，在有限域（包括布尔超立方体）中，一个类可学习当且仅当每个可实现的正样本可以通过多项式大小的自适应查询压缩方案进行认证。这一结果揭示了Valiant模型的学习能力严格介于PAC学习和无查询版本之间，并首次给出了在该模型中学习$d$维半空间的有效算法，展示了查询机制对可学习类的实质性影响。

详情

Comments: Abstract shortened for arXiv

英文摘要

Valiant's 1984 paper is widely credited with introducing the PAC learning model, but it, in fact, introduced a different model: unlike PAC learning, the learner receives only positives, may issue membership queries, and must output a hypothesis with no false positives. Prior work characterized variants, including the case without queries. We revisit Valiant's original model and ask: *Which classes are learnable in it?* For every finite domain, including Valiant's Boolean-hypercube setting, we show that a class is learnable if and only if every realizable positive sample can be certified by a poly-size adaptive query-compression scheme. This is a new variant of sample compression where the learner certifies samples via a short interaction with the membership oracle. Our characterization shows that learnability in Valiant's model is strictly sandwiched between learnability in the PAC model and the variant of Valiant's model without membership queries. This is one of the rare cases where introducing membership queries changes the set of learnable classes, and not just the sample or computational complexity. Next, we study the natural extension of the model to arbitrary domains. While we do not obtain an exact characterization, our techniques readily generalize and show that the same strict sandwiching persists. Finally, we show that $d$-dimensional halfspaces, which are not learnable without queries, are learnable with queries: we give a $\mathrm{poly}(d) \tilde{O}(1/ε)$ sample and $\mathrm{poly}(d) \mathrm{polylog}(1/ε)$ query algorithm, and prove that at least $Ω(d)$ samples or queries are necessary. To our knowledge, this is the first algorithm for halfspaces in Valiant's model. Together, these results uncover a surprisingly rich theory behind Valiant's original notion of learnability and introduce ideas that may be of independent interest in learning theory.

URL PDF HTML ☆

赞 0 踩 0

2605.13742 2026-05-14 stat.ME stat.AP

Macroscopic Activity-Based Modeling of Urban Active Mobility

Romain Azaïs, Adrien Marion, Florian Patout

AI总结本文提出了一种基于活动的宏观模型，用于利用非侵入式传感器数据建模城市主动出行行为。该模型引入了参与函数来描述活动之间的时空出行模式，并将聚合计数的分解建模为统计推断问题，采用泊松变量进行计数建模，并通过最大似然估计推断未知子群体规模。该方法基于微观随机模型构建，具有可扩展性和隐私保护优势，为分析城市软出行动态提供了有效工具。

2605.13717 2026-05-14 cs.LG stat.ML

Tight Sample Complexity Bounds for Entropic Best Policy Identification

Amer Essakine, Claire Vernade

AI总结本文研究了在熵风险度量下有限时间风险敏感强化学习中的最优策略识别问题。作者针对现有样本复杂度上界与下界之间存在的指数级差距，提出了一种基于前向模型并结合KL散度探索奖励的算法，通过利用指数效用函数的平滑性质，改进了集中性分析，从而消除了原有的指数因子，使得样本复杂度达到理论下界，填补了该问题的空白。

2605.13710 2026-05-14 math.ST stat.TH

Pattern-based tests for two-dimensional copulas

L. Baringhaus, R. Grübel

AI总结本文研究了基于模式频率的二维Copula检验方法，提出了适用于二维随机样本的模式频率函数型中心极限定理，并以此为基础构建了非参数 goodness-of-fit 检验、两样本检验和对称性检验方法。研究还探讨了参数情形下的应用，并通过仿真研究验证了方法的有效性。

2605.13689 2026-05-14 stat.ME

Moving beyond spatial and random cross-validation in environmental modelling: a call for prediction-domain adaptive evaluation

Jan Linnenbrink, Jakub Nowosad, Hanna Meyer

AI总结随着空间预测模型在生态学中的广泛应用，如何准确评估预测地图的质量成为一个关键问题。尽管独立概率抽样被认为是评估地图精度的理想方法，但在实际中往往难以实现，因此交叉验证成为常用手段。本文提出了一种新的交叉验证方法——预测域自适应评估，该方法能够根据不同预测场景灵活调整，从而更可靠地估计地图精度，并通过模拟研究验证了其有效性。

2605.13687 2026-05-14 cs.LG cs.AI stat.ML

A Hierarchical Language Model with Predictable Scaling Laws and Provable Benefits of Reasoning

Jason Gaitonde, Frederic Koehler, Elchanan Mossel, Joonhyung Shin, Allan Sly

AI总结本文提出了一类具有层次结构的合成语言，并通过树上的广播过程生成，从而能够精确分析上下文长度和推理在自回归生成中的作用。研究引入了一种精确的$k$-gram假设来替代传统变换器模型，并通过实验证明其有效性。研究发现，在特定语言模型下，若上下文长度不足，生成结果将偏离真实语言分布，而具备推理能力的模型仅需对数长度的内存即可精确生成符合真实语言的序列，展现出指数级的性能提升。

2605.13681 2026-05-14 cs.LG stat.ML

Sampling from Flow Language Models via Marginal-Conditioned Bridges

Iskander Azangulov, Leo Zhang

AI总结本文研究了如何从流语言模型（FLMs）中进行有效的采样，提出了一种基于边缘条件桥接的采样方法。与传统方法不同，该方法在每一步反向采样时，根据FLM的边缘后验分布生成干净的one-hot端点，并通过解析的Ornstein-Uhlenbeck桥接过程生成连续状态，从而更准确地保留语言模型的结构特性。该方法无需额外训练，能够自然地支持温度缩放和核截断等解码控制，实验表明其在生成质量与多样性之间取得了更好的平衡。

2605.13660 2026-05-14 stat.AP

Improving ecological inference and uncertainty quantification from camera trap data through the fusion of AI confidences and manual annotations

Adira Cohen, Erin M. Schliep, Roland Kays, Mohammad Alyetama, Matthew Snider

AI总结该研究旨在通过融合人工智能预测置信度与人工标注，提升从相机陷阱数据中进行生态推断和不确定性量化的能力。作者提出了一种新的贝叶斯层次数据融合模型，结合人工标注与AI预测的优势，提高了推断精度与预测能力，并通过模拟研究验证了其有效性。该方法应用于北卡罗来纳州白尾鹿的体况分析，揭示了鹿的健康状况与其栖息地和繁殖状态之间的关系，得出了传统方法无法获得的新生态结论。

2605.13650 2026-05-14 math.ST stat.TH

Weighted and Truncated Tail Index Estimation under Random Censoring: A Unified Full-Range Framework

Abdelhakim Necir, Nour Elhouda Guesmia, Djamel Meraghni

AI总结本文研究了在右删失条件下极值指数的估计问题，提出了一种加权且截断的Nelson-Aalen尾经验过程，构建了一类由大于1的调参参数索引的积分估计方法，从而在从弱删失到强删失的整个范围内恢复了可处理的渐近结构。该方法在标准正则变差条件下建立了统一的高斯近似，无需对删失程度施加限制，理论分析和实际数据应用表明其在中等和强删失情形下具有更高的稳定性和准确性。

2605.13642 2026-05-14 stat.ML cs.LG stat.CO

Conformal Anomaly Detection in Python: Moving Beyond Heuristic Thresholds with 'nonconform'

Oliver Hennhöfer, Maximilian Kirsch, Christine Preisach

AI总结本文介绍了名为 'nonconform' 的 Python 工具包，用于在机器学习流程中实现校准化的异常检测，解决传统方法依赖启发式阈值的问题。该工具包基于统计学中的交换性假设，将异常分数转化为具有统计意义的 p 值，并支持多种校准策略，适用于多种异常检测模型。文章通过代码示例和理论结合，展示了如何在实际中应用校准化异常检测，并验证了其在统计意义上的有效性。

2605.13639 2026-05-14 cs.LG math.OC stat.ML

Achieving $ε^{-2}$ Sample Complexity for Single-Loop Actor-Critic under Minimal Assumptions

Ishaq Hamza, Zaiwei Chen

AI总结本文研究了强化学习中无策略actor-critic方法在单循环实现下的样本复杂度问题，在仅假设存在能诱导不可约马尔可夫链的策略的前提下，证明了在单循环、单时间尺度框架下，首次实现了$\tilde{\mathcal{O}}(ε^{-2})$的样本复杂度保证，用于找到一个$ε$-最优策略。相比以往需要嵌套循环或强算法依赖假设的工作，本文通过构建耦合的Lyapunov漂移框架，解决了单循环更新和非策略学习带来的挑战，为actor和critic分别建立了几何收敛率和$\tilde{\mathcal{O}}(1/T)$收敛率，并通过交叉支配性质将两者结合，具有重要的理论意义和应用潜力。

2605.13612 2026-05-14 cs.LG cond-mat.dis-nn stat.ML

Deep Learning as Neural Low-Degree Filtering: A Spectral Theory of Hierarchical Feature Learning

Yatin Dandi, Matteo Vilucchio, Luca Arnaboldi, Hugo Tabanelli, Florent Krzakala

AI总结本文提出了一种名为“神经低度滤波”（Neural LoFi）的理论框架，用于解释深度神经网络如何通过层次化特征学习从数据中提取有用表示。该方法将基于梯度的训练过程简化为一种显式的迭代谱方法，每一层网络通过选择与标签具有最大低度相关性的方向来逐步构建特征。该理论不仅提供了对深度学习中特征演化机制的数学解释，还通过实验验证了其在全连接和卷积网络中的有效性，展示了其在特征选择和结构滤波方面的优越性。

2605.13607 2026-05-14 stat.CO cs.CE cs.MS

Ergodicity Library: A Python Toolkit for Stochastic-Process Simulation, Time-Average Diagnostics, and Agent-Based Experiments

Ihor Kendiukhov

AI总结 Ergodicity Library 是一个开源的 Python 工具包，专注于随机过程的模拟、时间平均分析和基于代理的实验，特别强调非遍历性、重尾过程和不确定性下的决策行为。该工具集整合了过程定义与模拟、分析与拟合工具以及基于代理的实验三个层次，简化了从模型构建到诊断分析的流程。文章介绍了该软件的架构、支持的过程类型、分析流程及其实现范围，并提供了多个可复现的实例以展示其应用。

2605.13589 2026-05-14 stat.ML cs.LG

Causal Learning with the Invariance Principle

Francesco Montagna, Francesco Locatello

AI总结本文研究了因果发现问题，即如何推断变量之间的因果方向。作者基于结构因果模型（SCM），提出在因果关系无环且跨不同环境保持不变的假设下，仅需两个辅助环境即可推断出任意非线性机制下的因果图。该方法不仅保证了因果图的可识别性，还进一步确保了反事实推理的正确性，并通过合成数据验证了理论结果。

2605.13550 2026-05-14 stat.ME

Causal Discovery via Statistical Power (CDSP)

Shreya Prakash, Fan Xia, Elena A. Erosheva

AI总结本文提出了一种名为CDSP的因果发现方法，通过将因果方向估计与统计功效联系起来，提供了一种能够进行不确定性量化的统计推断框架。该方法基于双变量观测数据，引入效应大小不对称性假设，用于判断数据是否足够支持某一因果方向，并有效提升了因果方向估计的可靠性。实验表明，CDSP在模型轻微误设的情况下仍具有较好的鲁棒性，并在实际数据中相比现有方法将假发现率降低了约18%。

2605.13504 2026-05-14 stat.ME math.AP math.DS math.PR q-bio.QM

Structural identifiability of partially-observed stochastic processes: from single-particle trajectories to total particle density data

Arianna Ceccarelli, Alexander P. Browning, Ruth E. Baker

AI总结本文研究了部分观测随机过程的结构可识别性问题，探讨了在单粒子轨迹数据和总粒子密度数据下参数能否唯一确定。作者提出了一种适用于时空随机过程的方法，针对轨迹数据采用个体模型描述，针对密度数据建立偏微分方程模型并结合微分代数方法进行分析，同时引入基于特征方程的初始条件分析方法，揭示了初始条件对可识别性的重要影响，并通过实例展示了该方法在识别参数组合上的有效性。

2605.13484 2026-05-14 cs.LG cs.AI stat.ME

Discovery of Hidden Miscalibration Regimes

Katarzyna Kobalczyk, Mihaela van der Schaar

AI总结本文研究了模型在不同输入上的校准偏差问题，指出传统方法仅基于置信度评估校准，可能掩盖局部校准失败的现象。为此，作者提出了一种无需预设数据切片的隐式校准偏差发现方法，通过学习输入空间的校准感知表示，并利用核平滑估计局部校准偏差。实验表明，该方法能有效揭示大语言模型在不同输入下的校准异质性，并在系统性偏差区域显著提升校准效果。

2605.13448 2026-05-14 stat.ML cs.LG math.PR

On the Limits of Latent Reuse in Diffusion Models

Yifeng Yu, Lu Yu

AI总结本文研究了扩散模型在分布偏移情况下潜在空间复用的可靠性问题。作者分析了源域和目标域数据虽近似低维但可能位于不同子空间时，复用源潜在空间会导致目标域评分误差的原因，发现该误差由两个因素决定：源目标子空间之间的主角度偏差以及扩散时间尺度放大后的目标噪声。基于这些发现，作者进一步探讨了混合源-目标训练方法，并分析了共享潜在空间维度与两个分布几何关系之间的依赖性，为潜在空间复用的适用条件提供了理论指导。

2605.13446 2026-05-14 stat.AP

Scenario generation of intraday electricity price paths for optimal trading in continuous markets

Andrzej Puć, Joanna Janczura

AI总结本文研究了如何在连续日内电能交易市场中生成电价路径场景，以支持最优交易决策。作者提出了一种基于修正支持向量回归模型的综合预测框架，通过引入基础变量预测误差的场景生成和新的支持向量排序方法，实现了从点预测到概率轨迹预测的扩展。实验结果表明，该方法在统计和经济指标上均优于基准方法，尤其在风险控制和交易收益方面表现突出。

2605.13439 2026-05-14 stat.ME

Median Radial Function: A Robust, Covariance-Free Framework and Applications

Elsayed Elamir

AI总结本文提出了一种基于中位数半径的框架，用于评估多元数据的中心性，该方法定义了一种尺度不变的径向离散度度量，并据此构建了一个对异常值鲁棒且不受协方差结构影响的深度函数。该深度函数无需依赖矩假设，能够自然适应偏态、多峰和重尾分布，适用于高维数据分析。研究还分析了该函数的次梯度和凸性特性，揭示了数据在不同方向上的不对称性，为检测数据偏态和结构不对称提供了新的径向方法。

2605.13434 2026-05-14 cs.LG cs.DC math.OC stat.ML

Rescaled Asynchronous SGD: Optimal Distributed Optimization under Data and System Heterogeneity

Ammar Mahran, Artavazd Maranjyan, Peter Richtárik

AI总结本文研究了在数据和系统异构环境下分布式学习中的异步随机梯度下降（ASGD）方法。传统ASGD因未考虑不同工作节点的计算速度差异，导致模型更新偏向于局部目标的频率加权平均，而非全局目标。本文提出了一种名为Rescaled ASGD的新方法，通过按各节点计算时间比例调整步长，使得每个节点在周期内对模型的总学习率贡献相同，从而恢复对全局目标的正确优化。理论分析表明，该方法在非凸设置下能够收敛到全局目标的平稳点，且时间复杂度达到已知下界，实验验证了其有效性与先进性。

2605.13421 2026-05-14 stat.ME

Combining pre-trained models via localized model averaging

Ziwen Gao, Baihua He, Yuhong Yang

AI总结本文研究了如何有效结合多个预训练模型（PTMs）以提升在不同任务上的预测性能。作者提出了一种基于协变量的局部模型平均方法，通过将模型权重建模为输入特征的函数，使方法能够自适应地捕捉不同PTMs在不同上下文中的相对优势。该方法在通用损失框架下学习灵活的局部权重，并在样本内和样本外风险方面建立了渐近最优性，同时证明了权重估计的一致性，实验结果进一步验证了其有效性。

2605.13401 2026-05-14 cs.LG cs.RO stat.ML

Trajectory-Level Data Augmentation for Offline Reinforcement Learning

Tobias Schmähling, Matthias Burkhardt, Tobias Windisch

AI总结本文提出了一种用于离线强化学习的轨迹级数据增强方法，旨在解决主动定位等任务中从少量次优轨迹中训练策略的问题。该方法利用任务结构以及奖励函数、价值函数与日志策略之间的几何关系，通过轨迹层面的增强技术提升数据质量，从而提高离线强化学习的性能。研究提供了理论依据，并在不同维度和部分可观测性条件下验证了方法的有效性。

2605.13388 2026-05-14 stat.ME stat.AP

Toward a practical handbook for choosing among causal inference methods in non-randomized studies with binary outcomes: A simulation study for applied researchers

Adrián Aurensanz-Crespo, Cristóbal M Rodríguez-Leal, Rosario Susi, Jorge Castillo-Mateo, Jesús Asín, José M Ramírez, Teresa Pérez

AI总结本研究旨在为应用研究者提供一份实用指南，帮助其在非随机研究中选择适合的因果推断方法，以估计二元结局下的处理效应。通过大规模模拟实验，研究比较了四种常用方法——倾向得分匹配、逆概率加权、G计算和靶向最大似然估计的性能，并基于实际数据验证了指南的实用性。该工作为在真实世界数据中进行因果效应估计提供了重要的参考依据。

详情

Comments: 21 pages, 4 figures. Code available at https://github.com/aaurensanz/code-causal-inference-comparison

英文摘要

Applied researchers in biomedicine and related fields are often interested in estimating the causal effect of a treatment or intervention. Although randomized clinical trials are considered the gold standard for establishing causal effects, they are not always feasible, and real-world data may represent the only available source of evidence. In such settings, causal effects must be estimated using statistical methods applied to observational data. Over the last few decades, modern causal inference methods based on the potential outcomes framework have emerged as useful tools in this field. However, many such techniques exist, and their performance depends on factors such as sample size, the proportion of treated patients, the proportion of patients experiencing the outcome, the magnitude of the treatment effect, the target estimand, and potential violations of the fundamental assumptions of causal inference. Given the wide range of available methods, selecting an appropriate approach can be challenging for applied researchers. This study uses a large-scale simulation experiment to address this issue and provide researchers with a guide in the form of a handbook for a binary treatment and a binary outcome. Particularly, we test four popular statistical techniques: propensity score matching (full matching), inverse of the probability weighting, G-computation, and targeted maximum likelihood estimation. The proposed handbook is applied to two real-world datasets to assess its practical utility: one comprising vulnerable patients with mild COVID-19 (n=534 patients and more than 50% treated), and another of patients undergoing colorectal surgery (n=3635 patients and about 20% treated).

URL PDF HTML ☆

赞 0 踩 0

2605.13386 2026-05-14 cs.LG stat.ML

Support-Conditioned Flow Matching Is Kernel Smoothing

Daniel Matsui Smola

AI总结本文研究了基于交叉注意力的生成模型在有限支持集条件下的生成机制，揭示其速度场本质上是 Nadaraya-Watson 核平滑器，并随着生成过程时间推移，核带宽逐渐缩小，从早期的全局平均过渡到后期的最近邻行为。研究将交叉注意力机制与经典核方法联系起来，并指出了三种失效场景，实验验证了理论预测，并表明 IP-Adapter 的交叉注意力实现了近似核平滑效果。

2605.10303 2026-05-14 math.ST stat.TH

Measuring Tail Dependence in Linear Processes: Theory and Empirics

Debanjana Datta, Diganta Mukherjee

AI总结该论文研究了线性过程中尾部依赖性的度量问题，旨在捕捉金融时间序列中标准高斯框架无法描述的厚尾分布和极端共移动现象。作者提出了一种基于依赖性度量的联合极端值分析方法，适用于非同分布和同分布的正则变差分布，并结合高频加密货币数据验证了持久性特性的影响。研究通过详细的模拟实验验证了方法的有效性，为极端风险分析提供了新的理论支持和实证依据。

2605.04999 2026-05-14 stat.ME

A Tutorial for Evaluating Cure Model Appropriateness

A Tutorial for Evaluating Cure Model Appropriateness Geethanjalee Mudunkotuwa, Durbadal Ghosh, Subodh Selukar

AI总结在生存分析中，传统模型假设所有个体最终都会经历感兴趣的事件，但随着治疗手段的进步，越来越多的临床场景中存在可能治愈的疗法，部分个体可能永远不会经历该事件。为此，统计学家提出了治愈模型来应对这一挑战，但其在生物医学领域的应用仍较为有限。本文提供了一种系统方法，结合临床判断、Kaplan-Meier曲线的可视化分析和定量评估，以判断是否适合使用治愈模型，并通过急性髓系白血病的临床试验数据及其他造血干细胞移植数据集的实例，为研究者提供了实用的指导，有助于提高生存分析的可靠性与临床决策质量。

详情

Comments: 24 pages, 2 figues, to be submitted in Statistics in Medicine, First two authors have equal contributions

英文摘要

In survival analysis, traditional models assume all individuals will eventually experience the event of interest. However, advances in therapeutics have led to multiple clinical contexts with potentially curative therapies, and in these contexts, certain individuals may never experience the event. Statisticians have developed cure models as a methodology to address this challenge. Nonetheless, despite significant statistical advances in cure models, we have seen more limited uptake in biomedical applications, and we hypothesize that this is caused by limited guidance in the appropriate application of cure models. Cure models require specific identifiability conditions for valid parameter estimation, and previous reports have demonstrated significant issues with the inappropriate application of cure models. Existing tutorials for cure models focus on model implementation and either assume or provide only limited guidance on whether cure modeling is appropriate for the given dataset. This tutorial addresses this gap by describing a systematic procedure that integrates clinical judgment, visual inspection of Kaplan-Meier curves, and quantitative evaluation. We provide a worked example using data from a randomized clinical trial in acute myeloid leukemia, and we also summarize findings from a series of other datasets of hematopoietic cell transplantation to suggest broad practical guidance for choosing to apply cure models. By systematically evaluating cure model appropriateness before fitting these models, researchers can achieve more reliable survival analysis and improved clinical decision-making.

URL PDF HTML ☆

赞 0 踩 0

2605.04912 2026-05-14 math.PR math.ST stat.TH

Can the $L^1$-$L^\infty$ duality be restored for non-dominated families of probability measures?

Irene Klein, Georg Köstenberger

AI总结本文研究了在非主导概率测度族下恢复 $L^1$ 与 $L^\infty$ 对偶关系的问题，指出在存在模型不确定性时，经典对偶关系失效，进而提出通过扩展概率空间来恢复这一对偶性的方法。作者证明，在扩展后的模型中，$\mathcal{P}$-几乎处处有界函数空间与有限符号测度空间之间存在等距同构关系，并展示了该方法适用于多种非主导模型，如无限乘积测度、高斯过程和带有不确定波动率的Black-Scholes模型等。此外，该方法统一了已有框架，并将Kraft的经典假设检验结果推广到非主导情形。

详情

Comments: 43 pages, fixed minor inconsistencies and typos, incl. references

英文摘要

The duality $L^{\infty}\simeq (L^{1})'$ frequently breaks down in the presence of model uncertainty, where a single reference measure $P$ is replaced by a non-dominated family of probability measures $\mathcal{P}$. The unavailability of classical measure-theoretic and functional-analytic tools in this regime poses a significant obstacle to developing robust probabilistic frameworks. We show that this duality can be restored for a broad class of robust statistical models by extending the underlying probability space. Specifically, on the extended model, the space $\mathbb{L}^{\infty}(\mathcal{P})$ of $\mathcal{P}$-quasi-surely bounded functions is isometrically isomorphic to the dual of the space of finite signed measures absolutely continuous with respect to at least one element of $\mathcal{P}$. The proposed extension is canonical: it is the smallest $\mathcal{P}$-complete extension of the original $σ$-algebra for which $\mathbb{L}^{\infty}(\mathcal{P})$ is the dual of any normed space. Our assumptions encompass several prominent non-dominated settings, including infinite product measures, Gaussian processes, the Black-Scholes model with uncertain constant volatility and drift, robust binomial models, and, more generally, infinite sequences from any parametric model with almost surely estimable parameters. Furthermore, we unify the existing frameworks of Cohen (2012) and Liebrich et al. (2022), demonstrating that our construction is equivalent to the capacity-based approach under mild assumptions satisfied by the aforementioned examples. Finally, we apply our theory to extend Kraft's (1955) characterization of strictly unbiased hypothesis tests to non-dominated cases.

URL PDF HTML ☆

赞 0 踩 0

2604.26070 2026-05-14 cs.LG math.OC math.ST q-bio.QM stat.TH

Observable Neural ODEs for Identifiable Causal Forecasting in Continuous Time

Jennifer Wendland, Nicolas Freitag, Maik Kschischo

AI总结该论文研究了连续时间因果推理中的可识别性问题，针对存在隐藏混杂因素的动态决策场景，提出了可观测神经ODE（ObsNODE）模型。通过将控制理论中的可观测性概念与因果可识别性联系起来，论文推导出一种连续时间调整公式，并设计了能够从观测数据中重构潜在状态的神经ODE模型，从而实现对不同干预路径下结果的预测。实验表明，该方法在合成癌症数据、基于MIMIC-IV的半合成数据和真实脓毒症数据上均表现出优越的性能。

2603.02928 2026-05-14 stat.ME stat.CO

LOO-PIT predictive model checking

Herman Tesso, Aki Vehtari

AI总结本文研究了基于留一法概率积分变换（LOO-PIT）的贝叶斯模型评估方法，用于预测性模型检验。由于LOO-PIT值在有限样本下存在依赖性，传统基于独立性假设的检验方法可能表现不佳，本文提出了三种适用于连续和离散数据的检验方法，并设计了一种自动化的图形化方法以可视化局部偏差。实验表明，所提方法在多个数据集上表现出更高的检验能力。

2602.22847 2026-05-14 cs.LG cs.AI stat.ML

Decentralized Ranking Aggregation via Gossip: Convergence and Robustness

Kerrian Le Caillec, Anna Van Elst, Igor Colin, Stephan Clémençon

AI总结本文研究了在去中心化网络环境中实现可靠且鲁棒的排名共识的问题，提出了一种基于随机闲聊（gossip）通信机制的方法，使各节点仅通过局部交互即可计算全局排名共识，无需中心协调。该方法在保证收敛性的同时，增强了对恶意节点的鲁棒性，并降低了通信成本，为分布式偏好分析提供了新的解决方案。

2602.11131 2026-05-14 physics.soc-ph math.ST stat.TH

Formalization of the generalized Pareto principle and structural typicality of the 20/80-rule

Antti Hippeläinen

AI总结本文对广义帕累托原理进行了形式化描述，将其定义为“输入的分数 $p$ 产生输出的分数 $1-p$”，并基于非负收益密度函数进行分析，得到了一个唯一的表征方法。研究推导了截断幂律、指数和正态分布族的 $p$ 的闭合表达式，并预测在样本量 $N$ 为 $[10^2, 10^5]$ 时，这些分布的 $p$ 值集中在 $[0.15, 0.26]$ 和 $[0.20, 0.29]$ 范围内，接近经典的 20/80 法则，且低于此前提出的饱和值。研究揭示了帕累托型不平衡现象的普遍性及其作为规范性目标的应用意义。

2602.06021 2026-05-14 stat.ML cs.LG cs.NA math.NA math.PR

Diffusion Model's Generalization Can Be Characterized by Inductive Biases toward a Data-Dependent Ridge Manifold

Ye He, Yitong Qiu, Molei Tao

AI总结本文研究扩散模型在不记忆训练数据时生成样本的分布特性，提出了一种基于数据依赖的几何视角来刻画其泛化能力。作者引入了一组随时间变化的对数密度脊流形，用于表征反向扩散过程，并发现生成样本遵循“进入-对齐-滑动”的机制。研究进一步将这一几何结构与训练动态联系起来，揭示了模型架构偏差与优化误差之间的定量关系，并在合成数据和MNIST实验中验证了理论预测。

2602.02791 2026-05-14 stat.ML cs.LG math.ST stat.TH

Plug-In Classification of Drift Functions in Diffusion Processes Using Neural Networks

Yuzhen Zhao, Jiarong Fan, Yating Liu

AI总结本文研究了扩散过程中的监督多类分类问题，每个类别由不同的漂移函数表征，观测数据为离散时间轨迹。作者提出了一种基于神经网络的插件分类方法，通过估计类别特定的漂移函数进行分类，并在标准正则性假设下建立了误分类风险的收敛速率，明确了漂移估计、时间离散化和维度的影响。理论分析表明，利用扩散结构进行漂移学习能够获得比直接基于轨迹的神经分类更优的性能，数值实验也验证了该方法在不同维度下的有效性。

2512.20280 2026-05-14 stat.ME

The post-hoc test for local dependence

Bogdan Ćmiel, Bartłomiej Gibas

AI总结本文旨在提出一种同时考虑全局和局部统计独立性检验的方法，以更全面地识别数据中的依赖关系及其强度。研究基于copula理论，引入了基于分位数依赖函数的检验方法，并提出了“临界曲面”概念，以在保持整体显著性水平的前提下，对局部依赖进行详细分析和显著性评估。该方法增强了对依赖结构的可视化与解释能力，具有重要的实际应用价值。

2510.00417 2026-05-14 math.OC cs.LG stat.ML

Progressively Sampled Equality-Constrained Optimization

Frank E. Curtis, Lingjun Guo, Daniel P. Robinson

AI总结本文提出了一种用于求解连续非线性等式约束优化问题的算法，适用于目标函数和约束函数由大量项的期望或平均定义的情形。该算法通过逐步增加样本量，依次求解一系列相关优化问题，从而在保证一定精度的前提下降低最坏情况下的样本复杂度。实验结果表明，该方法在实际应用中具有良好的效果。

2509.23800 2026-05-14 stat.ML cs.LG

Sample-Efficient Optimisation over the Outputs of Generative Models

Samuel Willis, Paul Duckworth, Jack Simons, Aleksandra Kalisz, Krisztina Sinkovics, Noam Ghenassia, Shikha Surana, Henry T. Oldroyd, Alexandru I. Stere, Dragos D Margineantu, Carl Henrik Ek, Henry Moss, Erik Bodin

AI总结本文提出了一种名为O3的方法，用于在生成模型的输出上进行样本高效的黑箱优化，特别适用于连续变量的扩散模型和流匹配模型。该方法基于代理潜在空间，即从生成模型中提取的低维欧几里得嵌入，无需额外训练即可实现可控维度的表示，并支持直接应用标准优化算法。实验表明，在图像和蛋白质设计任务中，代理空间优化相比传统采样或原潜在空间优化能获得显著更优的样本。该方法对模型和优化器具有通用性，额外成本极低，且无需重新训练或微调生成模型。

2509.19929 2026-05-14 stat.ML cs.LG physics.comp-ph physics.data-an

Geometric Autoencoder Priors for Bayesian Inversion: Learn First Observe Later

Arnaud Vadeboncoeur, Gregory Duthé, Mark Girolami, Eleni Chatzi

AI总结本文提出了一种用于贝叶斯反演的几何自编码器先验框架（GABI），旨在解决从少量噪声观测中恢复物理系统全场信息这一高度不适定的问题。GABI通过学习不同几何结构系统的物理响应生成模型，构建出与几何条件相关的强先验信息，从而在反演过程中提升不确定性量化（UQ）的准确性与鲁棒性。该方法无需依赖物理方程或边界条件，利用近似贝叶斯计算（ABC）采样实现高效计算，并在多个复杂几何场景中验证了其有效性与可靠性。

2509.12889 2026-05-14 math.ST stat.ML stat.TH

Gaussian Mixture Model with unknown diagonal covariances via continuous sparse regularization

Romane Giard, Yohann de Castro, Clément Marteau

AI总结本文研究了在未知对角协方差矩阵情况下高斯混合模型（GMM）的统计估计问题，提出利用Beurling-LASSO（BLASSO）方法同时估计混合成分的数量及其参数。该方法扩展了BLASSO框架至具有成分特异性对角协方差矩阵的多变量GMM，相比以往需要已知且相同的协方差矩阵的模型更具灵活性。研究建立了非渐近恢复保证，包括对成分均值、对角协方差和权重的近参数收敛速率，并引入了混合成分分离条件以构造非退化的对偶证书，为BLASSO的统计保证提供了理论支撑。

2507.09983 2026-05-14 stat.AP stat.ME

Gradient boosted multi-population mortality modelling with high-frequency data

Ziting Miao, Han Li, Yuyu Chen

AI总结本文研究了如何利用高频死亡率数据进行更准确的死亡率建模与预测，针对传统模型在处理季节性波动和短期变化时的不足，提出了一种结合梯度提升技术与多群体随机死亡率模型的新方法。核心创新在于将Li和Lee模型作为弱学习器嵌入梯度提升框架，替代传统决策树，提升了模型拟合与预测精度。实证研究表明，该方法在30个国家的周死亡率数据上表现出更优的预测性能，并有效解决了多群体建模中子群体选择的问题。

2502.11583 2026-05-14 stat.ML cs.LG

Distributional Autoencoders Know the Score

Andrej Leban

AI总结本文研究了分布型主成分自编码器（DPA），旨在实现分布正确重建与编码可解释性的统一。通过理论分析，作者建立了最优水平集几何与数据分布得分之间的精确关系，揭示了DPA能够分离数据变化因素的机理，并允许直接从样本中恢复得分函数。此外，当数据服从玻尔兹曼分布时，该关系可用于单次拟合中近似最小自由能路径。研究还证明，在数据位于可由编码器逼近的流形上时，超出流形维度的潜在变量与数据分布条件独立，从而揭示了数据的内在维度。这些结果表明，单一模型可以在保证下同时学习数据分布及其内在维度，统一了无监督学习的两个长期目标。

2501.07738 2026-05-14 math.PR math-ph math.MP math.ST q-bio.PE stat.TH

Mixing time for an epidemic model on graphs with external sources of infection

Wasiur R. KhudaBukhsh, Yangrui Xiang

AI总结本文研究了带有外部感染源的易感-感染-易感（SIS）传染病模型在图上的混合时间问题。作者在参数适当假设下，证明了该模型的混合时间与顶点数 $n$ 的数量级为 $Θ(n\log n)$。进一步地，他们在随机图家族（如 Erdős–Rényi 图、随机正则多重图和 Galton–Watson 树）上分析了该模型，证明在高概率下混合时间仍保持 $Θ(n\log n)$ 的数量级。

2409.02708 2026-05-14 cs.LG stat.ME

Few-shot Multi-Task Learning of Linear Invariant Features with Meta Subspace Pursuit

Chaozhi Zhang, Lin Liu, Xiaoqun Zhang

AI总结本文研究了在数据稀缺情况下如何通过多任务学习提取线性不变特征的问题，提出了一种名为Meta Subspace Pursuit（Meta-SP）的新算法，用于学习不同任务间共享的低秩不变子空间。该方法在算法层面和统计层面均提供了理论保证，并通过大量实验验证了其在性能上的优越性，优于包括ANIL在内的多种对比方法。

2405.07860 2026-05-14 econ.EM math.ST stat.ML stat.TH

Order-Explicit Linearization of High-Dimensional $U$-Statistics

David M. Ritzwoller, Vasilis Syrgkanis

AI总结本文研究了高维 $U$-统计量与其Hájek投影之间的偏差，并给出了一个与阶数显式相关的大型偏差界。通过发展新的高阶Hoeffding分量的显式矩不等式，作者证明了对于具有特定条件的$d$维核函数的$b$阶$U$-统计量，其最大偏差为$O_p(ϕb n^{-1}\log^2(dn))$，并表明这一速率在对数项的多项式因子内不可改进。研究结果进一步用于建立基于重采样的非参数回归估计器的同时置信区间的一致性，适用于包括广义随机森林在内的多种随机森林回归方法。

2402.15415 2026-05-14 cs.LG math.DS stat.ML

Understanding Catastrophic Forgetting In LoRA via Mean-Field Attention Dynamics

Hugo Koubbi, Louis Hernandez, Matthieu Boussard

AI总结本文研究了LoRA（低秩适配）方法在微调过程中出现的灾难性遗忘问题，通过构建一个可解析的均场自注意力玩具模型，将令牌视为相互作用的粒子系统，并将LoRA视为低秩扰动。利用偏微分方程和动力系统理论，揭示了遗忘行为与非遗忘行为之间的相变机制，并分析了扰动大小和模型深度对遗忘的影响，同时通过实验验证了理论预测。

2311.02299 2026-05-14 econ.EM stat.ME

The Fragility of Sparsity

Michal Kolesár, Ulrich K. Müller, Sebastian T. Roelsgaard

AI总结本文通过三个实证应用，揭示了基于稀疏性假设的线性回归估计存在两种脆弱性。首先，不同选择的回归矩阵（如分类变量的基线类别）虽不影响普通最小二乘（OLS）估计，却可能导致稀疏性估计发生两倍标准误以上的变动。其次，作者通过将稀疏性估计与OLS进行比较，提出了两种检验稀疏性假设的方法，结果在所有三个应用中均拒绝了稀疏性假设。除非解释变量数量接近或超过样本量，否则OLS在保持较高效率的同时能提供更稳健的推断。

1804.01050 2026-05-14 stat.ML cs.CV cs.LG

Training VAEs Under Structured Residuals

Gara Dorta, Sara Vicente, Lourdes Agapito, Neill D. F. Campbell, Ivor Simpson

AI总结本文研究了在变分自编码器（VAE）中如何更好地建模图像重构残差中的结构化相关性。传统VAE假设像素间的不确定性是独立的，但实际重构残差往往具有明显结构。为此，作者提出了一种新的方法，在VAE中引入结构化高斯似然预测网络，以建模残差中的相关性，并在保持模型复杂度较低的前提下，有效提升了VAE对颜色图像的不确定性建模能力与生成质量。

1802.07079 2026-05-14 stat.ML

Structured Uncertainty Prediction Networks

Gara Dorta, Sara Vicente, Lourdes Agapito, Neill D. F. Campbell, Ivor Simpson

AI总结本文首次提出了一种网络，用于预测合成图像的结构化不确定性分布。与以往方法主要预测对角协方差矩阵不同，该模型能够学习预测每个重建结果的完整高斯协方差矩阵，从而支持高效的采样和似然计算。实验表明，该模型能够准确重建合成数据集中的真实相关残差分布，并生成具有高频细节的真实人脸图像，同时展示了预测协方差在结构保持图像去噪中的应用。

2605.13326 2026-05-14 stat.ME

A Note on the Folding Test of Unimodality: limitation and improved alternative

Colombe Becquart, Aurore Archimbaud, Anne M. Ruiz, Zaineb Smida

AI总结本文指出了单峰性折叠检验（FTU）的一个关键局限性，即在某些一元混合分布情况下，该方法会系统性地误判多峰分布为单峰分布。作者对狄拉克混合和高斯混合中的此类失效情况进行了全面分析，并提出了一种双折叠方法，通过捕捉互补信息，改进了单峰性检验，有效解决了FTU的缺陷，并在模拟中提升了多峰检测的能力。

2605.13287 2026-05-14 cs.LG cs.AI math.OC stat.ML

Delightful Exploration

Ian Osband

AI总结本文提出了一种名为“Delight-gated exploration”（DE）的探索策略，用于解决大规模动作空间中探索预算有限的问题。该方法通过衡量潜在收益与惊喜值的乘积（即“delight”）来决定是否进行探索，从而更高效地利用有限的探索资源。DE 在多种任务中表现出比 Thompson Sampling 和 $\varepsilon$-greedy 更弱的遗憾增长，并且其超参数具有良好的跨任务迁移性，无需重新调整。

2605.13284 2026-05-14 stat.ML cs.LG math.ST stat.TH

Learning Perturbations to Extrapolate Your LLM

Zetai Cen, Chenfei Gu, Jin Zhu, Ting Li, Yunxiao Chen, Chengchun Shi

AI总结该研究旨在提升大语言模型在未知领域中的泛化能力，提出了一种通过学习连续潜在向量的可学习变换来扰动词元前缀的方法。该方法克服了传统离散固定扰动的局限性，并通过推导无偏估计方程并利用随机梯度下降进行优化，建立了在过参数化场景下的统计性质。实验表明，该方法在合成和真实数据集上均显著优于现有先进方法。

2605.13283 2026-05-14 cs.LG math.ST stat.TH

Byzantine-Robust Distributed Sparse Learning Revisited

Yuxuan Wang, Lixin Zhang, Kangqiang Li

AI总结本文重新研究了高维稀疏线性模型下的拜占庭鲁棒分布式估计问题。作者提出了一种结合局部鲁棒$\ell_1$正则化估计与服务器端鲁棒聚合的框架，适用于伪Huber回归、分位数回归和稀疏支持向量机。该方法在较弱条件下提供了非渐近保证，达到了近似最优的统计收敛速率，同时保持了通信效率，仿真实验验证了其在多种拜占庭攻击下的估计鲁棒性、支持恢复和分类精度。

2605.13260 2026-05-14 cs.LG math.AP math.FA stat.ML

Unified generalization analysis for physics informed neural networks

Yuka Hashimoto, Tomoharu Iwata

AI总结本文针对物理信息神经网络（PINNs）及其变体（VPINNs）的泛化能力进行了统一的理论分析。研究通过泰勒展开将非线性微分算子转化为高维空间中的线性算子，结合Koopman分析方法，建立了适用于包含微分操作的神经网络的泛化界。该方法突破了以往对稳定性条件或线性椭圆性的依赖，揭示了微分算子的非线性特性对泛化性能的显著影响，为理解物理信息神经网络的训练与推广提供了新的理论视角。

2605.13252 2026-05-14 stat.ML cs.LG math.ST stat.TH

The Sample Complexity of Multiple Change Point Identification under Bandit Feedback

Maximilian Graf, Victor Thuot

AI总结本文研究了在老虎机反馈机制下多突变点定位问题，旨在以最少的采样次数识别出函数中指定数量的突变点，并满足给定的精度和置信水平。作者提出了一种自适应算法，首先检测可能包含突变点的区间，再精确确定其位置，并给出了该算法的样本复杂度上界和下界。研究发现，突变点的幅度和相对位置共同影响样本复杂度，而不仅仅是突变幅度单独决定。

2605.13188 2026-05-14 stat.ML cs.CL cs.LG stat.ME

LLMs as Implicit Imputers: Uncertainty Should Scale with Missing Information

Stef van Buuren

AI总结本文研究了大型语言模型（LLMs）在不完整上下文下的回答不确定性问题，提出应将LLMs视为隐式的缺失值填补器，并借鉴多重填补理论中的标准，即不确定性应随缺失信息量增加而上升。通过在SQuAD数据集上的实验，作者发现基于采样的响应熵能更准确地反映上下文缺失程度，而置信度则无法有效体现这一变化。研究还提出了一种黑盒诊断指标，用于评估不同上下文水平下模型不确定性减少的比例，为评估LLMs在不完整信息下的表现提供了新方法。

2605.13187 2026-05-14 stat.ME stat.AP

Testing the Structural Properties of Marked Point Processes Using Local Inhomogeneous Mark-Weighted K-Functions

Nicoletta D'Angelo, Giada Adelfio, Matthias Eckardt

AI总结本文提出了一种基于卡方型检验统计量的方法，用于检验观测到的标记点模式在局部结构上的不同假设。该方法通过局部非齐次标记加权K函数的扩展，评估标记与位置之间的相互作用，从而揭示局部对独立性或均匀性偏离的贡献。该方法在具有细微标记结构或小样本的情境下仍表现出良好的检测能力，并在森林和地震等实际环境数据中展示了其检测空间依赖性标记结构的有效性。

2605.13174 2026-05-14 stat.ML cs.LG stat.CO

Coupling-Informed Transport Maps for Bayesian Filtering in Nonlinear Dynamical Systems

Dengfei Zeng, Lijian Jiang, Shuyu Sun, Dunhui Xiao

AI总结本文提出了一种基于状态与观测变量之间耦合关系的无似然传输滤波方法，用于非线性动态系统的贝叶斯滤波。通过利用传输映射的块三角结构，将滤波分析步骤转化为最小化真实联合分布与其传输近似之间的最大平均差异（MMD）。为避免MMD优化中的非凸性问题，作者引入了一种无需训练的传输滤波方法，通过梯度流实现传输映射的解析计算，从而有效逼近非高斯滤波后验分布并避免粒子崩溃。该方法在高维问题中通过域局部化进行扩展，并在数值实验中展现出优于传统滤波方法的性能。

2605.13160 2026-05-14 stat.ML cs.LG

Kernel-based guarantees for nonlinear parametric models in Bayesian optimization

Rafael Oliveira

AI总结本文研究了在贝叶斯优化中使用非线性参数模型时的理论保证问题，针对适应性数据收集场景下的模型分析缺乏理论支持的现状，提出了一种基于核函数的框架。该方法通过参数空间上的核函数诱导模型类的再生核希尔伯特空间结构，为使用广泛正则化凸损失训练的非线性模型提供了置信界，进而支持非线性获取函数和代理模型的收敛性保证，为贝叶斯优化及相关自适应优化问题提供了统一的理论分析途径。

2605.13150 2026-05-14 stat.ML cs.LG

Generative Modeling of Approximately Periodic Time Series by a Posterior-Weighted Gaussian Process

Elias Reich, Saverio Messineo, Stefan Huber

AI总结该论文研究了工业和网络物理系统中具有近似周期性特征的离散自动化过程的时间序列生成问题。为了解决传统高斯过程模型在处理此类数据时的不足，作者提出了一种基于后验加权高斯过程的生成模型，通过引入新的核函数，实现了对周期性结构和重复间变异的解耦。该方法能够在保持重复间结构一致性的同时，生成具有平滑变化特性的近似周期时间序列，为相关领域的建模与生成任务提供了新思路。

2605.13146 2026-05-14 stat.ML cs.CV cs.LG

On Hallucinations in Inverse Problems: Fundamental Limits and Provable Assessment Methods

David Iagaru, Nina M. Gottschling, Anders C. Hansen, Josselin Garnier

AI总结本文研究了逆问题中的“幻觉”现象，即人工智能模型生成的看似合理但实际错误的细节。作者提出了一种理论框架，揭示这类幻觉不仅源于模型本身，更可能源于逆问题本身的病态特性，并推导出幻觉产生的充要条件及仅依赖于前向模型的可计算界。基于该理论，文章提出了两种算法，分别用于估计最小幻觉幅度和评估重建细节的可信度，实验表明该方法适用于多种成像任务和生成模型，为量化和评估AI幻觉提供了理论依据。

2605.13128 2026-05-14 stat.ML cs.LG stat.CO

Amortized Neural Clustering of Time Series based on Statistical Features

Ángel López-Oriona, Ying Sun

AI总结本文提出了一种无需依赖传统聚类算法（如K-means、K-medoids或层次聚类）的基于统计特征的时间序列聚类方法，通过神经网络的 amortized 推理学习最优聚类规则。该方法利用自相关和分位数自相关等统计特征，从数据中自动学习亲和结构，无需预先指定聚类形状或数量，且能自动确定聚类数目。实验表明，该框架在多种场景下均能实现与传统方法相当或更优的聚类效果，并在金融时间序列分析中展现出实际应用价值。

2605.13127 2026-05-14 stat.ML cs.LG math.PR

State-of-art minibatches via novel DPP kernels: discretization, wavelets, and rough objectives

Hoang-Son Tran, Pranav Gupta, Rémi Bardenet, Subhroshekhar Ghosh

AI总结本文研究如何利用新型行列式点过程（DPP）核来生成更高效的迷你批次和核心集，以提升大规模数据集的机器学习效率。作者提出了基于小波的欧几里得空间DPP，其精度保证优于现有方法，并开发了一种将连续DPP转换为离散核的通用方法，从而在保持方差衰减特性的同时实现高效采样。该方法拓展了DPP在不规则目标函数任务中的适用性，并提供了与任务正则性自适应的理论保证。

2605.13092 2026-05-14 stat.ML cs.LG stat.ME

Adaptive Kernel Density Estimation with Pre-training

Ruitong Zhang, Ke Deng

AI总结本文研究了高维空间中的密度估计问题，传统核密度估计方法因难以指定合适的局部自适应核而不高效。为此，作者引入预训练思想，构建一个预训练神经网络，为每个样本点推荐合适的自适应核，从而实现高维下的高效密度估计。实验表明，当目标分布与预训练分布接近时，该方法能显著提升估计精度；即使分布差异较大，通过微调仍可恢复效果，展示了方法的灵活性和有效性。

2605.13004 2026-05-14 math.PR math.ST stat.TH

Orientation in Poisson Cluster Processes via Imaginary Bispectra

Conor Kresin, Yifu Tang, Boris Baeumer, Ting Wang

AI总结本文研究了一侧泊松聚类过程在聚类方向被抹去后仍可检测的信息。通过构造保持强度和巴特利特谱的可逆聚类空模型，作者表明仅凭二阶结构无法确定时间方向。对于平稳的泊松分支聚类，研究推导了约简三阶累积量的傅里叶-斯蒂尔特jes变换，并证明在$L^1$三阶累积量条件下，非零的虚因子双谱可确认方向性，同时给出了方向抹去后的空模型及有限窗口的三阶方向对比方法。

2605.12977 2026-05-14 stat.AP q-fin.MF q-fin.RM q-fin.ST stat.ML

Enhancing a Risk Model by Adding Transient Statistical Factors

Alexandros E. Tzikas, Emmanuel J. Candès, Trevor Hastie, Stephen P. Boyd, Mykel J. Kochenderfer, Ronald N. Kahn

AI总结本文研究如何通过引入瞬时统计因子来增强现有的风险模型，以更准确地估计资产收益的协方差。作者提出了一种基于最大似然估计的系统方法，通过调整现有因子模型并添加新的统计因子来提升模型表现，仅依赖于观测到的收益序列和两个超参数。该方法适用于存在缺失收益数据的典型股票数据集，并在实际应用中对Barra短期美国风险模型进行了验证，展示了其在捕捉原模型未能反映的收益结构方面的有效性。

2605.12947 2026-05-14 stat.ML cs.AI cs.LG stat.ME

When Should an AI Workflow Release? Always-Valid Inference for Black-Box Generate-Verify Systems

Young Hyun Cho, Will Wei Sun

AI总结随着基于大语言模型的AI工作流越来越多地采用生成-评估-修订的迭代流程，如何在适当的时候停止迭代并输出结果成为一个关键问题。本文提出了一种始终有效的发布包装器，用于现有生成-评估系统，通过构建高分失败案例的参考池并结合e-process累积证据，实现了在不确定停止时机下的统计保证。该方法能够在保证不释放不可行任务结果的同时，仍能对可行任务进行有效发布，理论分析和实验结果均验证了其有效性。

2605.12908 2026-05-14 stat.ML cs.LG

The Mechanism of Weak-to-Strong Generalization: Feature Elicitation from Latent Knowledge

Ryoya Awano, Taiji Suzuki

AI总结本文研究了从弱模型到强模型的泛化机制（W2S），即通过弱模型的输出对强模型进行微调，使强模型在保持原有能力的同时学习新任务。作者在奖励模型学习的设定下，利用两层神经网络分析了该过程，证明强模型能够高效学习任务特征并保留预训练的通用能力，而不会发生灾难性遗忘。该研究为理解W2S泛化提供了理论支持，并展示了其在特征学习场景中的有效性。

2605.12901 2026-05-14 stat.ME stat.AP stat.CO

A Bayesian Adaptive Latent Mixture Model for Zero-Inflated Weighted Brain Connectome Analysis

Hsin-Hsiung Huang, Yuh-Haur Chen, Teng Zhang

AI总结该研究针对加权脑连接网络中普遍存在的大量零值和异质非零边强度问题，提出了一种贝叶斯自适应潜在混合模型，用于分析零膨胀的加权脑连接组数据。该模型通过将每个被试网络表示为共享的低秩潜在得分矩阵的单纯形混合，并结合 hurdle 概率模型区分边的存在与否与边强度，从而更准确地捕捉连接模式的重叠特性。理论分析证明了后验一致性与预测一致性，并在模拟和实际数据中展示了优于传统拓扑方法的性能。

2605.12899 2026-05-14 stat.ML cs.LG

Robust Sequential Experimental Design for A/B Testing

Qianglin Wen, Xiangkun Wu, Chengchun Shi, Ting Li, Niansheng Tang, Yingying Zhang, Hongtu Zhu

AI总结本文研究了在模型误设情况下A/B测试中鲁棒的序贯实验设计问题，提出了一种统一的框架，适用于上下文 bandit 和动态设置。理论上，该方法能够保证估计处理效应的最坏情况均方误差上界；实验部分在合成数据和某科技公司的实际数据上验证了方法的有效性。

2605.12890 2026-05-14 stat.AP cs.LG

Steer-to-Detect: Probing Hidden Representations for Detection of LLM-Generated Texts

Luxu Liang, Xiang Li

AI总结随着大语言模型（LLM）的快速发展，区分机器生成文本与人类撰写文本变得越来越困难。为了解决这一问题，本文提出了一种名为Steer-to-Detect（S2D）的两阶段检测框架，通过注入引导向量提升冻结的观察模型的隐藏状态表示，从而增强类别可分性，并基于引导后的表示进行假设检验以实现检测。该方法在理论上有严格的误差保证，并在多种场景下表现出色，包括分布外和对抗性扰动情况。

2605.12881 2026-05-14 stat.ME

Change-point detection in variance-covariance matrix

Ying Lin, Benjamin Poignard

AI总结本文研究在方差协方差矩阵分段常数变化背景下，联合估计变化点位置和协方差矩阵的稀疏结构。通过在平方弗罗贝尼乌斯范数上应用分组融合LASSO和LASSO惩罚，并引入自适应权重以提高估计精度，提出了一种新的估计方法。作者还建立了估计量一致性的理论条件，并开发了基于ADMM的高效优化算法，实验表明该方法在合成数据和实际数据中表现良好。

2605.12847 2026-05-14 stat.ME

Never Too LATE: A Fully Stochastic Update to the Potential Outcome Framework

Hanti Lin

AI总结本文提出了一种对传统潜在结果框架的全新随机化更新方法，旨在解决在随机因果背景下局部平均处理效应（LATE）的识别问题。传统LATE假设每个个体的潜在结果是确定的，而作者引入了随机潜在结果，即个体在不同处理下的结果具有概率分布，并据此定义了一个加权平均处理效应（DATE）。研究证明，在与LATE相似但适用于随机设置的假设下，DATE与传统工具变量估计量一致，从而为因果推断提供了一个更灵活且更符合现实的理论框架。

详情

英文摘要

In the classic potential outcome framework, the local average treatment effect (LATE) and its identification via an instrumental variable are stated in a deterministic setting at the individual level: each individual has settled potential outcomes such as ``cured if treated''. Several authors have proposed working instead with \emph{stochastic} potential outcomes -- counterfactual probabilities of the form ``the chance of being cured if treated'' -- but the integration of stochastic potential outcomes with the LATE machinery raises an issue. It is a metaphysical issue: in a stochastic setting, the standard joint-probability definitions of compliers and the LATE assume what I will call the \emph{unique-parallel-universe view}, which asserts that, in any genuinely possible state of the world, every counterfactual condition settles a unique determinate outcome even when the underlying causal disposition is irreducibly chancy. The statistician Dawid (2000) doubts the plausibility of this view; the philosopher Lewis (1973) develops a reductio argument against it. I propose a fully stochastic update to the Rubin causal model that drops the assumption of the unique-parallel-universe view: stochastic potential outcomes are introduced as Bernoulli parameters in their own (small) probability spaces, and are connected to observables via the factorization rule of a causal Bayes net. Within this framework, I define a Degree-of-compliance-weighted Average Treatment Effect (DATE) and prove that, under assumptions analogous to those used for the LATE but rewritten for the fully stochastic setting, the DATE equals the usual IV estimand. The classic LATE identification result emerges as a deterministic special case. Existing IV practice can therefore be reinterpreted: it has been estimating the DATE all along, in a general stochastic setting, without assuming the unique-parallel-universe view.

URL PDF HTML ☆

赞 0 踩 0

2605.12844 2026-05-14 math.NA cs.NA stat.CO

Walk on spheres and Array-RQMC

Valerie N. P. Ho, Art B. Owen

AI总结本文将Array-RQMC采样方法应用于球面行走（WOS）算法，用于求解狄利克雷边值问题。实验表明，该方法在多个问题上显著降低了蒙特卡洛方差，方差降低因子达到57至2290倍。与之前研究的RQMC-WOS算法相比，本文方法在相同问题上表现出更优的方差缩减效果，并引入了基于Sobol'指标的列均值维度来解释这一改进。

2605.12840 2026-05-14 stat.AP cs.LG

Decision Support for Marketplace Policies under Incomplete Evidence: From Replay to Launch Readiness

Prashant Shekhar, Caroline Howard

AI总结本文研究了在实时竞价（RTB）市场中，如何基于不完整证据对定价和分配政策进行决策支持的问题。作者提出了一种支持感知的决策支持系统（DSS），整合了回放、离线评估、保守下界排名、多方面防护机制等多种方法，构建了一个可保留主张的评估流程，输出的是政策是否具备上线条件的分类结果，而非单一性能估计。实验表明，该系统能够识别出具有提升潜力的地板价格策略，并指出在缺乏关键因果证据的情况下，应选择在线验证而非直接部署，从而避免决策过断。

详情

英文摘要

Marketplace platforms routinely evaluate pricing and allocation policies using logged observational data, yet strong offline performance does not imply that a policy is safe to deploy. In real-time bidding (RTB) marketplaces, reserve-price and floor-policy changes affect not only revenue but also fill, advertiser value, budget pacing, and competition across auctions, creating feedback and interference. The central problem is therefore not to estimate whether a policy improves an offline metric, but to determine whether the available evidence justifies direct launch or only further validation. In this regard, we propose a support-aware decision-support system (DSS) that distinguishes promising from actionable evidence. The framework integrates replay, support-aware off-policy evaluation (OPE), conservative lower-bound ranking, multi-sided guardrails, out-of-time validation, sensitivity analysis, and interference-aware validation design into a claim-preserving pipeline that outputs a launch-readiness classification rather than a single performance estimate. Applying the framework to iPinYou-style RTB logs, we identify a margin-gated floor policy as the leading candidate, with a 47.7% replay yield lift, a 45.8% conservative lower-tail lift, and stable out-of-time performance. However, the framework does not recommend direct launch. A decision-rule ablation shows that simplified pipelines select the same policy but incorrectly recommend deployment, leaving key causal assumptions unresolved. In contrast, the proposed DSS selects the same policy but changes the action to online validation, reflecting missing evidence on propensities, bidder response, and interference. Overall, the contribution is a reproducible DSS protocol that prevents decision overclaim under partial identification and converts offline evaluation into an auditable, action-oriented recommendation.

URL PDF HTML ☆

赞 0 踩 0

2605.12832 2026-05-14 stat.AP cs.LG stat.ML

Digital Twins as Synthetic Controls in Single-Arm Trials

Daniele Bertolini, Franklin Fuller, Aaron M. Smith, Jonathan R. Walsh, Run Zhuang

AI总结本文探讨了在单臂试验中使用数字孪生作为合成对照的方法，以评估药物疗效和安全性。研究提出基于结果模型的合成对照能够克服传统数据驱动方法的局限性，提供更稳健的治疗效果估计。文章重点介绍了数字孪生技术，即利用机器学习模型生成的个性化疾病进展预测，并讨论了其在实际应用中的统计方法、样本量计算及与FDA最新指南的兼容性。最后，作者通过重新分析肌萎缩侧索硬化症和亨廷顿病的试验数据，验证了所提方法的有效性。

2605.12807 2026-05-14 stat.CO cs.IT math.IT

Multi-Marginal Couplings for Metropolis-Hastings

Buu Phan, Gergely Flamich, Ashish Khisti, Shahab Asoodeh

AI总结本文研究了基于多边缘耦合的Metropolis-Hastings算法的收敛诊断问题，提出了一种新的多链耦合方法，通过引入自然的目标函数并结合列表级分布耦合与分布式配对问题，建立了上下界分析。该方法改进了经典泊松蒙特卡洛方法的运行时间复杂度，避免了维度依赖的瓶颈，并在高维设置中表现出显著优势。实验表明，该方法在提升马尔可夫链耦合效率、缩短会合时间方面优于现有方法。

2605.12797 2026-05-14 stat.ME stat.AP

Evaluating the impact of outcome delay on the efficiency of sample size re-estimation

Aritra Mukherjee, Michael J Grayling, James J M S Wason

AI总结本文研究了结果延迟对内部试点型样本量重新估计（SSR）设计效率的影响。通过分析不同延迟长度下连续和二元结局数据的最终样本量分布，探讨了延迟对样本量估计精度的影响，并引入了均方误差（RMSE）、延迟影响和成本等指标进行评估。研究发现，随着延迟增加，平均样本量和统计功效会上升，但其影响程度取决于具体试验设置，尤其是当重新估计的样本量小于原计划时，延迟的影响更为显著。

2605.12780 2026-05-14 stat.ME cs.LG stat.ML

When to Trust Confidence Thresholding: Calibration Diagnostics for Pseudo-Labelled Regression

Marcell T. Kurbucz

AI总结本文研究了在回归分析中使用经过校准的分类器输出作为伪标签时，置信度阈值选择对估计结果的影响。作者提出了一种基于校准的诊断方法，推导出置信度阈值引起的衰减偏差的闭式表达，并表明该偏差可由未标记数据集上的残差得分方差 $V^{*}$ 预测。研究还给出了在有界校准漂移下的敏感性边界，并提出了一个基于 $V^{*}$ 和 $κ$ 的决策规则，帮助实践者判断是否安全使用置信度阈值进行伪标签。

2605.12760 2026-05-14 stat.ME stat.AP

How long should a block be?

Léo R. Belzile, Anthony C. Davison

AI总结本文研究了极端值分析中块最大值方法中块长度的选择问题，指出块长度对方法效果有重要影响。作者通过渐近相对效率分析了过长块长的影响，并提出基于似然的方法和图形诊断工具，以判断块长度是否合适，同时考虑数据可能存在的舍入和左截断问题。研究通过模拟和实际气象数据验证了所提方法的有效性。

2605.12756 2026-05-14 math.OC cs.AI stat.ML

Uncovering Symmetry Transfer in Large Language Models via Layer-Peeled Optimization

Zhehang Du, Hangfeng He, Weijie Su

AI总结本文研究了大规模语言模型在最小化交叉熵损失进行预训练时，是否会在模型权重和上下文嵌入中诱导出几何结构。通过分析一个约束的逐层剥离优化模型，作者证明了目标下一个词分布中的对称性会以群论意义上的方式转移到模型的最优解中。例如，当目标词具有循环移位对称性时，最优的logit矩阵为循环矩阵，输出投影和上下文嵌入的格拉姆矩阵也呈现出循环几何结构；对于具有对称群不变性的目标分布，最优输出投影矩阵形成等角紧框架，且继承了输入数据中的排列对称性。实验表明，开源大语言模型自然表现出与理论预测一致的对称性，尽管训练过程中并未显式引入相关正则化。

详情

英文摘要

Large language models (LLMs) are pretrained by minimizing the cross-entropy loss for next-token prediction. In this paper, we study whether this optimization strategy can induce geometric structure in the learned model weights and context embeddings. We approach this problem by analyzing a constrained layer-peeled optimization program, which serves as a mathematically tractable surrogate for LLMs by treating the output projection matrix and last-layer context embeddings as optimization variables. Our analysis of this nonconvex optimization program demonstrates that symmetries in the target next-token distributions are transferred to the global minimizers of the layer-peeled model in a precise group-theoretic sense. Specifically, we prove that when the target tokens exhibit a cyclic-shift symmetry (such as the seven days of the week or the twelve months of the year), the optimal logit matrix is exactly circulant, and the Gram matrices of both the output projections and the context embeddings form circulant geometries as well. Next, for exchangeable target distributions invariant under the symmetric group and, more generally, under two-transitive group actions, we show that the global optimal output projection matrix forms a simplex equiangular tight frame, while the optimal logit matrix and context embeddings inherit the permutation symmetries present in the input data. A key technical step is to reduce the constrained nonconvex factorized problem to an explicit logit-level convex characterization for cyclic symmetry and to a symmetry-based lower bound for permutation symmetry, together with a sharp characterization of the optimal factorization. Finally, we empirically demonstrate that open-source LLMs naturally exhibit symmetries consistent with our theoretical predictions, despite being trained without any explicit regularization promoting such geometric structure.

URL PDF HTML ☆

赞 0 踩 0

2605.12733 2026-05-14 cs.LG cs.AI stat.ML

From Generalist to Specialist Representation

Yujia Zheng, Fan Feng, Yuke Li, Shaoan Xie, Kevin Murphy, Kun Zhang

AI总结本文研究了从通用模型中学习任务相关的专家表征问题，核心在于在非参数设定下证明任务结构和任务相关潜在表征的可识别性。研究无需干预、参数形式或结构约束，证明了即使在时间序列缺乏严格时序依赖或存在断开的情况下，任务结构仍可在完全无监督条件下被识别，同时在每个时间步内，通过简单的稀疏性正则化可将任务相关与无关部分分离。这些结果为从通用模型向专家模型的可证性转变奠定了理论基础。

2605.12720 2026-05-14 math.ST math.PR stat.ML stat.TH

Optimal sequential tests yield log-optimal e-processes

Ashwin Ram, Aaditya Ramdas

AI总结本文研究了序贯检验与对数最优e-过程之间的关系，证明了可以通过聚合渐近最优的序贯检验构造出渐近对数最优的e-过程，从而完善了相关理论。核心方法是引入一种新的加权停止时间指示符聚合的e-过程，能够在备择假设下以最优速率增长。该研究澄清了不同渐近最优性定义之间的细微差别，为序贯统计推断提供了更坚实的理论基础。

2605.12697 2026-05-14 stat.ML cs.LG math.PR

A Unified Framework for Critical Scaling of Inverse Temperature in Self-Attention

Tomohiro Hayase, Ryo Karakida

AI总结本文提出了一种统一的框架，用于确定自注意力机制中逆温度参数的临界缩放规律，以稳定长上下文处理。研究通过分析每个注意力行的间隔计数函数 $N_n$，定义了上尾累积尺度，并证明该尺度决定了softmax集中度的临界逆温度值。该框架统一了先前不同的缩放规律，并为从理论模型到实际Transformer的注意力得分分布提供了直接的诊断方法。

2605.12679 2026-05-14 stat.ME

Measures of predictive accuracy, miscalibration and discrimination

Łukasz Delong, Mario Wüthrich

AI总结本文研究了在决策理论框架下，基于Bregman散度的均值一致损失函数对实值点预测器的评估方法。作者推导出一种新的Murphy分解形式，将预期损失分解为误校准和判别两个部分，并将其与基于洛伦兹曲线的准确性指标联系起来。引入了改进的ABC²指标以弥补传统ABC指标在均值校准识别上的不足，同时指出这些指标依赖于预测器权重，因而无法与均值一致评分函数保持一致。研究结果表明，在模型选择中使用ABC、ABC²或基尼分数可能导致不诚实的评估，支持采用均值一致损失函数和Murphy分解中的误校准与判别度量进行模型评估。

2605.12668 2026-05-14 stat.ML cs.LG

Online Conformal Prediction: Enforcing monotonicity via Online Optimization

Eduardo Ochoa Rivera, Ambuj Tewari

AI总结本文研究了在线符合预测问题，旨在在多个置信水平下同时生成具有嵌套结构的有效预测集，以满足不同用户对风险容忍度的异构需求。作者提出了两种新的在线符合预测方法，通过在线优化视角实现预测集的嵌套性，并控制分位数估计误差。实验表明，与现有方法相比，该方法在多个置信水平上实现了稳定的覆盖率、严格的嵌套结构以及更高的统计效率。

2605.12653 2026-05-14 cs.LG cs.AI stat.ML

Plan Before You Trade: Inference-Time Optimization for RL Trading Agents

Eun Go, Rohan Deb, Arindam Banerjee

AI总结本文提出了一种名为FPILOT的推理时优化框架，用于改进强化学习在投资组合管理中的应用。该方法受模型预测控制启发，利用价格预测信息在推理阶段动态优化交易策略，而无需依赖训练时的固定策略。FPILOT能够在不重新训练策略的情况下，结合价格预测模型生成多步价格轨迹，并据此优化每一步的资产配置，从而在多个风险调整指标上显著提升交易表现。

2605.12648 2026-05-14 cs.LG stat.ML

Population Risk Bounds for Kolmogorov-Arnold Networks Trained by DP-SGD with Correlated Noise

Puyu Wang, Jan Schuchardt, Nikita Kalinin, Junyu Zhou, Sophie Fellenz, Christoph Lampert, Marius Kloft

AI总结本文首次为使用带有梯度裁剪的随机梯度下降（SGD）训练的柯尔莫戈罗夫-阿诺尔德网络（KAN）建立了群体风险界，涵盖了非隐私保护的SGD以及使用高斯扰动的差分隐私SGD（DP-SGD），其中扰动噪声在独立与时间相关之间进行插值。研究采用更贴近实际训练的批量SGD方法，并引入时间相关噪声机制，以改善隐私与效用的平衡。通过引入辅助未投影动态、偏移迭代和高概率引导分析，解决了非凸优化中相关噪声DP训练的分析难题，最终得到了KAN的群体风险界，为非凸学习中的相关噪声机制提供了首个优化与泛化分析。

2605.11168 2026-05-14 stat.ME stat.CO stat.ML

Variational predictive resampling

Laura Battaglia, Stefano Cortinovis, Chris Holmes, David T. Frazier, Jack Jewson

AI总结本文提出了一种名为变分预测重采样（VPR）的可扩展后验采样方法，旨在解决变分推理（VI）在捕捉后验依赖性方面的不足。该方法结合了VI的预测优势与重采样框架，通过反复生成未来观测并更新变分近似，逐步逼近真实的贝叶斯后验分布。实验表明，VPR在保持计算效率的同时，显著提升了后验不确定性量化能力，并恢复了均值场近似所遗漏的后验依赖关系。

2605.11108 2026-05-14 math.PR math.ST stat.TH

Empirical Convergence of Even-Order Gromov-Wasserstein Functionals

Vasyl Paliy

AI总结本文研究了在实空间 $\mathbb{R}^{d_x}$ 和 $\mathbb{R}^{d_y}$ 上具有紧支撑的概率测度之间，偶阶幂次Gromov-Wasserstein泛函的样本复杂度。作者证明了对于任意固定的正整数对 $(r,k)$，两样本经验估计的误差以 $n^{-2/\max\{\min\{d_x,d_y\},4\}}$ 的速率收敛，其中在 $\min\{d_x,d_y\}=4$ 的临界情况下包含对数因子。该结果将已知的二次欧几里得误差上界推广到了整个偶阶幂次Gromov-Wasserstein泛函族，核心方法包括偶阶GW泛函的多项式分解、耦合依赖项的广义对偶公式以及半凹对偶势的熵估计。

2605.09968 2026-05-14 cs.LG math.OC stat.ML

Consolidation-Expansion Operator Mechanics:A Unified Framework for Adaptive Learning

Debashis Guha

AI总结本文提出了一种名为“巩固-扩展算子力学”（OpMech）的统一框架，用于描述自适应学习系统中巩固已有知识与扩展新知识之间的交替过程。核心概念是“顺序差距”（order-gap），它衡量了巩固算子和扩展算子在某一知识状态下的非交换程度，并可作为实时控制信号指导学习过程。该框架在多个领域如强化学习、连续学习和递归语言模型中均有应用，并提供了基于顺序差距的停止规则，具有理论保证和实际有效性。

2604.18242 2026-05-14 math.ST cs.LG stat.ML stat.TH

Horospherical Depth and Busemann Median on Hadamard Manifolds

Yangdi Jiang, Xiaotian Chang, Cyrus Mostajeran

AI总结本文提出了一种在Hadamard流形上的内在统计深度——horospherical深度，并定义了其最大值点集为Busemann中位数。该方法利用了Tukey半空间深度中线性泛函与归一化距离函数极限的关系，在Hadamard流形上则对应为Busemann函数，其下水平集为horoball，可视为半空间的内在替代。该深度具有视觉边界参数化、等距协变等特性，且无需切空间线性化或指定基点，适用于任意Hadamard流形，并在负曲率条件下具有严格拟凹性和唯一中位数，同时具备对污染和样本扰动的鲁棒性。

2603.20521 2026-05-14 cs.LG cs.AI math.OC stat.ML

Delightful Distributed Policy Gradient

Ian Osband

AI总结分布式强化学习在使用过时、有错误或不匹配的智能体生成的数据进行训练时，容易受到高惊讶度（负对数概率）动作的影响，导致学习效果下降。本文提出的“Delightful Policy Gradient”（DG）方法通过将优势值与惊讶度相乘作为门控机制，有效抑制高惊讶度的失败案例，同时保留高惊讶度的成功案例，从而提升学习效率。实验表明，DG在多种复杂场景下相比传统方法具有显著的样本效率优势，尤其在任务复杂度增加时表现更为突出。

2603.14479 2026-05-14 stat.AP stat.ME

Risk-Calibrated Process Capability Approval with Finite Samples

Fei Jiang, Lei Yang

AI总结本文研究了在有限样本条件下，如何基于过程能力指数 $C_{pk}$ 进行风险校准的工艺能力认证问题。传统方法通常采用确定性阈值规则进行决策，但未考虑估计不确定性带来的风险。本文提出了一种考虑估计误差和不对称操作损失的决策框架，通过引入校准常数 $k$，将认证规则扩展为 $\widehat{C}_{pk} \ge C_0 + k\,SE(\widehat{C}_{pk})$，从而在近阈值决策中提升认证稳定性并降低预期操作损失。

2602.13155 2026-05-14 cs.LG cs.DS cs.NE stat.ML

Learning to Approximate Uniform Facility Location via Graph Neural Networks

Chendi Qian, Christopher Morris, Stefanie Jegelka, Christian Sohler

AI总结本文研究了在统一设施选址问题（UniFL）中如何通过图神经网络（GNN）实现高效的近似求解。作者提出了一种全微分的图神经网络方法，结合经典近似算法的思想，无需求解器监督或离散松弛，从而在保证理论近似比的同时提升了算法性能。该方法在实验中表现优于传统近似算法，缩小了与整数线性规划的性能差距。

2602.06713 2026-05-14 stat.ML cs.LG

Distribution Shift in Missing Data Imputation: A Risk-Based Perspective and Importance-Weighted Correction under MAR

Luke Shannon, Song Liu, Katarzyna Reluga

AI总结本文从风险最小化角度出发，严格将缺失数据填补建模为均方误差风险最小化问题，揭示了当缺失概率依赖于数据时，现有方法未能考虑训练数据与完整数据分布之间的分布偏移，导致无法有效降低整体均方误差。为此，作者提出了一种基于重要性加权的修正算法，显式处理该分布偏移问题，实验表明该方法在RMSE和Wasserstein距离上均优于未修正的基准方法。

2602.06104 2026-05-14 cs.LG stat.ML

Pragmatic Curiosity: A Unified Framework for Hybrid Learning and Optimization via Active Inference

Yingke Li, Anjali Parashar, Enlu Zhou, Chuchu Fan

AI总结该论文提出了一种名为“实用好奇心”（Pragmatic Curiosity, PraC）的统一框架，用于结合学习与优化的混合场景，通过主动推理实现高效的决策。该方法通过权衡任务相关潜在符号的信息增益与结果的预期遗憾，指导候选查询的选择，从而在减少不确定性的同时提升任务性能。研究展示了PraC在多个复杂场景中的应用，包括固定符号的决策监控、局部符号的目标主动搜索以及未知偏好的复合贝叶斯优化，表现出降低决策风险、提升关键结果区域覆盖能力和联合学习预测与偏好结构的优势。

2602.03730 2026-05-14 stat.ML cs.LG

Efficient Generative Prediction for EHR Foundation Models: The SCOPE and REACH Estimators

Luke Solo, Matthew B. A. McDermott, William F. Parker, Bashar Ramadan, Michael C. Burkhart, Brett K. Beaulieu-Jones

AI总结该论文提出两种高效估计方法SCOPE和REACH，用于提升基于电子健康记录（EHR）生成模型的临床结果预测性能。这两种方法利用生成模型中未被充分利用的下一个token概率分布，有效解决了传统蒙特卡洛采样在稀疏性、计算成本和方差方面的局限。实验表明，它们在保持预测校准的同时，显著减少了生成token数量，尤其在罕见但重要的临床结果上表现突出，从而大幅降低了推理成本。

2602.01099 2026-05-14 stat.AP cs.NA math.NA

Simultaneous Estimation of Seabed and Its Roughness With Longitudinal Waves

Babak Maboudi Afkham, Ana Carpio

AI总结本文提出了一种无限维贝叶斯框架，用于利用纵向波散射同时估计海底及其粗糙度。该方法基于海底统计各向同性假设，通过分数阶可微性刻画海底粗糙度，并设计了鲁棒的数值算法以实现海底参数估计与不确定性量化。大量数值实验验证了该方法的有效性，为大规模海底探测提供了新的可行途径。

2601.22816 2026-05-14 cs.LG stat.ML

Cascaded Flow Matching for Heterogeneous Tabular Data with Mixed-Type Features

Markus Mueller, Kathrin Gruber, Dennis Fok

AI总结本文提出了一种用于生成包含离散和连续混合特征的表格数据的级联流匹配方法，以解决现有模型在生成混合类型特征时的困难。该方法首先生成表格数据的低分辨率版本，再通过一种新的引导条件概率路径和数据依赖耦合机制，在高分辨率模型中生成更精确的混合特征。实验表明，该方法在生成样本的真实性和分布细节捕捉方面表现优异，检测得分提升了51.9%。

2601.22409 2026-05-14 cs.LG cs.AI stat.ML

Optimization, Generalization and Differential Privacy Bounds for Gradient Descent on Kolmogorov-Arnold Networks

Puyu Wang, Junyu Zhou, Philipp Liznerski, Marius Kloft

AI总结本文研究了梯度下降在Kolmogorov-Arnold网络（KAN）上的优化动态、泛化性能及差分隐私保障。通过理论分析，作者得出了关于训练过程、泛化误差和隐私预算的通用界，并在逻辑斯蒂损失下证明了对数宽度的网络即可实现与迭代次数和样本量相关的优化与泛化速率。在差分隐私设置中，研究进一步表明所需噪声与输入维度和隐私参数相关，并揭示了在隐私保护下网络宽度不仅需满足充分性，还需满足必要性，揭示了隐私与非隐私训练之间的本质差异。

2601.06147 2026-05-14 cs.LG cs.CL stat.ML

LLM Flow Processes for Text-Conditioned Regression

Felix Biggs, Samuel Willis

AI总结本文研究了在文本条件回归任务中如何有效利用预训练大语言模型（LLM）进行预测的问题。针对LLM在短序列预测中存在误差累积、计算密集且难以并行的问题，作者提出将LLM的边际预测密度与一个轻量级扩散神经过程结合，以提升预测的校准性与局部一致性。该方法还引入了一种无需梯度且非蒙特卡洛的采样方法，能够从分数模型与专家密度的乘积中高效采样，具有独立的理论与应用价值。

2512.17485 2026-05-14 math.PR stat.CO

Koenigs functions in the subcritical and critical Markov branching processes with Poisson probability reproduction of particles

Penka Mayster, Assen Tchorbadjieff

AI总结本文研究了在泊松概率繁殖机制下的亚临界和临界马尔可夫分支过程中的Koenigs函数。通过求解柯尔莫戈罗夫方程并结合Koenigs函数的图示表示，作者得到了亚临界情况下的条件极限分布和临界情况下的不变测度。研究中获得了包含指数贝尔多项式和修正指数积分函数的显式解，为分支过程的理论分析提供了新的工具和方法。

2512.10857 2026-05-14 cs.LG cs.AI stat.ML

Generative Modeling from Black-box Corruptions via Self-Consistent Stochastic Interpolants

Chirag Modi, Jiequn Han, Eric Vanden-Eijnden, Joan Bruna

AI总结本文研究了如何从受黑盒噪声干扰的数据中构建生成模型的问题。作者提出了一种基于随机插值的自洽方法（SCSI），通过迭代更新受污染数据与干净数据之间的映射，仅依赖于受污染数据集和对噪声通道的黑盒访问，从而实现对原始数据分布的逆向建模。该方法在计算效率、灵活性和理论保证方面具有优势，并在图像处理和科学重建等任务中表现出优越性能。

2511.14056 2026-05-14 cs.LG cs.AI cs.IT math.DG math.IT stat.ML

Radial Compensation: Fixing Radius Distortion in Chart-Based Generative Models on Riemannian Manifolds

Marios Papamichalis, Regina Ruane

AI总结本文研究了基于坐标图的黎曼流形生成模型中的基础分布问题。传统方法在欧几里得切空间中采样后再映射到流形，但这种方法会导致测地距离的扭曲，不同坐标图、曲率和维度下相同切空间尺度可能对应不同的测地半径。为此，作者提出了一种称为径向补偿（Radial Compensation, RC）的方法，通过特定设计的基础分布使模型实现用户指定的测地半径分布，并提升了训练稳定性与曲率估计的清晰度。此外，文中还引入了平衡指数坐标图，进一步优化了模型的数值条件，使得统计意义与数值计算解耦，提高了模型的可解释性与实用性。

2510.18114 2026-05-14 cs.LG cs.AI stat.ML

Latent-Augmented Discrete Diffusion Models

Dario Shariatian, Alain Durmus, Umut Simsekli, Stefano Peluchetti

AI总结离散扩散模型在语言生成任务中展现出强大潜力，但现有方法常因忽略跨词依赖而影响生成效率。本文提出了一种名为Latent-Augmented Discrete Diffusion (LADD) 的新模型，通过引入可学习的辅助潜在变量，在联合的（词，潜在）空间中进行扩散，从而更好地捕捉结构信息并保持参数可学习性。实验表明，LADD在无条件生成任务中优于现有最优方法，尤其在低采样预算下表现更优。

2510.16986 2026-05-14 stat.ML cs.LG stat.OT

When to Transfer: Adaptive Source Selection for Positive Transfer in Linear Models

Hamza Cherkaoui, Hélène Halconruy, Yohan Petetin

AI总结在许多实际场景中，目标任务的标注数据稀缺或获取成本高昂，限制了监督学习的效果。本文研究了在多源设置下，如何通过样本共享选择性地从相关源任务中迁移信息以提升目标任务的性能。提出了一种基于数据依赖的迁移增益估计的接受/拒绝规则，用于决定从哪些源任务中引入多少样本，并证明该方法在高概率下能够保证正向迁移。实验表明，该方法在合成和真实数据上均优于经典及近期强基线方法，有效避免了负迁移。

2510.16253 2026-05-14 cs.LG cs.AI q-bio.BM q-bio.QM stat.ML

Protein Folding with Neural Ordinary Differential Equations

Arielle Sanford, Shuo Sun, Christian B. Mendl

AI总结本文提出了一种基于神经常微分方程（Neural ODE）的连续深度Evoformer模型，用于蛋白质折叠预测。该方法将传统Evoformer中48个离散块替换为连续时间参数化模块，从而在保持核心注意力机制的同时，显著降低了计算资源消耗。实验表明，该模型在较少计算资源下仍能生成结构合理的预测结果，并有效捕捉部分二级结构特征，展示了连续深度模型在生物分子建模中的潜力。

2509.24728 2026-05-14 cs.LG stat.ML

Beyond Softmax: A Natural Parameterization for Categorical Random Variables

Alessandro Manenti, Cesare Alippi

AI总结该论文提出了一种替代传统softmax函数的新方法——catnat函数，用于处理分类随机变量。从信息几何角度出发，作者揭示了softmax的局限性，并通过分层二元分割构造catnat函数，使其具有对角化的费舍尔信息矩阵，从而提升梯度下降的效率。实验表明，catnat在图结构学习、变分自编码器和强化学习等多种任务中均能提高学习效率和模型性能，且易于实现并兼容现有训练技术。

2507.22095 2026-05-14 stat.ML cs.LG math.PR

Posterior Bayesian Neural Networks with Dependent Weights

Nicola Apollonio, Giovanni Franzina, Giovanni Luca Torrisi

AI总结本文研究具有依赖权重和可能重尾分布的全连接前馈深度神经网络，旨在克服标准高斯先验的局限性。通过引入高斯似然的后验分布视角，论文分析了在网络宽度趋于无穷时输出的后验分布行为，并在先验下随机协方差矩阵正定的条件下，确定了输出的后验分布。研究还给出了确保协方差矩阵可逆的温和条件，并展示了某些模型参数（如激活函数和相关Lévy测度）对极限独立性的影响，扩展了已有研究成果。

2507.17172 2026-05-14 stat.ME stat.AP

Local graph estimation with pathwise false discovery control

Omar Melikechi, David B. Dunson, Noureddine Melikechi, Jeffrey W. Miller

AI总结本文提出了一种局部图估计方法，旨在在复杂网络中聚焦于科学感兴趣的变量，揭示其局部结构关系。该方法引入路径式特征选择（PFS），通过迭代特征选择和网络路径不确定性传播，实现了对局部子图的有效估计，并在有限样本下严格控制假发现率。研究展示了PFS在多个实际应用中的有效性，能够恢复符合领域知识的可解释网络，有助于发现已有机制并提出新假设。

2507.10797 2026-05-14 cs.LG math.OC stat.ML

Multi-Armed Sampling Problem and the End of Exploration

Mohammad Pedramfar, Siamak Ravanbakhsh

AI总结本文提出了多臂采样问题框架，作为多臂老虎机优化问题的采样对应，旨在严谨分析采样过程中的探索与利用权衡。研究系统定义了该框架下的遗憾概念并建立了下界，提出了一种简单算法实现了近似最优的遗憾界，理论结果表明与优化不同，采样几乎无需探索。通过引入温度参数，本文还建立了连接多臂采样与多臂老虎机的连续问题族，为采样相关研究，如神经采样器、熵正则化强化学习等提供了基础理论支持。

2506.03120 2026-05-14 stat.AP cs.LG

Validating remotely sensed biomass estimates with forest inventory data in the western US

Xiuyu Cao, Joseph O. Sexton, Panshi Wang, Dimitrios Gounaridis, Neil H. Carter, Kai Zhu

AI总结该研究旨在验证商业遥感公司terraPulse提供的地表以上生物量密度（AGBD）数据的准确性，利用美国林业局的森林清查与分析（FIA）数据作为独立参考。研究在美国内华达州、犹他州和华盛顿州的64,000公顷六边形区域及县尺度上进行验证，结果显示terraPulse与FIA数据在县尺度上具有高度一致性，R²达0.90，相关系数为0.95。研究还揭示了terraPulse数据在非森林区域和高生物量森林中与FIA数据的偏差原因，并提出了一个基于独立FIA数据的可扩展验证框架，为全球生物量监测提供了新的商业数据基准。

详情

DOI: 10.1016/j.srs.2026.100441
Journal ref: Science of Remote Sensing, Volume 13, June 2026, 100441
Comments: 32 pages, 5 figures

英文摘要

Monitoring aboveground biomass (AGB) and its density (AGBD) at high resolution is essential for carbon accounting and ecosystem management. While NASA's spaceborne Global Ecosystem Dynamics Investigation (GEDI) LiDAR mission provides globally distributed reference measurements for AGBD estimation, the majority of commercial remote sensing products based on GEDI remain without rigorous or independent validation. Here, we present an independent regional validation of an AGBD dataset offered by terraPulse, Inc., based on independent reference data from the US Forest Service Forest Inventory and Analysis (FIA) program. Aggregated to 64,000-hectare hexagons and US counties across the US states of Utah, Nevada, and Washington, we found very strong agreement between terraPulse and FIA estimates. At the hexagon scale, we report R2 = 0.88, RMSE = 26.68 Mg/ha, and a correlation coefficient (r) of 0.94. At the county scale, agreement improves to R2 = 0.90, RMSE =32.62 Mg/ha, slope = 1.07, and r = 0.95. Spatial and statistical analyses indicated that terraPulse AGBD values tended to exceed FIA estimates in non-forest areas, likely due to FIA's limited sampling of non-forest vegetation. The terraPulse AGBD estimates also exhibited lower values in high-biomass forests, likely due to saturation effects in its optical remote-sensing covariates. This study advances operational carbon monitoring by delivering a scalable framework for comprehensive AGBD validation using independent FIA data, as well as a benchmark validation of a new commercial dataset for global biomass monitoring.

URL PDF HTML ☆

赞 0 踩 0

2505.17469 2026-05-14 cs.LG cs.AI cs.IT math.IT math.OC math.ST stat.TH

Efficient compression of neural networks and datasets

Lukas Silvester Barth, Paulo von Petersenn

AI总结本文探讨了神经网络与数据集的高效压缩问题，结合算法信息论与神经网络剪枝技术，提出了一种基于最小描述长度原则（MDL）的模型泛化优化方法。通过引入参数稀疏性作为模型描述长度的可计算近似，并改进稀疏优化算法，作者在图像和文本数据集上实现了显著的模型压缩，同时保持了较高的准确率。实验还验证了压缩模型在样本效率和泛化能力上的优势，支持了索洛莫诺夫归纳理论的预测。

2505.14587 2026-05-14 stat.ML cs.LG

High-Dimensional Analysis of Bootstrap Ensemble Classifiers

Malik Tiomoko, Hamza Cherkaoui, Mohamed El Amine Seddik, Cosme Louart, Ekkehard Schnoor, Balazs Kegl

AI总结本文对应用于最小二乘支持向量机（LSSVM）集成分类器的自助（Bootstrap）方法进行了理论分析，重点关注样本量和特征维度较大的场景。通过随机矩阵理论工具，研究了由多个弱分类器决策函数聚合而成的分类器性能，并探讨了自助方法在高维设置下的应用效果。基于理论分析，提出了优化子集数量和正则化参数以提升LSSVM集成性能的策略，实验结果在合成和真实数据集上验证了理论结论的有效性。

2505.04613 2026-05-14 stat.ML cs.LG math.ST stat.TH

Kernel Embeddings and the Separation of Measure Phenomenon

Leonardo V. Santoro, Kartik G. Waghmare, Victor M. Panaretos

AI总结本文研究了核嵌入在区分连续概率分布中的能力，证明了核协方差嵌入能够实现信息论意义上的完美分离。研究指出，在局部紧致的不可数波兰空间上，两个非原子概率测度的相等性检验等价于在再生核希尔伯特空间中两个中心高斯测度的奇异性检验。这一现象揭示了核方法在高维或复杂领域中表现出色的核心机制，并为设计高效的推理工具提供了理论依据。

2504.03158 2026-05-14 stat.ML cs.LG

Accelerating Particle-based Energetic Variational Inference

Xuelian Bao, Lulu Kang, Chun Liu, Yiwei Wang

AI总结本文提出了一种基于粒子的变分推断方法，旨在加速已有隐式方案的能变分推断（EVI-Im）。该方法借鉴能量二次化和算子分裂技术，通过高效引导粒子向目标分布移动，并保留稳定性机制。与EVI-Im不同，新方法避免了每步中重复计算粒子间相互作用项，显著降低了计算成本，同时框架也可扩展至其他基于梯度的采样技术。实验表明，该方法在效率和鲁棒性方面具有优势，性能与现有粒子变分推断方法相当。

2502.02270 2026-05-14 cs.LG math.OC stat.ML

Exact Sequence Interpolation with Transformers

Albert Alcalde, Giovanni Fantuzzi, Enrique Zuazua

AI总结本文研究了变压器模型在有限输入序列插值问题中的能力，证明了其可以在实数空间中精确插值任意长度的输入序列及其对应输出序列。通过交替使用前馈层和自注意力层，并结合自注意力机制中的聚类效应，作者构建了一个参数数量与输入序列长度无关的变压器模型，实现了精确插值。此外，该方法还引入了低秩参数矩阵，提升了模型的实用性，并将结果从硬最大自注意力扩展到软最大自注意力，同时提供了正则化训练下的收敛性保证，为理解变压器模型的理论性能提供了新视角。

详情

DOI: 10.1007/s44439-026-00005-y
Comments: 36 pages, 9 figures. Funded by the European Union (Horizon Europe MSCA project ModConFlex, grant number 101073558)

英文摘要

We prove that transformers can exactly interpolate datasets of finite input sequences in $\mathbb{R}^d$, $d\geq 2$, with corresponding output sequences of smaller or equal length. Specifically, given $N$ sequences of arbitrary but finite lengths in $\mathbb{R}^d$ and output sequences of lengths $m^1, \dots, m^N \in \mathbb{N}$, we construct a transformer with $\mathcal{O}(\sum_{j=1}^N m^j)$ blocks and $\smash{\mathcal{O}(d \sum_{j=1}^N m^j)}$ parameters that exactly interpolates the dataset. Our construction provides complexity estimates that are independent of the input sequence length, by alternating feed-forward and self-attention layers and by capitalizing on the clustering effect inherent to the latter. Our novel constructive method also uses low-rank parameter matrices in the self-attention mechanism, a common feature of practical transformer implementations. These results are first established in the hardmax self-attention setting, where the geometric structure permits an explicit and quantitative analysis, and are then extended to the softmax setting. Finally, we demonstrate the applicability of our exact interpolation construction to learning problems, in particular by providing convergence guarantees to a global minimizer under regularized training strategies. Our analysis contributes to the theoretical understanding of transformer models, offering an explanation for their excellent performance in exact sequence-to-sequence interpolation tasks.

URL PDF HTML ☆

赞 0 踩 0

2501.01541 2026-05-14 stat.ME

Denoising Diffused Embeddings: a Generative Approach for Hypergraphs

Shihao Wu, Junyi Yang, Gongjun Xu, Ji Zhu

AI总结该论文研究了如何从高维超图数据中生成新的超边，这一任务在电子健康记录分析和生物研究等领域具有重要应用。为了解决超边离散性、模型可解释性差以及超图结构复杂等挑战，作者提出了去噪扩散嵌入（DDE）方法，通过条件超边似然模型将离散超边映射到连续潜在嵌入空间，并利用基于分数的扩散模型进行重构。理论分析表明，DDE在真实潜在嵌入可得时能将高维超边生成简化为低维嵌入生成，实验验证了其在计算效率和生成性能上的优越性。

详情

英文摘要

Hypergraph data, which capture multi-way interactions among entities, are increasingly prevalent in the big data era. Generating new hyperlinks from an observed, usually high-dimensional hypergraph is an important yet challenging task with diverse applications in areas such as electronic health record analysis and biological research. This task is fraught with several challenges. The discrete nature of hyperlinks renders many existing generative models inapplicable. Additionally, powerful machine learning-based generative models often operate as black boxes, providing limited interpretability. Key structural characteristics of hypergraphs, including node degree heterogeneity and hyperlink sparsity, further complicate the modeling process and must be carefully addressed. To tackle these challenges, we propose Denoising Diffused Embeddings (DDE), a general and efficient generative modeling architecture for hypergraphs. DDE exploits low-rank structure in high-dimensional hypergraphs via a conditional hyperlink likelihood model that links discrete hyperlinks to a continuous latent embedding space and leverages a score-based diffusion model to reconstruct that space. Theoretically, we show that when true latent embeddings are accessible, DDE exactly reduces the task of generating new high-dimensional hyperlinks to generating new low-dimensional embeddings. Moreover, we analyze the implications of using estimated embeddings in DDE, revealing how hypergraph characteristics such as dimensionality, node degree heterogeneity, and hyperlink sparsity impact its generative performance. Simulation studies demonstrate the superiority of DDE over existing methods, in terms of both computational efficiency and generative performance. Furthermore, an application to a symptom co-occurrence hypergraph derived from electronic medical records uncovers interesting findings and highlights the advantages of DDE.

URL PDF HTML ☆

赞 0 踩 0

2411.04229 2026-05-14 stat.ME

Detecting State Changes in Functional Neuronal Connectivity using Factorial Switching Linear Dynamical Systems

Yiwei Gong, Susanna B. Mierau, Sinead A. Williamson

AI总结本文研究如何从神经元活动的时间记录中识别动态变化的功能连接性，并提出了一种基于因子隐马尔可夫模型的切换线性动态系统，以捕捉多个潜在子网络可能同时或独立激活的特性。该方法能够更准确地反映神经网络中局部变化不影响整体连接模式的特点，并结合可扩展的变分推断算法，有效推断潜在状态和模型参数，成功揭示了体外神经元培养中神经活动成熟过程的结构特征。

2410.16477 2026-05-14 stat.ME stat.ML

Finite-Sample and Distribution-Free Fair Classification: Optimal Trade-off Between Excess Risk and Fairness, and the Cost of Group-Blindness

Xiaotian Hou, Linjun Zhang

AI总结本文研究了在有限样本和分布无关条件下实现算法公平分类的最优风险与公平性权衡问题，提出了一个适用于有偏见和无偏见场景的统一框架，能够在控制额外风险的同时提供公平性保证。该方法基于一种适用于任意黑箱模型的后处理过程，具有良好的实用性。理论分析表明该算法在最小最大意义下接近最优，并通过大量实验验证了其有效性。

2407.11518 2026-05-14 stat.ML cs.LG stat.OT

Ensemble Transport Filter via Optimized Maximum Mean Discrepancy

Dengfei Zeng, Lijian Jiang

AI总结本文提出了一种基于最优最大均值差异（MMD）的集合传输滤波方法，通过构建传输映射直接将先验粒子转移到后验粒子，从而改进粒子滤波中的分析步骤。该方法利用MMD损失函数优化传输映射，以匹配近似后验与参考后验的期望信息，并引入方差惩罚项以增强鲁棒性，有效提升了高维数据同化问题中的后验分布估计精度。数值实验表明，该方法在性能上优于传统的集合卡尔曼滤波。

2407.01602 2026-05-14 cs.CL cs.LG math.DS stat.ML

Clustering in pure-attention hardmax transformers and its role in sentiment analysis

Albert Alcalde, Giovanni Fantuzzi, Enrique Zuazua

AI总结本文研究了纯注意力机制中使用硬max自注意力和归一化子层的Transformer模型在层数趋于无穷时的行为，揭示了其输入会收敛到由特定“领导者”点决定的聚类平衡状态。通过将Transformer视为欧几里得空间中的离散时间动力系统，并结合超平面分离的几何解释，作者提出了一个可解释的Transformer模型，用于情感分析任务，能够通过围绕有意义“领导者”词聚类无意义词来有效捕捉上下文信息。该研究为理解Transformer的数学特性提供了理论基础，并指出了理论分析与实际应用之间的挑战。

2406.13619 2026-05-14 stat.ML cs.LG

Generative Modeling by Minimizing the Wasserstein-2 Loss

Yu-Jui Huang, Zachariah Malik

AI总结本文提出了一种通过最小化二阶Wasserstein损失（$W_2$损失）的生成模型，利用与真实数据分布及当前估计相关的Kantorovich势构建分布依赖的常微分方程（ODE）。研究证明该ODE的时间边缘分布形成$W_2$损失的梯度流，并以指数速率收敛于真实数据分布。基于该ODE设计了欧拉数值方案，并通过持续训练策略构建算法，在低维和高维实验中均优于传统Wasserstein生成对抗网络。

2404.17772 2026-05-14 stat.ME stat.CO

PWEXP: An R Package Using Piecewise Exponential Model for Study Design and Event/Timeline Prediction

Tianchen Xu, Rachael Wen, Wen Zhang

AI总结本文介绍了一个名为PWEXP的R语言软件包，用于基于分段指数模型（PWE）进行临床试验设计及事件/时间线预测。该方法通过将风险函数划分为多个具有恒定风险的区间，兼顾了模型的灵活性和计算的便捷性，能够更准确地预测事件数量和分析时间，从而提升研究设计的可靠性。PWEXP包通过AIC、BIC和交叉验证等标准选择最佳分段点，提供稳健的生存曲线拟合与可视化功能，有助于提高样本量计算和研究时间规划的准确性。

2312.04110 2026-05-14 stat.ML cs.LG physics.soc-ph

Small Area Estimation of Case Growths for Timely COVID-19 Outbreak Detection

Zhaowei She, Zilong Wang, Jagpreet Chhatwal, Turgay Ayer

AI总结本文提出了一种基于迁移学习的随机森林框架（TLRF），用于在小样本区域中准确估计新冠疫情病例增长率，从而实现对疫情爆发的及时检测。该方法通过将增长率估计问题转化为回归任务，并利用随机森林的自适应加权机制实现跨时空的迁移学习，有效平衡了估计精度与计算速度之间的矛盾。实验表明，TLRF在预测性能上优于现有方法，并在科罗拉多州的案例研究中将疫情爆发的检测效率提升了224%。

详情

Comments: Equal contributions by co-first authors Zhaowei She, Zilong Wang (in alphabetical order)

英文摘要

The COVID-19 pandemic has exerted a profound impact on the global economy and continues to exact a significant toll on human lives. The COVID-19 case growth rate stands as a key epidemiological parameter to estimate and monitor for effective detection and containment of the resurgence of outbreaks. A fundamental challenge in growth rate estimation and hence outbreak detection is balancing the accuracy-speed tradeoff, where accuracy typically degrades with shorter fitting windows. In this paper, we provide a transfer learning framework, which we call Transfer Learning Random Forest (TLRF), for an effective implementation of the random forests algorithm that balances this accuracy-speed tradeoff. Specifically, we develop an identification strategy that converts the growth rate estimation problem into a regression task, which enables effective transfer learning across space and time through random forests' adaptive weighting mechanism. As such, through adaptively choosing fitting window sizes based on relevant day-level and county-level features affecting the disease spread, TLRF can accurately estimate case growth rates for counties with small sample sizes. Out-of-sample prediction analysis shows that TLRF outperforms established growth rate estimation methods. Furthermore, we conducted a case study based on outbreak case data from the state of Colorado and showed that TLRF could improve timely detections of outbreaks up to 224% when compared to the decisions made by Colorado's Department of Health and Environment (CDPHE). To demonstrate practical implementation, we developed a publicly available outbreak detection tool that operated from September 2020 through March 2023, receiving substantial attention from policymakers across all 50 states.

URL PDF HTML ☆

赞 0 踩 0

2208.12930 2026-05-14 stat.CO math.ST stat.TH

Joint distribution properties of Fully Conditional Specification under the normal linear model with normal inverse-gamma priors

Mingyang Cai, Stef van Buuren, Gerko Vink

AI总结本文研究了在正态线性模型中使用正态逆伽玛先验时，全条件规范（FCS）方法的联合分布性质。通过理论分析和模拟实验，证明了FCS在该先验下能够收敛，并展示了联合模型与条件模型在先验设定上的等价性。该研究扩展了FCS在有信息先验下的收敛性分析，为缺失数据的多重插补提供了更坚实的理论支持。

2208.12929 2026-05-14 stat.CO

Graphical and numerical diagnostic tools to assess multiple imputation models by posterior predictive checking

Mingyang Cai, Stef van Buuren, Gerko Vink

AI总结该论文提出了一种基于后验预测检验的诊断方法，用于评估多重插补模型的合理性。通过比较观测数据与根据后验预测分布生成的重复数据，判断插补模型是否与实际分析模型一致。研究通过模拟和实际应用验证了该方法在参数和半参数插补方法、连续和离散缺失变量以及单变量和多变量缺失模式中的有效性。

1906.00573 2026-05-14 q-fin.ST q-fin.PM stat.AP

Conditional inference on the asset with maximum Sharpe ratio

Steven E. Pav

AI总结本文研究了在一组可能存在相关性的资产中，对具有最大样本夏普比率的资产的信噪比进行条件推断的问题。作者应用了Lee等人提出的方法，并提出了一个用于该条件估计过程的多元夏普比率近似标准误。研究还比较了多种替代方法，如Bonferroni校正、卡方检验、Follman检验等，结果表明所提出的条件推断方法在保持名义I型错误率方面表现良好，且不受收益非正态性的影响，具有较好的统计性能。

2605.12577 2026-05-14 stat.AP

Circula-based multivariate distributions on the flat torus, with applications in structural biology

Guillaume Carrière, Alix Lhéritier, Frédéric Cazals

AI总结本文研究了如何在不依赖边缘分布的情况下，建模定义在$d$维平坦环面$\mathbb{T}^d$上的随机变量之间的依赖关系，并将其应用于结构生物学中。作者提出了一种基于低秩协方差结构的循环分布模型，首次在平坦环面上构造了具有协方差结构的闭式归一化分布，并进一步构建了蛋白质中相邻氨基酸的主链和侧链二面角的联合分布模型。实验表明，该模型在似然性和稀疏性方面优于现有方法，有望推动结构生物学从离散结构分析向热力学和动力学研究发展。

2605.12568 2026-05-14 math.ST math.PR stat.ML stat.TH

Non-asymptotic quantisation of spherically symmetric distributions

Luc Pronzato, Anatoly Zhigljavsky

AI总结本文研究了球对称分布的非渐近量化问题，针对高维空间中传统最优量化方法需要极大样本量的缺陷，提出了一种在中等样本规模下性能优异的随机量化方法。通过分析球面上均匀分布的量化点，作者给出了期望失真度的精确表达式，并展示了如何高效确定最优球半径。研究还结合极值理论，推导了在样本量随维数变化时半径的近似表达式，为高维量化提供了新的理论支持和实用方法。

2605.12532 2026-05-14 q-fin.TR cs.AI stat.ME

AgenticAITA: A Proof-Of-Concept About Deliberative Multi-Agent Reasoning for Autonomous Trading Systems

Ivan Letteri

AI总结传统算法交易系统依赖确定性启发式方法或离线训练的统计模型，难以适应快速变化的市场环境。本文提出AGENTICAITA，一种基于多智能体的自主交易框架，通过多个大型语言模型代理的协同推理、协商与执行，实现无需离线训练和人工干预的自主交易决策。该框架引入了自适应Z分触发引擎、顺序推理管道、推理门控协议和相关性破除多样化评分等四个核心架构创新，经过五天的实盘模拟验证，展示了其在资产交易中的可行性和有效性。

详情

英文摘要

Conventional algorithmic trading systems are grounded in deterministic heuristics or offline-trained statistical models that cannot adapt to the semantic complexity of rapidly shifting market regimes. This paper introduces AGENTICAITA, an agentic AI framework that replaces the traditional signal then execute paradigm with a fully autonomous deliberative loop in which multiple specialized Large Language Model agents reason, negotiate, and act in concert - without any offline training or human intervention. The framework proposes four architectural contributions: (i) an Adaptive Z-Score Trigger Engine that acts as a cognitive resource allocator, gating LLM inference exclusively on statistically anomalous market conditions; (ii) a Sequential Deliberative Pipeline - the core agentic contribution - in which an Analyst agent, a Risk Manager agent, and an Executor agent form a structured reasoning chain governed by typed JSON contracts and a deterministic hard-gate safety layer; (iii) an Inference Gating Protocol, a mutex-based cognitive resource scheduler that serializes concurrent agent activations and ensures fully reproducible audit trails; and (iv) a Correlation-Break Diversification composite score that operationalizes portfolio-level idiosyncratic signal prioritization within individual agent reasoning. Validated over a five-day autonomous dry-run session under live market conditions, the framework demonstrates operational correctness of the deliberative pipeline, achieving 157 zero-intervention invocations across 76 assets with an 11.5% agentic friction rate that confirms non-trivial inter-agent negotiation. This preliminary proof-of-concept establishes the feasibility of training-free, deterministic safety-constrained multi-agent orchestration in financial decision loops, with statistically robust performance evaluation and execution cost modeling deferred to extended live deployment.

URL PDF HTML ☆

赞 0 踩 0

2605.12514 2026-05-14 cs.SI cs.CV cs.CY cs.DL stat.AP

Structural Diversity Drives Disruptive Scientific Innovation

Yichun Peng, Saike He, Peijie Zhang, Kang Zhao, Yi Yang, Ning Zhang, Qingpeng Zhang, Daniel Dajun Zeng, Hao Peng

AI总结科学创新越来越依赖于合作，但能促进突破性想法的组织结构仍不明确。本文提出“结构多样性”（Structural Diversity，SD）这一新指标，用于衡量团队在其先前合作网络中连接多个不同知识社区的程度，并证明其是预测颠覆性创新的强大而稳健的指标，优于传统指标如团队新颖性和边密度。研究还发现，结构多样性能够与团队规模产生正向交互作用，缓解“规模诅咒”问题，并通过跨学科整合机制提升创新效能，为科学合作的组织设计提供了新的理论框架和实践指导。

2509.20206 2026-05-14 stat.ME

Non-overlap Average Treatment Effect Bounds

Herbert P. Susmann, Alec McClean, Iván Díaz

AI总结本文研究了在缺乏重叠条件（overlap）时平均处理效应（ATE）的识别问题。传统方法要求所有个体具有非零的治疗概率，但当这一条件不满足时，通常需转向子群体估计。本文提出了一种无需重叠条件的ATE非重叠置信区间方法，其宽度与非重叠子群体规模成正比，并在常见场景下具有实际意义。作者还提出了一种基于半参数效率理论的估计方法，能够提供渐近有效且一致的区间估计，并通过模拟和实际数据验证了方法的有效性。