arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2605.15168 2026-05-15 cs.CL cs.AI cs.LG stat.ML

Text Knows What, Tables Know When: Clinical Timeline Reconstruction via Retrieval-Augmented Multimodal Alignment

Sayantan Kumar, Shahriar Noroozizadeh, Juyong Kim, Jeremy C. Weiss

AI总结本研究旨在解决临床文本与结构化电子健康记录（EHR）在时间信息上的互补性问题，提出了一种基于检索增强的多模态对齐框架，用于重建更精确的临床时间线。该方法通过从文本中提取关键事件构建时间框架，并结合结构化数据中的时间信息进行校准，从而提升时间戳的准确性。实验表明，该方法在多个模型上均显著提升了时间一致性，同时保留了事件匹配率，展示了多模态对齐在临床轨迹重建中的优势。

详情

Comments: Sayantan Kumar, Shahriar Noroozizadeh, Juyong Kim (authors contributed equally)

英文摘要

Reconstructing precise clinical timelines is essential for modeling patient trajectories and forecasting risk in complex, heterogeneous conditions like sepsis. While unstructured clinical narratives offer semantically rich and contextually complete descriptions of a patient's course, they often lack temporal precision and contain ambiguous event timing. Conversely, structured electronic health record (EHR) data provides precise temporal anchors but misses a substantial portion of clinically meaningful events. We introduce a retrieval-augmented multimodal alignment framework that bridges this gap to improve the temporal precision of absolute clinical timelines extracted from text. Our approach formulates timeline reconstruction as a graph-based multistep process: it first extracts central anchor events from narratives to build an initial temporal scaffold, places non-central events relative to this backbone, and then calibrates the timeline using retrieved structured EHR rows as external temporal evidence. Evaluated using instruction-tuned large language models on the i2m4 benchmark spanning MIMIC-III and MIMIC-IV, our multimodal pipeline consistently improves absolute timestamp accuracy (AULTC) and improves temporal concordance across nearly all evaluated models over unimodal text-only reconstruction, without compromising event match rates. Furthermore, our empirical gap analysis reveals that 34.8% of text-derived events are entirely absent from tabular records, demonstrating that aligning these modalities can produce a more temporally faithful and clinically informative reconstruction of patient trajectories than either source alone.

URL PDF HTML ☆

赞 0 踩 0

2605.15154 2026-05-15 stat.ML cs.LG

RoSHAP: A Distributional Framework and Robust Metric for Stable Feature Attribution

Lanxin Xiang, Liang Shi, Youhui Ye, Boyu Jiang, Dawei Zhou, Feng Guo

AI总结本文提出了一种名为RoSHAP的分布框架和鲁棒度量方法，用于实现更稳定的特征归因分析。该方法基于SHAP值，通过引导重采样和核密度估计建模特征归因分数的分布，并在温和正则条件下证明其聚合值渐近服从高斯分布，从而降低了分布估计的计算成本。RoSHAP不仅提升了特征排名的稳定性，还在模拟和实际数据实验中表现出优于传统单次归因方法的性能，同时使用更少的特征即可达到与全特征模型相当的预测效果。

2605.15142 2026-05-15 stat.ME

Creating treatment and component hierarchies in component network meta-analysis

Augustine Wigle, Audrey Béliveau, Adriani Nikolakopoulou, Lifeng Lin

AI总结该论文研究了组件网络meta分析（CNMA）中如何构建治疗和组件的层次结构，以评估多组分治疗（如抗抑郁药物组合）与单个组分（如单一抗抑郁药物）之间的相对效果。由于CNMA中可唯一估计的相对效应较为复杂，传统网络meta分析（NMA）的层次结构方法无法直接应用。本文提出了一种适用于频率学派和贝叶斯学派CNMA的分步工作流程，明确识别可唯一估计的相对效应，并通过两个实际案例展示了该方法的应用。

2605.15115 2026-05-15 econ.EM stat.ME

A Practical Guide to Instrumental Variables Methods with Heterogeneous Treatment Effects

Tymon Słoczyński, Liyang Sun, S. Derya Uysal

AI总结本文提供了一本关于工具变量（IV）方法的实用指南，重点探讨了在存在异质处理效应的情况下如何正确应用IV方法。作者分析了不同协变量设定对局部平均处理效应（LATE）加权平均的影响，并指出参数设定错误可能破坏因果推断的可靠性，因此建议采用灵活的模型作为稳健性检验。此外，文章还回顾了LATE假设的正式检验方法，并介绍了对单调性假设不成立具有一定鲁棒性的方法，同时提供了相关软件实现的指导。

2605.15085 2026-05-15 stat.ML cs.LG stat.AP stat.ME

From Data to Action: Accelerating Refinery Optimization with AI

Dániel Pfeifer, Ábrahám Papp, Tibor Bernáth, Tamás Zoltán Varga, Márk Czifra, Botond Szilágyi, Edith Alice Kovács

AI总结本文研究了如何利用人工智能加速炼油厂优化过程，针对线性规划（LP）方法在实际应用中面临的解释与应用难题，提出结合机器学习的方法以提升决策支持。核心方法包括改进的异常检测工具和高维数据处理策略，有效识别了炼油厂调度与规划中的业务机会与数据供应错误，为优化结果的可信度提供了新的洞察。

2605.15082 2026-05-15 stat.ML cs.LG math.ST stat.TH

Average Gradient Outer Product in kernel regression provably recovers the central subspace for multi-index models

Libin Zhu, Damek Davis, Dmitriy Drusvyatskiy, Maryam Fazel

AI总结本文研究了在样本数量少于精确预测所需的情况下，如何通过学习预测器发现数据中的低维结构。具体来说，考虑从有限数据对中恢复多指标多项式模型 $f^*(x)=h(Ux)$ 的问题，其中输入仅通过未知的 $r$ 维中心子空间的投影来影响输出。作者提出了一种简单方法：拟合核岭回归（KRR）并计算拟合预测器的平均梯度外积（AGOP），证明其前 $r$ 个特征向量可准确恢复该子空间，即使预测误差仍较大时也成立。研究还表明，当目标函数的低阶部分包含所有预测相关方向时，子空间恢复所需的样本量远低于精确预测所需的样本量，揭示了预测与表示之间的差异。

2605.14976 2026-05-15 stat.ME econ.EM q-fin.ST

Multi-regime Markov-switching models with time-varying transition probabilities: An application to U.S. Treasury yields

Samuel Modée, Yushu Li, Sjur Westgaard, Stein Andreas Bethuelsen

AI总结本文研究了具有时间变化转移概率的多制度马尔可夫切换模型，并将其应用于美国国债收益率分析。作者将广义自回归得分（GAS）模型中两制度共同方差设定扩展到具有制度特异均值和方差的多制度一般情形，并开发了开源R包用于数据模拟与参数估计。研究表明，制度均值、方差和转移概率可可靠估计，但转移概率驱动系数较难识别，同时GAS得分系数在联合似然函数中存在非识别问题。实证分析显示，基于收益率水平的外生设定在拟合效果上优于常数和滞后变化模型，而GAS设定则因收敛问题表现不佳。

2512.16768 2026-05-15 stat.ML cs.LG math.PR

On The Hidden Biases of Flow Matching Samplers

Soon Hoe Lim

AI总结本文研究了流匹配（Flow Matching）采样器在有限样本情况下的隐藏偏差问题。通过将总体期望替换为样本平均，并用有限样本替代目标分布，作者提出了一种经验流匹配模型的层次结构。针对仿射条件流，文中推导了精确的经验最小化解，并识别出一种平滑插值机制，使得终端分布恰好为核混合估计量。研究揭示了经验流匹配中的多重偏差来源，包括目标分布替换带来的统计目标变化、经验最小化解可能不是梯度场，以及边际路径无法唯一确定粒子动力学等问题。

2502.14407 2026-05-15 math.ST cs.CC cs.DS math.PR stat.TH

Sharp Phase Transitions in Estimation with Low-Degree Polynomials

Youngtak Sohn, Alexander S. Wein

AI总结该论文研究了在高维隐藏结构估计问题中，低度多项式算法的计算限制，揭示了统计可行性与计算可行性之间的显著差距。作者提出了一种新的方法，用于证明低度多项式算法在多种模型（如隐藏子矩阵、密集子图、尖峰维吉纳模型和随机块模型）中的下界，从而获得了关于估计任务的精确相变结果。研究不仅解决了多个开放问题，还为相关猜想提供了严格的理论支持。

2412.14291 2026-05-15 math.OC cs.LG stat.ML

Projected gradient methods for nonconvex and stochastic smooth optimization: new complexities and auto-conditioned stepsizes

Guanghui Lan, Tianjiao Li, Yangyang Xu

AI总结本文提出了一类新的投影梯度（PG）方法，用于在凸紧集上最小化光滑但不一定凸的目标函数。研究引入了“自适应条件化”投影梯度（AC-PG）方法，在无需输入梯度的Lipschitz常数或进行线搜索的情况下，达到了与现有最佳方法相当的迭代复杂度。此外，文章将PG方法推广到随机优化场景，提出了随机投影梯度（SPG）和方差缩减随机梯度（VR-SPG）方法，并在不同Oracle设置下获得了新的复杂度界，同时为这些方法设计了自适应步长策略，保证了收敛性。

2406.06980 2026-05-15 stat.ME

Sensitivity Analysis for the Test-Negative Design

Soumyabrata Kundu, Peng Ding, Jingshu Wang, Xinran Li

AI总结本文研究了测试阴性设计（test-negative design）在评估疫苗有效性中的应用，并针对该设计中可能存在的未测量混杂因素进行了敏感性分析。作者提出了两种方法来评估疫苗接种对具有良好医疗寻求行为人群的因果优势比影响，并探讨了该设计在控制未测量混杂方面的局限性。通过结合不同方法，本文进一步收紧了因果优势比的置信区间，并将方法应用于新冠疫苗有效性的观察性数据分析中。

2605.14967 2026-05-15 cs.LG stat.ML

InfoSFT: Learn More and Forget Less with Information-Aware Token Weighting

Mahdi Sabbaghi, George Pappas, Adel Javanmard, Hamed Hassani

AI总结本文提出了一种名为 InfoSFT 的监督微调方法，通过关注信息量大且置信度适中的 token 来提升大语言模型的学习效果，避免过度拟合低概率样本或抑制已有能力。该方法仅需对标准损失函数进行一行修改，能够在数学、代码和思维链等任务中显著提升模型泛化能力，同时更好地保留模型原有的性能。

2605.14952 2026-05-15 stat.ME stat.AP

Generalizing conditional average treatment effects from nested randomized trials to all trial-eligible individuals

Lan Wen, Issa J. Dahabreh, Yu-Han Chiu

AI总结本文研究了如何从嵌套随机试验中推广条件平均处理效应（CATE），以适用于所有符合试验资格的个体。作者提出了一种结合半参数理论与灵活估计方法的策略，通过数据自适应方法估计干扰函数，构造条件影响函数伪结果，并利用局部线性（核）回归估计CATE函数。该方法采用样本分割和交叉拟合技术以降低过拟合偏差，确保渐近有效性，并通过模拟和冠状动脉外科手术研究（CASS）实例验证了其有限样本性能。

2605.14936 2026-05-15 stat.ME

Relaxation of Projected Prior with Continuous Gap Shrinkage

Leo L Duan, Sunghyun Cho, Mingzhang Yin

AI总结本文提出了一种投影先验的连续松弛方法，旨在解决传统投影先验在后验计算中可能带来的高计算成本问题。核心思想是通过量化原问题与对偶目标之间的对偶间隙，并引入一种概率先验以促使该间隙趋于零，从而在无需迭代优化子程序的情况下实现近似投影。该方法具有形式简洁、计算高效的特点，并在后验收缩性能和广泛应用性方面表现出色，已在营销数据分析中得到验证。

2605.14917 2026-05-15 cs.LG cs.CE cs.IT math.IT stat.ML

A Mutual Information Lower Bound for Multimodal Regression Active Learning

Leonardo Ferreira Guilhoto, Akshat Kaushal, Paris Perdikaris

AI总结该论文针对多模态回归中的主动学习问题，提出了一种新的获取函数MI-LB，用于更准确地捕捉模型的不确定性。研究引入了双索引框架，区分认识论不确定性和偶然性不确定性，并基于信息论推导出一个互信息下界作为获取目标。实验表明，该方法在多模态系统基准上表现优异，优于现有各类基线方法。

2605.14840 2026-05-15 cs.LG math.OC stat.ML

In-Context Learning for Data-Driven Censored Inventory Control

Sohom Mukherjee, Anh-Duy Pham, Richard Pibernik, Yunbei Xu

AI总结本文研究了在数据驱动环境下具有决策依赖性截断的库存控制问题，提出了一种基于上下文生成后验采样的新方法（ICGPS），结合了生成模型的离线元训练与在线自回归生成，以应对订单量影响需求观测完整性的挑战。该方法理论上保证了其贝叶斯遗憾与理想完成核下的TS基准相比仅增加一个与时间平方根成正比的惩罚项，并在实际应用中通过ChronosFlow实现，表现出对先验偏差和分布偏移的鲁棒性，实验显示其在模拟和真实数据集上均优于传统方法。

详情

英文摘要

We study inventory control with decision-dependent censoring, focusing on the censored or repeated newsvendor (R-NV), where each order quantity determines whether demand is fully observed or censored by sales. Existing approaches based on parametric Thompson sampling (TS) can be brittle under prior mismatch, while offline imputation methods need not transfer to online learning. Motivated by the predictive view of decision making, we combine these ideas by taking oracle actions on learned completions of latent demand. We propose in-context generative posterior sampling (ICGPS), which uses modern generative models that are meta-trained offline and deployed online by in-context autoregressive generation. Theoretically, we show that the Bayesian regret of ICGPS with a learned completion kernel is bounded by the Bayesian regret of a TS benchmark with the ideal completion kernel plus a deployment penalty scaling as $\sqrt{T}$ times the square root of the completion mismatch. This yields a plug-in template for operational problems with known TS regret bounds. For R-NV, we derive sublinear Bayesian regret by reducing censored feedback to bandit convex optimization feedback. We also show that, under reasonable coverage and stability assumptions, the online completion mismatch is controlled by the offline censored predictive mismatch, so offline predictive quality transfers to online performance. Practically, we instantiate ICGPS with ChronosFlow, which combines a frozen time-series transformer backbone with a trainable conditional normalizing-flow head for fast censoring-consistent sampling. In benchmark experiments, ChronosFlow-ICGPS matches correctly specified TS, outperforms myopic and UCB-style baselines, and is robust to prior mismatch and distribution shift. ChronosFlow-ICGPS also performs well for the real-world SuperStore dataset, especially under heavy censoring.

URL PDF HTML ☆

赞 0 踩 0

2605.14828 2026-05-15 stat.ML cs.LG stat.ME

K-Models: a Flexible and Interpretable Method for Ordinal Clustering with Application to Antigen-Antibody Interaction Profiles

Giulia Patanè, Alessandra Menafoglio, Alexander Krauth, Peter Fechner, Luca Dede', Bianca Maria Colosimo, Federica Nicolussi

AI总结该研究提出了一种名为K-Models的新型聚类方法，用于处理具有序数关系的函数型数据，旨在在保证聚类性能的同时提升模型的可解释性。该方法通过引入序数约束，估计生成观测函数型数据的随机过程中的关键要素，从而更准确地识别数据的内在结构。研究通过仿真和实际应用（如抗原-抗体相互作用的反射传感器数据）验证了该方法的有效性，展示了其在具有潜在序数结构的数据分析中的优越性和实用性。

2605.14796 2026-05-15 stat.ME

A Class of Higher-Order INAR Random Fields for Poisson Counts and Beyond

Christian H. Weiß, Angelika Silbernagel

AI总结本文提出了一类新型的高阶整数值自回归（CINAR）随机场模型，用于处理计数型数据，解决了现有模型在刻画平稳边缘分布和计算条件概率方面的困难。该模型结合了经典的自回归依赖结构，并允许边缘分布属于广义离散自分解分布类，包括泊松分布和负二项分布等。文章推导了CINAR模型的关键统计性质，探讨了其特殊情形与扩展，并通过农业数据应用验证了其实际有效性。

2605.14762 2026-05-15 stat.ME math.ST stat.TH

Differentially private inference framework of Riemannian manifold data

Yangdi Jiang, Xiaotian Chang, Qirui Hu

AI总结本文提出了一种针对非欧几里得数据的系统性差分隐私推断框架。研究设计了适用于黎曼流形数据的弗雷歇均值和方差的两种差分隐私机制，并根据流形的几何结构进行隐私预算的分析校准。进一步建立了所提估计量的一致性和中心极限定理，支持在隐私保护下的统计推断，并提供了完整的实现指南和可行方法。实验表明该方法在医学图像和社会学数据集上具有良好的效果。

2605.14663 2026-05-15 math.OC math.PR stat.ML

Optimal Asymptotic Rates for (Stochastic) Gradient Descent under the Local PL-Condition: A Geometric Approach

Sebastian Kassing, Thomas Kruse

AI总结本文研究了梯度下降和随机梯度下降在满足Polyak-Lojasiewicz (PL)条件的$C^2$函数下的局部收敛行为，特别考虑了由过参数化神经网络引发的乘法梯度噪声模型。通过几何视角解释PL条件，作者证明了一个简洁而令人惊讶的结论：即使在非凸设置下，(S)GD的渐近收敛速度仍与强凸二次函数的收敛速度一致。这一结果揭示了SGD在非凸优化中具有与凸问题相似的最优渐近收敛速率。

2605.14647 2026-05-15 stat.ME stat.AP

Multiscale Topological Inference for Marked Point Processes via Euler Characteristic Envelopes

Matthias Eckardt, Mehdi Moradi

AI总结本文提出了一种基于欧拉特征包络的多尺度拓扑推断框架，用于分析标记点过程中的复杂空间结构与属性依赖关系。通过引入标记加权的距离度量和非参数全局包络检验，该方法能够有效捕捉高阶拓扑结构和属性与空间之间的非线性相互作用，并实现对随机标记假设的正式检验。此外，该方法还通过Z分数分解局部拓扑信号，识别结构中心和拓扑障碍，具有高度的灵敏性和鲁棒性，为标记空间数据的结构依赖分析提供了全面且可解释的工具。

2605.14632 2026-05-15 cs.LG stat.AP

DRL-STAF: A Deep Reinforcement Learning Framework for State-Aware Forecasting of Complex Multivariate Hidden Markov Processes

Manrui Jiang, Jingru Huang, Yong Chen, Chen Zhang

AI总结该研究提出了一种基于深度强化学习的DRL-STAF框架，用于复杂多变量隐马尔可夫过程的状态感知预测。该方法结合深度神经网络建模非线性观测，并利用强化学习估计离散隐状态，克服了传统隐马尔可夫模型在非线性发射和扩展性方面的不足，同时减少了对预定义状态转移结构的依赖。实验表明，DRL-STAF在预测性能和隐状态估计方面均优于现有方法。

2605.14599 2026-05-15 cs.LG cs.AI stat.ML

Fast Rates for Inverse Reinforcement Learning

Andreas Schlaginhaufen, Maryam Kamgarpour

AI总结本文研究了有限时间马尔可夫决策过程中的熵正则化最小-最大逆强化学习（Min-Max-IRL）问题，针对线性奖励类问题，建立了新的结构和统计性质。作者证明了在总体层面，最大似然估计与Min-Max-IRL等价，在确定性动力学下在经验层面也等价。通过利用Min-Max-IRL损失的伪自共轭性质，作者展示了轨迹级KL散度和参数误差在Hessian范数下的衰减速度为$\mathcal{O}(n^{-1})$，且结果适用于模型误设情况，无需探索假设。此外，还扩展了奖励可识别性的结果到一般的Borel空间，并推导了软最优价值函数关于奖励参数的导数新性质。

2605.14575 2026-05-15 econ.GN q-fin.EC stat.ME

The Asset Price Channel of Monetary Policy: Evidence from Regional Stock-Market Developments in the Successor States of Former Yugoslavia

Stefan Tanevski

AI总结本研究旨在实证分析前南斯拉夫六个共和国地区是否存在货币政策的部门资产价格传导渠道。通过构建区域部门股票指数，并运用面板向量自回归模型和混合均值组估计方法，研究发现金融和电信部门存在明显的资产价格传导效应，这可能归因于跨国企业网络促进了子市场区域化。相比之下，制造业和电力部门则未表现出类似效应，表明当地股票市场仍较为分散，亟需更高效的区域市场整合或加强交易所合作。

2605.14567 2026-05-15 stat.ML cs.LG math.PR math.ST stat.TH

Scaling Laws from Sequential Feature Recovery: A Solvable Hierarchical Model

Arie Wortsman-Zurich, Hugo Tabanelli, Yatin Dandi, Florent Krzakala, Bruno Loureiro

AI总结本文提出了一种简单的机制，解释了多层网络中特征学习如何产生缩放定律。研究对象是一个高维的分层目标函数，该函数虽然整体复杂度很高，但可以通过一组权重呈幂律衰减的潜在组合特征来表示。通过设计一种逐层谱算法，能够逐步恢复这些潜在特征，且在样本量较小时就能检测到强特征，而弱特征则需要更多数据。理论分析表明，该方法在预测误差上实现了明确的幂律衰减，并通过数值实验验证了特征逐步恢复的现象和与非分层方法的性能差异。

2605.14524 2026-05-15 stat.ML cs.LG

Large Dimensional Kernel Ridge Regression: Extending to Product Kernels

Yang Zhou, Yicheng Li, Yuqian Cheng, Qian Lin

AI总结本文研究了高维核岭回归（KRR）中在更广泛核函数下的泛化误差行为，扩展了之前仅针对球面内积核的结果。作者提出了一类新的高维核函数，并推导了其对应的泛化误差收敛速率。研究发现，即使在更一般的核设置下，仍存在最小最大最优性、饱和效应以及收敛速率的周期性平台和样本量相关的多重下降现象，从而拓展了对高维KRR行为的理解。

2605.14491 2026-05-15 stat.ME math.ST stat.TH

Adaptive Long-Run Variance Thresholding for Sparse Covariance Estimation in High-Dimensional Time Series

Wenhao Zhang, Zhaoxing Gao

AI总结本文研究了高维时间序列中稀疏协方差矩阵的估计问题，针对传统适用于独立数据的阈值方法在时间序列中可能失效的问题，提出了一种结合长期方差的自适应阈值方法，以适应时间依赖性。该方法在谱范数下具有一致性，并在稀疏协方差矩阵类中达到最优收敛速率，同时能够准确恢复协方差矩阵的非零元素位置。仿真和实际数据应用表明该方法在估计精度和结构恢复方面优于现有方法。

2605.14463 2026-05-15 stat.ME

KAP-CPD: Kernel Aggregation for Change-Point Detection in Dynamic Networks

Mingxuan Sun, Hao Chen

AI总结本文提出了一种基于核聚合的动态网络变点检测方法KAP-CPD，旨在解决在未知变化模式下选择合适核函数的挑战。该方法通过聚合多个核的信息，提升了对不同变化模式的适应能力，且无需假设网络的具体分布，具有广泛的适用性。为进一步提升计算效率，研究还提出了快速分析检验方法KAPf-CPD，在长序列网络数据上显著减少了计算时间，并通过仿真实验和实际数据验证了方法的有效性。

2605.14453 2026-05-15 stat.ME

Estimating Precision Matrices for High-Dimensional Interval-Valued Data

Zhongfeng Qin, Hao Xu, Wenhao Cui, Wan Tian

AI总结本文研究了如何在高维区间值数据下估计精度矩阵，这类数据中每个观测值以区间形式表示而非单一数值，传统方法难以有效处理。作者提出了一种新的估计框架，假设区间上下界具有相同的条件依赖结构，并构建了区间图lasso优化目标函数进行估计。该方法在计算上高效，并在理论上证明了估计器的稀疏性和一致性，实验表明其在估计精度和可解释性方面优于现有方法。

2605.14444 2026-05-15 stat.ME

Inlier Recovery for Robust Registration via Gram-Matrix Overlap

Ruizi Wu, Yuehaw Khoo, Wanjie Wang

AI总结本文研究了在存在噪声和离群点的情况下，如何通过比较两个数据集的Gram矩阵的Hadamard乘积，实现鲁棒点集配准中的内点恢复问题。提出的方法将内点识别转化为结构化恢复问题，避免了对旋转群的直接优化，并开发了基于主特征向量匹配和行和匹配的两种算法。实验表明，这些方法在内点比例较低甚至趋于零的情况下仍能实现精确恢复，具有较好的鲁棒性和实用性。

2605.14343 2026-05-15 cs.LG math.ST stat.ML stat.TH

Nearest-Neighbor Radii under Dependent Sampling

Yuanyuan Gao, Yilong Hou, Zhexiao Lin

AI总结本文研究了在依赖采样条件下最近邻方法的邻域半径性质，突破了传统独立采样假设。通过分析强混合依赖观测，论文建立了多项式混合条件下的几乎处处收敛结果，并在几何混合条件下给出了精确的非渐近矩界，这些界依赖于局部内在维度而非环境维度，从而适用于高维流形数据。实验验证了理论结果，表明即使在依赖采样下，最近邻几何结构仍具有信息性。

2605.14301 2026-05-15 cs.LG stat.ML

Language-Induced Priors for Domain Adaptation

Qiyuan Chen, Jiayu Zhou, Raed Al Kontar

AI总结在领域适应中，当目标域数据稀缺时，传统统计方法难以区分相关与不相关的源域，导致负迁移。本文提出利用目标域的专家文本描述，构建语言诱导先验（LIP），将其与期望最大化算法结合，以识别相关源域。该方法兼容多种参数模型，能够在目标信号弱时引导源域选择，并随着数据积累逐步优化，理论分析表明其在正确先验下具有接近理想冷启动性能，并保持渐近一致性。实验验证了该框架在估计、预测和决策任务中的有效性。

2605.14297 2026-05-15 cs.LG cs.AI math.OC stat.ML

Policy Optimization in Hybrid Discrete-Continuous Action Spaces via Mixed Gradients

Matias Alvo, Daniel Russo, Yash Kanoria

AI总结本文研究了在混合离散-连续动作空间中的强化学习问题，这类问题常见于机器人控制和优化领域。为了解决传统策略梯度方法在高维空间中梯度质量差的问题，作者提出了混合策略优化（HPO）方法，通过结合路径梯度和得分函数梯度，实现无偏混合梯度估计，从而有效应对离散动作和非光滑动态带来的挑战。实验表明，HPO在库存控制和切换线性二次调节器等任务中显著优于PPO算法，且在连续动作维度增加时优势更加明显。

2605.14280 2026-05-15 cs.LG stat.ML

TILT: Target-induced loss tilting under covariate shift

Kakei Yamamoto, Martin J. Wainwright

AI总结本文提出了一种名为TILT的无监督域适应方法，用于处理协变量偏移问题。该方法通过引入一个新颖的目标函数，将源域预测器分解为两个部分，并在有标签的源域数据上拟合这两个部分，同时在无标签的目标域数据上对辅助部分施加惩罚，最终得到的主预测器用于目标域预测。理论分析表明，该方法在总体层面能够隐式地诱导相对重要性加权，并且具有良好的稳定性与泛化能力。实验结果表明，TILT在多个任务中优于仅使用源域训练、精确重要性加权以及相对密度比等基线方法。

2605.14276 2026-05-15 stat.ML cs.LG

Training-Free Generative Sampling via Moment-Matched Score Smoothing

Zhenyu Yao, Daniel Paulin

AI总结本文提出了一种无需训练的生成采样方法MM-SOLD，通过矩匹配的得分平滑技术，直接从训练数据中估计目标分布的统计特性，并在采样过程中保持这些矩不变。该方法基于过阻尼朗之万动力学，能够在不训练神经网络的情况下实现高质量的样本生成，实验表明其在二维分布和图像生成任务中表现优异，具有计算高效、鲁棒性强的特点。

2605.14275 2026-05-15 math.ST stat.TH

Double/debiased machine learning of quantile treatment effects on long-term outcomes in clinical trials

Ziyang Liu, Niwen Zhou, Peng Wu, Xu Guo

AI总结在临床试验中，长期结果往往难以获取，而短期替代指标较为常见。本文研究如何结合随机试验数据和外部观察数据，估计长期结果的分位数处理效应，提出了一种双重稳健的估计方法，能够在处理变量随机化和可转移性假设下实现有效推断。该方法兼容灵活的机器学习技术，具有良好的有限样本表现，能够揭示不同分位数下的异质性长期治疗效应。

2605.14222 2026-05-15 stat.ME

Robust and Data-Adaptive Integration of Nonconcurrent Data in Platform Trials via Gaussian Processes

Yuhan Qian, Yu Du, Jingning Zhang, Yanyao Yi, Patrick J. Heagerty, Ting Ye

AI总结本文研究了如何在平台试验中稳健且数据自适应地整合非同期数据，以提高试验效率。作者提出了一种基于高斯过程的框架，利用平台试验中的时间平滑特性，有效融合非同期数据，并提供了不确定性量化。该方法不仅具有清晰的频率学解释，还理论证明了其在降低治疗效应后验方差和控制偏差方面的优势，并通过实例和R包展示了其应用。

2605.14200 2026-05-15 cs.LG stat.ML

How to Scale Mixture-of-Experts: From muP to the Maximally Scale-Stable Parameterization

Leena Chennuru Vankadara, Moritz Haas, Luke Hayward, Sebastian Bordt, Alessandro Breccia

AI总结本文研究了混合专家（MoE）架构在大规模扩展时的参数设置问题，分析了网络宽度、专家数量、稀疏度等超参数的合理缩放关系。作者提出了一种基于动态平均场理论（DMFT）的分析框架，推导出满足最大更新（μ）条件的参数化方法（μP），但发现其在扩展性方面存在不足。为此，作者进一步提出了最大尺度稳定性参数化（MSSP），在不同扩展场景下均能实现学习率迁移和性能的单调提升，为MoE架构的扩展提供了完整的理论指导。

2605.14193 2026-05-15 math.ST stat.TH

Equilibrium and Pricing in Consumer Networks with Nonlinear Utilities: An Online Shape-Constrained Learning Approach

Daniele Bracale, George Michailidis

AI总结本文研究了具有非线性效用函数的消费者网络中的均衡与最优垄断定价问题，考虑消费者效用不仅依赖于个人价格，还受其社交网络中同伴消费行为的影响。作者提出了一个统一的理论框架，涵盖多种非线性效用形式，并建立了在一般条件下消费者均衡的存在性与唯一性。为应对未知效用函数的挑战，本文引入了一种无需调参的形状约束学习方法，实现了无悔收敛，为垄断定价提供了理论支持与实用工具。

2605.13154 2026-05-15 quant-ph math.ST stat.TH

Three ways to find comfort with the Bell proof and the results of the Bell experiments

Richard D Gill, Inge S. Helland, Bart Jongejan

AI总结本文探讨了贝尔定理及其实验结果所带来的哲学与物理问题，分析了如何在放弃反事实确定性或设定与隐藏状态之间的共谋假设后重建一致的世界观。三位作者分别提出不同观点：吉尔接受不可约的非定域量子随机性，并认为局域性与实在性的对立是虚假的；海兰德从可访问变量理论重建希尔伯特空间形式，认为观察者在某种意义上必须受限；容格詹提出一种依赖空间维度的几何隐变量模型，解释了CHSH不等式违反程度与空间维度的关系。文章综述了贝尔定理的经典部分、无漏洞实验及近期文献，并对不同立场进行了比较讨论。

2605.10289 2026-05-15 cs.LG stat.ML

Sample-Mean Anchored Thompson Sampling for Offline-to-Online Learning with Distribution Shift

Bochao Li, Yao Fu, Wei Chen, Fang Kong

AI总结本文研究了在分布偏移场景下的离线到在线学习问题，旨在利用离线数据提升在线决策性能。为了解决传统汤普森采样（TS）在处理分布偏移时的估计偏差问题，作者提出了基于样本均值锚定的汤普森采样（Anchor-TS），通过引入中位数锚定规则，有效校正了分布偏移带来的估计偏差，提升了算法的稳定性和性能。理论分析表明该方法能够安全利用离线数据加速在线学习，并通过实验验证了其在多种场景下的优越性。

2605.07060 2026-05-15 physics.geo-ph cs.LG physics.comp-ph stat.ML

Functional-prior-based approaches to Bayesian PDE-constrained inversion using physics-informed neural networks

Ryoichiro Agata, Tomohisa Okazaki

AI总结本文提出了一种基于函数先验的贝叶斯偏微分方程约束反演方法（fpBPINN），旨在将物理意义明确的函数空间先验有效引入基于物理信息神经网络（PINN）的贝叶斯反演中。研究引入了两种互补方法：一种通过学习神经网络权重先验以符合给定函数先验，另一种则在函数空间中直接进行变分推理。实验表明，这两种方法在地震层析成像和达西流渗透率反演中均能准确估计后验分布，突显了引入物理可解释函数先验在提升反演精度中的重要性。

2605.03823 2026-05-15 cs.LG cs.IT math.IT math.ST stat.TH

Realizable Bayes-Consistency for General Metric Losses

Dan Tsir Cohen, Steve Hanneke, Aryeh Kontorovich

AI总结本文研究了在可实现设定下，使用一般度量损失进行学习时的强泛化贝叶斯一致性问题，扩展了传统二分类和回归问题的相关结果。作者给出了假设类满足何种条件时，存在一种分布无关的学习规则，使其风险几乎必然收敛到类内最优风险（即零）。主要贡献在于提出了一种基于组合障碍的精确刻画，引入了无限非递减 $(γ_k)$-Littlestone 树的概念，从而将经典 Littlestone 树结构推广到度量损失场景。

2604.21809 2026-05-15 cs.LG cs.AI q-bio.QM stat.ML

Quotient-Space Diffusion Models

Yixian Xu, Yusong Wang, Shengjie Luo, Kaiyuan Gao, Tianyu He, Di He, Chang Liu

AI总结本文提出了一种名为商空间扩散模型（Quotient-Space Diffusion Models）的生成模型框架，旨在有效处理和利用系统中的对称性。该方法通过在去除对称冗余的商空间上进行生成过程，使模型能够在保持目标对称分布的前提下，更灵活地学习生成过程。该框架在分子结构生成任务中进行了实例化，相比等变扩散模型和基于对齐的方法，表现出更优的性能，为生成模型中的对称性处理提供了新的解决方案。

2604.17548 2026-05-15 cs.LG math.AT stat.ML

Contraction and Hourglass Persistence for Learning on Graphs, Simplices, and Cells

Mattie Ji, Indradyumna Roy, Vikas Garg

AI总结该论文研究了如何在图、单纯复形和胞腔网络上进行学习的拓扑方法，提出了收缩同调（Contraction Homology）和小时glass持续性（Hourglass Persistence）的概念，以改进传统持续同调在图神经网络中的应用。通过结合包含和收缩操作，小时glass持续性提升了模型的表达能力、可学习性和稳定性，并设计了高效的算法，能够在多种现实图数据集上取得优于传统方法的实验结果。

2603.21996 2026-05-15 cs.SE stat.CO

StreamSampling.jl: Efficient Sampling from Data Streams in Julia

Adriano Meligrana

AI总结 StreamSampling.jl 是一个用于在单次遍历数据流时高效采样的 Julia 库，特别适用于数据总量未知的情况。该库通过保持较小的内存占用和无需完全加载数据到内存中，提供了比传统方法更高效和灵活的采样方式。研究通过实证基准测试展示了其在性能和内存使用方面的优势。

2603.00772 2026-05-15 stat.ML cs.LG

Generalizing Score-based generative models for Heavy-tailed Distributions

Tiziano Fassina, Gabriel Cardoso, Sylvan Le Corff, Thomas Romary

AI总结本文研究了如何将基于分数的生成模型（SGMs）推广到具有重尾分布的数据。针对现有方法在生成保真度和理论基础方面的不足，作者提出了两个理论贡献：一是证明通过早期停止和适当初始化可以将扩散框架扩展到任意目标分布；二是为归一化流的生成过程推导出新的理论保证。基于这些结果，文章提出了一种统一的生成框架，结合归一化流捕捉重尾特性与SGM细化结构细节，有效提升了生成质量并克服了现有方法的局限。

2602.09969 2026-05-15 cs.LG econ.EM stat.ML

Causal Multi-Task Demand Learning

Varun Gupta, Vijay Kamble

AI总结本文研究了一个由零售定价驱动的多任务需求学习问题，旨在估计不同决策场景下的异质性线性价格响应函数。由于每个场景的协变量丰富但价格变化有限，作者提出了一种新的元学习框架，通过利用跨任务信息进行迁移学习，解决因内生性导致的估计偏差问题。该方法在每个任务中假设存在至少两个局部外生的价格点，从而在保证因果识别的前提下提升需求参数估计的准确性，并在真实和合成数据上验证了其有效性。

2512.24588 2026-05-15 stat.ME

Multiple Testing of One-Sided Hypotheses with Conservative $p$-values

Kwangok Seo, Johan Lim, Hyungwon Choi, Jaesik Jeong

AI总结本文研究了一类大规模单边假设检验问题，其中检验统计量服从单位方差的正态分布，目标是识别具有正均值效应的信号。传统方法在假设所有零假设均值严格为零的情况下计算p值，但由于零假设是复合的，部分零均值可能为负，导致p值过于保守，从而降低检验功效。本文提出一种新的方法，在经验贝叶斯框架下估计检验统计量的边缘零分布，并基于该分布构造精确的p值，从而在不修改现有多重检验程序的前提下提升检验功效。仿真和实际数据应用表明，该方法在传统p值保守时显著提升功效，且在传统p值准确时表现与现有方法相当。

2512.03637 2026-05-15 cs.SD cs.LG stat.ML

AaSP: Aliasing-aware Self-Supervised Pre-Training for Audio Spectrogram Transformers

Kohei Yamamoto, Kosuke Okusa

AI总结该研究提出了一种名为AaSP的音频频谱图Transformer自监督预训练框架，旨在解决传统方法中因时间下采样导致的混叠问题。AaSP通过引入感知混叠的补丁表示、教师-学生掩码建模、跨注意力预测器以及多掩码对比正则化，学习能够整合易受混叠影响频段特征且在不同掩码视图下保持稳定的音频表示。实验表明，AaSP在多个音频识别任务中表现出色，优于现有自监督方法。

详情

DOI: 10.1109/TASLPRO.2026.3690632
Comments: Accepted for publication in IEEE Transactions on Audio, Speech and Language Processing (TALSP). Copyright IEEE

英文摘要

Transformer-based audio self-supervised learning (SSL) models commonly use spectrograms, vision-style Transformers, and masked modeling objectives. However, convolutional patchification with temporal downsampling lowers the effective Nyquist frequency and introduces aliasing, while naïve low-pass filtering may remove task-relevant high-frequency cues. We present AaSP, an aliasing-aware self-supervised pre-training framework for audio spectrogram transformers. AaSP combines an aliasing-aware patch representation, teacher-student masked modeling, a cross-attention predictor, and multi-mask contrastive regularization to learn representations that integrate features from alias-prone modulation bands while remaining stable across masked views. Its patch-embedding module, Aliasing-aware Patch Embedding (AaPE), augments standard patch tokens with features from alias-prone modulation bands using a band-limited complex sinusoidal kernel with a two-sided exponential window. The kernel's frequency and decay parameters are estimated from the input, enabling adaptive subband analysis whose outputs are fused with standard patch tokens. We pre-train on AudioSet and evaluate the learned representations by fine-tuning and linear evaluation on acoustic/environmental, speech, and music recognition benchmarks. Under fine-tuning, the full AaSP framework achieves state-of-the-art results on AS-20K, ESC-50, and NSynth among compared self-supervised baselines, while remaining competitive elsewhere. Linear evaluation shows a similar trend, including gains on US8K and NSynth. Overall, AaSP learns representations that are more stable under aliasing-sensitive temporal perturbations and competitive for downstream transfer.

URL PDF HTML ☆

赞 0 踩 0

2511.18739 2026-05-15 cs.AI cs.LG stat.ML

A Problem-Oriented Taxonomy of Evaluation Metrics for Time Series Anomaly Detection

Kaixiang Yang, Jiarong Liu, Yupeng Song, Shuanghua Yang, Yujue Zhou

AI总结时间序列异常检测在物联网和物理信息系统中应用广泛，但其评估因应用场景多样和指标假设不同而面临挑战。本文提出了一种面向问题的评估指标分类框架，从解决的具体评估问题出发重新诠释现有指标，将其分为六个维度，涵盖准确性、及时性、标签容忍度、人工审核成本惩罚、抗随机性以及跨数据集可比性等方面。通过实验分析不同场景下指标的行为，量化其区分真实检测与随机噪声的能力，揭示了多数事件级指标具有较强区分力，而部分常用指标对随机分数膨胀较为敏感，强调了评估指标应根据具体任务需求进行选择。

2511.05159 2026-05-15 stat.ML cs.LG

A New Framework for Convex Clustering in Kernel Spaces: Finite Sample Bounds, Consistency and Performance Insights

Shubhayan Pan, Kushal Bose, Debolina Paul, Saptarshi Chakraborty, Swagatam Das

AI总结本文提出了一种在核空间中的凸聚类新框架，用于处理线性不可分或非凸结构的数据。该方法通过将数据映射到再生核希尔伯特空间（RKHS），在变换后的空间中进行凸聚类，从而提升对复杂数据分布的处理能力，并能在有限维空间中生成嵌入表示。研究提供了该方法的理论保证，包括算法收敛性和有限样本误差界，并通过实验验证了其在合成和真实数据集上的优越性能，为非线性与非凸数据的聚类提供了有效解决方案。

2510.25240 2026-05-15 stat.ML cs.LG

Generative Bayesian Optimization: Generative Models as Acquisition Functions

Rafael Oliveira, Daniel M. Steinberg, Edwin V. Bonilla

AI总结本文提出了一种将生成模型用于批量贝叶斯优化（BO）的通用策略，使生成模型能够作为候选解采样器，从而实现大规模批量优化、非连续设计空间优化以及高维和组合设计优化。受直接偏好优化（DPO）成功启发，研究通过使用观测数据计算出的简单效用值训练生成模型，使其生成的分布密度与预期效用（即BO的获取函数值）成正比，避免了传统方法中构建代理模型的需求。理论分析表明，生成模型在BO过程中形成的分布序列在一定条件下可逼近最优目标，并通过高维大规模优化实验验证了方法的有效性。

2510.15141 2026-05-15 stat.ML cs.LG stat.AP

Manifold Dimension Estimation via Local Graph Structure

Zelong Bi, Pierre Lafaye de Micheaux

AI总结本文提出了一种基于局部图结构的流形维度估计方法，通过在局部主成分分析坐标上进行回归来捕捉流形的局部结构。该方法引入了两个代表性估计器：二次嵌入（QE）和总最小二乘（TLS），实验表明它们在合成数据和现实数据上均具有竞争力，且在许多情况下优于现有先进方法。

2510.13583 2026-05-15 stat.ML cs.LG

On the Identifiability of Causal Graphs with the Invariance Principle

Francesco Montagna

AI总结本文研究了在独立同分布观测数据下因果图的可识别性问题，提出在结构因果模型生成的数据分布以及少量（最多两个）具有不同噪声统计特性的环境数据下，可以唯一确定因果图。该成果首次保证了在固定数量环境中恢复完整因果图的可能性，且适用于任意非线性机制，仅需噪声满足高斯性假设，并探讨了放松该假设的可能方法。研究还进一步拓展了独立成分分析与因果发现之间的对偶关系，表明在较少辅助信息条件下，因果发现可达到与非线性ICA相当的性能。

2510.11177 2026-05-15 stat.AP stat.ME

Policy Robustness & Uncertainty in Model-based Decision Support for the Energy Transition

Ian J. Burton, Femke J. M. M. Nijsse, James M. Salter

AI总结本文研究了在能源转型背景下基于模型的决策支持系统中的政策鲁棒性与不确定性问题，提出了一种通用的不确定性分析方法，能够识别模型框架中的关键不确定性因素，并克服了传统方法在计算成本和不确定性表示上的限制。通过应用该方法于全球及印度的电力系统转型分析，研究发现可再生能源的平均替代率、建设周期和电网连接时间是影响转型结果的主要不确定性因素，而政策设计可以有效缓解这些不确定性。研究还表明，包含部分淘汰机制的政策组合在应对不确定性方面更具鲁棒性，但长期的实施延迟仍对政策目标构成挑战。

2508.07876 2026-05-15 stat.ML cs.LG math.DS math.ST stat.TH

Stochastic dynamics learning with state-space systems

Juan-Pablo Ortega, Florian Rossmannek

AI总结本文研究了状态空间系统在随机动态学习中的特性，旨在深化对脉冲神经网络计算（RC）理论基础的理解。通过统一处理确定性和随机性场景下的记忆衰减和回声状态属性（ESP），作者证明了即使在缺乏ESP的情况下，记忆衰减和解的稳定性也具有普遍性，从而为RC模型的广泛应用提供了理论支持。在随机情形下，文章引入了基于概率分布吸引子动力学的新视角，拓展了非自主动力系统的相关研究，为RC模型在因果性、稳定性与记忆特性方面提供了更深入的见解。

2507.11922 2026-05-15 math.ST stat.ME stat.ML stat.TH

Enhancing Signal Proportion Estimation Through Leveraging Arbitrary Covariance Structures

Jingtian Bai, Xinge Jessie Jeng

AI总结本文研究了在变量之间存在复杂依赖关系的情况下，如何更准确地估计大量变量中真实信号的比例。传统方法通常假设变量独立或满足特定稀疏性条件，限制了其在实际问题中的适用性。本文提出了一种新的信号比例估计方法，利用变量间的任意协方差结构信息，提升了在不同稀疏程度和依赖结构下的估计性能。通过理论分析和模拟实验，验证了该方法在估计精度和弱信号检测方面的优越性。

2506.20425 2026-05-15 stat.ML cs.LG stat.CO stat.ME

Scalable Subset Selection in Linear Mixed Models

Ryan Thompson, Matt P. Wand, Joanna J. J. Wang

AI总结本文研究了在包含固定效应和随机效应的线性混合模型中如何高效地进行可扩展的子集选择问题。为了解决现有方法在处理大量预测变量时计算效率低下的问题，作者提出了一种基于 $\ell_0$ 正则化的新型子集选择方法，并结合坐标下降算法和局部搜索算法以实现快速收敛和非凸优化的高效求解。该方法在统计上提供了有限样本下的KL散度界，并在合成和真实数据实验中表现出优越的性能。

2506.12296 2026-05-15 stat.ME stat.AP

Finite-sample bias-variance tradeoff with variables related to trial participation inserted into causal forest models for ensuring generalizability

Rikuta Hamaya, Etsuji Suzuki, Konan Hara

AI总结该研究探讨了在因果森林模型中引入与试验参与相关的变量时，有限样本下的偏差-方差权衡问题，旨在提高从随机对照试验（RCT）中估计条件平均处理效应（CATE）的泛化能力。研究发现，在现实样本量下，高维协变量带来的方差膨胀往往超过了偏差的减少，从而降低了估计精度；相比之下，基于逆概率加权（IPW）的方法在不同场景下表现更稳定。该成果为处理RCT中的选择偏差提供了重要参考，建议在实际应用中优先考虑单独处理选择偏差的方法。

2505.09552 2026-05-15 stat.ME cs.LG stat.ML

Scalable Krylov Subspace Methods for Generalized Mixed-Effects Models with Crossed Random Effects

Pascal Kündig, Fabio Sigrist

AI总结该论文针对具有交叉随机效应的广义混合效应模型中的计算瓶颈问题，提出了一种基于Krylov子空间的方法，有效提升了高维数据下的计算效率。研究通过理论分析和实验验证，展示了预条件随机Lanczos拟合和共轭梯度方法在收敛性和数值稳定性方面的优势，并开发了可扩展的预测方差计算方法。实验表明，新方法相比传统的Cholesky分解方法，在速度和稳定性上均有显著提升。

2505.05670 2026-05-15 econ.EM math.ST stat.AP stat.ME stat.TH

Estimation and Inference in Boundary Discontinuity Designs: Location-Based Methods

Matias D. Cattaneo, Rocio Titiunik, Ruiqi Rae Yu

AI总结本文研究了边界不连续设计中因果效应的估计与推断问题，针对基于连续分配边界划分处理组与对照组的场景，提出了一种基于位置得分的局部多项式处理效应估计方法。研究构建了边界平均处理效应曲线（BATEC）及其加总参数（WBATE和LBATE）的点wise和uniform估计与推断方法，适用于尖锐和模糊（不完美依从）设计，并通过实证应用和配套软件展示了方法的有效性。

2501.18756 2026-05-15 stat.ML cs.LG math.OC

A Unified Framework for Entropy Search and Expected Improvement in Bayesian Optimization

Nuojin Cheng, Leonard Papenmeier, Stephen Becker, Luigi Nardi

AI总结本文提出了一种统一的理论框架——变分熵搜索（Variational Entropy Search），揭示了预期改进（EI）与基于信息论的获取函数之间的深层联系，挑战了它们本质不同的传统观点。研究通过将EI解释为最大值熵搜索（MES）的变分近似，提出了一个新的获取函数VES-Gamma，该方法在合成和现实世界的低维与高维基准测试中表现出色，优于现有的EI和MES方法。

2410.24003 2026-05-15 stat.ME

On testing for independence between generalized error models of several time series

Kilani Ghoudi, Bouchra R. Nasri, Bruno N. Remillard

AI总结本文研究了多个时间序列广义误差模型之间的独立性检验问题，提出了一种适用于任意分布（包括连续和离散混合分布）的广义创新概念，并构建了基于滞后广义误差的经验过程族。通过莫比乌斯变换处理经验过程的协方差，提出了基于Cramer-von Mises统计量和依赖度量的检验统计量，并结合图形方法进行依赖关系可视化。研究还通过数值实验评估了检验方法的效能，并在金融和犯罪数据中展示了方法的应用，相关方法已实现于R语言包IndGenErrors中。

2410.09504 2026-05-15 stat.ME stat.CO

Bayesian Transfer Learning for Artificially Intelligent Geospatial Systems: A Predictive Stacking Approach

Luca Presicce, Sudipto Banerjee

AI总结本文提出了一种基于贝叶斯预测堆叠的迁移学习框架，用于构建人工智能地理空间系统，以实现对大规模空间数据的快速、自动化分析。该方法将大规模数据集分割为小数据集逐步输入分析框架，从而在无需人工干预的情况下进行学习传播和整体推断。研究通过大量仿真实验和植被指数数据的应用验证了该方法的有效性，其推断结果与传统统计方法相当，但对硬件要求更低。

2406.15865 2026-05-15 stat.CO math.OC

Approximate Bayesian Computation sequential Monte Carlo via random forests

Khanh N. Dinh, Cécile Liu, Zijin Xiang, Zhihan Liu, Simon Tavaré

AI总结本文研究了如何在近似贝叶斯计算（ABC）中更有效地利用随机森林方法进行参数后验推断。作者提出了两种改进方法：一种是利用分布型随机森林直接推断参数的联合后验分布，另一种是结合序贯蒙特卡罗方法，通过迭代更新先验分布以聚焦于参数空间中最可能的区域。这些方法在提高计算效率和推断准确性方面表现出色，适用于多种科学领域的确定性和随机模型。

2404.13649 2026-05-15 stat.ML cs.LG stat.ME

Distributional Principal Autoencoders

Xinwei Shen, Nicolai Meinshausen

AI总结本文提出了一种名为分布主成分自编码器（DPA）的降维方法，旨在在重建数据时保留原始数据的分布特性。该方法通过学习数据在低维潜在变量条件下的条件分布，使得重建数据与原始数据在分布上一致。实验表明，DPA在气候数据、单细胞数据和图像数据上均能有效保留数据的原始分布和重要结构特征。

2305.06280 2026-05-15 math.ST math.AG stat.TH

Maximum likelihood thresholds of generic linear concentration models

Daniel Irving Bernstein, Steven J. Gortler, Louis Theran

AI总结本文研究了一般线性浓度模型的最大似然阈值，即通过最大似然估计拟合模型所需的最小数据点数量。作者确定了这类模型的最大似然阈值，并证明其与直观的维度计算结果一致，这一结论在半代数概念下并不显然。此外，文章还从几何角度解释了线性浓度模型在何种情况下会偏离这一通用行为。

2305.00578 2026-05-15 stat.ME

High-Dimensional Clustering via Nearest-Neighbor Asymmetry

Hao Chen, Xiancheng Lin

AI总结高维聚类通常依赖于几何或局部相似性结构，但群体间的显著差异未必总是由位置差异引起。本文提出了一种基于最近邻不对称性的聚类方法NAC，通过构建有向$k$-最近邻图，并利用两种标准化统计量评估聚类划分，能够适应不同分离模式，无需预设混合模型或低维表示。该方法在位置、尺度及联合差异的多种场景下表现出色，尤其在存在最近邻不对称性时具有明显优势，并在基因表达数据分析中展示了其有效性。

2304.11468 2026-05-15 cs.LG stat.ML

Increasing the Scope as You Learn: Adaptive Bayesian Optimization in Nested Subspaces

Leonard Papenmeier, Luigi Nardi, Matthias Poloczek

AI总结本文提出了一种名为BAxUS的自适应贝叶斯优化方法，通过引入嵌套随机子空间，在优化过程中动态调整搜索空间，以应对高维黑箱函数优化中的性能下降问题。该方法在理论上保证了稳定性，并在多个应用任务中表现出优于现有先进方法的优化效果。

2202.05568 2026-05-15 stat.ML cs.IT cs.LG math.IT math.PR math.ST stat.TH

Change of measure through the Legendre transform

Antoine Picard-Weibel, Benjamin Guedj

AI总结本文研究了通过Legendre变换实现测度变化的方法，用于推导PAC-Bayes泛化界。作者结合Legendre变换与Fenchel-Young不等式，基于$f$-散度构建了测度变化不等式，拓展了传统Donsker-Varadhan定理的条件。该方法为学习理论提供了更灵活的分析工具，能够在更广泛的假设条件下建立PAC-Bayes保证。

1902.06002 2026-05-15 cs.IT cs.DM math.IT math.PR math.ST stat.TH

Group Testing: An Information Theory Perspective

Matthew Aldridge, Oliver Johnson, Jonathan Scarlett

AI总结本文从信息论的角度综述了群组测试问题的最新研究进展。群组测试旨在通过检测物品的组合来识别少量缺陷品，广泛应用于医学、生物、通信等领域。文章介绍了高效的算法、解码方法的可达界与反向界，并提出了群组测试的“速率”概念，用于衡量每项测试获取的信息量。此外，还讨论了噪声环境及多种变体问题下的相关结果。

详情

DOI: 10.1108/FTCIT-11-2025-0150
Journal ref: Foundations and Trends in Communications and Information Theory: Vol. 23: No. 1-2, pp 1-221, 2026
Comments: Second edition. Published in Foundations and Trends in Communications and Information Theory. The first edition can be found in arXiv v3

英文摘要

The group testing problem concerns discovering a small number of defective items within a large population by performing tests on pools of items. A test is positive if the pool contains at least one defective, and negative if it contains no defectives. This is a sparse inference problem with a combinatorial flavour, with applications in medical testing, biology, telecommunications, information technology, data science, and more. In this monograph, we survey recent developments in the group testing problem from an information-theoretic perspective. We cover several related developments: efficient algorithms with practical storage and computation requirements, achievability bounds for optimal decoding methods, and algorithm-independent converse bounds. We assess the theoretical guarantees not only in terms of scaling laws, but also in terms of the constant factors, leading to the notion of the {\em rate} of group testing, indicating the amount of information learned per test. For the noiseless setting, we present a series of results leading to optimal rates, which in turn imply optimality and suboptimality results of various algorithms depending on the sparsity regime. We also survey analogous developments in noisy settings. In addition, we survey results concerning a number of variations on the standard group testing problem, including approximate recovery criteria, adaptive algorithms with a limited number of stages, sublinear-time algorithms, and settings with additional prior information, among others.

URL PDF HTML ☆

赞 0 踩 0

1805.06144 2026-05-15 math.ST stat.TH

On Difference Between Two Types of $γ$-divergence for Regression

Takayuki Kawashima, Hironori Fujisawa

AI总结本文研究回归问题中两种类型的 $γ$-散度在异质污染下的差异，指出其中一种具有强鲁棒性，而另一种在一般情况下不具有，但在特定参数模型或同质污染条件下仍可保持鲁棒性。研究揭示了两种散度在处理不同污染场景时的适用性差异，为模型选择提供了理论依据。

1802.03127 2026-05-15 stat.ML stat.ME

Robust and Sparse Regression in GLM by Stochastic Optimization

Takayuki Kawashima, Hironori Fujisawa

AI总结该论文研究了在广义线性模型（GLM）中如何通过随机优化方法实现鲁棒且稀疏的回归分析。针对高维数据中稀疏GLM对异常值不鲁棒的问题，作者基于γ-散度提出了一种鲁棒且稀疏的GLM估计方法，并采用随机投影梯度下降算法进行参数估计，有效提升了大规模问题的求解效率。研究还通过数值实验和实际数据分析验证了该方法在多个具体模型中的优越性。

2605.14168 2026-05-15 cs.LG cs.DS stat.ML

Finite Sample Bounds for Learning with Score Matching

Devin Smedira, Abhijith Jayakumar, Sidhant Misra, Marc Vuffray, Andrey Y. Lokhov

AI总结本文研究了在有限样本条件下，使用得分匹配方法学习连续指数族分布的统计学习问题。作者提供了非渐近的样本复杂度分析，揭示了模型维数的多项式依赖关系，这是该领域首个此类结果。该工作填补了得分匹配理论分析的空白，为高维统计学习提供了重要的理论保证。

2605.14142 2026-05-15 stat.ML cs.LG stat.CO

To discretize continually: Mean shift interacting particle systems for Bayesian inference

Ayoub Belhadji, Daniel Sharp, Youssef M. Marzouk

AI总结本文提出了一种基于最大均值差异（MMD）最小化的交互粒子系统，用于在已知非归一化密度的情况下近似概率分布的积分。该方法扩展了经典均值漂移算法和经验分布最优量化算法，适用于连续分布，并且不受未知归一化常数的影响，支持无梯度和有梯度的实现方式。实验表明，该方法在多模态混合、贝叶斯分层模型、受PDE约束的反问题等多种采样任务中表现出良好的收敛性、多模态捕捉能力和高维扩展性。

2605.14098 2026-05-15 stat.ML cs.CL cs.LG

Pause and Reflect: Conformal Aggregation for Chain-of-Thought Reasoning

Yu Gu, Zijun Yu, Vahid Partovi Nia, Masoud Asgharian

AI总结该研究针对链式推理（CoT）中多路径推理结果的聚合不确定性问题，提出了一种基于 conformal 的聚合方法，以提升系统在拒绝回答时的准确性。不同于传统的多数投票方式，该方法采用加权得分聚合，并结合 conformal 风险控制来校准拒绝规则，从而在有限样本下保证自信错误率的控制。实验表明，该方法在多个基准测试中实现了较高的选择性准确率，且无需重新训练模型。

2605.14059 2026-05-15 cond-mat.dis-nn stat.ML

Finite-size scaling of hetero-associative retrieval in continuous-signal-driven Ising spin systems

Andrea Ladiana

AI总结该研究探讨了在连续信号驱动的伊辛自旋系统中异构联想记忆的有限大小标度行为。通过构建一个多层伊辛框架，将连续信号编码为离散自旋，并结合伪逆记忆耦合，实现了对高维生物信号的有效联想记忆。研究揭示了系统在热涨落作用下的对称性破缺机制，并建立了动态对偶性，明确了并行与串行更新在信号传播中的不同作用。实验表明该模型在睡眠多导睡眠图数据上表现出优异的跨模态回忆能力。

2605.14056 2026-05-15 stat.ME stat.AP

An MCMC-Based Method for Dynamic Causal Modeling of Effective Connectivity in Functional MRI

Kaitlyn R. Fales, Hyebin Song, Nicole A. Lazar

AI总结该研究提出了一种基于马尔可夫链蒙特卡洛（MCMC）方法的动态因果建模（CDCM）技术，用于功能磁共振成像（fMRI）中有效连接的动态分析。与传统DCM相比，CDCM采用更简洁的观测模型和No-U-Turn采样器，提高了计算效率并增强了参数可识别性。实验结果表明，CDCM在模拟和真实数据中均能提供更可靠的不确定性估计和实验输入相关参数的一致估计，适用于小规模和大规模神经影像数据分析。

2605.14041 2026-05-15 stat.ME cs.LG

Wahkon: A Statistically Principled Deep RKHS Superposition Network

Yongkai Chen, Wenxuan Zhong, Ping Ma

AI总结本文提出了一种名为Wahkon的深度再生核希尔伯特空间（RKHS）叠加网络，旨在结合深度学习的预测能力与RKHS方法的统计保证。该方法基于Kolmogorov叠加原理和Wahba样条的RKHS正则化思想，建立了有限维的深度表示定理，实现了可训练的模型结构与逐层复杂度控制。理论分析表明，该方法在层次化高斯过程先验下等价于最大后验估计，并在深度与宽度的正则化权衡方面具有最优收敛率；实验显示其在多个基准任务和单细胞数据分析中优于传统深度模型。

2605.14019 2026-05-15 econ.EM cs.LG math.ST stat.CO stat.TH

Regret Equals Covariance: A Closed-Form Characterization for Stochastic Optimization

Irene Aldridge

AI总结本文研究了随机优化问题中遗憾（Regret）的度量问题，提出了一个精确的协方差分解公式，将期望遗憾表示为不确定参数与最优决策之间的协方差加上一个可估计的残差项。对于线性规划和无约束二次规划问题，该残差项为零，使得遗憾可直接由协方差计算得出，从而避免了传统样本平均近似方法的高计算复杂度。该方法在实际问题中可通过历史数据高效估计协方差，计算效率显著提升，并通过理论分析和实验验证了其有效性。

2605.14011 2026-05-15 stat.ME

Robust inference in inflated beta regression

Francisco Felipe Queiroz, Silvia Lopes de Paula Ferrari

AI总结本文研究了在边界值存在的连续比例数据建模中，如何提高膨胀beta回归模型的鲁棒性。针对最大似然估计对异常值敏感的问题，提出了一种稳健估计方法，在保持模型简洁性和可解释性的基础上提升了推断的稳定性。同时，文中还引入了一种根据数据稳健性需求选择调参常数的算法，并发展了稳健的Wald型检验，通过模拟研究和实际数据分析验证了方法的有效性。

2605.14008 2026-05-15 stat.ME math.ST stat.TH

Predictive Inference via Kernel Density Estimates

Torey Hilbert

AI总结本文研究了基于核密度估计的预测推断方法，探讨了两种核预测规则的收敛性质。作者证明了经典核密度估计和递归版本在预测分布上均以几乎必然的方式弱收敛，为核密度估计提供了新的贝叶斯解释。研究发现，经典方法收敛于紧支撑测度，而递归方法则收敛于非紧支撑测度，揭示了两者在渐近行为上的本质差异。

2605.14000 2026-05-15 stat.AP

Recent advances in statistical methodology applied to the Hjort liver index time series (1859-2012) and associated influential factors

Gudmund H. Hermansen, Nils Lid Hjort, Olav S. Kjesbu

AI总结本文综述了若干近期统计方法在生物学和渔业科学中的应用，重点探讨了聚焦模型选择、动态拟合优度检验、突变点检测、预测不确定性以及多源信息融合等方法，并将其应用于分析1859至2012年间的Hjort肝脏质量指数时间序列。该序列源自1914年Hjort的经典研究，并经后续研究扩展为目前最长的海洋科学时间序列之一。研究详细分析了该序列与其相关因素（如科拉冬季温度、鳕鱼长度分布、死亡率及食物可得性指数）之间的关系与相互作用。

详情

Journal ref: Canadian Journal of Fisheries and Aquatic Sciences, 2016, vol. 73, pages 279-295
Comments: 16 pages, 19 figures. This is the authors' manuscript, 2016, published in modified form in Canadian Journal of Fisheries and Aquatic Sciences 2016, vol. 73, pages 279-295, part of the special issue based on the Johan Hjort Symposium on Recruitment Dynamics and Stock Variability, Bergen, Norway, October 2014

英文摘要

Certain recent advances in statistical methodology have promising potential for fruitful use in general biology and the fisheries sciences. This paper reviews and discusses some of the relevant themes, including accurate modelling via focused model selection techniques, dynamic goodness-of-fit testing of processes evolving over time, finding break points for phenomena experiencing changes, prediction uncertainty, and optimal combination of information across diverse sources via confidence distributions. The methods are illustrated for the Hjort liver quality index time series. Its roots lie in the classic Hjort (`Fluctuations in the Great Fisheries of Northern Europe, Viewed in the Light of Biological Research', 1914), where liver quality of the Atlantic cod {\it (Gadus morhua)} for 1880--1912 is reported on and studied, along with related factors, making it one of the first teleost time series ever published. Diligent work by Kjesbu et al. (`Making use of Johan Hjort's `unknown' legacy: reconstruction of a 150-year coastal time-series on northeast Arctic cod (Gadus morhua) liver data reveals long-term trends in energy allocation patterns', 2014), involving both archival and calibration efforts, have extended the series both backwards and forwards in time, to 1859--2012, yielding one of the longest time series of marine science. Our study offers a detailed examination of this series and how it relates to and interacts with associated factors, including Kola winter temperatures, length distribution parameters, cod mortality, and a certain index related to availability of food.

URL PDF HTML ☆

赞 0 踩 0

2605.13979 2026-05-15 quant-ph cs.LG stat.ML

Winning Lottery Tickets in Neural Networks via a Quantum-Inspired Classical Algorithm

Natsuto Isogai, Hayata Yamasaki, Sho Sonoda, Mio Murao

AI总结本文提出了一种受量子算法启发的全新经典算法，用于从大型浅层神经网络中高效选取稀疏子网络。该算法通过优化概率分布进行采样，避免了传统方法中指数级的时间复杂度，实现了多项式时间复杂度的改进。实验表明，该算法在采样效率和经验风险方面均优于传统方法，展示了在无需量子硬件的情况下，经典计算机也能高效完成量子启发的稀疏子网络选择任务。

2605.13933 2026-05-15 cs.LG cs.AI stat.ML

Unsupervised learning of acquisition variability in structural connectomes via hybrid latent space modeling

Gaurav Rudravaram, Lianrui Zuo, Karthik Ramadass, Elyssa McMaster, Jongyeon Yoon, Aravind R. Krishnan, Adam M. Saunders, Chenyu Gao, Nancy R. Newlin, Praitayini Kanakaraj, Lori L. Beason Held, Murat Bilgel, Laura A. Barquero, Micah DArchangel, Tin Q. Nguyen, Laurie B. Cutting, Derek Archer, Timothy J. Hohman, Daniel C. Moyer, Bennett A. Landman

AI总结该研究旨在解决扩散磁共振成像（dMRI）数据中因采集设备、地点和协议不同而引入的结构连接组变异问题。提出了一种无需手动调参的无监督框架，通过架构层面的退火机制，使模型在训练过程中自适应地平衡离散与连续潜在变量，从而更有效地分离采集相关变异与生物变异。实验表明，该方法在多个数据集上表现出更强的站点识别能力，展示了其在捕捉dMRI采集变异方面的有效性。

2605.13928 2026-05-15 stat.CO

CudaMon: An R Package to Monitor NVIDIA GPUs, Showcased by Monitoring a GPU-accelerated Single-cell Analysis Workflow in R

Mohammad Amin Zadenoori, Riccardo Ceccaroni, Gabriele Sales, Davide Risso

AI总结 CudaMon 是一个用于监控 NVIDIA GPU 的 R 包，通过 NVML 接口实时提供 GPU 利用率、内存、温度和功耗等信息，并支持数据导出与可视化。该研究以单细胞 RNA 测序分析流程为例，展示了 CudaMon 在监测 GPU 加速计算过程中的应用，揭示了计算密集型步骤的高利用率及数据管理阶段的性能瓶颈。CudaMon 有助于优化 GPU 资源使用、调试性能问题并提升 R 工作流的可重复性。

2605.13926 2026-05-15 stat.AP

Optimising football transfer strategy under budget constraints: A weighted multi-criteria approach

Tathagata Basu, Soudeep Deb, Rishideep Roy

AI总结本文研究了在预算约束下优化足球转会策略的问题，提出了一种结合加权多准则优化的定量框架，综合考虑球员表现、转会价格及联赛环境等因素。通过构建线性混合效应模型预测球员评分和转会价格，并将其整合到约束优化模型中，以制定最优转会方案。同时，将该方案嵌入独立私人价值拍卖模型，分析多支球队竞争同一球员时的市场行为，展示了该方法在捕捉转会市场动态方面的有效性。

2605.13922 2026-05-15 cs.CR cs.LG stat.CO

XAI and Statistical Analysis for Reliable Intrusion Detection in the UAVIDS-2025 Dataset: From Tree to Hybrid and Tabular DNN Ensembles

Iakovos-Christos Zarkadis, Christos Douligeris

AI总结本文研究了如何利用可解释人工智能（XAI）和统计分析方法，提高无人机入侵检测系统（UAVIDS-2025）中机器学习模型的可靠性。通过对比多种树模型、深度神经网络、混合堆叠模型和集成神经网络，作者找到了性能最佳的XGBoost模型，并结合SHAP方法进行特征重要性分析，揭示了不同攻击类型的关键特征和误判原因。进一步通过密度估计和多重比较统计检验，发现了Wormhole和Blackhole攻击在数据集中的分布特性及其误判的根本原因，为构建可解释且可靠的入侵检测模型提供了重要参考。

2605.13916 2026-05-15 stat.ML cs.AI cs.LG

A Regret Perspective on Online Multiple Testing

Qingyang Hao, Kongchang Zhou, Fang Kong, Hongxin Wei

AI总结本文从遗憾（Regret）的角度研究在线多重假设检验（OMT），旨在统一评估假阳性与假阴性之间高度不对称的成本。作者引入了加权遗憾指标，揭示了严格控制FDR的确定性方法在稀疏信号冷启动阶段会导致线性遗憾惩罚，并提出了Decoupled-OMT（DOMT）方法，通过引入非负随机扰动，在不增加假阴性的同时显著降低遗憾，实验证明其在非平稳环境下有效缓解阈值耗尽问题。

2605.13915 2026-05-15 stat.ML cs.AI cs.LG

Multi-Scale Dequant: Eliminating Dequantization Bottleneck via Activation Decomposition for Efficient LLM Inference

Lingchao Zheng, Yuwei Fan, Jun Li, Chengqiu Hu, Qichen Liao, Junyi Fan, Rui Shi, Fangzheng Miao

AI总结量化是实现大语言模型高效推理的关键技术，但反量化步骤在现代AI加速器上已成为性能瓶颈。本文提出多尺度反量化（MSD）框架，通过将高精度激活分解为多个低精度组件，直接与量化权重进行矩阵乘法，从而绕过传统反量化流程，显著提升计算效率。实验表明，MSD在保持精度的同时，有效减少了计算延迟和显存带宽需求，适用于多种权重格式并具有严格的误差界保证。

2605.13913 2026-05-15 stat.ML cs.LG

A Survey on Data-Dependent Worst-Case Generalization Bounds

Hubert Leroux, Jean Marcus, Julien Roger

AI总结本文综述了数据依赖的最坏情况泛化界的研究进展，旨在解释深度神经网络在高度参数化情况下仍具有良好泛化能力的现象。核心方法包括扩展PAC-Bayesian理论以适应数据依赖的假设集、利用优化轨迹的几何与拓扑特性改进复杂度项，以及通过稳定性假设替代信息论中的相关项。本文将这些成果统一在一个通用不等式框架下，并对不同方法的泛化界进行了对比分析。

2605.13910 2026-05-15 stat.ML cs.CV cs.LG

Covariance-aware sampling for Diffusion Models

Andrea Schioppa, Tim Salimans

AI总结本文提出了一种协方差感知采样器，旨在提升扩散模型在少量采样步数下的像素空间生成质量。该方法通过显式建模反向过程的协方差，结合Tweedie公式和傅里叶空间分解，有效改进了传统仅依赖均值预测的采样方式。实验表明，在相同函数评估次数下，该方法在像素级扩散模型中生成的样本质量优于当前最先进的二阶采样器和最新aDDIM采样器。

2605.13907 2026-05-15 stat.ML cs.AI cs.LG

AIS: Adaptive Importance Sampling for Quantized RL

Jiajun Zhou, Wei Shao, Lingchao Zheng, Yuwei Fan, Ngai Wong

AI总结在大语言模型的强化学习中，低精度 rollout（如 FP8）与高精度训练（如 BF16）之间的不匹配会导致策略梯度偏差，影响训练稳定性。为了解决这一问题，本文提出自适应重要性采样（AIS）方法，通过实时诊断指标动态调整梯度修正强度，既保留了低精度 rollout 的探索优势，又抑制了其带来的不稳定因素。实验表明，AIS 在保持 FP8 加速效果的同时，在多个数学推理和规划任务上达到了与 BF16 基线相当的性能。

2602.21376 2026-05-15 math.OC stat.ME

Fenchel-Young Estimators of Perturbed Utility Models

Xi Lin, Yafeng Yin, Tianming Liu

AI总结本文研究了扰动效用模型（PUM）框架下的参数估计问题，该框架统一了多项逻辑斯蒂（MNL）和Sparsemax等离散选择模型。为了解决传统最大似然估计在稀疏场景下存在的非凸性和不稳定性问题，作者提出了一种基于Fenchel-Young损失的统一估计方法，该方法利用选择概率的凸共轭结构，保证了全局凸性，从而提供了更稳定可靠的估计方案。此外，作者进一步开发了参数基估计（PBE）方法，在预设基函数族中联合估计效用参数和树结构扰动函数，实验表明该方法在预测性能上优于标准MNL模型。

详情

Comments: 46 pages, 5 figures. Distributionally robust extensions previously included in earlier versions are no longer part of this manuscript and will be presented separately

英文摘要

The Perturbed Utility Model (PUM) framework provides a generalization of discrete choice analysis, unifying models like Multinomial Logit (MNL) and Sparsemax through convex optimization. However, standard Maximum Likelihood Estimation (MLE) encounters theoretical and computational limitations when applied to this broader class, particularly regarding non-convexity and instability in sparse regimes. To address these issues, this paper introduces a unified estimation framework for PUMs based on the Fenchel-Young loss. By leveraging the intrinsic convex conjugate structure of the choice probabilities, we demonstrate that the Fenchel-Young estimator guarantees global convexity, providing a stable alternative to MLE that accommodates both dense and sparse choice kernels. Furthermore, we establish the framework's asymptotic consistency and normality under standard regularity conditions. Leveraging the tractability of the Fenchel-Young estimator, we further develop a Parametric Basis Estimation (PBE) procedure that estimate utility parameters jointly with a tree-structured perturbation function within a pre-specified basis family. PBE employs a bi-level optimization architecture that parameterizes the unknown perturbation as a learnable convex combination of basis functions. For any fixed perturbation structure, the inner Fenchel--Young estimation problem is globally convex in the utility parameters, yielding a well-defined solution mapping that can be differentiated under regularity conditions. Empirical validation on the Swissmetro dataset demonstrates that the proposed framework improves predictive performance, as measured by the Brier score and Brier Skill Score, compared to the standard MNL baseline.

URL PDF HTML ☆

赞 0 踩 0

2511.08559 2026-05-15 stat.ME

Reluctant Transfer Learning in Penalized Regressions for Individualized Treatment Rules under Effect Heterogeneity

Eun Jeong Oh, Min Qian

AI总结本文研究了在治疗效应异质性背景下，如何通过迁移学习方法更新个性化治疗规则（ITR）模型以适应新数据集中的治疗-协变量关系变化。提出了一种“迟疑迁移学习”（RTL）框架，通过选择性地迁移源模型的关键组件（如回归系数），在无需访问源数据个体信息的情况下实现高效模型适应。该方法仅在提升目标数据集性能时进行模型调整，控制模型复杂度并增强泛化能力，适用于多治疗组场景，并提供了最优ITR与估计ITR价值差异的遗憾界，实验表明其优于现有方法。

2502.00270 2026-05-15 cs.LG cs.AI stat.ML

DUET: Optimizing Training Data Mixtures via Feedback from Unseen Evaluation Tasks

Zhiliang Chen, Gregory Kang Ruey Lau, Chuan-Sheng Foo, Bryan Kian Hsiang Low

AI总结本文研究了如何在未知的下游评估任务下优化大型语言模型的训练数据混合问题。由于实际任务数据往往不可见，传统数据选择方法难以适用，作者提出了一种基于反馈的优化方法DUET，结合影响函数与贝叶斯优化，实现了无需任务数据先验知识的全局到局部的数据混合优化。实验表明，DUET在多种语言任务中优于现有方法，展示了其在未知任务设置下的有效性。

2412.03992 2026-05-15 stat.ML cs.LG math.ST stat.TH

How well behaved is finite dimensional Diffusion Maps?

Wenyu Bo, Marina Meilă

AI总结本文研究有限维扩散映射（Diffusion Maps）在嵌入子流形时的几何性质及其误差界。在一系列关于子流形的假设下，作者推导了在扩散映射变换后仍保持的几何特性，如近似均匀密度、有限多项式逼近和曲率半径等。基于这些性质，他们严格界定了扩散映射嵌入的误差，并量化了估计切空间与真实切空间之间的偏差，为理解扩散映射在实际应用中的性能和可靠性提供了坚实的理论基础。

2409.19129 2026-05-15 math.ST stat.TH

Consistency of Graphical Model-based Clustering: Robust Clustering using Bayesian Spanning Forest

Yu Zheng, Leo L. Duan, Arkaprava Roy

AI总结本文研究了基于图模型的聚类方法在数据生成过程与假设模型不一致时的鲁棒性问题。作者提出使用贝叶斯生成森林方法，通过节点划分的集成后验分布进行聚类估计，并在无需完全支持分离的条件下，证明了当数据来自未知的组件分布且满足一定渐近分离条件时，后验分布会集中于真实聚类划分，从而实现聚类结果的一致性。该结果适用于固定或随样本量增长的聚类数，并给出了误分类率的上界，表明图模型是混合模型之外一种有效的聚类方法。

2209.11315 2026-05-15 stat.ME

Robust beta regression through the logit transformation

Yuri S. Maluf, Silvia L. P. Ferrari, Francisco F. Queiroz

AI总结本文研究了在存在异常值情况下如何提高贝塔回归模型的鲁棒性。作者提出了一种基于对数变换的稳健估计方法，避免了现有方法对参数空间的严格限制，提升了模型的适用性。该方法不仅具有良好的渐近性质，还引入了稳健的Wald型检验，并通过仿真和实际数据应用验证了其有效性。

2202.01697 2026-05-15 stat.ME

Power logit regression for modeling bounded data

Francisco Felipe Queiroz, Silvia Lopes Paula Ferrari

AI总结本文提出了一类用于建模有界连续数据的新型回归模型——幂对数回归模型，该模型假设响应变量服从一个包含中位数、离散参数和偏态参数的三参数分布族。文章提供了完整的似然推断与诊断分析工具，并介绍了新的R语言包PLreg。通过实际和模拟数据的应用，展示了所提模型及其统计工具和计算包的优势。