A Necessary and Sufficient Condition for Size Controllability of Heteroskedasticity Robust Test Statistics
异方差稳健检验统计量尺寸可控性的一个充要条件
AI总结 针对回归模型中单个约束检验,给出了异方差稳健检验统计量尺寸可控性的充要条件,改进了现有仅充分条件的结果。
Comments Clarification in Footnote 15 added
异方差稳健检验统计量尺寸可控性的一个充要条件
AI总结 针对回归模型中单个约束检验,给出了异方差稳健检验统计量尺寸可控性的充要条件,改进了现有仅充分条件的结果。
Comments Clarification in Footnote 15 added
插值分位数估计:桥接分位数与均值的统一框架
AI总结 提出三类在经典分位数与样本均值之间连续插值的估计量,基于平滑L1损失构建统一M估计框架,证明一致性和渐近正态性,并揭示轻尾和重尾分布下的不同效率特性。
超越预测的良性过拟合:普通最小二乘插值器
发表机构 * Department of Data Sciences & Operations, University of Southern California(数据科学与运营系,南加州大学) ; Department of Statistics, University of California, Davis(统计学系,加州大学戴维斯分校) ; Department of Statistics, University of California, Berkeley(统计学系,加州大学伯克利分校) ; Google DeepMind(谷歌DeepMind)
AI总结 本文研究过参数化线性模型中最小ℓ2范数OLS插值器的参数估计与推断性质,推导了留k法、遗漏变量偏误公式和Frisch-Waugh-Lovell定理的过参数化版本,并扩展了高斯-马尔可夫定理。
Comments This work is accepted for publication in Biometrika
加权贝叶斯共形预测
发表机构 * Technical University of Munich(慕尼黑技术大学) ; Massachusetts Institute of Technology(麻省理工学院)
AI总结 提出加权贝叶斯共形预测(WBCP),通过加权Dirichlet先验推广贝叶斯共形预测到重要性加权设置,理论证明有效样本量决定后验方差,并提供更丰富的条件覆盖不确定性。
异质环境下的不变分位数回归
AI总结 针对多环境数据集提出不变分位数回归框架,通过核平滑估计器利用环境间不变性实现因果发现和内生性克服。
Comments 25 pages, 4 figures
评估旨在扩大筛查和改善结果的策略总效应的因果框架
AI总结 针对集群随机试验中多层次、缺失数据和中介效应问题,提出反事实分层效应定义总效应,并扩展两阶段目标最小损失估计(TMLE)进行识别和估计。
Comments 20 pages, 3 figures, accepted at "Statistics in Medicine"
气象学中基于回归的因果推断实用入门(I):所有混杂因素可测
AI总结 介绍在非时间序列场景下,利用匹配方法进行因果推断,提供气象学应用实例和R代码。
气象学中基于回归的因果推断实用入门(二):未测量的混杂因素
AI总结 介绍在未测量混杂因素存在时,利用工具变量法通过回归估计因果效应,并以气象数据为例说明工具变量选择的重要性。
高维离散协变量下的因果推断
AI总结 研究高维离散协变量下因果效应的估计问题,证明常用估计量的均方误差界为d²/n²+1/n,并给出极小化下界,提出利用效应同质性和先验知识的新估计量以加速收敛。
Comments 74 pages, 9 figures
环境地图的实用预测:一种函数型数据方法
AI总结 提出一种基于函数型数据分析的统计方法,用于预测随时间变化的地理区域环境数据,通过整合时空依赖关系生成预测表面,并以德国地面臭氧浓度预测为例验证其有效性。
折叠传输MCMC:对称贝叶斯模型的可认证商后验计算
发表机构 * Wuhan University of Technology(武汉理工大学)
AI总结 针对对称贝叶斯模型中的冗余多峰性导致MCMC收敛诊断退化的问题,提出Folded Transport MCMC方法,通过在对称群的基本域上构建独立采样器直接对商后验进行推断,并利用LCNF振荡认证框架在商度量下提供可证明的认证下界。
Comments 50 pages (including supplementary material), 5 figures, 6 tables. Submitted to Journal of Computational and Graphical Statistics
临床试验设计操作特性的Q-近似
AI总结 提出Q-近似方法,通过二次近似似然函数替代完整数据模拟,快速评估临床试验的操作特性,计算效率比蒙特卡罗模拟高150-1900倍。
概率函数对函数非线性自回归模型用于随机动力系统的仿真与可靠性分析
AI总结 提出F2NARX模型,从函数对函数回归角度改进NARX方法,结合PCA和高斯过程回归实现概率预测,并通过主动学习高效估计首次穿越失效概率。
鲁棒的、部分存活的粒子Metropolis-Hastings算法:基于Frankenfilter
AI总结 针对隐马尔可夫模型中条件似然为零导致粒子滤波失效的问题,提出Frankenfilter,通过固定模拟次数上下限并设定成功目标,实现鲁棒且高效的似然估计,在伪边际Metropolis-Hastings中比标准粒子滤波效率提高2-3倍。
非线性矩阵分解的交替方向乘子法
发表机构 * University of Mons(蒙斯大学)
AI总结 提出基于交替方向乘子法(ADMM)的算法求解非线性矩阵分解(NMD),支持多种非线性函数和损失函数,在真实数据集上验证了适用性和效率。
Comments 16 pages, 7 figures. v3: Revised version: added new experiments and comparisons. Code available from https://gitlab.com/Atharva05/admm-for-nmd
用于高效可扩展数据同化的流匹配
发表机构 * The Computing and Mathematical Sciences Department, California Institute of Technology(加州理工学院计算与数学科学系) ; Department of Mathematics and Scientific Computing and Imaging Institute, University of Utah(犹他大学数学与科学计算系和成像研究所)
AI总结 提出基于流匹配的无训练集成流滤波器(EnFF),通过蒙特卡洛估计和局部化引导加速高维非线性数据同化,在成本-精度权衡和可扩展性上优于现有方法。
Comments revamp presentation, add experiments
走向实用的PDMP采样:Metropolis调整、局部自适应步长和基于NUTS的时间长度
AI总结 针对PDMP采样需要计算模型特定界限的难题,提出Metropolis调整近似、自适应步长机制和NUTS启发的路径长度选择,集成得到双重自适应PDMP采样器,提升鲁棒性和效率。
信息论与统计学习
AI总结 本文是Cover & Thomas《信息论基础》第三版的章节预印本,系统介绍了散度度量在模型训练中的作用,涵盖线性回归、生成扩散模型等,并给出了扩散模型更系统的推导。
基于注意力的PCA
AI总结 本文研究了注意力机制在无监督问题PCA中的表现,证明在高斯数据上训练时,softmax和线性注意力层学习的参数与协方差矩阵的主特征向量对齐,建立了与PCA的直接联系,并扩展到上下文设置中。
学习模拟混沌:对抗最优传输正则化
发表机构 * Department of Mechanical and Aerospace Engineering, North Carolina State University, Raleigh, NC(北卡罗来纳州立大学机械与航空航天工程系) ; Department of Electrical and Computer Engineering, Tufts University, Medford, MA(塔夫茨大学电气与计算机工程系) ; Work performed while at the University of Campinas(在坎皮纳斯大学工作期间)
AI总结 针对混沌动力学模拟中长程统计保真度低的问题,提出基于对抗最优传输的目标函数,联合学习高质量汇总统计量和物理一致的模拟器,理论分析与实验验证了Sinkhorn散度和WGAN对偶形式的有效性。
高维经验风险最小化中高斯普适性破坏的表征
发表机构 * School of Data Science, The Chinese University of Hong Kong, Shenzhen, China ; Huawei Noah's Ark Lab, Huawei Technologies, Paris, France ; School of Electronic Information ; Communications, Huazhong University of Science \& Technology, China
AI总结 通过将凸高斯极小极大定理推广到非高斯数据,刻画了高维经验风险最小化估计量的渐近分布,揭示了高斯普适性的适用范围与局限。
Comments 28 pages, 5 figures, 1 table
Journal ref ICML 2026
使用正则化稳定赌博机:精确遗憾与定量中心极限定理
发表机构 * Department of Statistics, Rutgers University(罗切斯特大学统计系) ; Indian Statistical Institute, Kolkata(加尔各答印度统计研究所)
AI总结 本文提出一种精细的稳定性条件,证明正则化随机镜像下降算法满足该条件,并推导出自适应采样下经验奖励估计的非渐近Berry-Esseen界、匹配的遗憾上下界,以及抗腐败下的渐近正态性,同时揭示正则化是有效推断的必要代价。
Comments Updated rate of convergence and precise regret in version 2
元流映射实现可扩展的奖励对齐
发表机构 * University of Oxford(牛津大学) ; Harvard University(哈佛大学) ; Kempner Institute(凯普纳研究所)
AI总结 提出元流映射(MFMs)框架,通过可微分的单步后验采样实现高效价值函数估计,从而无需轨迹模拟即可进行推理时引导和离策略微调,显著降低计算成本。
具有多于 $\sqrt{n}$ 个社区的随机块模型的相变
发表机构 * Institut für Mathematik – Universität Potsdam, Potsdam, Germany(波恩大学数学研究所,德国波恩) ; Laboratoire de Mathématiques d’Orsay, Université Paris-Saclay, CNRS, France(奥赛数学实验室,巴黎-萨克雷大学,法国 CNRS) ; INRAE, Institut Agro, MISTEA, Univ. Montpellier, France(国家农业研究院,蒙彼利埃大学,法国)
AI总结 本文证明在随机块模型中,当社区数 $K\geq \sqrt{n}$ 时,低度多项式在 Chin 等人提出的阈值以下无法恢复社区,而通过计数特定子图可在多项式时间内实现恢复,支持了新相变阈值的猜想。
面向词嵌入迁移学习的组稀疏矩阵分解
发表机构 * W. P. Carey School of Business, Arizona State University(亚利桑那州立大学韦伯商学院) ; University of Pennsylvania(宾夕法尼亚大学) ; Wharton School, University of Pennsylvania(宾夕法尼亚大学沃顿商学院)
AI总结 提出一种基于组稀疏惩罚的两阶段估计器,通过结合大规模语料和少量领域数据高效迁移学习领域特定的词嵌入,并证明了其泛化误差界和非凸目标函数的局部最优与全局最优统计等价。
共享效应组合预测因子的灵活聚合用于微生物组关联分析
AI总结 提出BRACE方法,通过尖峰-聚类先验和投影约束高斯先验,实现微生物组数据的自适应聚类和变量选择,识别与结果共享效应的关键特征。
基于条件原理的宏观层面赔款准备金模型无关自助法
AI总结 本文提出一种满足条件原理的自助法,用于宏观层面赔款准备金估计,通过Dirichlet-Gamma层次结构实现精确校准,改进了现有自助法的覆盖误差问题。
Comments 23 pages, v2: correction of the interpretation of the $κ$ parameter
负二项链梯法:一种完整的似然模型用于赔款准备
AI总结 本文提出负二项链梯模型,通过泊松-伽马构造自然产生负二项分布,提供更清晰的生成解释,统一了链梯方法家族,并通过模拟验证了模型的稳健性。
Comments 35 pages, 3 figures, v2: correction of the interpretation of the $κ$ parameter
电力系统中碳成本传导率:来自欧盟排放交易体系下意大利的证据
AI总结 研究欧盟排放交易体系下碳成本在意大利电力市场的传导率,基于2016-2024年数据,采用自回归线性回归模型,发现全国平均传导率约32%,且各市场区域存在显著异质性。
希波克拉底效用与现状偏见
AI总结 本文通过简单例子揭示一种重视失去生命多于拯救生命的效用函数,其适用范围比最初看起来有限得多。
瑞士制国际象棋锦标赛与不公平性
AI总结 研究瑞士制国际象棋锦标赛中轮次奇偶性导致的不公平性,发现多执白一局的选手得分显著更高,建议采用偶数轮次和平衡颜色分配机制。
Comments 13 pages, 4 tables
大规模多路网络中的统计推断
AI总结 提出一种基于分类任务的多路网络结构参数估计方法,无需固定效应数量与结构假设,避免 incidental parameter 问题,在稀疏网络中比 PPML 更快且置信区间更可靠,应用于法国医疗政策因果效应分析。
Comments Working paper
环境自适应协变量选择:学习何时利用虚假相关进行分布外预测
发表机构 * Department of Statistics, University of Michigan, Ann Arbor(统计系,密歇根大学,安阿伯分校)
AI总结 针对分布外预测中协变量选择问题,提出环境自适应算法,根据环境特征动态选择协变量集,在模拟和实际数据中优于静态方法。
理解入门数据科学教师的教学内容知识:一个初步框架
AI总结 通过访谈14名入门数据科学教师并分析教学大纲,探索其教学内容知识(PCK)的关键组成部分,为教师发展提供见解,并建立IDS领域的PCK初步框架。
Comments 67 pages, 4 tables
全球生活便利指数:面向主要经济体纵向分析的机器学习框架
发表机构 * Transitional Artificial Intelligence Research Group, School of Mathematics and Statistics(过渡人工智能研究组,数学与统计学学院) ; Centre for Artificial Intelligence and Innovation(人工智能与创新中心) ; Pingla Institute(Pingla研究所)
AI总结 提出全球生活便利指数,结合社会经济和基础设施因素,利用机器学习处理缺失数据,并通过主成分分析和因子分析降维,为政策制定者提供改善生活质量的可操作工具。
有限样本下弱依赖条件下期望签名估计的界限
AI总结 本文研究了在弱依赖条件下,从单一长依赖轨迹估计期望签名的有限样本界限,通过块平均估计器证明了非渐近的均方误差界,并探讨了在不同Hurst指数下的收敛性。
Comments 59 pages, 1 figure
平稳时间序列分析的移位算子演算
AI总结 本文为平稳时间序列建模建立了严格的移位算子演算,证明了不同函数族下转移函数算子的存在性和等距性,并统一了平稳过程可逆性与转移函数算子可逆性的概念。
Comments 7 pages
高维量子系统的局部温和态认证
AI总结 研究局部温和量子态认证中非破坏性测量的信息代价,推导出样本复杂度为Θ(d³/(ε²α²)),揭示了α-温和性惩罚与希尔伯特空间维度d的线性关系。
单调二元回归中弱特征影响对NPMLE的影响
AI总结 研究单调二元回归中非参数最大似然估计在弱特征关系下的极限分布,发现一种新的分布连续插值于两个极端情况,并改进了小样本近似。
Comments Added Theorem 3.3 and several visualizations