Flexible modeling of bimodal distributions via skewed-$t$ mixtures
双峰分布的灵活建模:基于偏斜-t分布的混合模型
AI总结 提出基于Fernández和Steel (1998)偏斜-t分布的混合模型,通过EM算法进行极大似然估计,并开发似然比检验,用于拟合双峰、偏斜和厚尾数据,在标准普尔500指数中验证了双峰性。
双峰分布的灵活建模:基于偏斜-t分布的混合模型
AI总结 提出基于Fernández和Steel (1998)偏斜-t分布的混合模型,通过EM算法进行极大似然估计,并开发似然比检验,用于拟合双峰、偏斜和厚尾数据,在标准普尔500指数中验证了双峰性。
拉丁方设计的不确定固定效应模型分析
AI总结 针对无频率稳定性的不确定实验数据,建立拉丁方设计的不确定固定效应模型,提出三种估计方法并构建置信区间,进行不确定齐性检验和常见检验,通过数值模拟和实例验证模型有效性。
移位指数模型的最小风险与成本高效双序贯检验框架及其在降水数据中的应用
AI总结 提出一种双序贯抽样框架,通过控制第一类错误概率并最小化包含第二类错误和抽样成本的损失函数,检验两个移位指数模型的位置参数差异,具有一阶、二阶效率和风险效率。
多重检验中的无标签校准
AI总结 针对多重检验中无法观测真实标签的难题,利用有序p值间距构造伪标签,实现局部错误发现率的校准,并揭示q值在心理学和神经科学文献中可能严重失准。
机器学习集成小波收缩 (MLShrink)
AI总结 提出MLShrink,结合小波收缩与机器学习,通过双阈值对中间带系数进行数据自适应分类,保留经典阈值简单性,理论证明其非扩张性和oracle一致性,在非平滑信号上表现优异。
SCOPE 收缩:小波去噪的统一框架
AI总结 提出基于对称单峰分布累积分布函数的SCOPE收缩族,通过两个可解释参数分离尺度与形状效应,实现局部强收缩与渐近无偏的平衡,在小波去噪中性能与可解释性兼具。
基于LLM启发式的零样本主动特征获取
发表机构 * Faculty of EE, Technion(技术学院电子工程系) ; Faculty of Medicine, Technion(技术学院医学院) ; CytoReason ; NVIDIA
AI总结 提出通过LLM启发式获取马尔可夫随机场充分统计量的零样本主动特征获取框架,解决数据标注不足问题,在IBD患者诊断中优于现有方法。
异方差稳健检验统计量尺寸可控性的一个充要条件
AI总结 针对回归模型中单个约束检验,给出了异方差稳健检验统计量尺寸可控性的充要条件,改进了现有仅充分条件的结果。
Comments Clarification in Footnote 15 added
插值分位数估计:桥接分位数与均值的统一框架
AI总结 提出三类在经典分位数与样本均值之间连续插值的估计量,基于平滑L1损失构建统一M估计框架,证明一致性和渐近正态性,并揭示轻尾和重尾分布下的不同效率特性。
超越预测的良性过拟合:普通最小二乘插值器
发表机构 * Department of Data Sciences & Operations, University of Southern California(数据科学与运营系,南加州大学) ; Department of Statistics, University of California, Davis(统计学系,加州大学戴维斯分校) ; Department of Statistics, University of California, Berkeley(统计学系,加州大学伯克利分校) ; Google DeepMind(谷歌DeepMind)
AI总结 本文研究过参数化线性模型中最小ℓ2范数OLS插值器的参数估计与推断性质,推导了留k法、遗漏变量偏误公式和Frisch-Waugh-Lovell定理的过参数化版本,并扩展了高斯-马尔可夫定理。
Comments This work is accepted for publication in Biometrika
通过自适应谱收缩的过拟合高维矩阵分解
AI总结 提出EigenBayes方法,通过谱估计和自适应经验贝叶斯校准超参数,实现快速且具有不确定性量化的过拟合因子模型,在数值实验和基因组学应用中优于现有方法。
变分共识蒙特卡洛用于贝叶斯混合模型
AI总结 提出变分共识蒙特卡洛方法扩展至过拟合贝叶斯混合模型,通过新颖的聚类匹配算法和聚合策略,在联邦学习设置下推断聚类数和所有参数,并在模拟和真实电子健康记录数据上验证了有效性。
利用尾部进行自适应
AI总结 研究非参数贝叶斯中基于p-指数尾先验的后验收缩率,发现p越小收缩越快,且p→0时可实现光滑性自适应,应用于白噪声回归和ReLU神经网络。
Comments 59 pages, 3 figures
加权贝叶斯共形预测
发表机构 * Technical University of Munich(慕尼黑技术大学) ; Massachusetts Institute of Technology(麻省理工学院)
AI总结 提出加权贝叶斯共形预测(WBCP),通过加权Dirichlet先验推广贝叶斯共形预测到重要性加权设置,理论证明有效样本量决定后验方差,并提供更丰富的条件覆盖不确定性。
使用贝叶斯非参数和半参数修正的因果中介分析案例研究
AI总结 提出截断富集狄利克雷过程混合模型估计自然直接和间接效应,结合高效MCMC算法和基于有效影响函数的一步后验修正,解决贝叶斯非参数中因果估计量的可靠推断问题。
因果推断中的迭代期望定律入门
AI总结 本文介绍迭代期望定律及其在因果效应识别中的应用,通过g公式的两种非参数等价形式(NICE和ICE)和三个数值示例阐明其数学直觉。
马尔可夫决策过程中奖励非随机缺失的缺失感知策略的离线评估
AI总结 针对奖励非随机缺失的离线强化学习问题,提出基于未来状态作为影子变量的识别方法,并利用桥函数和min-max估计器恢复条件均值奖励,实现缺失感知策略的离线评估。
Comments Accepted at ICML 2026. 31 pages, 6 figures
基于核的协变量函数平衡法用于成分处理下的因果推断
AI总结 针对成分处理(暴露位于单纯形)的因果效应估计,提出基于核的协变量函数平衡加权法,通过最小化再生核希尔伯特空间中的最坏情况平衡误差构造权重,并构建增强加权估计量,实现√n一致性。
Comments 40 pages, 3 figures
基于LLM的A/B测试的统计基础:用于人类因果推断的替代指标框架
发表机构 * Spotify USA, Inc.(Spotify美国公司)
AI总结 提出替代指标理论框架,证明在弱于分布等价条件下,校准LLM输出可识别平均处理效应,并分析随机性带来的偏差与方差。
异质环境下的不变分位数回归
AI总结 针对多环境数据集提出不变分位数回归框架,通过核平滑估计器利用环境间不变性实现因果发现和内生性克服。
Comments 25 pages, 4 figures
评估旨在扩大筛查和改善结果的策略总效应的因果框架
AI总结 针对集群随机试验中多层次、缺失数据和中介效应问题,提出反事实分层效应定义总效应,并扩展两阶段目标最小损失估计(TMLE)进行识别和估计。
Comments 20 pages, 3 figures, accepted at "Statistics in Medicine"
气象学中基于回归的因果推断实用入门(I):所有混杂因素可测
AI总结 介绍在非时间序列场景下,利用匹配方法进行因果推断,提供气象学应用实例和R代码。
气象学中基于回归的因果推断实用入门(二):未测量的混杂因素
AI总结 介绍在未测量混杂因素存在时,利用工具变量法通过回归估计因果效应,并以气象数据为例说明工具变量选择的重要性。
高维离散协变量下的因果推断
AI总结 研究高维离散协变量下因果效应的估计问题,证明常用估计量的均方误差界为d²/n²+1/n,并给出极小化下界,提出利用效应同质性和先验知识的新估计量以加速收敛。
Comments 74 pages, 9 figures
具有错误发现率控制的超图变量选择
AI总结 针对预测变量复杂依赖结构导致变量选择方法功效降低的问题,提出基于超图的选择方法,在控制错误发现率的同时提高选择功效。
Comments 28 pages, 4 figures
环境地图的实用预测:一种函数型数据方法
AI总结 提出一种基于函数型数据分析的统计方法,用于预测随时间变化的地理区域环境数据,通过整合时空依赖关系生成预测表面,并以德国地面臭氧浓度预测为例验证其有效性。
AK-MCS-C2: 具有共形认证的主动克里金蒙特卡洛模拟方法用于失效概率估计
AI总结 提出一种结合主动克里金蒙特卡洛模拟与共形预测的主动学习框架,通过自适应交叉共形策略和J+GP共形估计器,在少量样本下提供无分布假设的预测误差保证,提高极限状态面附近样本分类可靠性,从而提升失效概率估计的准确性和鲁棒性。
DASH: 一种用于大规模凸MIQP的降维方法及其在子集投资组合选择中的应用
AI总结 提出DASH降维方法,通过减少变量层次改善大规模凸MIQP求解器性能,在子集投资组合选择中显著提升Gurobi难以求解问题的初始解质量。
建立 PDMP 采样器的 $\Omega(\sqrt{d})$ 复杂度下界及如何突破:针对高斯尾目标的一个亚 $\sqrt{d}$ 算法
AI总结 本文证明分段确定性马尔可夫过程采样器在标准设置下具有 $\Omega(\sqrt{d})$ 复杂度下界,并通过放宽目标密度连续时间不变性假设,提出一种新方案,对高斯尾目标实现 $O(d^\alpha)$($\alpha\in[0.2,0.3]$)的经验复杂度。
平坦联络:分层MCMC中的汇集因子与中心化几何
AI总结 研究分层MCMC中中心化/非中心化障碍的几何原因,证明Fisher信息诱导的联络是平坦的,障碍源于统计上的汇集因子π_j,并据此提出诊断方法。
Comments 39 pages, 9 figures, accompanying R package
计算可识别性
发表机构 * New York University(纽约大学)
AI总结 提出“计算可识别性”框架,通过有限计算搜索过程在指定误差容限内找到经验估计量,从而解决理论可识别性在有限样本、模糊图标准等实际场景中的不足。
折叠传输MCMC:对称贝叶斯模型的可认证商后验计算
发表机构 * Wuhan University of Technology(武汉理工大学)
AI总结 针对对称贝叶斯模型中的冗余多峰性导致MCMC收敛诊断退化的问题,提出Folded Transport MCMC方法,通过在对称群的基本域上构建独立采样器直接对商后验进行推断,并利用LCNF振荡认证框架在商度量下提供可证明的认证下界。
Comments 50 pages (including supplementary material), 5 figures, 6 tables. Submitted to Journal of Computational and Graphical Statistics
临床试验设计操作特性的Q-近似
AI总结 提出Q-近似方法,通过二次近似似然函数替代完整数据模拟,快速评估临床试验的操作特性,计算效率比蒙特卡罗模拟高150-1900倍。
概率函数对函数非线性自回归模型用于随机动力系统的仿真与可靠性分析
AI总结 提出F2NARX模型,从函数对函数回归角度改进NARX方法,结合PCA和高斯过程回归实现概率预测,并通过主动学习高效估计首次穿越失效概率。
鲁棒的、部分存活的粒子Metropolis-Hastings算法:基于Frankenfilter
AI总结 针对隐马尔可夫模型中条件似然为零导致粒子滤波失效的问题,提出Frankenfilter,通过固定模拟次数上下限并设定成功目标,实现鲁棒且高效的似然估计,在伪边际Metropolis-Hastings中比标准粒子滤波效率提高2-3倍。
非线性矩阵分解的交替方向乘子法
发表机构 * University of Mons(蒙斯大学)
AI总结 提出基于交替方向乘子法(ADMM)的算法求解非线性矩阵分解(NMD),支持多种非线性函数和损失函数,在真实数据集上验证了适用性和效率。
Comments 16 pages, 7 figures. v3: Revised version: added new experiments and comparisons. Code available from https://gitlab.com/Atharva05/admm-for-nmd
用于高效可扩展数据同化的流匹配
发表机构 * The Computing and Mathematical Sciences Department, California Institute of Technology(加州理工学院计算与数学科学系) ; Department of Mathematics and Scientific Computing and Imaging Institute, University of Utah(犹他大学数学与科学计算系和成像研究所)
AI总结 提出基于流匹配的无训练集成流滤波器(EnFF),通过蒙特卡洛估计和局部化引导加速高维非线性数据同化,在成本-精度权衡和可扩展性上优于现有方法。
Comments revamp presentation, add experiments
走向实用的PDMP采样:Metropolis调整、局部自适应步长和基于NUTS的时间长度
AI总结 针对PDMP采样需要计算模型特定界限的难题,提出Metropolis调整近似、自适应步长机制和NUTS启发的路径长度选择,集成得到双重自适应PDMP采样器,提升鲁棒性和效率。
SSH-Net: 一种用于竞争风险下预测失效时间分布函数的深度神经网络及其在GPU数据上的应用
AI总结 提出结构化分段风险深度神经网络(SSH-Net),通过将网络结构与数据结构关联,允许不同协变量组通过子网络影响预测,在竞争风险框架下预测失效时间分布函数,仿真和GPU数据验证了准确性。
AURA: 用于LLM作为评判审计的自适应不确定性感知精炼
AI总结 提出AURA框架,通过自适应不确定性感知精炼,在少量人工验证下迭代学习人类一致性信号,优先审核不确定比较,提升LLM评判的可靠性。
一种无求解器的预测后优化训练方法
AI总结 提出一种基于测度变换的决策聚焦学习管道,通过无求解器代理损失实现预测后优化中预测模型的高效训练,理论保证Fisher一致性,训练时间降低数个数量级。
Comments Accepted by ICML 2026
标量交互的表征限制:一种干预分解
AI总结 本文证明标量交互指标混淆了唯一性、冗余性和协同性,并提出Stochastic Hi-Fi方法,通过干预掩码推理分解每个特征的U/R/S轮廓,在表格和图像任务中恢复被标量基线遗漏的结构。
匹配市场遇上累积前景理论:迈向最优和对抗鲁棒学习
发表机构 * Indian Institute of Technology Bombay(印度理工学院孟买分校)
AI总结 研究基于累积前景理论(CPT)的竞争性双边匹配市场多智能体多臂赌博机问题,提出最优遗憾界算法并扩展到对抗性市场。
Comments Accepted at ECML-PKDD 2026, Naples, Italy
LLM后训练中应比较哪些对?
发表机构 * Columbia University(哥伦比亚大学)
AI总结 研究偏好后训练中如何选择最具信息量的比较对,提出基于采样设计的比较策展方法,通过DPO训练的理论分析给出优化准则,实验证明能提升样本效率。
LayerNorm Transformer 中的代数死方向:一种仅需前向传播的大语言模型规模诊断方法
发表机构 * IIIT, Hyderabad(海得拉巴国际信息技术学院)
AI总结 本文发现 LayerNorm 的逆尺度方向是后最终归一化中心激活协方差矩阵的精确代数核,可仅从参数中读取死方向,无需前向或后向传播,并在 14 个预训练模型上验证了其有效性。
Comments 34 pages, 7 figures, 6 tables. Empirical companion to arXiv:2606.05957
最优确定性多校准与全预测
发表机构 * University of Pennsylvania(宾夕法尼亚大学)
AI总结 本文提出一种确定性算法,实现多校准的极小化最优样本复杂度,并推广到结果不可区分性,解决确定性预测器是否必要的问题。
具有有界噪声的随机线性上下文赌博机:一种集合成员方法
AI总结 针对有界奖励噪声的随机线性上下文赌博机,提出基于集合成员估计和乐观原则的SME-OFU算法,实现O(log T)的遗憾界,优于次高斯噪声下的最优界。
Comments 23 pages, 1 figure
基于插值的梯度下降的预言复杂度
发表机构 * Purdue University(普渡大学)
AI总结 提出分段多项式插值梯度下降(PPI-GD)方法,通过数据域等距点查询一阶预言构造多项式插值近似全梯度,在强凸和非凸损失下分析预言复杂度,证明在数据维数受限且损失足够光滑时优于多种GD变体。
Comments 16 pages, 2 figures
公共噪声Wasserstein不确定性下的平均场控制鲁棒$Q$-学习
AI总结 提出一种针对公共噪声分布Wasserstein不确定性的离散时间平均场控制鲁棒$Q$-学习算法,结合量化投影与Wasserstein对偶,证明同步和异步学习的收敛性及有限时间界,并在系统风险和流行病模型中验证鲁棒性-性能权衡。
训练与泛化的统计特性
AI总结 从物理学角度研究深度学习的关键特征和意外现象,回顾神经缩放定律及其与物理问题中约束和归纳偏置的相互作用。
Comments 32 pages, 3 figures. Part of the VERaiPHY initiative
信息论与统计学习
AI总结 本文是Cover & Thomas《信息论基础》第三版的章节预印本,系统介绍了散度度量在模型训练中的作用,涵盖线性回归、生成扩散模型等,并给出了扩散模型更系统的推导。
基于注意力的PCA
AI总结 本文研究了注意力机制在无监督问题PCA中的表现,证明在高斯数据上训练时,softmax和线性注意力层学习的参数与协方差矩阵的主特征向量对齐,建立了与PCA的直接联系,并扩展到上下文设置中。
学习模拟混沌:对抗最优传输正则化
发表机构 * Department of Mechanical and Aerospace Engineering, North Carolina State University, Raleigh, NC(北卡罗来纳州立大学机械与航空航天工程系) ; Department of Electrical and Computer Engineering, Tufts University, Medford, MA(塔夫茨大学电气与计算机工程系) ; Work performed while at the University of Campinas(在坎皮纳斯大学工作期间)
AI总结 针对混沌动力学模拟中长程统计保真度低的问题,提出基于对抗最优传输的目标函数,联合学习高质量汇总统计量和物理一致的模拟器,理论分析与实验验证了Sinkhorn散度和WGAN对偶形式的有效性。
高维经验风险最小化中高斯普适性破坏的表征
发表机构 * School of Data Science, The Chinese University of Hong Kong, Shenzhen, China ; Huawei Noah's Ark Lab, Huawei Technologies, Paris, France ; School of Electronic Information ; Communications, Huazhong University of Science \& Technology, China
AI总结 通过将凸高斯极小极大定理推广到非高斯数据,刻画了高维经验风险最小化估计量的渐近分布,揭示了高斯普适性的适用范围与局限。
Comments 28 pages, 5 figures, 1 table
Journal ref ICML 2026
使用正则化稳定赌博机:精确遗憾与定量中心极限定理
发表机构 * Department of Statistics, Rutgers University(罗切斯特大学统计系) ; Indian Statistical Institute, Kolkata(加尔各答印度统计研究所)
AI总结 本文提出一种精细的稳定性条件,证明正则化随机镜像下降算法满足该条件,并推导出自适应采样下经验奖励估计的非渐近Berry-Esseen界、匹配的遗憾上下界,以及抗腐败下的渐近正态性,同时揭示正则化是有效推断的必要代价。
Comments Updated rate of convergence and precise regret in version 2
元流映射实现可扩展的奖励对齐
发表机构 * University of Oxford(牛津大学) ; Harvard University(哈佛大学) ; Kempner Institute(凯普纳研究所)
AI总结 提出元流映射(MFMs)框架,通过可微分的单步后验采样实现高效价值函数估计,从而无需轨迹模拟即可进行推理时引导和离策略微调,显著降低计算成本。
具有多于 $\sqrt{n}$ 个社区的随机块模型的相变
发表机构 * Institut für Mathematik – Universität Potsdam, Potsdam, Germany(波恩大学数学研究所,德国波恩) ; Laboratoire de Mathématiques d’Orsay, Université Paris-Saclay, CNRS, France(奥赛数学实验室,巴黎-萨克雷大学,法国 CNRS) ; INRAE, Institut Agro, MISTEA, Univ. Montpellier, France(国家农业研究院,蒙彼利埃大学,法国)
AI总结 本文证明在随机块模型中,当社区数 $K\geq \sqrt{n}$ 时,低度多项式在 Chin 等人提出的阈值以下无法恢复社区,而通过计数特定子图可在多项式时间内实现恢复,支持了新相变阈值的猜想。
面向词嵌入迁移学习的组稀疏矩阵分解
发表机构 * W. P. Carey School of Business, Arizona State University(亚利桑那州立大学韦伯商学院) ; University of Pennsylvania(宾夕法尼亚大学) ; Wharton School, University of Pennsylvania(宾夕法尼亚大学沃顿商学院)
AI总结 提出一种基于组稀疏惩罚的两阶段估计器,通过结合大规模语料和少量领域数据高效迁移学习领域特定的词嵌入,并证明了其泛化误差界和非凸目标函数的局部最优与全局最优统计等价。
锚定之外:使用多层次非锚定元回归(ML-UMR)导航非锚定间接比较
AI总结 针对随机证据缺失时的非锚定治疗比较,提出多层次非锚定元回归(ML-UMR),通过贝叶斯框架联合建模个体与汇总数据,估计多治疗、多研究及目标人群的边际和条件效应,并明确识别假设与可转移性假设。
Comments 20 pages (excluding supplementary material), 5 figures
省略协变量的比例风险模型中的内置选择偏倚:模拟证据与替代方法
AI总结 本文通过模拟和实际数据,证明在随机试验中,即使省略的协变量与处理独立,仍会导致Cox比例风险模型估计的处理风险比存在偏倚,并比较了脆弱模型、加速失效时间模型和Kaplan-Meier曲线等替代方法的稳健性。
混合行政删失与随机删失下的Ghosh-Lin和Fine-Gray模型
AI总结 针对同时存在行政删失和随机删失的数据,提出结合风险集调整和逆概率删失加权的方法,使Ghosh-Lin和Fine-Gray模型得到一致估计。
协变量调整的功能主成分分析用于建模美国人口体力活动的风险率
AI总结 提出基于风险函数的分布分析方法,利用功能主成分分析(FPCA)从腕部加速度计数据中刻画个体活动强度分布变异,优于均值摘要。
一种用于汇总遗传数据的贝叶斯时空最近邻高斯过程模型
AI总结 提出最近邻高斯过程模型,结合序贯蒙特卡洛平方算法,高效推断汇总遗传数据中的单倍型频率,并应用于非洲抗疟药物耐药性遗传数据分析。
意大利西尼罗病毒疫情用量子生命游戏建模
AI总结 使用量子生命游戏细胞自动机模型模拟2025年夏季意大利西尼罗病毒传播,通过优化蚊子出生和移除率,准确拟合局部和区域平均累计感染曲线,并评估环境变化的影响。
利用所有现患和发病事件在生物库研究中进行高效累积发病率估计
AI总结 针对生物库数据中同时包含招募前发病(现患)和随访期间发病的个体,提出一种新的累积发病率函数估计方法,整合所有病例,处理年轻发病且生存期长的疾病,理论证明渐近性质,模拟和UK生物库癌症数据验证其优势。
共享效应组合预测因子的灵活聚合用于微生物组关联分析
AI总结 提出BRACE方法,通过尖峰-聚类先验和投影约束高斯先验,实现微生物组数据的自适应聚类和变量选择,识别与结果共享效应的关键特征。
两样本IV:高效两步估计及过度识别与弱工具变量检验
AI总结 针对两样本IV估计,提出异方差和样本异质性下稳健的两步高效估计方法及过度识别检验,仅需线性回归的汇总统计量,并扩展弱工具变量检验。
高级校准分析与工具:识别随机利率模型校准中的有影响观测值
AI总结 将校准问题嵌入非线性回归理论,证明最小化RMSRE等价于加权最小二乘,开发诊断框架(加权帽子矩阵、影响函数、泛函Delta方法),实证发现杠杆边界主导、有效维度损失及2022年后参数稳定性转变,指出低RMSRE不足以验证校准。
Comments 47 pages, 9 figures, 1 table
具有未知加速参数的可变作业的动态核心分配
AI总结 针对多核系统中具有未知加速参数的可变作业,提出一种迭代学习-控制框架,通过最大似然估计未知参数并求解马尔可夫决策过程更新分配策略,以最小化长期平均作业数。
基于条件原理的宏观层面赔款准备金模型无关自助法
AI总结 本文提出一种满足条件原理的自助法,用于宏观层面赔款准备金估计,通过Dirichlet-Gamma层次结构实现精确校准,改进了现有自助法的覆盖误差问题。
Comments 23 pages, v2: correction of the interpretation of the $κ$ parameter
负二项链梯法:一种完整的似然模型用于赔款准备
AI总结 本文提出负二项链梯模型,通过泊松-伽马构造自然产生负二项分布,提供更清晰的生成解释,统一了链梯方法家族,并通过模拟验证了模型的稳健性。
Comments 35 pages, 3 figures, v2: correction of the interpretation of the $κ$ parameter
电力系统中碳成本传导率:来自欧盟排放交易体系下意大利的证据
AI总结 研究欧盟排放交易体系下碳成本在意大利电力市场的传导率,基于2016-2024年数据,采用自回归线性回归模型,发现全国平均传导率约32%,且各市场区域存在显著异质性。
希波克拉底效用与现状偏见
AI总结 本文通过简单例子揭示一种重视失去生命多于拯救生命的效用函数,其适用范围比最初看起来有限得多。
瑞士制国际象棋锦标赛与不公平性
AI总结 研究瑞士制国际象棋锦标赛中轮次奇偶性导致的不公平性,发现多执白一局的选手得分显著更高,建议采用偶数轮次和平衡颜色分配机制。
Comments 13 pages, 4 tables
大规模多路网络中的统计推断
AI总结 提出一种基于分类任务的多路网络结构参数估计方法,无需固定效应数量与结构假设,避免 incidental parameter 问题,在稀疏网络中比 PPML 更快且置信区间更可靠,应用于法国医疗政策因果效应分析。
Comments Working paper
私有率双稳健推断
AI总结 本文通过局部隐私机制注入噪声保护个体隐私,同时利用率双稳健性实现目标参数的无偏和半参数有效推断,并开发了私有化非参数和参数 nuisance 估计方法。
环境自适应协变量选择:学习何时利用虚假相关进行分布外预测
发表机构 * Department of Statistics, University of Michigan, Ann Arbor(统计系,密歇根大学,安阿伯分校)
AI总结 针对分布外预测中协变量选择问题,提出环境自适应算法,根据环境特征动态选择协变量集,在模拟和实际数据中优于静态方法。
小样本有序情境下的社区检测:德尔菲数据的基准测试框架
AI总结 针对德尔菲数据高维小样本导致的秩亏问题,提出从变量中心协方差模型转向网络中心连接模型,利用社区检测算法识别潜在主题结构,实现结构稳定的降维。
重新思考链接预测中的采样策略
AI总结 提出β-采样方案,研究两阶段采样对链接预测性能的影响,发现缺失链接的结构特征显著影响预测精度,且第二阶段采样策略至关重要。
Comments 19 pages, 5 figures, 3 tables
基于保形预测的概率AI天气预报的严格不确定性量化
AI总结 针对AI概率天气预报校准不足(尤其是极端事件),提出使用保形预测方法,无需分布假设即可数学保证覆盖,应用于三个全球模型(GenCast、NeuralGCM、AIFS-ENS)的温度和降水预报,实现校准不确定性而不牺牲其他概率指标。
对弈的棋谱签名
AI总结 利用粗路径理论的签名变换提取棋局中事件顺序与交互的不变特征,构建签名核双样本检验和时序有效作弊检测方法,在控制错误率的同时显著提升检测能力。
逐点是否无意义?基于图神经网络的降水临近预报的多模态消融研究
发表机构 * Norwegian Meteorological Institute(挪威气象研究所)
AI总结 本研究通过多模态图神经网络系统,消融分析雷达、数值预报、地面观测、卫星数据及训练损失对降水临近预报的影响,发现各模态分别改善不同方面,点观测虽提升局部但需结合损失函数和不确定性表示才能优化雷达场。
QC-GAN: 一种参数高效的四元数Conformer GAN用于高保真语音增强
发表机构 * The Asahi Shimbun Company(朝日新闻社) ; Tokyo Woman's Christian University(东京女子基督教大学)
AI总结 提出参数高效的QC-GAN,结合四元数Conformer生成器和MetricGAN训练,通过汉密尔顿积共享权重减少参数量,在VoiceBank+DEMAND上以0.89M参数达到PESQ 3.48,性能媲美两倍大小模型。
Comments 10 pages, 6 figures and 5 tables. Accepted at Interspeech2026
理解入门数据科学教师的教学内容知识:一个初步框架
AI总结 通过访谈14名入门数据科学教师并分析教学大纲,探索其教学内容知识(PCK)的关键组成部分,为教师发展提供见解,并建立IDS领域的PCK初步框架。
Comments 67 pages, 4 tables
全球生活便利指数:面向主要经济体纵向分析的机器学习框架
发表机构 * Transitional Artificial Intelligence Research Group, School of Mathematics and Statistics(过渡人工智能研究组,数学与统计学学院) ; Centre for Artificial Intelligence and Innovation(人工智能与创新中心) ; Pingla Institute(Pingla研究所)
AI总结 提出全球生活便利指数,结合社会经济和基础设施因素,利用机器学习处理缺失数据,并通过主成分分析和因子分析降维,为政策制定者提供改善生活质量的可操作工具。
Doeblin 曲线
AI总结 提出 Doeblin 曲线概念,量化马尔可夫核在不同散度和功率水平下的收缩行为,并应用于噪声迭代优化、噪声电路可靠计算和差分隐私等领域的更细粒度收缩分析。
Comments 42 pages, 2 figures
Journal ref IEEE Transactions on Information Theory, vol. 72, no. 6, pp. 3556-3596, June 2026
Behrens-Fisher问题的拉普拉斯方程方法
AI总结 针对两独立正态样本方差未知且不等的情况,提出偏微分方程公式,通过正交分解和球面楔概率将分布问题转化为拉普拉斯-狄利克雷边值问题,导出累积分布函数和概率密度的精确有限样本表示,并得到尾部分布展开。
Comments 31 pages, 4 figures
核赌博机中的算法与极小极大复杂度
AI总结 本文通过统一MAIR框架,将GP-UCB与MAMS算法置于共同语言下,提出结合两者优势的安全主算法,并证明在过参数化模型中算法复杂度比类宽极小极大或DEC证书更具信息性。
有限样本下弱依赖条件下期望签名估计的界限
AI总结 本文研究了在弱依赖条件下,从单一长依赖轨迹估计期望签名的有限样本界限,通过块平均估计器证明了非渐近的均方误差界,并探讨了在不同Hurst指数下的收敛性。
Comments 59 pages, 1 figure
平稳时间序列分析的移位算子演算
AI总结 本文为平稳时间序列建模建立了严格的移位算子演算,证明了不同函数族下转移函数算子的存在性和等距性,并统一了平稳过程可逆性与转移函数算子可逆性的概念。
Comments 7 pages
高维量子系统的局部温和态认证
AI总结 研究局部温和量子态认证中非破坏性测量的信息代价,推导出样本复杂度为Θ(d³/(ε²α²)),揭示了α-温和性惩罚与希尔伯特空间维度d的线性关系。
单调二元回归中弱特征影响对NPMLE的影响
AI总结 研究单调二元回归中非参数最大似然估计在弱特征关系下的极限分布,发现一种新的分布连续插值于两个极端情况,并改进了小样本近似。
Comments Added Theorem 3.3 and several visualizations
二维受限角度随机游走的分布
AI总结 研究受限角度二维随机游走的分布,推导两步联合与边缘分布,提供一般步数的数值解及大步数近似,明确支持集的精确描述。
Comments 14 pages, 14 figures
Journal ref IEEE Transactions on Signal Processing, vol. 74, pp. 2316-2330, 2026
发表机构 * Stanford University, Department of Management Science and Engineering and Institute for Computational and Mathematical Engineering(斯坦福大学管理科学与工程系和计算与数学工程研究所) ; Upstart, Inc.(Upstart公司) ; Stanford University, Institute for Computational and Mathematical Engineering(斯坦福大学计算与数学工程研究所)
发表机构 * Banking Academy of Vietnam(越南银行学院) ; Vietnam Academy of Science and Technology(越南科学技术 academy) ; Hanoi University of Science and Technology(河内科学技术大学) ; University of Koblenz(科隆大学)
Comments The manuscript is submitted to Springer Nature's journal
通过自我探索的机器人好奇心驱动行为与语言发展
发表机构 * Okinawa Institute of Science and Technology(冲绳科学技术大学院大学)
AI总结 本研究通过好奇心驱动的机器人自我探索,结合Q学习实现主动推理,揭示了组合泛化、快速学习、先配对后组合以及异常处理导致的U型发展模式,为人类高效语言习得提供解释。
Comments 27 pages, 22 pages of supplementary material
用全尺度基图拉索方法建模大非平稳空间数据
AI总结 本文提出了一种结合隐含低秩过程和稀疏协方差模型的新方法,用于建模大非平稳空间数据,通过灵活的图高斯马尔可夫随机场模型对低秩组件系数进行建模,并结合全尺度近似和基图拉索方法,提出全尺度基图拉索方法(FSBGL),采用图拉索惩罚似然进行估计,通过差异凸方案优化,通过合成场和热层高分辨率模拟数据集验证,与现有空间模型相比,在有限训练数据下更能捕捉热层温度场的显著特征。
Comments Fixed several typos throughout the manuscript, substantially revised Section 4 with improved theoretical bounds, and updated simulations with corresponding code base improvements
Journal ref Stoch PDE: Anal Comp (2026)
Journal ref In: Stich, M., Carballido-Landeira, J. (eds) Nonlinear Dynamics for Biological Systems. SEMA SIMAI Springer Series, vol 40, 2025, Springer, Cham
目标驱动集成:弥合可解释稀疏性与算法预测之间的差距
AI总结 本文提出目标驱动集成方法,通过将最优子集选择推广为联合数学优化问题,生成可解释的集成模型,并理论证明惩罚预测变量重叠可限制预测协方差、减轻有限样本虚假相关的影响,实现机器学习级精度与稀疏模型可解释性的兼顾。
拓扑与统计行为分类器用于跟踪应用
AI总结 本文提出基于多假设跟踪、拓扑数据分析和机器学习的统一理论,通过拓扑特征编码行为信息,利用统计模型拟合拓扑特征分布,并结合目标类型分类方法提升跟踪性能。