Flexible modeling of bimodal distributions via skewed-$t$ mixtures
双峰分布的灵活建模:基于偏斜-t分布的混合模型
AI总结 提出基于Fernández和Steel (1998)偏斜-t分布的混合模型,通过EM算法进行极大似然估计,并开发似然比检验,用于拟合双峰、偏斜和厚尾数据,在标准普尔500指数中验证了双峰性。
双峰分布的灵活建模:基于偏斜-t分布的混合模型
AI总结 提出基于Fernández和Steel (1998)偏斜-t分布的混合模型,通过EM算法进行极大似然估计,并开发似然比检验,用于拟合双峰、偏斜和厚尾数据,在标准普尔500指数中验证了双峰性。
拉丁方设计的不确定固定效应模型分析
AI总结 针对无频率稳定性的不确定实验数据,建立拉丁方设计的不确定固定效应模型,提出三种估计方法并构建置信区间,进行不确定齐性检验和常见检验,通过数值模拟和实例验证模型有效性。
移位指数模型的最小风险与成本高效双序贯检验框架及其在降水数据中的应用
AI总结 提出一种双序贯抽样框架,通过控制第一类错误概率并最小化包含第二类错误和抽样成本的损失函数,检验两个移位指数模型的位置参数差异,具有一阶、二阶效率和风险效率。
多重检验中的无标签校准
AI总结 针对多重检验中无法观测真实标签的难题,利用有序p值间距构造伪标签,实现局部错误发现率的校准,并揭示q值在心理学和神经科学文献中可能严重失准。
机器学习集成小波收缩 (MLShrink)
AI总结 提出MLShrink,结合小波收缩与机器学习,通过双阈值对中间带系数进行数据自适应分类,保留经典阈值简单性,理论证明其非扩张性和oracle一致性,在非平滑信号上表现优异。
SCOPE 收缩:小波去噪的统一框架
AI总结 提出基于对称单峰分布累积分布函数的SCOPE收缩族,通过两个可解释参数分离尺度与形状效应,实现局部强收缩与渐近无偏的平衡,在小波去噪中性能与可解释性兼具。
基于LLM启发式的零样本主动特征获取
发表机构 * Faculty of EE, Technion(技术学院电子工程系) ; Faculty of Medicine, Technion(技术学院医学院) ; CytoReason ; NVIDIA
AI总结 提出通过LLM启发式获取马尔可夫随机场充分统计量的零样本主动特征获取框架,解决数据标注不足问题,在IBD患者诊断中优于现有方法。
通过自适应谱收缩的过拟合高维矩阵分解
AI总结 提出EigenBayes方法,通过谱估计和自适应经验贝叶斯校准超参数,实现快速且具有不确定性量化的过拟合因子模型,在数值实验和基因组学应用中优于现有方法。
变分共识蒙特卡洛用于贝叶斯混合模型
AI总结 提出变分共识蒙特卡洛方法扩展至过拟合贝叶斯混合模型,通过新颖的聚类匹配算法和聚合策略,在联邦学习设置下推断聚类数和所有参数,并在模拟和真实电子健康记录数据上验证了有效性。
利用尾部进行自适应
AI总结 研究非参数贝叶斯中基于p-指数尾先验的后验收缩率,发现p越小收缩越快,且p→0时可实现光滑性自适应,应用于白噪声回归和ReLU神经网络。
Comments 59 pages, 3 figures
使用贝叶斯非参数和半参数修正的因果中介分析案例研究
AI总结 提出截断富集狄利克雷过程混合模型估计自然直接和间接效应,结合高效MCMC算法和基于有效影响函数的一步后验修正,解决贝叶斯非参数中因果估计量的可靠推断问题。
因果推断中的迭代期望定律入门
AI总结 本文介绍迭代期望定律及其在因果效应识别中的应用,通过g公式的两种非参数等价形式(NICE和ICE)和三个数值示例阐明其数学直觉。
马尔可夫决策过程中奖励非随机缺失的缺失感知策略的离线评估
AI总结 针对奖励非随机缺失的离线强化学习问题,提出基于未来状态作为影子变量的识别方法,并利用桥函数和min-max估计器恢复条件均值奖励,实现缺失感知策略的离线评估。
Comments Accepted at ICML 2026. 31 pages, 6 figures
基于核的协变量函数平衡法用于成分处理下的因果推断
AI总结 针对成分处理(暴露位于单纯形)的因果效应估计,提出基于核的协变量函数平衡加权法,通过最小化再生核希尔伯特空间中的最坏情况平衡误差构造权重,并构建增强加权估计量,实现√n一致性。
Comments 40 pages, 3 figures
基于LLM的A/B测试的统计基础:用于人类因果推断的替代指标框架
发表机构 * Spotify USA, Inc.(Spotify美国公司)
AI总结 提出替代指标理论框架,证明在弱于分布等价条件下,校准LLM输出可识别平均处理效应,并分析随机性带来的偏差与方差。
具有错误发现率控制的超图变量选择
AI总结 针对预测变量复杂依赖结构导致变量选择方法功效降低的问题,提出基于超图的选择方法,在控制错误发现率的同时提高选择功效。
Comments 28 pages, 4 figures
AK-MCS-C2: 具有共形认证的主动克里金蒙特卡洛模拟方法用于失效概率估计
AI总结 提出一种结合主动克里金蒙特卡洛模拟与共形预测的主动学习框架,通过自适应交叉共形策略和J+GP共形估计器,在少量样本下提供无分布假设的预测误差保证,提高极限状态面附近样本分类可靠性,从而提升失效概率估计的准确性和鲁棒性。
DASH: 一种用于大规模凸MIQP的降维方法及其在子集投资组合选择中的应用
AI总结 提出DASH降维方法,通过减少变量层次改善大规模凸MIQP求解器性能,在子集投资组合选择中显著提升Gurobi难以求解问题的初始解质量。
建立 PDMP 采样器的 $\Omega(\sqrt{d})$ 复杂度下界及如何突破:针对高斯尾目标的一个亚 $\sqrt{d}$ 算法
AI总结 本文证明分段确定性马尔可夫过程采样器在标准设置下具有 $\Omega(\sqrt{d})$ 复杂度下界,并通过放宽目标密度连续时间不变性假设,提出一种新方案,对高斯尾目标实现 $O(d^\alpha)$($\alpha\in[0.2,0.3]$)的经验复杂度。
平坦联络:分层MCMC中的汇集因子与中心化几何
AI总结 研究分层MCMC中中心化/非中心化障碍的几何原因,证明Fisher信息诱导的联络是平坦的,障碍源于统计上的汇集因子π_j,并据此提出诊断方法。
Comments 39 pages, 9 figures, accompanying R package
计算可识别性
发表机构 * New York University(纽约大学)
AI总结 提出“计算可识别性”框架,通过有限计算搜索过程在指定误差容限内找到经验估计量,从而解决理论可识别性在有限样本、模糊图标准等实际场景中的不足。
SSH-Net: 一种用于竞争风险下预测失效时间分布函数的深度神经网络及其在GPU数据上的应用
AI总结 提出结构化分段风险深度神经网络(SSH-Net),通过将网络结构与数据结构关联,允许不同协变量组通过子网络影响预测,在竞争风险框架下预测失效时间分布函数,仿真和GPU数据验证了准确性。
AURA: 用于LLM作为评判审计的自适应不确定性感知精炼
AI总结 提出AURA框架,通过自适应不确定性感知精炼,在少量人工验证下迭代学习人类一致性信号,优先审核不确定比较,提升LLM评判的可靠性。
一种无求解器的预测后优化训练方法
AI总结 提出一种基于测度变换的决策聚焦学习管道,通过无求解器代理损失实现预测后优化中预测模型的高效训练,理论保证Fisher一致性,训练时间降低数个数量级。
Comments Accepted by ICML 2026
标量交互的表征限制:一种干预分解
AI总结 本文证明标量交互指标混淆了唯一性、冗余性和协同性,并提出Stochastic Hi-Fi方法,通过干预掩码推理分解每个特征的U/R/S轮廓,在表格和图像任务中恢复被标量基线遗漏的结构。
匹配市场遇上累积前景理论:迈向最优和对抗鲁棒学习
发表机构 * Indian Institute of Technology Bombay(印度理工学院孟买分校)
AI总结 研究基于累积前景理论(CPT)的竞争性双边匹配市场多智能体多臂赌博机问题,提出最优遗憾界算法并扩展到对抗性市场。
Comments Accepted at ECML-PKDD 2026, Naples, Italy
LLM后训练中应比较哪些对?
发表机构 * Columbia University(哥伦比亚大学)
AI总结 研究偏好后训练中如何选择最具信息量的比较对,提出基于采样设计的比较策展方法,通过DPO训练的理论分析给出优化准则,实验证明能提升样本效率。
LayerNorm Transformer 中的代数死方向:一种仅需前向传播的大语言模型规模诊断方法
发表机构 * IIIT, Hyderabad(海得拉巴国际信息技术学院)
AI总结 本文发现 LayerNorm 的逆尺度方向是后最终归一化中心激活协方差矩阵的精确代数核,可仅从参数中读取死方向,无需前向或后向传播,并在 14 个预训练模型上验证了其有效性。
Comments 34 pages, 7 figures, 6 tables. Empirical companion to arXiv:2606.05957
最优确定性多校准与全预测
发表机构 * University of Pennsylvania(宾夕法尼亚大学)
AI总结 本文提出一种确定性算法,实现多校准的极小化最优样本复杂度,并推广到结果不可区分性,解决确定性预测器是否必要的问题。
具有有界噪声的随机线性上下文赌博机:一种集合成员方法
AI总结 针对有界奖励噪声的随机线性上下文赌博机,提出基于集合成员估计和乐观原则的SME-OFU算法,实现O(log T)的遗憾界,优于次高斯噪声下的最优界。
Comments 23 pages, 1 figure
基于插值的梯度下降的预言复杂度
发表机构 * Purdue University(普渡大学)
AI总结 提出分段多项式插值梯度下降(PPI-GD)方法,通过数据域等距点查询一阶预言构造多项式插值近似全梯度,在强凸和非凸损失下分析预言复杂度,证明在数据维数受限且损失足够光滑时优于多种GD变体。
Comments 16 pages, 2 figures
公共噪声Wasserstein不确定性下的平均场控制鲁棒$Q$-学习
AI总结 提出一种针对公共噪声分布Wasserstein不确定性的离散时间平均场控制鲁棒$Q$-学习算法,结合量化投影与Wasserstein对偶,证明同步和异步学习的收敛性及有限时间界,并在系统风险和流行病模型中验证鲁棒性-性能权衡。
训练与泛化的统计特性
AI总结 从物理学角度研究深度学习的关键特征和意外现象,回顾神经缩放定律及其与物理问题中约束和归纳偏置的相互作用。
Comments 32 pages, 3 figures. Part of the VERaiPHY initiative
锚定之外:使用多层次非锚定元回归(ML-UMR)导航非锚定间接比较
AI总结 针对随机证据缺失时的非锚定治疗比较,提出多层次非锚定元回归(ML-UMR),通过贝叶斯框架联合建模个体与汇总数据,估计多治疗、多研究及目标人群的边际和条件效应,并明确识别假设与可转移性假设。
Comments 20 pages (excluding supplementary material), 5 figures
省略协变量的比例风险模型中的内置选择偏倚:模拟证据与替代方法
AI总结 本文通过模拟和实际数据,证明在随机试验中,即使省略的协变量与处理独立,仍会导致Cox比例风险模型估计的处理风险比存在偏倚,并比较了脆弱模型、加速失效时间模型和Kaplan-Meier曲线等替代方法的稳健性。
混合行政删失与随机删失下的Ghosh-Lin和Fine-Gray模型
AI总结 针对同时存在行政删失和随机删失的数据,提出结合风险集调整和逆概率删失加权的方法,使Ghosh-Lin和Fine-Gray模型得到一致估计。
协变量调整的功能主成分分析用于建模美国人口体力活动的风险率
AI总结 提出基于风险函数的分布分析方法,利用功能主成分分析(FPCA)从腕部加速度计数据中刻画个体活动强度分布变异,优于均值摘要。
一种用于汇总遗传数据的贝叶斯时空最近邻高斯过程模型
AI总结 提出最近邻高斯过程模型,结合序贯蒙特卡洛平方算法,高效推断汇总遗传数据中的单倍型频率,并应用于非洲抗疟药物耐药性遗传数据分析。
意大利西尼罗病毒疫情用量子生命游戏建模
AI总结 使用量子生命游戏细胞自动机模型模拟2025年夏季意大利西尼罗病毒传播,通过优化蚊子出生和移除率,准确拟合局部和区域平均累计感染曲线,并评估环境变化的影响。
利用所有现患和发病事件在生物库研究中进行高效累积发病率估计
AI总结 针对生物库数据中同时包含招募前发病(现患)和随访期间发病的个体,提出一种新的累积发病率函数估计方法,整合所有病例,处理年轻发病且生存期长的疾病,理论证明渐近性质,模拟和UK生物库癌症数据验证其优势。
两样本IV:高效两步估计及过度识别与弱工具变量检验
AI总结 针对两样本IV估计,提出异方差和样本异质性下稳健的两步高效估计方法及过度识别检验,仅需线性回归的汇总统计量,并扩展弱工具变量检验。
高级校准分析与工具:识别随机利率模型校准中的有影响观测值
AI总结 将校准问题嵌入非线性回归理论,证明最小化RMSRE等价于加权最小二乘,开发诊断框架(加权帽子矩阵、影响函数、泛函Delta方法),实证发现杠杆边界主导、有效维度损失及2022年后参数稳定性转变,指出低RMSRE不足以验证校准。
Comments 47 pages, 9 figures, 1 table
具有未知加速参数的可变作业的动态核心分配
AI总结 针对多核系统中具有未知加速参数的可变作业,提出一种迭代学习-控制框架,通过最大似然估计未知参数并求解马尔可夫决策过程更新分配策略,以最小化长期平均作业数。
私有率双稳健推断
AI总结 本文通过局部隐私机制注入噪声保护个体隐私,同时利用率双稳健性实现目标参数的无偏和半参数有效推断,并开发了私有化非参数和参数 nuisance 估计方法。
小样本有序情境下的社区检测:德尔菲数据的基准测试框架
AI总结 针对德尔菲数据高维小样本导致的秩亏问题,提出从变量中心协方差模型转向网络中心连接模型,利用社区检测算法识别潜在主题结构,实现结构稳定的降维。
重新思考链接预测中的采样策略
AI总结 提出β-采样方案,研究两阶段采样对链接预测性能的影响,发现缺失链接的结构特征显著影响预测精度,且第二阶段采样策略至关重要。
Comments 19 pages, 5 figures, 3 tables
基于保形预测的概率AI天气预报的严格不确定性量化
AI总结 针对AI概率天气预报校准不足(尤其是极端事件),提出使用保形预测方法,无需分布假设即可数学保证覆盖,应用于三个全球模型(GenCast、NeuralGCM、AIFS-ENS)的温度和降水预报,实现校准不确定性而不牺牲其他概率指标。
对弈的棋谱签名
AI总结 利用粗路径理论的签名变换提取棋局中事件顺序与交互的不变特征,构建签名核双样本检验和时序有效作弊检测方法,在控制错误率的同时显著提升检测能力。
逐点是否无意义?基于图神经网络的降水临近预报的多模态消融研究
发表机构 * Norwegian Meteorological Institute(挪威气象研究所)
AI总结 本研究通过多模态图神经网络系统,消融分析雷达、数值预报、地面观测、卫星数据及训练损失对降水临近预报的影响,发现各模态分别改善不同方面,点观测虽提升局部但需结合损失函数和不确定性表示才能优化雷达场。
QC-GAN: 一种参数高效的四元数Conformer GAN用于高保真语音增强
发表机构 * The Asahi Shimbun Company(朝日新闻社) ; Tokyo Woman's Christian University(东京女子基督教大学)
AI总结 提出参数高效的QC-GAN,结合四元数Conformer生成器和MetricGAN训练,通过汉密尔顿积共享权重减少参数量,在VoiceBank+DEMAND上以0.89M参数达到PESQ 3.48,性能媲美两倍大小模型。
Comments 10 pages, 6 figures and 5 tables. Accepted at Interspeech2026
Doeblin 曲线
AI总结 提出 Doeblin 曲线概念,量化马尔可夫核在不同散度和功率水平下的收缩行为,并应用于噪声迭代优化、噪声电路可靠计算和差分隐私等领域的更细粒度收缩分析。
Comments 42 pages, 2 figures
Journal ref IEEE Transactions on Information Theory, vol. 72, no. 6, pp. 3556-3596, June 2026
Behrens-Fisher问题的拉普拉斯方程方法
AI总结 针对两独立正态样本方差未知且不等的情况,提出偏微分方程公式,通过正交分解和球面楔概率将分布问题转化为拉普拉斯-狄利克雷边值问题,导出累积分布函数和概率密度的精确有限样本表示,并得到尾部分布展开。
Comments 31 pages, 4 figures
核赌博机中的算法与极小极大复杂度
AI总结 本文通过统一MAIR框架,将GP-UCB与MAMS算法置于共同语言下,提出结合两者优势的安全主算法,并证明在过参数化模型中算法复杂度比类宽极小极大或DEC证书更具信息性。
二维受限角度随机游走的分布
AI总结 研究受限角度二维随机游走的分布,推导两步联合与边缘分布,提供一般步数的数值解及大步数近似,明确支持集的精确描述。
Comments 14 pages, 14 figures
Journal ref IEEE Transactions on Signal Processing, vol. 74, pp. 2316-2330, 2026
发表机构 * Stanford University, Department of Management Science and Engineering and Institute for Computational and Mathematical Engineering(斯坦福大学管理科学与工程系和计算与数学工程研究所) ; Upstart, Inc.(Upstart公司) ; Stanford University, Institute for Computational and Mathematical Engineering(斯坦福大学计算与数学工程研究所)
发表机构 * Banking Academy of Vietnam(越南银行学院) ; Vietnam Academy of Science and Technology(越南科学技术 academy) ; Hanoi University of Science and Technology(河内科学技术大学) ; University of Koblenz(科隆大学)
Comments The manuscript is submitted to Springer Nature's journal
通过自我探索的机器人好奇心驱动行为与语言发展
发表机构 * Okinawa Institute of Science and Technology(冲绳科学技术大学院大学)
AI总结 本研究通过好奇心驱动的机器人自我探索,结合Q学习实现主动推理,揭示了组合泛化、快速学习、先配对后组合以及异常处理导致的U型发展模式,为人类高效语言习得提供解释。
Comments 27 pages, 22 pages of supplementary material
用全尺度基图拉索方法建模大非平稳空间数据
AI总结 本文提出了一种结合隐含低秩过程和稀疏协方差模型的新方法,用于建模大非平稳空间数据,通过灵活的图高斯马尔可夫随机场模型对低秩组件系数进行建模,并结合全尺度近似和基图拉索方法,提出全尺度基图拉索方法(FSBGL),采用图拉索惩罚似然进行估计,通过差异凸方案优化,通过合成场和热层高分辨率模拟数据集验证,与现有空间模型相比,在有限训练数据下更能捕捉热层温度场的显著特征。
Comments Fixed several typos throughout the manuscript, substantially revised Section 4 with improved theoretical bounds, and updated simulations with corresponding code base improvements
Journal ref Stoch PDE: Anal Comp (2026)
Journal ref In: Stich, M., Carballido-Landeira, J. (eds) Nonlinear Dynamics for Biological Systems. SEMA SIMAI Springer Series, vol 40, 2025, Springer, Cham
目标驱动集成:弥合可解释稀疏性与算法预测之间的差距
AI总结 本文提出目标驱动集成方法,通过将最优子集选择推广为联合数学优化问题,生成可解释的集成模型,并理论证明惩罚预测变量重叠可限制预测协方差、减轻有限样本虚假相关的影响,实现机器学习级精度与稀疏模型可解释性的兼顾。
拓扑与统计行为分类器用于跟踪应用
AI总结 本文提出基于多假设跟踪、拓扑数据分析和机器学习的统一理论,通过拓扑特征编码行为信息,利用统计模型拟合拓扑特征分布,并结合目标类型分类方法提升跟踪性能。