Probability Bound Analysis for Dependence Uncertainty in Risk and Decision Models
风险与决策模型中依赖不确定性的概率界分析
AI总结 针对边际信息与依赖信息不完整的情况,提出一种依赖敏感的PBA框架,通过p-box、copula和Fréchet耦合集传播不确定性,并在风险决策模型中展示依赖假设对输出界和尾部风险的影响。
风险与决策模型中依赖不确定性的概率界分析
AI总结 针对边际信息与依赖信息不完整的情况,提出一种依赖敏感的PBA框架,通过p-box、copula和Fréchet耦合集传播不确定性,并在风险决策模型中展示依赖假设对输出界和尾部风险的影响。
贝叶斯空间中多元密度的降维
AI总结 提出在贝叶斯空间中对多元概率密度函数进行正交分解,实现独立与交互成分的分离,并证明该分解在PCA意义下最优,应用于房屋和地质数据展示可解释性。
可选停止下始终有效推断的闭式样本量校正
AI总结 针对A/B测试中连续监测的顺序检验,提出闭式校正因子k*,通过调整固定样本量使经验功效接近目标值,节省8-20%样本预算。
Hilbert值随机元的对数能量距离与Gini协方差
AI总结 研究α↓0时广义能量距离的极限,得到对数能量距离,保留特征性质并导出高斯核最大均值差异表示,进而提出对数Gini协方差用于k样本问题。
Comments 18 pages
Fisher宽度:统计流形上的几何复杂度度量
发表机构 * Department of Mathematics, FPT University(FPT大学数学系)
AI总结 提出Fisher宽度作为统计流形上高斯宽度的类比,利用Fisher信息度量局部几何,并证明其保持高斯宽度的关键性质,应用于Fisher-Lipschitz假设类的泛化界。
Comments 48 pages, 3 figures
宇宙学推断中的协方差收缩:基于Sellentin-Heavens型似然
AI总结 研究在有限模拟样本下协方差矩阵的收缩正则化方法,提出将收缩强度作为辅助推断量并边缘化其不确定性,以改进参数后验校准。
复杂缺失机制下二元回归的共形预测
AI总结 针对复杂缺失机制下的二元回归问题,提出共形预测框架,通过分布不变性条件替代可交换性,并利用双射论证处理随机子集样本,同时提出多种共形预测程序,包括图论加权方法,实现渐近条件有效性。
在符合推断中对虚假发现比例的处处有效界
发表机构 * Department of Statistics, Stanford University(斯坦福大学统计学系) ; Department of Statistics and Data Science, University of Pennsylvania(宾夕法尼亚大学统计学与数据科学系) ; Department of Mathematics, Stanford University(斯坦福大学数学系)
AI总结 本文提出了一种在多重检验问题中对虚假发现比例(FDP)的处处有效界,通过构造高概率包络来保证在任意后验阈值选择下的统计保证,同时展示了该方法在异常检测和符合选择中的应用。
Comments 34 pages, 12 figures. Code available at https://github.com/sza919/everywhere-valid-fdp-bounds-in-conformal-inference
小区域估计中用于模型验证的数据稀疏化
AI总结 提出数据稀疏化方法,将单个观测拆分为独立训练和测试集,实现小区域估计的模型验证,并分析其偏差-方差权衡,给出实用建议。
面向目标估计量的AUC泛化与跨研究基准比较方法
AI总结 提出一种以目标估计量为中心的框架,通过校准加权和增强变体,将AUC推断锚定到预设目标人群,解决生物标志物验证中人群迁移和跨研究比较问题。
覆盖相关性:检测随机变量之间的奇异依赖关系
AI总结 提出覆盖相关系数,一种基于Monge-Kantorovich秩的非参数统计量,用于检测随机变量间的奇异依赖关系,具有分布自由、计算高效等优点。
Comments 100 pages, 6 figures, 3 tables
多元函数数据中异常点的贝叶斯非参数检测
AI总结 提出一种贝叶斯非参数方法,通过无限混合多输出高斯过程建模多元函数数据,自动确定混合分量数,利用切片采样和Besov先验实现稀疏表示,并引入Carlin-Chib步骤选择协方差核,从而无需预设异常数量即可检测异常。
Comments 29 pages, 8 figures
一种面向约束感知的生物过程开发的人机协同贝叶斯优化框架
发表机构 * Imperial College London(伦敦帝国理工学院) ; DataHow AG ; ETH Zurich(苏黎世联邦理工学院)
AI总结 提出一种扩展的帕累托前沿引导采样框架,通过将高斯过程代理的约束满足概率和鲁棒性作为多目标优化目标,结合交互式仪表盘实现人机协同的约束感知生物过程优化。
贝叶斯替代混杂因子的收缩先验
发表机构 * School of Mathematical Sciences, University of Nottingham, Nottingham, UK(诺丁汉大学数学科学学院) ; Department of Statistics, Rice University, USA(里士满大学统计学系;伯克利国家实验室) ; Lawrence Berkeley National Laboratory, USA(洛斯阿拉莫斯国家实验室统计科学组) ; Statistical Sciences Group, Los Alamos National Laboratory, USA
AI总结 针对多原因观察研究中替代混杂因子过度编码问题,提出贝叶斯因子分配框架,利用收缩先验学习稀疏替代混杂因子,保持粗粒度多原因依赖,并证明后验集中性和重叠保持几何性质,实现潜在结果的一致性估计。
相干性原理:从理论语法出发的可证伪模型选择先验
AI总结 提出相干性原理,通过理论语法(对称性、守恒律等)的符合度分配模型先验,用最大熵指数形式量化代价,在宇宙学和粒子物理中验证其有效性。
贝叶斯布尔矩阵分解及其在癌症拷贝数分析中的应用
发表机构 * Department of Data Science, Dana-Farber Cancer Institute(数据科学部,达纳-法伯癌症研究所) ; Department of Biostatistics, Harvard T.H. Chan School of Public Health(生物统计学部,哈佛T.H. 潘克学校公共卫生学院)
AI总结 提出贝叶斯布尔矩阵分解(BBMF)模型,通过全共轭生成模型和稀疏先验实现布尔约束下的可解释因子分解,并应用于多发性骨髓瘤的染色体臂拷贝数变异分析,揭示肿瘤异质性的离散潜在结构。
在可分离先验中的正定性:对先验可解释性和推断的影响
AI总结 本文研究了在对称正定矩阵中使用可分离先验时,截断对先验可解释性和推断的影响,探讨了如何设置先验参数以减少截断带来的影响。
Comments 34 pages, 3 figures
基于RJMCMC的全贝叶斯宽带波达方向估计与检测
AI总结 提出一种宽带信号模型,通过循环卷积和频域稀疏矩阵分解,将边际似然计算复杂度从O(N^3 k^3)降至O(N k^3),结合非可逆RJMCMC实现全贝叶斯源数检测与DOA估计。
通过反事实归因分配两个风险因素对不良结果的因果责任
AI总结 提出一个量化框架,在无混杂和单调性假设下,通过反事实归因分配两个二元风险因素对已发生不良结果的因果责任,并建立非参数识别或推导出尖锐界限。
Wasserstein 策略学习用于分布性结果
AI总结 针对分布值结果,提出基于Wasserstein重心和效用泛函的策略学习框架,使用IPW和DR估计器,证明遗憾率由策略类复杂度主导,并给出极小化下界。
Comments Accepted by The 39th Annual Conference on Learning Theory (COLT 2026)
平衡双胞胎:存在隐藏混杂的时间序列因果推断
AI总结 提出神经框架同时学习个体时间序列的低维潜在表示和倾向得分,通过灵活匹配恢复反事实,估计处理组的平均处理效应,适用于交错干预和隐藏混杂场景。
确保可信的在线A/B测试:解决关于CUPED的五个关键问题
AI总结 本文系统解决CUPED应用中五个常见但被忽视的问题,包括最优调整规范、回归调整有效性、鲁棒方差估计,并扩展到多臂实验和两阶段抽样设计,通过理论分析和实验验证提供可靠方法,已在字节跳动平台部署。
Comments 15 pages, 3 figures
竞争风险背景下条件平均处理效应估计指南
发表机构 * Department of Statistics, TU Dortmund University(图恩-多特蒙德大学统计学系) ; Research Center Trustworthy Data Science and Security, University Alliance Ruhr (UA Ruhr)(鲁尔大学联盟可信数据科学与安全研究中心) ; Institute for Mathematics, University of Augsburg(艾希施泰特大学数学研究所)
AI总结 针对竞争风险生存数据,比较六种元学习器估计条件平均处理效应,提供R包crsurvlearners指导模型选择。
多物品多周期库存控制的实验设计
AI总结 研究多物品多周期库存系统中A/B测试的偏差问题,提出一种物品与时间配对的实验设计,并通过仿真和真实数据验证其有效性。
因果数据融合中的聚类与剪枝
发表机构 * Department of Mathematics and Statistics(数学与统计学系)
AI总结 针对多数据源因果融合中变量增多导致计算复杂的问题,提出剪枝和聚类预处理方法,基于小图推断大图中因果效应的可识别性并给出识别函数。
分布工具变量方法
AI总结 提出分布工具变量方法,利用生成建模在非线性工具变量设置中估计整个干预分布,并证明其可识别性优于传统方法。
基于部分观测干涉数据的正则化协方差估计
AI总结 针对部分观测干涉数据中系统缺失的问题,提出一种基于拉普拉斯正则化的矩阵补全方法进行非参数协方差估计,无需平稳性或各向同性假设,在模拟和实地数据中均表现优异。
高维结构断点预测回归的特征筛选
AI总结 提出一种在高维结构断点预测回归中筛选活跃预测变量和估计断点的方法,结合SICS、RCRS和IC准则,实现一致估计与选择。
全球变暖加速的空间涌现
AI总结 使用贝叶斯分层时空模型检测全球变暖加速的空间涌现,发现高置信度信号最早出现在高纬度地区,空间聚集会延迟检测。
Comments Supplementary information included after main manuscript
TimeLAVA: 时间序列的学习无关数据估值
发表机构 * School of Mathematics and Statistics, The University of Melbourne(墨尔本大学数学与统计学学院) ; Statistics, The University of Melbourne(墨尔本大学统计学系) ; Statistics, University of Sydney(悉尼大学统计学系) ; Responsible AI Research Centre, Australian Institute for Machine Learning(澳大利亚机器学习研究所负责任人工智能研究中心) ; Amazon(亚马逊) ; School of Mathematical Sciences, Adelaide University(阿德莱德大学数学科学学院) ; Department of Machine Learning, MBZUAI(MBZUAI机器学习系)
AI总结 提出TimeLAVA,一种学习无关框架,通过小波变换和最优传输评估时间序列片段对分布差异的边际贡献,无需模型训练,在异常检测、数据剪枝和标签噪声检测中优于现有方法。
Comments 34pages
Journal ref ICML2026
INDEQS: 信息引导的神经控制微分方程
AI总结 提出INDEQS,一种基于图的NCDE预测方法,通过在不同架构位置注入有向图先验知识,结合内外混合机制和自适应图卷积,在合成和真实任务中优于无信息NCDE。
基于谱的MA(q)模型拟合优度判定系数
AI总结 提出基于谱的判定系数,衡量MA(q)模型对平稳过程谱密度的拟合优度,并建立渐近正态性、假设检验及最小阶数选择方法。
Comments 8 pages, 2 figures
三角参考薛定谔桥用于时间序列生成
发表机构 * Arakne S.r.l.(阿拉克内公司)
AI总结 提出三角参考薛定谔桥框架,通过区间冻结的退化扩散参考和层次化潜在波动率结构,实现时间序列的保守生成,并保持熵最小化的变分核心。
用于变化点检测的局部水平动态随机划分模型
AI总结 提出一种新颖的状态空间建模框架,通过动态线性模型和马尔可夫结构实现时间序列的局部水平动态随机划分,并采用非边缘错误发现率控制进行变化点检测,在模拟和人体手势数据上验证了有效性。
自由支撑Wasserstein中位数的快速计算
AI总结 提出一种直接固定权重自由支撑求解器,通过求解精确最优传输子问题并重新定位支撑点,避免内循环,实现单调下降、凸包不变性和有限时间最佳残差率,计算效率显著优于嵌套Weiszfeld方法。
smoothbp:具有平滑转换和尖峰-板模型选择的快速贝叶斯分层分段回归
AI总结 提出R包smoothbp,利用Rust实现的Metropolis-within-Gibbs采样器和HMC,实现具有逻辑平滑转换的贝叶斯分层分段回归,支持多断点、随机效应和自动断点选择。
Comments 16 pages, 2 figures, R package on CRAN
蒙特卡洛噪声下连续时间马尔可夫链的矩映射学习
AI总结 针对连续时间马尔可夫链矩计算困难的问题,提出基于蒙特卡洛噪声训练数据的代理模型,学习参数到矩的映射,并分析噪声对均值和协方差估计的影响,给出计算资源分配策略。
一种可扩展、集成且动态的信用风险预测与压力测试方法
AI总结 提出一种集成贷款生成与信用风险的可扩展压力测试方法,通过蒙特卡洛模拟生成贷款组合并计算风险指标,支持动态调整参数以评估多种压力情景。
Comments 23 pages, 10 figures
漂移与腐败下基于潜在簇几何的在线分布预测
发表机构 * Indian Institute of Technology, Bombay(印度理工学院,孟买)
AI总结 针对非平稳流中的在线分布预测问题,提出一种基于潜在簇几何的吉布斯准后验方法,通过可逆跳跃MCMC采样变维后验,并引入重启变体应对漂移,在亚线性腐败预算和运输代价下实现亚线性Wasserstein遗憾。
面向GPU上广义线性模型的混合精度通信避免SGD
发表机构 * Department of Computer Science, Wake Forest University(沃杰福大学计算机科学系) ; Department of Computer Science, Cornell University(康奈尔大学计算机科学系)
AI总结 提出混合精度通信避免SGD(CA-SGD),通过分析有限精度误差将精度选择分解为九个独立部分,在NVIDIA GPU上实现5.1-6.8倍加速,且损失与FP32 SGD匹配。
基于聚类的消息传递(CluMP)优化复杂QUBO问题
AI总结 提出CluMP算法,通过信念传播控制聚类内阻挫,实现自旋集体更新,在稀疏图上以更少操作达到更低能量,优于局部更新启发式方法。
Comments Main: 9 pages, 4 figures, 1 table. End Matter: 2 pages and 1 figure. Supp. Info: 5 pages, 3 figures
非平稳高斯过程的规则傅里叶特征
发表机构 * Institute of Measurement and Sensor Technology University of Kaiserslautern-Landau(测量与传感器技术研究所 柏林-卡尔斯鲁厄大学) ; Independent Researcher(独立研究者)
AI总结 提出规则傅里叶特征方法,通过直接离散化谱表示避免概率假设,实现非平稳高斯过程的低秩近似,并扩展至核学习。
Comments 11 pages (9 main + 2 suppl.), 5 figures, 2 tables
面向数字孪生应用中导数信息高斯过程代理的流式稀疏Cholesky方法
发表机构 * organization= Department of Mechanical Engineering, University of Utah , addressline= , city= Salt Lake City , postcode= 84112 , state= UT , country= USA ; organization= Kahlert School of Computing, University of Utah , city= Salt Lake City , postcode= 84112 , state= UT , country= USA ; organization= Scientific Computing \& Imaging Institute, University of Utah , addressline= , city= Salt Lake City , postcode= 84112 , state= UT , country= USA
AI总结 提出一种流式稀疏Cholesky方法,通过动态更新和导数信息增强高斯过程代理,降低协方差矩阵维度,实现数字孪生中飞机结构性能的实时预测。
无需Metropolis检验的实用可扩展哈密顿蒙特卡洛
AI总结 提出自动调整步长方案,在无Metropolis调整的HMC和欠阻尼Langevin蒙特卡洛中控制渐近偏差,实验表明该方法在贝叶斯推断和百万参数物理模型中显著优于调整后的方法。
离散观测多元霍克斯过程的粒子马尔可夫链蒙特卡罗参数推断
AI总结 针对离散观测的多元霍克斯过程,提出基于序贯蒙特卡洛的无偏似然估计,结合Metropolis-Hastings算法实现参数后验推断,在模拟和实际数据中优于现有方法。
Comments 28 pages, 9 figures and 2 tables
使用条件模型和模态吉布斯采样的混合模型拟合
AI总结 提出一种基于模态吉布斯采样的新算法,通过仅采样辅助变量来近似混合模型的后验分布,利用集成嵌套拉普拉斯近似计算密度参数的条件分布众数,降低计算负担并给出良好估计。
语义对抗攻击的广义特征值几何
AI总结 提出一种连续局部模型,通过矩阵束$(A,B)$的最大广义特征值量化语义对抗攻击性,并给出预测翻转条件、攻击性证书及VC界。
通过正-无标签学习量化与审计大语言模型评估
AI总结 针对大语言模型作为评估者存在的系统性偏差(如冗长偏好),提出基于部分最优传输的几何审计框架,利用少量人工验证正样本校正偏差,无需重训练即可提升与人类偏好的一致性。
基于自适应投注的序列核条件独立性检验
AI总结 提出一种对估计误差更鲁棒的序列条件独立性检验方法,通过自适应优化核条件独立性统计量、归一化及截断平移校准,在合成与真实数据上控制第一类错误并保持高功效。
Comments Published at ICML 2026: https://openreview.net/forum?id=vUMdIyTs9c
FOSC-X: 一种用于从聚类层次结构中提取最优局部切割和非水平聚类的扩展框架
AI总结 提出FOSC-X框架,通过动态规划从层次聚类树中提取前M个全局最优的局部非水平切割聚类,支持聚类数约束,在线性时间内保证最优排序。
划分路径的核:树集成的统一表示
AI总结 提出KPP核,通过路径度量索引森林节点,统一了预测、精确加性归因、确定性Lipschitz鲁棒半径和Rademacher风险界,为树集成提供几何框架。
Comments 31 pages
轨迹级监督何时允许高效的离线强化学习?
发表机构 * University of Wisconsin-Madison(威斯康星大学麦迪逊分校)
AI总结 本文研究离线强化学习中仅使用轨迹级结果(如累积回报或偏好)进行策略优化的统计理论,提出OPAC算法并证明其样本复杂度,同时揭示在非线性聚合目标下存在的统计障碍。
Comments 69 pages
面向同时最优遗憾的U-校准
发表机构 * University of Colorado Boulder(科罗拉多大学波德穆尔分校) ; University of Southern California(南加州大学) ; Google Research(谷歌研究)
AI总结 提出一种基于自和谐噪声的FTPL变体,实现对所有有界适当损失的最优$\tilde O(\sqrt{T})$遗憾和对光滑损失的对数遗憾。
Comments 30 pages; to appear at COLT 2026
层次结构的紧凑几何表示
发表机构 * UW-Madison(威斯康星大学麦迪逊分校) ; MIT(麻省理工学院)
AI总结 研究如何用低维几何嵌入表示有向无环图中的祖先-后代关系,提出基于树宽等结构参数的维度上界和下界,并在真实数据集上验证了紧凑性。
Comments Published at the 39th Annual Conference on Learning Theory (COLT) 2026. 22 Pages
基于光滑性的PAC-Bayes去随机化
发表机构 * Department of Computer Science and Software Engineering(计算机科学与软件工程系) ; Université Laval(拉瓦尔大学)
AI总结 利用损失和预测器的光滑性,将Gibbs预测器去随机化为后验均值处的确定性预测器,通过Jensen间隙类的Rademacher复杂度控制泛化界,并导出涉及参数雅可比和海森矩阵的正则化器。
战略特征选择
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; University of Texas, Austin(德克萨斯大学奥斯汀分校) ; Cornell Tech(康奈尔科技) ; Stanford University(斯坦福大学) ; University of Pennsylvania(宾夕法尼亚大学) ; Harvard University(哈佛大学) ; Inria, Paris(巴黎Inria)
AI总结 研究通过特征选择和岭正则化应对战略操纵的分类问题,发现仅基于可操纵性排除特征通常次优,提出联合优化特征集与正则化水平的算法,并在医疗支付基准上验证。
稀疏性与叠加对简单自编码器损失的影响
发表机构 * Department of Statistics, UC Berkeley(伯克利大学统计学系) ; Department of Materials Science, UC Berkeley(伯克利大学材料科学系)
AI总结 研究神经网络中多语义性源于叠加现象,通过数学分析稀疏输入下自编码器的L2重构损失上下界,验证并扩展了Elhage等人的实证结果。
Comments 16 pages, 3 figures
概念调制模型:可识别性与外推的统一框架
发表机构 * Department of Statistics and Data Science, Carnegie Mellon University(卡内基梅隆大学统计与数据科学系) ; Machine Learning Department, Carnegie Mellon University(卡内基梅隆大学机器学习系)
AI总结 提出概念调制模型(CMMs),通过属性势统一条件潜变量模型的可识别性与外推分析,将基于转移的可识别性提升至条件设置,并导出代数外推准则。
量子退火增强强化学习用于精确剩余使用寿命预测
发表机构 * Central University of Karnataka(卡纳塔克中央大学) ; University College of Engineering, Anna University(安娜大学工程学院) ; AIONOS India Pvt Ltd(AIONOS印度私人有限公司) ; National Institute of Technology Tiruchirappalli(蒂鲁吉拉帕利国立理工学院)
AI总结 提出量子退火增强Q学习框架,通过将Q值更新编码为QUBO问题并利用量子退火采样实现随机动作选择,解决高维非凸空间中的收敛问题,在C-MAPSS和工业数据集上显著优于基线方法。
Comments 29 pages, 6 figures, 12 tables
测量噪声限制了非线性模型在生物医学预测中相对于线性模型的优势
发表机构 * Hertie Institute for AI in Brain Health, University of Tübingen(赫蒂人工智能脑健康研究所,图宾根大学) ; Tübingen AI Center, University of Tübingen(图宾根人工智能中心,图宾根大学) ; Department of Psychiatry and Neurosciences, Charité – Universitätsmedizin Berlin(精神病学与神经科学系,柏林夏里特医学院) ; Bernstein Center for Computational Neuroscience, Berlin(伯恩斯坦计算神经科学中心,柏林) ; German Center for Mental Health (DZPG), partner site Tübingen(德国心理健康中心(DZPG),图宾根合作站点)
AI总结 本文指出,在生物医学表格数据中,测量噪声会削弱非线性结构,导致非线性模型与线性模型性能相当,并提出了一个精确的超额风险恒等式,揭示了测量可靠性、样本量和特征表示三个条件必须同时满足才能体现非线性优势。
随机动量方法的计算效率与串行运行时间权衡
发表机构 * Harvard University(哈佛大学) ; Kempner Institute at Harvard University(哈佛大学凯普纳研究所)
AI总结 研究随机动量方法(如重球法和加速SGD)在一致线性回归中的批次大小权衡,证明重球法不改善SGD的计算效率前沿但允许更大批次减少串行运行时间,而加速SGD的计算效率与串行运行时间权衡依赖于谱衰减。
论局部总体风险证书
发表机构 * Department of Mathematics, The University of Hong Kong(香港大学数学系)
AI总结 本文提出局部总体风险增量证书,用于在模型更新时提供风险控制,通过双边置信带判断更新是否接受。
Comments 35 pages, 6 figures
通过导数约束的最优得分函数估计
AI总结 研究通过经验风险最小化估计得分函数的问题,提出在Sobolev球上约束假设空间以防止过拟合并获得极小极大估计速率,并应用于基于得分的生成模型。
指数多个初始化以避免贫瘠高原
发表机构 * Fujitsu Research of America, Santa Clara, CA 95054, USA(美国富士通美洲研究部) ; University of Delaware, Newark, DE 19716, USA(德雷克塞尔大学) ; Department for Quantum Information and Computation at Kepler (QUICK), Johannes Kepler University, Linz, Austria(约翰·凯撒大学量子信息与计算部门) ; Information Sciences, Los Alamos National Laboratory, Los Alamos, NM 87545, USA(洛斯阿拉莫斯国家实验室信息科学部)
AI总结 提出一阶矩框架诊断初始化能否逃离完全集中的贫瘠高原不动点,发现避免贫瘠高原的初始化策略高度非唯一,存在指数多个不等价族,且不同初始化导致不同极小值。
Comments 18 + 27 pages, 5+4 figures, 1 Table
小批量随机梯度下降的隐式偏差
AI总结 研究小批量随机最陡下降在多类分类中的隐式偏差,揭示批大小、动量和方差缩减对最大间隔行为和收敛率的影响,并证明动量可实现小批量收敛,方差缩减可恢复全批量隐式偏差。
基于Knockoffs的深度神经网络错误发现率控制与简化
发表机构 * bnbu.edu.cn(北京理工大学)
AI总结 本文基于knockoff方法和正则化神经网络,提出了三种在控制错误发现率条件下的变量筛选方法(单层过滤、多层过滤、变量权重聚合过滤),以简化深度神经网络并降低计算复杂度。
离散扩散模型的维度无关收敛性:伴随方程诱导了正确的空间
发表机构 * Department of Mathematics(数学系) ; Oden Institute School of Data Science and Society(数据科学与社会学院) ; UCLA(加州大学洛杉矶分校) ; University of Texas at Austin(德克萨斯大学奥斯汀分校) ; UNC Chapel Hill(北卡罗来纳大学教堂山分校) ; Computational and Applied Sciences Group(计算与应用科学组) ; Department of Mathematics and Statistics(数学与统计学系) ; SRI International(SRI国际) ; University of Massachusetts Amherst(马萨诸塞大学阿姆赫斯特分校)
AI总结 本文提出了一种基于伴随方程的统一框架,实现了任何积分概率度量(IPM)下的维度无关收敛保证,克服了传统KL和TV方法在处理大规模状态空间时的局限性。
分布偏移下决策的生成模型
发表机构 * Department of Mathematics, Duke University(杜克大学数学系) ; H. Milton Stewart School of Industrial and Systems Engineering, Georgia Institute of Technology(佐治亚理工学院H. Milton Stewart工业与系统工程学院)
AI总结 本文提出基于流和分数生成模型的统一框架,通过传输映射、速度场等工具处理分布偏移下的决策问题,实现鲁棒性、条件分布生成及不确定性量化。
Comments INFORMS TutORials in Operations Research, 2026
鲁棒正则化策略迭代在转移不确定性下
发表机构 * College of Computer Science and Technology, Zhejiang University, Hangzhou, China(浙江大学计算机科学与技术学院) ; School of Artificial Intelligence, Optics and Electronics (iOPEN), Northwestern Polytechnical University, Xi'an, China(西北工业大学人工智能、光学与电子学院(iOPEN)) ; School of Software Technology, Zhejiang University, Hangzhou, China(浙江大学软件技术学院) ; School of Software Engineering, Xi'an Jiaotong University, Xi'an, China(西安交通大学软件工程学院) ; School of Systems Science and Engineering, Sun Yat-sen University, Guangzhou, China(中山大学系统科学与工程学院)
AI总结 提出鲁棒正则化策略迭代(RRPI),通过将离线强化学习建模为鲁棒策略优化,使用KL正则化替代难解的双层目标,并基于鲁棒正则化贝尔曼算子实现高效策略迭代,理论保证收敛性,实验在D4RL基准上表现优异。
ReLU激活函数如何影响高维神经网络回归中梯度下降的隐式偏差?
发表机构 * Georgia Institute of Technology(佐治亚理工学院)
AI总结 本文通过原始-对偶分析,研究了高维随机数据下浅层ReLU模型平方损失梯度下降的隐式偏差,证明其以高概率近似最小ℓ2范数解,差距为Θ(√(n/||λ||₁))。
Comments 66 pages
不仅多少,而且何处:将认知不确定性分解为每类贡献
发表机构 * Department of Mathematics and Statistics(数学与统计学系)
AI总结 针对安全关键分类中认知不确定性度量无法区分类别的问题,提出将互信息分解为每类向量$C_k$,通过二阶泰勒展开和$1/\mu_k$加权校正边界抑制,在糖尿病视网膜病变选择性预测、分布外检测和标签噪声研究中验证其有效性。
Comments 8 pages, 17 figures Accepted at UAI 2026
Journal ref Forty-Second Annual Conference on Uncertainty in Artificial Intelligence}, year={2026}, url={https://openreview.net/forum?id=cxuWscJmAr}
反因果域泛化:利用无标签数据
发表机构 * Apple(苹果公司) ; ETH Zürich(苏黎世联邦理工学院)
AI总结 针对反因果设置下的域泛化问题,提出利用无标签数据估计环境扰动方向,通过惩罚模型对协变量均值和协方差变化的敏感性实现鲁棒性,并提供最坏情况最优性保证。
Comments Accepted at the International Conference on Machine Learning (ICML) 2026
关于GD和SGD中非线性动力学的稳定性:超越二次势能
发表机构 * CISPA Helmholtz Center for Information Security(CISPA赫尔姆霍兹信息安全中心)
AI总结 研究梯度下降和随机梯度下降中非线性项对动力学稳定性的影响,推导了多元设置下稳定振荡的精确条件,并发现SGD的稳定性由单个不稳定批次决定。
Comments Accepted to COLT 2026
基于Kolmogorov-Arnold网络中样条局部性的超快片上在线学习
发表机构 * MIT(麻省理工学院)
AI总结 针对量子计算和核聚变控制等高频系统对亚微秒级在线学习的需求,提出利用Kolmogorov-Arnold网络的B样条局部性实现稀疏更新和固定点量化鲁棒性,在FPGA上实现比MLP更高效、更具表达力的超快在线学习。
Comments Forty-Third International Conference on Machine Learning (ICML'26)
无需下降的随机自适应梯度下降
发表机构 * Univ. Bordeaux CNRS, Bordeaux INP, IMB, UMR 5251(波尔多大学 CNRS,波尔多 INP,IMB,UMR 5251)
AI总结 提出一种无需超参数调优的随机梯度自适应步长策略,利用一阶随机Oracle的局部几何信息,理论证明收敛性,实验与调优基线竞争。
未约简持久图在拓扑机器学习中的应用
发表机构 * Department of Mathematics and Statistics, Florida Atlantic University, Boca Raton, FL(数学与统计学系,佛罗里达国际大学, Boca Raton, FL)
AI总结 研究未约简边界矩阵生成的拓扑特征向量在机器学习中的性能,发现其与完全约简持久图性能相当甚至更优,且计算内存需求低一个数量级。
Comments Substantially expanded to include additional ML and software benchmark experiments. 11 figures, 4 tables, 20 pages (without appendix and references)
连续语音帕金森病检测:基于声学和非谐和性特征
AI总结 提出一种基于连续语音的帕金森病检测方法,利用传统声学特征和新型非谐和性特征,实验表明连续语音模型优于持续元音模型。
联合模型中极端随机效应的改进预测:WRaPs
AI总结 针对联合模型中极端随机效应预测的回归均值问题,提出加权随机效应预测器(WRaPs),通过最小化加权平方预测误差来改善尾部估计,并在贝叶斯框架下提供解析解和MCMC计算方案。
应用Weibull形状参数检验进行药物警戒信号检测:基于R包WSPsignal
AI总结 提出Weibull形状参数检验家族用于药物警戒信号检测,开发R包WSPsignal集成多种估计方法和分布,支持默认与仿真调优,通过大样本和小样本示例展示功能。
使用马尔可夫决策过程对2型糖尿病护理随访间隔进行上下文感知优化
AI总结 提出上下文马尔可夫决策过程模型,利用电子健康记录数据为2型糖尿病患者优化个性化随访间隔,识别低风险和高风险亚群,相比固定间隔策略显著降低预期累积成本。
超越AHI:一种可解释的因果发现引导的睡眠恢复框架在互联健康中的应用
发表机构 * University of California, Irvine(加州大学尔湾分校)
AI总结 提出一种可解释的因果发现引导框架,从多模态PSG中推导层次化睡眠恢复评分(SRS),在两大队列中SRS与感知恢复的关联强度是AHI的2.5倍。
Comments 6 pages, 2 figures, 2 tables. Accepted at the 2nd Workshop on Sensing and Computing for Smart and Connected Health (SCH), co-located with IEEE/ACM CHASE 2026
具有隐藏底层家庭结构的流行病最终规模数据集的贝叶斯推断
AI总结 提出一种基于MCMC的贝叶斯推断方法,通过插补未报告的家庭结构来估计传染病传播强度,在合成数据上实现超90%覆盖率,并利用COVID-19数据表明按家庭规模分层可降低估计不确定性。
延迟治疗启动的外部对照试验中生存分析的索引日期插补
AI总结 针对外部对照试验中因治疗启动延迟导致的索引日期错位问题,提出截断感知的索引日期插补(IDI)方法,结合倾向得分加权以校正混杂,模拟和真实数据验证其减少偏差的有效性。
面板数据中的因果预测:一种双向合成预测方法
AI总结 针对面板数据中未经历干预的目标单元的未来结果预测问题,提出双向合成预测(TWSF)方法,结合合成控制与时间序列外推,给出有限样本误差界和渐近正态性,并通过NFL体育场开放案例验证。
族群密度代表什么?基于统一英国小区域普查数据的广泛使用的背景测量的空间共现网络
AI总结 通过分析英国23.9万小区域普查数据,使用混合图模型和空间自相关分析,揭示族群密度并非单一背景标量,不同族群的密度百分比代表不同的邻里背景特征。
Gini-Bayes 联系:CAP 斜率作为贝叶斯定理,及其在证据权重、Somers' $D$ 和校准中的应用
AI总结 本文明确将累积精度曲线 (CAP) 的斜率识别为贝叶斯定理在累积坐标下的形式,并由此推导出证据权重、信息值、准确率比、Somers' $D$ 和 Gini 系数之间的几何关系,同时提出基于 Gini 系数差异的校准诊断方法。
Comments 19 pages, 7 figures, 6 tables. Code and data: https://github.com/deburky/gini-bayes-paper
基于梯度的随机优化在效用型短缺风险中的应用
AI总结 本文扩展了效用型短缺风险(UBSR)以涵盖无界随机变量,提出其梯度估计器,并基于随机梯度算法给出强凸、凸和非凸目标下的非渐近收敛界。
ToolChain-CRC: 检索与工具使用漂移下代理型AI的共形风险控制
发表机构 * The University of Texas Rio Grande Valley(德克萨斯大学里奥格兰德谷分校) ; Florida International University(佛罗里达国际大学)
AI总结 针对检索增强和工具使用代理在漂移下的风险控制问题,提出ToolChain-CRC方法,通过构建轨迹级风险评分并校准接受或干预规则,实现可证明的轨迹级风险控制。
Comments 26 pages, 11 figures
f-差分隐私的顺序审计
AI总结 提出基于输出样本的顺序审计器,自适应确定样本量以检测f-DP违规,降低采样成本,支持白盒和黑盒设置。
Comments 24 pages, 10 figures
加速网络智能体分散:领地行为与方向性偏倚懒惰随机游走
AI总结 研究通过领地行为和方向性偏倚懒惰随机游走加速网络智能体分散,理论分析和模拟表明领地行为大幅降低分散时间,方向性偏倚可进一步加速。
通过迁移学习弥合结构易损性建模中的数据空白:方法与案例研究
发表机构 * Department of Civil and Environmental Engineering, Rice University(Rice大学土木与环境工程系) ; Ken Kennedy Institute, Rice University(Rice大学肯尼迪研究所)
AI总结 提出以方法为中心的迁移学习框架,解决领域偏移、类别不平衡和目标标签稀缺问题,通过三个案例验证其在低数据场景下提升失效检测与预测稳定性的有效性。
Comments 24 pages, 12 figures
题库质量保证分析(AQuAP):AI驱动评估系统中题库健康的监控与维护
AI总结 提出AQuAP仪表盘环境,通过有效题库规模等指标监控题库质量,支持大规模自动与人工结合的试题开发,确保高利害测试的题库健康。
Comments 11 pages, 4 figures
IOAH3: 重要性驱动的自适应空间划分
发表机构 * Interdisciplinary Transformation University Austria(跨学科转型大学奥地利)
AI总结 提出IOAH3方法,通过多源特征提取、马尔可夫随机场图割优化和数据驱动层次细化,构建自适应空间划分,解决可修改面积单元问题。
TS-Fault: 针对结构性故障的时间序列预测器基准测试
发表机构 * Ray-zyy
AI总结 提出TS-Fault基准,通过参数化故障场景(沿观测/机制、单变量/多变量两轴)评估时间序列预测模型鲁棒性,发现干净数据准确性与鲁棒性负相关、机制级故障重排排名、基础模型最脆弱。
gsynth R包中的未记录行为及其对三项已发表研究的影响
AI总结 研究发现gsynth包在特定选项组合下因实现错误严重低估标准误,导致假阳性率升高,并影响三篇APSR论文的结论。
机场航站楼登机口与安检点旅客排队预测
发表机构 * Korea Aerospace University(韩国航空大学) ; Korea Airports Corporation(韩国机场公社)
AI总结 提出基于Transformer的框架,利用历史队列长度、等待时间和旅客吞吐量数据,预测登机口和安检点未来两小时的队列长度与等待时间,支持主动排队管理。
Comments 10 pages, 6 figures, accepted at DASC 2026
从客户调查反馈到软件改进:充分利用数据的潜力
AI总结 提出一种端到端方法,从客户调查数据中提取有用信息,通过推断统计方法分析并驱动软件改进,同时展示用于向利益相关者传达分析结果的UX原型仪表板。
Comments 10 pages, 8 figures, published in Springer Nature
Journal ref Lecture Notes in Computer Science, Volume 15795, Pages 3-19, 2025
基于Knockoff滤波器与多准则权衡的数据驱动稀疏识别控制偏微分方程
发表机构 * RIKEN Center for Advanced Intelligence Project (AIP)(RIKEN先进人工智能项目中心) ; The University of Osaka(大阪大学)
AI总结 提出KO-PDE-IDENT框架,通过模型-X knockoff滤波器控制错误发现率,结合递归特征消除和多准则决策,从噪声数据中稀疏识别偏微分方程。
Comments 44 pages, 5 figures, 11 tables
面向全球站点业务天气预报的物理信息时间序列模型基准测试
发表机构 * Department of Computer Science and Engineering, Hong Kong University of Science and Technology, Hong Kong SAR China(香港科技大学计算机科学与工程系) ; Department of Computer Science and Engineering, Southern University of Science and Technology, Shenzhen, China(南方科技大学计算机科学与工程系) ; School of Computer and Information Sciences, University of Newcastle, Newcastle, Australia(新castle大学计算机与信息科学学院) ; Hangzhou Innovation Institute of Beihang University, Hangzhou, China(北京航空航天大学杭州创新研究院) ; Shanghai Artificial Intelligence Laboratory, Shanghai, China(上海人工智能实验室)
AI总结 提出大规模观测数据集WEATHER-5K和物理信息模型PhysicsFormer,通过压力-风对齐和能量感知平滑损失增强物理一致性,在多个天气变量和极端事件预测上评估学术模型与业务系统的差距。
Comments Accepted by ICML2026
太阳耀斑数据源中的缺陷与不一致性:对机器学习预报的影响
AI总结 本研究识别了太阳耀斑数据源中的缺陷与不一致性,量化其影响,并提出修复或缓解方法,为机器学习预报模型的数据选择提供建议。
使用几何非负矩阵分解和高通量多污染物空气传感器数据在美国巴尔的摩柯蒂斯湾进行空气污染负担源解析
AI总结 本研究利用几何非负矩阵分解方法分析高时空分辨率多污染物传感器数据,成功识别出三个稳定潜在源,并定量评估了其对不同污染物的贡献,展示了社区空气监测从污染检测向源识别转变的潜力。
深度神经网络驱动的基于模拟推理的极点估计方法在模型误设定下的应用
AI总结 提出深度神经网络驱动的基于模拟推理方法,在模型误设定下比传统卡方最小化更准确估计共振极点位置,以ππ散射和ρ(770)共振为例验证。
Comments 12 pages, 4 figures
大语言模型生成器-调节器博弈的变分框架
发表机构 * Department of Electrical and Computer Engineering, Tandon School of Engineering, New York University, Brooklyn, NY, USA(电气工程系,工程学院,纽约大学,布鲁克林,纽约,美国)
AI总结 提出一个变分框架,将语言生成建模为熵正则化吉布斯分布,将调节建模为最优判别器,通过鞍点问题平衡效用、熵、调节一致性和有限长度可检测性,并通过审查过滤和钓鱼防御案例验证。
关于归一化逆高斯过程两个被忽视的棍子断裂构造
AI总结 本文揭示了归一化逆高斯随机离散分布的两种替代棍子断裂构造,分别基于条件布朗运动划分和归一化广义Gamma子序的随机时空变换,并推广到更广泛的分布族。
Comments 10 pages
神经网络内部表示的Patnaik-Pearson本征维数
AI总结 提出Patnaik-Pearson维数度量数据流形的本征维数,应用于神经网络内部表示,证明其性质,并与HTSR/SETOL分析关联,通过BERT-base和DeepSeek-R1模型研究维数演化。
Comments 35 pages, 19 figures
具有延迟和缺失响应的群组高效随机自适应设计
AI总结 提出一种基于ERADE的群组响应自适应设计,通过固定时间间隔招募和动态更新分配概率,处理延迟和缺失响应,保留原设计的渐近性质。
Gamma模型中的贝叶斯预测:可容许性与无穷小预测
AI总结 研究Gamma模型中形状参数已知、尺度参数未知时的估计与预测问题,证明基于Jeffreys先验的贝叶斯预测密度对所有α>0是可容许的,并建立无穷小预测框架。
推断模型:辅助变量在科学不确定性推理中的力量
AI总结 本文探讨推断模型(IMs)作为无先验概率推理的框架,通过预测辅助变量并利用校准预测随机集传递合理性陈述,实现频率校准的不确定性评估,并阐明与费希尔、内曼、登普斯特-谢弗等方法的联系。
Comments 29 pages, 4 figures
使用预测分布混合的自适应序列变化检测
AI总结 针对后变化分布未知的独立观测序列变化检测问题,提出一种基于滑动窗口预测分布混合的PM-CuSum算法,实现一阶渐近最优性且渐近延迟余项更小。
非高斯弱引力透镜似然:多元Copula构建及其对宇宙学约束的影响
AI总结 提出用Copula方法构建两点相关函数的非高斯似然,在大尺度上比高斯似然更准确,但对Stage-IV巡天影响可忽略。
Comments 16 pages, 5 figures in the main text. Published in the Open Journal of Astrophysics
Journal ref The Open Journal of Astrophysics, Vol. 9, 2026
无穷多臂老虎机的自适应算法:统一框架
AI总结 提出统一框架OSE和PROSE算法,针对预算小于臂数(可能无穷)的老虎机问题,自适应臂均值分布,最大化期望简单奖励,实现近最优率。
半随机模型中植入子图的鲁棒检测
AI总结 研究半随机模型下植入子图检测问题,证明存在对抗者时强次对数密度子图检测在信息论上不可能,而对数以上密度子图统计极限不变,并设计了高效鲁棒检测算法。
Comments 38 pages, 2 figures
因子模型的规范分解:弱因子无处不在
AI总结 本文提出因子模型的规范分解,引入弱公共成分(动态与静态公共成分之差),并通过理论和实证表明该成分不可忽略,且考虑弱成分可获得更合理的脉冲响应函数。
关于稀疏线性回归极小风险的一个注记
AI总结 本文推导了稀疏线性回归在各项同性高斯随机设计下极小风险的渐近精确表达式,即$2\sigma^2 k/n \log(p/k)$,并总结了现有结果和未解决问题。
面板数据中因忽略非线性而弱化的工具变量:一个超级学习控制函数估计器
AI总结 本文研究面板数据中因忽略非线性导致的弱工具变量问题,提出超级学习控制函数估计器以解决结构参数的识别问题。
贝叶斯变量选择用于受 censoring 的空间响应:应用于加利福尼亚州 PFAS 浓度
AI总结 本文提出一种贝叶斯框架,结合近似高斯过程处理受 censoring 的空间数据,并通过交叉验证评估三种后选择策略,以识别影响 PFAS 浓度的关键预测变量。
多重体投影集合在学习量子数据分布中的普遍性
发表机构 * Quantum Laboratory, Fujitsu Research, Fujitsu Limited, Kawasaki, Kanagawa 211-8588, Japan(富士通量子实验室,富士通研究,富士通株式会社,神户,神奈川县211-8588,日本)
AI总结 本文探讨了多重体投影集合框架在量子机器学习中的普遍性,证明了其能近似任意纯态分布,并提出改进训练的增量MPE方法,通过实验验证了其在复杂量子数据分布学习中的有效性。
Comments 21 pages, 6 figures (added Github repository)
Journal ref IJCNN 2026
具有空间信息的变换器:将地理统计学协方差偏置注入自注意力机制以进行时空预测
发表机构 * Unimercatorum(乌尼默卡图姆大学)
AI总结 本文提出一种混合架构,通过可学习的协方差核将地理统计学归纳偏置注入自注意力机制,以提升时空预测的准确性与物理合理性。
线性系统辨识中通用滤波和平滑的实验验证:基于自适应调节
AI总结 本文通过五层剪切框架的实验验证了通用滤波和平滑方法在有无直接反馈情况下的鲁棒性,引入自适应调节机制提升实时适应能力,适用于结构健康监测中传感器网络偏离理想配置的情形。
Bootstrap模型平均
AI总结 本文提出一种基于bootstrap的模型平均方法,通过最小化bootstrap准则选择权重,证明所得估计量在渐近意义上最优,并推导了其极限分布。
一种用于有信息缺失数据的共聚类贝叶斯模型
AI总结 本文提出一种贝叶斯非参数模型,用于共聚类多变量有序数据,通过将缺失值视为信息而非缺失,提升对数据潜在结构的理解。
Comments 25 pages, 11 figures
具有空间选择性和依赖性的随机效应用于小区域估计:应用于租金负担
AI总结 本文提出考虑随机效应和潜在过程空间依赖性的模型,提升小区域估计的预测精度,通过实证研究和县级租金负担估计展示其有效性。
Journal ref J. R. Stat. Soc. Ser. A Stat. Soc. (2025) qnaf063
智能手机触发数据的生存建模用于地震参数估计在预警中的应用。应用于2023年土耳其-叙利亚事件和2019年Ridgecrest事件
AI总结 本文提出基于生存混合治愈模型的统计方法,用于估计地震参数,并设计高效温控MCMC算法处理后验分布多模态问题,应用于土耳其-叙利亚和Ridgecrest地震数据。
Journal ref Journal of the Royal Statistical Society Series A: Statistics in Society 189(1), qnae148 (2025)
从子集对应关系中学习运输成本
发表机构 * Department of Electrical Engineering(电气工程系) ; Department of Genetics(遗传学系) ; Stanford University(斯坦福大学) ; Department of Biomedical Data Science(生物医学数据科学系)
AI总结 本文提出OT-SI算法,通过子集对应关系学习运输成本函数,有效提升多数据集对齐性能,在图像、婚姻匹配和单细胞RNA测序等任务中优于现有方法。
Journal ref International Conference on Learning Representations (ICLR 2020)
一种多状态条件逻辑回归模型用于动物运动分析
AI总结 本文提出一种基于条件逻辑回归的多状态动物运动分析方法,用于区分动物觅食和迁徙区域,揭示栖息地异质性对功能连通性的影响。
Journal ref The Annals of Applied Statistics, 2017, 11 (3), 1537-1560
一种通用的隐藏状态随机游走模型用于动物运动
AI总结 本文提出了一种通用的隐藏状态随机游走模型,用于描述考虑环境特征的动物运动趋性,通过圆形-线性过程建模动物连续定位间的方向和距离,并通过隐藏过程结构捕捉动物运动行为的变化,同时引入多个环境目标到方向模型中。
Comments 28 pages
Journal ref Computational Statistics & Data Analysis, Volume 105, January 2017, Pages 76--95