A case study of causal mediation using Bayesian nonparametrics and semiparametric corrections
使用贝叶斯非参数和半参数修正的因果中介分析案例研究
AI总结 提出截断富集狄利克雷过程混合模型估计自然直接和间接效应,结合高效MCMC算法和基于有效影响函数的一步后验修正,解决贝叶斯非参数中因果估计量的可靠推断问题。
使用贝叶斯非参数和半参数修正的因果中介分析案例研究
AI总结 提出截断富集狄利克雷过程混合模型估计自然直接和间接效应,结合高效MCMC算法和基于有效影响函数的一步后验修正,解决贝叶斯非参数中因果估计量的可靠推断问题。
DASH: 一种用于大规模凸MIQP的降维方法及其在子集投资组合选择中的应用
AI总结 提出DASH降维方法,通过减少变量层次改善大规模凸MIQP求解器性能,在子集投资组合选择中显著提升Gurobi难以求解问题的初始解质量。
小样本有序情境下的社区检测:德尔菲数据的基准测试框架
AI总结 针对德尔菲数据高维小样本导致的秩亏问题,提出从变量中心协方差模型转向网络中心连接模型,利用社区检测算法识别潜在主题结构,实现结构稳定的降维。
因果推断中的迭代期望定律入门
AI总结 本文介绍迭代期望定律及其在因果效应识别中的应用,通过g公式的两种非参数等价形式(NICE和ICE)和三个数值示例阐明其数学直觉。
移位指数模型的最小风险与成本高效双序贯检验框架及其在降水数据中的应用
AI总结 提出一种双序贯抽样框架,通过控制第一类错误概率并最小化包含第二类错误和抽样成本的损失函数,检验两个移位指数模型的位置参数差异,具有一阶、二阶效率和风险效率。
省略协变量的比例风险模型中的内置选择偏倚:模拟证据与替代方法
AI总结 本文通过模拟和实际数据,证明在随机试验中,即使省略的协变量与处理独立,仍会导致Cox比例风险模型估计的处理风险比存在偏倚,并比较了脆弱模型、加速失效时间模型和Kaplan-Meier曲线等替代方法的稳健性。
混合行政删失与随机删失下的Ghosh-Lin和Fine-Gray模型
AI总结 针对同时存在行政删失和随机删失的数据,提出结合风险集调整和逆概率删失加权的方法,使Ghosh-Lin和Fine-Gray模型得到一致估计。
协变量调整的功能主成分分析用于建模美国人口体力活动的风险率
AI总结 提出基于风险函数的分布分析方法,利用功能主成分分析(FPCA)从腕部加速度计数据中刻画个体活动强度分布变异,优于均值摘要。
一种用于汇总遗传数据的贝叶斯时空最近邻高斯过程模型
AI总结 提出最近邻高斯过程模型,结合序贯蒙特卡洛平方算法,高效推断汇总遗传数据中的单倍型频率,并应用于非洲抗疟药物耐药性遗传数据分析。
多重检验中的无标签校准
AI总结 针对多重检验中无法观测真实标签的难题,利用有序p值间距构造伪标签,实现局部错误发现率的校准,并揭示q值在心理学和神经科学文献中可能严重失准。
机器学习集成小波收缩 (MLShrink)
AI总结 提出MLShrink,结合小波收缩与机器学习,通过双阈值对中间带系数进行数据自适应分类,保留经典阈值简单性,理论证明其非扩张性和oracle一致性,在非平滑信号上表现优异。
SCOPE 收缩:小波去噪的统一框架
AI总结 提出基于对称单峰分布累积分布函数的SCOPE收缩族,通过两个可解释参数分离尺度与形状效应,实现局部强收缩与渐近无偏的平衡,在小波去噪中性能与可解释性兼具。
通过自适应谱收缩的过拟合高维矩阵分解
AI总结 提出EigenBayes方法,通过谱估计和自适应经验贝叶斯校准超参数,实现快速且具有不确定性量化的过拟合因子模型,在数值实验和基因组学应用中优于现有方法。
高级校准分析与工具:识别随机利率模型校准中的有影响观测值
AI总结 将校准问题嵌入非线性回归理论,证明最小化RMSRE等价于加权最小二乘,开发诊断框架(加权帽子矩阵、影响函数、泛函Delta方法),实证发现杠杆边界主导、有效维度损失及2022年后参数稳定性转变,指出低RMSRE不足以验证校准。
Comments 47 pages, 9 figures, 1 table
如何发现异常值:一种集成异常检测框架
AI总结 针对风险估值输出中的异常问题,提出集成质量评估框架(EQAF),结合多种无监督异常检测方法,在信用衍生品数据上实现F1分数61-79%,优于最佳单一方法(6-66%),并揭示纯统计方法无法检测冻结馈送异常。
劳动力之后是什么资本?预测人机时代的人才ROI转型
AI总结 针对AI增强打破劳动时间与贡献的会计关联,本文构建从时间到产出的人才ROI预测框架,核心定理为ROI反转,并利用韩国52小时工作制案例验证了前期压力信号,预测产出型企业在2032年TFP增长领先1.5-2.0个百分点。
Comments 90 pages, 6 figures
哪些投资组合?因子模型表现的构建依赖性
AI总结 研究发现因子模型表现高度依赖于测试资产的构建方式,如选股、初始加权、持有期和再平衡,其中买入持有策略偏好FF5和FF6,而每日恒定加权偏好FF3,且q5在因子跨度测试中夏普比率最高但定价误差较大。
预测市场是否与期权价格匹配?来自币安和Polymarket的比特币阈值证据
AI总结 本文通过比较Polymarket预测市场与币安期权隐含的比特币阈值合约价格,发现两者之间存在显著且持久的定价差距,平均约6.3个百分点,表明数字金融市场碎片化导致经济上相同的收益产生系统性定价偏差。
Comments 22 pages, 6 figures, 7 tables; JEL: G13, G14, G19
大规模随机基因调控网络中的振荡与空间模式
AI总结 研究负反馈与扩散的循环基因调控网络,通过确定性和随机方法分析其稳定性,发现随机波动可诱导图灵失稳,为理解发育中的模式形成提供新视角。
Comments 16 pages, 10 figures
婴儿大脑发育中结构-功能模块一致性的鲁棒概率测量
AI总结 提出基于随机模块的概率方法,鲁棒测量婴儿大脑结构-功能模块一致性,发现0-5岁间一致性下降,初级脑区一致性更高。
BioHarness:面向生物医学问答的底物感知证据组装——跨文献、知识库和生物图谱
AI总结 提出BioHarness,通过级联控制机制在文献检索、知识库和生物图谱间选择性组装证据,提升生物医学问答准确率,在19,302个问答项上得分从65.9提升至71.0。
Comments 14 Pages, 11 Figures, Keywords: biomedical question answering; retrieval-augmented generation; large language models; evidence assembly; biomedical knowledge bases; biological atlases
bioETH-Beacon: 基于全同态EVM的机密基因组信标,支持加密计数、过滤和有界噪声
AI总结 提出基于全同态EVM的智能合约原型bioETH-Beacon,实现加密基因组信标查询,通过加密计数、有界噪声和访问控制抵御成员推理攻击,并优化查询成本。
Comments 11 pages, 6 figures, 8 tables. Research prototype for privacy-preserving genomics using Fully Homomorphic Encryption (FHE) on blockchain (fhEVM)
预测AI时代的生产率:智力融合人类框架与生产函数理论中缺失的认知中介
AI总结 本文提出智力融合人类(ICH)框架,通过引入四维认知构念“融合能力”(C)作为AI与生产率之间的认知中介,解释了AI投资未能带来相应生产率增长的理论悖论,并基于20个OECD国家的数据分析验证了AI与C的交互作用对全要素生产率变异的解释力。
Comments 78 pages, 3 figures
从效率到泄露——联邦语言模型微调中的隐私后门
AI总结 提出NeuroImprint攻击,恶意参数服务器在参数高效微调中植入隐私后门,通过为每个样本分配独立神经元并限制单次更新,实现高保真重建训练文本。
Easy Reads: 一个使arXiv上的科学论文更易读和更易访问的Python程序
AI总结 针对科学论文排版紧凑、可读性差的问题,提出Easy Reads——一个自动化、端到端的开源Python程序,通过自定义字体大小和列数等格式,从arXiv获取论文并重新排版,提升可读性和可访问性。
Comments 9 pages. Open-source software project available at: https://github.com/Curious-flow/Easy-Reads
为美元缓存,而非命中率:云出口缓存的精确离线参考及决定何时值得的交叉点
AI总结 针对云存储出口费用而非延迟的缓存问题,提出多项式时间精确离线最优策略,发现LRU的美元后悔随成本分散度上升,而成本感知的GreedyDual可大幅降低,并给出决定何时需要成本感知缓存的闭合形式交叉点。
Comments 6 pages, 3 figures. Code, benchmarks, and full pre-registration: https://github.com/samyama-ai/cloud-egress-cache
A-COMPASS:微观数据匿名性分析的形式化基础
AI总结 本文修改COMPASS语言为A-COMPASS,使其适用于微观数据表,支持匿名条件检查与匿名化操作,并证明其语义的确定性和组合性,可用于验证k-匿名和l-多样性等属性。
软件包MaRDI开放接口:提升数值优化互操作性
AI总结 提出MaRDI开放接口软件包,通过统一非线性优化接口减少编码与测试工作,并以物理信息神经网络求解粘性Burgers方程为例验证其互操作性。
Comments 15 pages, 1 figure, 1 table, GAMM2026
Farmer Connect:改善农民进入农产品市场的途径
AI总结 针对乌干达小农户面临的市场准入难、议价能力弱等问题,提出基于合作社的数字平台Farmer Connect,通过移动优先架构和云后端支持群体管理、市场协调和收益透明,实现约85%的用户需求。
随机摩尔自动机在前缀依赖同余下的极小性
AI总结 研究随机确定性迁移系统中前缀依赖同余的平凡性,证明在标签独立且每个标签至少有三个可接受符号时,同余高概率为平凡。
Comments 9 pages