Conditional Local Importance by Quantile Expectations
基于分位数期望的条件局部重要性
AI总结 提出模型无关的局部变量重要性方法CLIQUE,通过分位数期望捕获局部依赖关系,提升稳定性并直接适用于多类分类问题。
Comments 29 pages, 28 figures
基于分位数期望的条件局部重要性
AI总结 提出模型无关的局部变量重要性方法CLIQUE,通过分位数期望捕获局部依赖关系,提升稳定性并直接适用于多类分类问题。
Comments 29 pages, 28 figures
基于权重正则化的稳定且可操控的稀疏自编码器
AI总结 通过L1/L2权重正则化提高稀疏自编码器的跨种子特征一致性,并在语言模型上提升操控成功率,同时保持可解释性分数。
基于高斯过程的工具变量和近端因果推断
AI总结 提出去条件高斯过程框架,用于存在未观测混杂时的因果推断,同时提供可靠的后验不确定性量化,并通过边际似然优化实现模型选择。
从有偏且昂贵的数据源学习:预算下的极小极大最优数据收集
AI总结 针对预算固定的多源数据收集问题,提出最大化有效样本量的采样方案,结合事后分层估计器,实现极小极大最优风险。
Comments COLT 2026
SPATIA: 空间细胞表型的多模态生成与预测
AI总结 提出SPATIA模型,融合细胞形态、基因表达和空间上下文,通过置信感知流匹配和形态-谱对齐实现多尺度生成与预测,在12项任务中优于18个基线模型。
Comments ICML 2026
向量量化中度量普适性的代价至多为0.11比特
AI总结 本文证明存在一个通用码本,对于所有可能的X统计量,在W为高斯时,其性能至少与速率每维度降低0.11比特的X自适应水填充码本相当。
Comments 41 page, 1 figure
超越独立基因:学习模块归纳表示用于单细胞基因扰动预测
AI总结 提出scBIG框架,通过基因关系聚类、基因簇感知编码器和结构感知对齐学习协调的基因程序模块表示,结合条件流匹配实现灵活泛化的扰动预测,在多个单细胞扰动基准上平均提升6.7%。
最大化相对改进:将公平学习视为讨价还价问题
AI总结 提出将群体公平解释为子群体间的讨价还价问题,通过相对改进指标恢复Kalai-Smorodinsky解,并给出公理化和有限样本收敛保证。
Comments Accepted at ICML 2026
学习增强的形式化推理:从合约合成到工件复用和形式语义
AI总结 提出将形式化方法与人工智能融合的长期研究愿景,通过自动化合约合成、语义工件复用和精化理论,构建知识驱动的验证生态系统,加速未来保障。
Comments LNCS Proceedings Submitted Version. 17 pages. Accepted and presented at VERIFAI-2026: The Interplay between Artificial Intelligence and Software Verification LASER center, Villebrumier, France, March 8-11, 2026
大型语言模型的隐性协调
AI总结 研究大型语言模型在多智能体无通信协调中的焦点涌现能力,通过博弈和搜救任务评估,发现模型在多数场景匹配或超越人类,但在数值常识和文化显著性任务中失败,并提出无学习策略改善协调。
Comments Code: https://github.com/EmanueleLM/focal-points
质疑共形预测中的覆盖-长度度量:当更短的区间并不更好时
AI总结 本文批判性检验共形预测中标准度量(覆盖率和区间长度)的充分性,揭示一种称为“偏见技巧”(PT)的反直觉方法可欺骗性地缩短区间长度而保持覆盖有效,并提出新度量“区间稳定性”以检测此类行为。
从加密视频会议流量的数据包级别测量中学习QoE
AI总结 针对ISP无法访问加密内容评估QoE的挑战,提出基于CNN的框架仅利用数据包大小预测BRISQUE和MOS,在WhatsApp和Zoom数据集上优于先前模型。
Vulcan:通过LLM驱动的搜索实现实例特化的可验证系统启发式方法
AI总结 提出Vulcan框架,利用LLM生成系统启发式方法,通过隔离决策逻辑和受限语言Anvil保证安全,在调度、缓存和内存管理上取得显著性能提升。
Comments 19 pages
增强型进化多目标深度强化学习用于可靠高效无线可充电传感器网络
AI总结 针对无线可充电传感器网络中节点存活率与充电能效的权衡问题,提出一种结合LSTM策略网络、MLP前瞻增量模型和时变Pareto策略评估的增强型进化多目标深度强化学习算法,显著优于现有方法。
Comments The article content needs to be significantly revised
学习上下值包络以塑造在线强化学习:一种原则性方法
AI总结 提出一种两阶段框架,利用离线数据学习值函数的上下界,并将其融入在线算法,通过解耦上下界实现更灵活紧致的近似,理论分析给出高概率遗憾界,实验表明显著降低遗憾。
Comments 35 pages, 5 figures
BadScientist: 研究代理能否写出令人信服但不严谨的论文来欺骗LLM审稿人?
AI总结 提出BadScientist框架,通过无需真实实验的呈现操纵策略生成造假论文,揭示LLM审稿系统存在系统性漏洞,造假论文接受率高达一定水平,且审稿人存在“担忧-接受冲突”,当前检测方法效果有限。
Comments ACL 2026; Project Page at https://bad-scientist.github.io/
无崩溃的递归学习:基于加权的稳定化框架
AI总结 针对递归生成模型训练中的模型崩溃问题,提出基于加权的训练策略,在混合真实与合成数据场景下,理论推导出最优加权方案的统一表达式,揭示合成数据利用与模型性能间的权衡。
Comments This article has been accepted for publication in Journal of the Royal Statistical Society: Series B, published by Oxford University Press
破解代码:通过系统性越狱攻击对AI代码代理进行安全评估
AI总结 提出JAWS-Bench基准测试,通过三级工作区评估代码LLM代理的越狱风险,发现代理化使攻击成功率提升1.6倍,并揭示可执行攻击代码的高比例。
Comments 22 pages, 18 figures, 8 tables
基于相似性核的稳健局部多项式回归
AI总结 针对传统局部多项式回归对异常值敏感的问题,提出一种结合响应变量信息的条件密度核加权方法,通过局部密度估计降低异常值影响,在保持与标准LOWESS竞争力同时降低经验偏差。
神经网络分析的动力学系统视角
AI总结 利用动力学系统重新表述深度神经网络、梯度下降等挑战,研究信息传播、训练动态和平均场极限,揭示网络嵌入、稳定性及图极限等性质。
Comments preprint of a book chapter contribution
基于预训练属性预测器的可适应方法用于跨多样约束与目标的晶体设计
AI总结 提出一种直接预测器引导的梯度优化方法,结合现成预测器、位点元素掩码、模板初始化和任务特定损失,实现数据高效、约束丰富的晶体设计,在钙钛矿中优于生成和贝叶斯基线,并支持半金属设计。
对数凹分布约束采样的随机中点方法
AI总结 提出约束域中过阻尼和动能朗之万扩散的随机中点离散化方法,通过投影算子建立统一框架,证明Wasserstein-q距离下的收敛保证并得到近最优下界。
从理论到应用:神经算子在科学计算中的实用入门
AI总结 本文综述了用于学习参数偏微分方程解算子的神经网络架构,包括DeepONet、PCANet和傅里叶神经算子,并在三个典型问题上评估其性能,同时讨论了作为贝叶斯逆问题替代模型的应用及挑战。
Comments 72 pages, 22 figures, GitHub repository: https://github.com/CEADpx/neural_operators
离散形状分析的Morse变换
AI总结 提出一种基于定向分段线性Morse理论的拓扑变换,通过记录多个高度函数下的临界点来量化嵌入对象的几何形状,生成的特征向量在配体虚拟筛选中取得最优平均AUROC。
Comments 37 pages, 3 main figures, 2 main tables, 12 appendix figures and 4 appendix tables
使用大型视觉语言模型审核不安全的用户生成内容游戏中的非法在线图像推广
AI总结 针对社交媒体上非法推广不安全UGC游戏的图像,提出UGCG-Guard系统,利用大型视觉语言模型和条件提示策略实现零样本域适应,检测准确率达94%。
Comments In Proceedings of the 33rd USENIX Conference on Security Symposium (SEC '24), August 14-16, 2024
标准化痴呆筛查测试的自动化评估
AI总结 本文研究了标准化痴呆筛查测试的自动化评分方法,通过分析手动和自动转录本的评分相关性,发现自动评分在某些任务上比人工评分更严格,但整体仍保持高相关性。
Comments Submitted to Interspeech 2022. arXiv admin note: text overlap with arXiv:2206.05018
超越交错双重差分中的平行趋势:高阶平行性下的识别
AI总结 本文提出高阶平行性假设层次,替代传统平行趋势假设,在交错双重差分设计中实现队列特定和平均处理效应的点识别,并证明聚合定理。
Comments 38 pages, 4 figures. Companion Stata command (anddp) implementing the estimator will be available soon at https://github.com/zanteneh/anddp
接收机感知的干扰诱导退化下频谱分离系数的分析与验证
AI总结 本文通过引入接收机前端特性计算依赖接收机的频谱分离系数(SSC),并利用真实和仿真数据集实验验证了干扰影响计算的鲁棒性。
Comments 7 pages, 4 figures
通过说话人日志条件将口语大语言模型扩展到多说话人音频
AI总结 提出基于说话人日志条件的口语语言模型,通过条件化声学编码器提取目标说话人表示,避免序列化输出训练导致的灾难性遗忘,在多个数据集上显著提升说话人属性转录性能。
Comments Accepted to Interspeech 2026
基于潜在空间中MeanFlow的一步式Token到波形生成
AI总结 提出MeanFlow在高度压缩潜在空间中实现一步式Token2Wav生成,解决多步流匹配解码器的速度-质量权衡,RTF提升17倍且质量损失可忽略。
Comments 5 pages, 1 figure