arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

检索范围排序方式

检索时间范围

重置

HOT 人工智能、机器人等 9

cs.AI 人工智能 cs.CV 计算机视觉 cs.CL 自然语言处理 cs.RO 机器人 cs.LG 机器学习 cs.SD 声音 cs.ET 新兴技术 eess.AS 音频语音 eess.IV 图像视频

CS 计算机 41

cs 计算机 cs.AI 人工智能 cs.AR 硬件架构 cs.CC 计算复杂性 cs.CE 计算工程 cs.CG 计算几何 cs.CL 自然语言处理 cs.CR 密码安全 cs.CV 计算机视觉 cs.CY 计算机与社会 cs.DB 数据库 cs.DC 分布式计算 cs.DL 数字图书馆 cs.DM 离散数学 cs.DS 数据结构 cs.ET 新兴技术 cs.FL 形式语言 cs.GL 综述文献 cs.GR 图形学 cs.GT 博弈论 cs.HC 人机交互 cs.IR 信息检索 cs.IT 信息论 cs.LG 机器学习 cs.LO 计算机逻辑 cs.MA 多智能体 cs.MM 多媒体 cs.MS 数学软件 cs.NA 数值分析 cs.NE 神经进化 cs.NI 网络架构 cs.OH 其他计算机 cs.OS 操作系统 cs.PF 性能 cs.PL 编程语言 cs.RO 机器人 cs.SC 符号计算 cs.SD 声音 cs.SE 软件工程 cs.SI 社会信息网络 cs.SY 系统控制

ECON 经济学 4

econ 经济学 econ.EM 计量经济 econ.GN 一般经济 econ.TH 理论经济

EESS 电气与系统 5

eess 电气与系统 eess.AS 音频语音 eess.IV 图像视频 eess.SP 信号处理 eess.SY 系统控制

MATH 数学 33

math 数学 math.AC 交换代数 math.AG 代数几何 math.AP 偏微分方程 math.AT 代数拓扑 math.CA 经典分析 math.CO 组合数学 math.CT 范畴论 math.CV 复变函数 math.DG 微分几何 math.DS 动力系统 math.FA 泛函分析 math.GM 一般数学 math.GN 一般拓扑 math.GR 群论 math.GT 几何拓扑 math.HO 历史综述 math.IT 信息论 math.KT K理论 math.LO 逻辑 math.MG 度量几何 math.MP 数学物理 math.NA 数值分析 math.NT 数论 math.OA 算子代数 math.OC 优化控制 math.PR 概率 math.QA 量子代数 math.RA 环与代数 math.RT 表示论 math.SG 辛几何 math.SP 谱理论 math.ST 统计理论

PHYSICS 物理 55

astro-ph 天体物理 astro-ph.CO 宇宙学 astro-ph.EP 地球行星 astro-ph.GA 星系物理 astro-ph.HE 高能天体 astro-ph.IM 天文仪器 astro-ph.SR 太阳恒星 cond-mat 凝聚态 cond-mat.dis-nn 无序神经 cond-mat.mes-hall 介观纳米 cond-mat.mtrl-sci 材料科学 cond-mat.other 其他凝聚态 cond-mat.quant-gas 量子气体 cond-mat.soft 软凝聚态 cond-mat.stat-mech 统计力学 cond-mat.str-el 强关联电子 cond-mat.supr-con 超导 gr-qc 广义相对论 hep-ex 高能实验 hep-lat 格点高能 hep-ph 高能唯象 hep-th 高能理论 math-ph 数学物理 nlin 非线性科学 nlin.AO 自适应系统 nlin.CD 混沌动力学 nlin.CG 胞自动机 nlin.PS 斑图孤子 nlin.SI 可积系统 nucl-ex 核物理实验 nucl-th 核物理理论 physics 物理 physics.acc-ph 加速器物理 physics.ao-ph 大气海洋 physics.app-ph 应用物理 physics.atm-clus 原子分子团簇 physics.atom-ph 原子物理 physics.bio-ph 生物物理 physics.chem-ph 化学物理 physics.class-ph 经典物理 physics.comp-ph 计算物理 physics.data-an 数据分析 physics.ed-ph 物理教育 physics.flu-dyn 流体动力学 physics.gen-ph 普通物理 physics.geo-ph 地球物理 physics.hist-ph 物理史哲 physics.ins-det 仪器探测 physics.med-ph 医学物理 physics.optics 光学 physics.plasm-ph 等离子体 physics.pop-ph 科普物理 physics.soc-ph 物理与社会 physics.space-ph 空间物理 quant-ph 量子物理

Q-BIO 定量生物 11

q-bio 定量生物 q-bio.BM 生物分子 q-bio.CB 细胞行为 q-bio.GN 基因组学 q-bio.MN 分子网络 q-bio.NC 神经认知 q-bio.OT 其他定量生物 q-bio.PE 种群进化 q-bio.QM 定量方法 q-bio.SC 亚细胞过程 q-bio.TO 组织器官

Q-FIN 定量金融 10

q-fin 定量金融 q-fin.CP 计算金融 q-fin.EC 经济学 q-fin.GN 一般金融 q-fin.MF 数学金融 q-fin.PM 投资组合 q-fin.PR 证券定价 q-fin.RM 风险管理 q-fin.ST 统计金融 q-fin.TR 交易微观结构

STAT 统计 7

stat 统计 stat.AP 统计应用 stat.CO 统计计算 stat.ME 统计方法 stat.ML 机器学习 stat.OT 其他统计 stat.TH 统计理论

2605.05876 2026-05-14 cs.GR cs.CV

3DSS: 3D Surface Splatting for Inverse Rendering

Mae Younes, Adnane Boukhayma

发表机构 * INRIA, University of Rennes（INRIA，里昂大学）

AI总结本文提出了一种名为3D Surface Splatting（3DSS）的可微表面点扩散渲染方法，用于从多视角图像中进行基于物理的逆向渲染。其核心思想是将表面分离问题直接建模为重建核的函数，从而推导出一种基于覆盖度的合成模型，能够生成抗锯齿的轮廓和稀疏区域的可见性梯度。结合优化的高动态范围环境光和密度感知的自适应细化，3DSS能够同时恢复物体的形状、空间变化的材质属性以及光照信息，并可通过有向点云重建方法自然地与基于网格的工作流程衔接。

2604.22966 2026-05-14 cs.CY cs.AI

Institutions for the Post-Scarcity of Judgment

Lauri Lovén

发表机构 * Future Computing Group, University of Oulu（奥卢大学未来计算组）

AI总结本文探讨了人工智能革命带来的“判断稀缺性”反转现象，指出随着AI技术的发展，高质量判断的生产成本趋于零，而验证信号、合法性、真实来源和整合能力等四类资源变得稀缺。文章认为，传统机构（如法院、期刊、立法机构）在制造合法判断方面正与AI技术竞争，并提出将AI政策重新定位为制度设计、构建验证与溯源的公共基础设施、以及发展战略代理下的制度组合形式等三步行动议程。

Comments 5 pages, 9 references. Submitted to Communications of the ACM (Opinion section). Comments welcome

2604.21789 2026-05-14 cs.GT cs.LG

Mechanism Design for Decentralized Risk Detection: Strict Propriety, Network Coalitions, and the Backfiring Mandat

Jian Ni, Lecheng Zheng, John R Birge

发表机构 * Pamplin College of Business, Virginia Tech（弗吉尼亚理工学院商学院帕姆林学院）； Booth School of Business, University of Chicago（芝加哥大学博斯商学院）

AI总结本文研究了在多个企业共享高风险客户群体的情况下，如何设计机制以实现去中心化的风险检测。核心问题在于各企业掌握碎片化信息，但缺乏激励进行真实共享。文章提出了一种动态机制设计框架，引入时间价值分配（TVA）机制，通过严格正确的评分规则激励企业如实报告后验信息，并分析了网络联盟中的边际贡献度，提出了优先考虑企业间交互规模而非企业规模的联盟设计原则。研究还揭示了在缺乏兼容激励设计的情况下，强制信息共享政策可能适得其反，降低整体福利。

2603.07770 2026-05-14 cs.DC cs.CL

ArcLight: A Lightweight LLM Inference Architecture for Many-Core CPUs

Yuzhuang Xu, Xu Han, Yuxuan Li, Wanxiang Che

发表机构 * Harbin Institute of Technology（哈尔滨工业大学）； Tsinghua University（清华大学）

AI总结尽管现有的CPU大语言模型推理框架已较为成熟，但它们未能充分利用多核CPU平台的计算潜力。为此，研究提出了一种轻量级的LLM推理架构ArcLight，专门针对多核CPU设计，通过高效的内存管理和线程调度，结合精细控制的张量并行技术，有效降低了跨NUMA节点的内存访问开销。实验表明，ArcLight在主流框架的基础上显著提升了推理吞吐量，最高可达46%，并且兼容各种CPU设备。

Comments Accepted by ACL 2026 Demo

2603.02245 2026-05-14 eess.AS cs.LG cs.SD

LMU-Based Sequential Learning and Posterior Ensemble Fusion for Cross-Domain Infant Cry Classification

Niloofar Jazaeri, Hilmi R. Dajani, Marco Janeczek, Martin Bouchard

发表机构 * University of Ottawa（渥太华大学）； Crynostics Inc.（Crynostics公司）

AI总结本文研究了跨领域婴儿哭声分类问题，针对信号非平稳、标注有限及领域差异大的挑战，提出了一种融合MFCC、STFT和基频特征的紧凑声学框架，并采用增强的Legendre记忆单元（LMU）建模时序动态。通过引入校准的后验集成融合方法，有效提升了模型在不同数据集上的泛化能力，实验表明该方法在跨域评估中取得了更好的宏F1分数，并具备实时部署的可行性。

Comments 7 pages, to appear in Proc. Int. Conf. IEEE Engineering in Medicine and Biology Society (EMBC 2026), Toronto, Canada, July 26-30 2026

2602.17346 2026-05-14 cs.DM cs.DS cs.LG

Partial Optimality in the Preordering Problem

David Stein, Jannik Irmai, Bjoern Andres

发表机构 * Machine Learning for Computer Vision TU Dresden（计算机视觉机器学习 TU 漳州）

AI总结本文研究预序问题，即在给定元素对的数值权重下，寻找一个预序关系以最大化特定对的权重和。该问题具有 NP 难特性，作者提出了新的部分最优条件及高效算法，用于判断某些元素对在最优预序中是否不满足关系。实验表明，这些条件有效提升了对元素对关系的高效判定比例，为实际应用提供了更高效的解决方案。

2602.16253 2026-05-14 eess.AS cs.SD

How Much Does Machine Identity Matter in Anomalous Sound Detection at Test Time?

Kevin Wilkinghoff, Keisuke Imoto, Zheng-Hua Tan

发表机构 * Aalborg University（奥胡斯大学）； Pioneer Centre for Artificial Intelligence（先锋人工智能中心）； Kyoto University（京都大学）

AI总结本文研究了在测试阶段缺乏机器身份信息时，对异常声音检测（ASD）性能的影响。作者提出了一种修改后的评估方法，将多台机器的测试录音合并处理，不依赖机器身份进行推理，仅在事后评估中使用身份标签。实验表明，这种方法揭示了传统评估下隐藏的性能下降和方法鲁棒性差异，并发现这些下降与模型隐含的机器识别准确性密切相关。

2602.07029 2026-05-14 eess.IV cs.CV

Guidestar-Free Adaptive Optics with Asymmetric Apertures

Weiyun Jiang, Haiyun Guo, Christopher A. Metzler, Ashok Veeraraghavan

发表机构 * Rice University（Rice大学）； University of Maryland, College Park（马里兰大学学院公园分校）

AI总结本文提出了一种无需引导星或波前传感器的闭环自适应光学系统，能够实时校正光学像差。该方法基于非对称孔径和机器学习，结合波前感知、点扩散函数估计与光学校正，实现了高效、低计算量的波前校正。实验表明，该方法在复杂自然场景中表现优于现有无引导星波前调控技术，测量次数和计算量分别减少了十倍和千倍。

Comments Accepted to ACM Transactions on Graphics (TOG)

2602.06021 2026-05-14 stat.ML cs.LG cs.NA math.NA math.PR

Diffusion Model's Generalization Can Be Characterized by Inductive Biases toward a Data-Dependent Ridge Manifold

Ye He, Yitong Qiu, Molei Tao

发表机构 * Georgia Institute of Technology（佐治亚理工学院）； University of Science and Technology of China（中国科学技术大学）

AI总结本文研究扩散模型在不记忆训练数据时生成样本的分布特性，提出了一种基于数据依赖的几何视角来刻画其泛化能力。作者引入了一组随时间变化的对数密度脊流形，用于表征反向扩散过程，并发现生成样本遵循“进入-对齐-滑动”的机制。研究进一步将这一几何结构与训练动态联系起来，揭示了模型架构偏差与优化误差之间的定量关系，并在合成数据和MNIST实验中验证了理论预测。

2602.02791 2026-05-14 stat.ML cs.LG math.ST stat.TH

Plug-In Classification of Drift Functions in Diffusion Processes Using Neural Networks

Yuzhen Zhao, Jiarong Fan, Yating Liu

发表机构 * Université Paris-Dauphine, PSL Chaire DIALog, Fondation du Risque Institut Louis Bachelier（巴黎-第十大学，PSL DIALog研究中心，风险基金会路易·巴舍利埃研究所）； LaMME, University of Paris-Saclay（LaMME，巴黎-萨克雷大学）； CEREMADE, CNRS Université Paris-Dauphine, PSL（CEREMADE，国家科学研究中心巴黎-第十大学，PSL）

AI总结本文研究了扩散过程中的监督多类分类问题，每个类别由不同的漂移函数表征，观测数据为离散时间轨迹。作者提出了一种基于神经网络的插件分类方法，通过估计类别特定的漂移函数进行分类，并在标准正则性假设下建立了误分类风险的收敛速率，明确了漂移估计、时间离散化和维度的影响。理论分析表明，利用扩散结构进行漂移学习能够获得比直接基于轨迹的神经分类更优的性能，数值实验也验证了该方法在不同维度下的有效性。

2602.00586 2026-05-14 q-bio.MN cs.AI cs.LG

RAG-GNN: Integrating Retrieved Knowledge with Graph Neural Networks for Precision Medicine

Hasi Hays, William J. Richardson

发表机构 * Department of Chemical Engineering, University of Arkansas（化学工程系，阿肯色大学）

AI总结该研究提出了一种名为 RAG-GNN 的端到端可训练框架，将图神经网络（GNN）与动态检索的生物医学文献知识相结合，以提升精准医学中的功能聚类性能。通过联合优化的检索投影、门控融合机制和对比对齐方法，RAG-GNN 在癌症信号通路案例中显著提升了功能聚类效果，并验证了检索信息对聚类一致性和内部紧密性的积极影响。实验表明，该方法在功能聚类任务上优于仅依赖图结构的传统方法，为精准医学中的知识整合提供了新思路。

2601.17187 2026-05-14 cs.IT cs.AI math.IT

High-Rate Quantized Matrix Multiplication I

Or Ordentlich, Yury Polyanskiy

发表机构 * Hebrew University of Jerusalem（海法大学）； MIT（麻省理工学院）； MIT-IBM Watson AI Lab（麻省理工-IBM Watson AI实验室）

AI总结本文研究了量化矩阵乘法（MatMul）问题，这对于高效部署大型语言模型至关重要。文章在无需先验统计信息的情况下，探讨了通用矩阵乘法场景中权重和激活量化的问题，并分析了量化率与失真之间的信息论基本权衡，同时对比了常用量化方案的性能。研究还为这些方案提供了准确的启发式近似，并在后续部分探讨了仅对权重进行量化的场景。

2601.15280 2026-05-14 cs.HC cs.AI

LLM-based Multimodal Feedback Produces Equivalent Learning and Better Student Perceptions than Educator Feedback

Chloe Qianhui Zhao, Jie Cao, Jionghao Lin, Kenneth R. Koedinger

发表机构 * Carnegie Mellon University（卡内基梅隆大学）； The University of North Carolina at Chapel Hill（北卡罗来纳大学教堂山分校）； The University of Hong Kong（香港大学）

AI总结本研究提出了一种基于大语言模型的实时多模态反馈系统，结合结构化文本解释与动态多媒体资源，旨在提升学习效果与学生体验。实验结果表明，该系统在学习成效方面与教师反馈相当，但在清晰度、针对性、简洁性、学习动机和认知负荷等方面表现更优。研究还发现，AI反馈在不同题型中展现出不同的促进作用，凸显了其在规模化教学中的潜力与优势。

Comments 11 pages, to be published at the 16th International Learning Analytics & Knowledge Conference (LAK '26)

2512.06109 2026-05-14 math.OC cs.LG cs.RO cs.SY eess.SY

Unifying Entropy Regularization in Optimal Control: From and Back to Classical Objectives via Iterated Soft Policies and Path Integral Solutions

Ajinkya Bhole, Mohammad Mahmoudi Filabadi, Guillaume Crevecoeur, Tom Lefebvre

发表机构 * Department of Electromechanical, Systems and Metal Engineering, Ghent University, Ghent, Belgium（电子机械、系统与金属工程系，根特大学，根特，比利时）； Core lab MIRO, Flanders Make, Belgium（Flanders Make核心实验室，比利时）

AI总结本文通过Kullback-Leibler（KL）正则化的视角，统一了多种最优控制问题的表述，提出了一种将策略和转移的KL惩罚分离并赋予独立权重的核心问题，从而推广了概率最优控制中常用的轨迹级KL正则化方法。该统一框架能够涵盖经典随机最优控制（SOC）、风险敏感随机最优控制（RSOC）及其对应的软策略变体，并揭示了软策略方法在迭代求解过程中可恢复原始目标的特性。此外，文中还识别出一种策略与转移KL权重一致的同步情况，使得问题可转化为线性Bellman算子形式，支持路径积分解法，从而将这些计算优势扩展到更广泛的控制问题中。

Comments refurbished introduction, added a few remarks, reduced size

2511.10709 2026-05-14 quant-ph cs.LG

Limitations of Quantum Advantage in Unsupervised Machine Learning

Apoorva D. Patel

发表机构 * Centre for High Energy Physics, Indian Institute of Science, Bangalore（高能物理中心，印度科学研究院，班加罗尔）； International Centre for Theoretical Sciences, Bangalore（理论科学国际中心，班加罗尔）

AI总结本文探讨了量子计算在无监督机器学习中可能带来的优势及其局限性。研究指出，量子模型通过密度矩阵替代经典概率分布来拟合数据，但其优势仅在特定数据和目标观测量下才能体现。文章通过具体例子分析了限制量子优势的关键因素，揭示了量子优势在不同任务中的依赖性和适用范围。

Comments 4 pages,1 figure. Invited talk at the 2025 IEEE International Conference on Quantum Control, Computing and Learning (IEEE qCCL2025), Hong Kong, June 2025. Published in the proceedings, pp. 39-42 (v2) Published version

Journal ref Proceedings of IEEE qCCL2025, June 2025, pp. 39-42

2510.04698 2026-05-14 q-bio.NC cs.AI econ.TH

The Bayesian Origin of the Probability Weighting Function in Human Representation of Probabilities

Xin Tong, Thi Thu Uyen Hoang, Xue-Xin Wei, Michael Hahn

发表机构 * Saarland University（萨尔兰大学）； The University of Texas at Austin（德克萨斯大学奥斯汀分校）

AI总结人类在感知概率时普遍存在系统性的扭曲，表现为典型的反S型权重模式，但其成因长期未明。本文提出一种基于贝叶斯编码-解码的解释框架，认为概率通过带有噪声的内部信号进行编码，并通过最小化贝叶斯风险进行解码。研究发现，这种编码过程中的扭曲可分解为边界回归、似然排斥和先验吸引，从而预测出反S型权重模式源于编码精度的U型分布，即在概率接近0和1时更为敏感。实验结果表明，该框架能够从数据中自然恢复出U型编码结构，并在多个任务中优于传统确定性权重函数和其它模型。

2510.03992 2026-05-14 cs.CR cs.AI

Quantitative Certification of Agentic Tool Selection

Jehyeok Yeon, Isha Chaudhary, Gagandeep Singh

发表机构 * University of Illinois Urbana-Champaign（伊利诺伊大学厄巴纳-香槟分校）

AI总结随着大型语言模型（LLMs）在智能代理系统中的广泛应用，如何准确地将用户意图映射到合适的外部工具成为一个关键问题。本文提出了一种名为LLMCert-T的统计框架，用于在真实工具分布下对工具选择流程的安全性进行定量认证，返回具有高置信度的上界概率。该方法将工具选择评估建模为伯努利估计问题，并通过条件生成过程模拟实际部署环境，从而揭示当前主流LLM代理在面对干扰选择和Top-N饱和等安全规范时仍存在较大的性能下降。

2510.00417 2026-05-14 math.OC cs.LG stat.ML

Progressively Sampled Equality-Constrained Optimization

Frank E. Curtis, Lingjun Guo, Daniel P. Robinson

发表机构 * Department of Industrial and Systems Engineering, Lehigh University（莱维大学工业与系统工程系）

AI总结本文提出了一种用于求解连续非线性等式约束优化问题的算法，适用于目标函数和约束函数由大量项的期望或平均定义的情形。该算法通过逐步增加样本量，依次求解一系列相关优化问题，从而在保证一定精度的前提下降低最坏情况下的样本复杂度。实验结果表明，该方法在实际应用中具有良好的效果。

2509.23800 2026-05-14 stat.ML cs.LG

Sample-Efficient Optimisation over the Outputs of Generative Models

Samuel Willis, Paul Duckworth, Jack Simons, Aleksandra Kalisz, Krisztina Sinkovics, Noam Ghenassia, Shikha Surana, Henry T. Oldroyd, Alexandru I. Stere, Dragos D Margineantu, Carl Henrik Ek, Henry Moss, Erik Bodin

发表机构 * University of Cambridge（剑桥大学）； Lancaster University（兰卡斯特大学）； Karolinska Institutet（卡罗林斯卡研究院）； Boeing Commercial Airplanes（波音商用飞机）； Boeing AI（波音人工智能）； InstaDeep ； Monumo

AI总结本文提出了一种名为O3的方法，用于在生成模型的输出上进行样本高效的黑箱优化，特别适用于连续变量的扩散模型和流匹配模型。该方法基于代理潜在空间，即从生成模型中提取的低维欧几里得嵌入，无需额外训练即可实现可控维度的表示，并支持直接应用标准优化算法。实验表明，在图像和蛋白质设计任务中，代理空间优化相比传统采样或原潜在空间优化能获得显著更优的样本。该方法对模型和优化器具有通用性，额外成本极低，且无需重新训练或微调生成模型。

2509.19929 2026-05-14 stat.ML cs.LG physics.comp-ph physics.data-an

Geometric Autoencoder Priors for Bayesian Inversion: Learn First Observe Later

Arnaud Vadeboncoeur, Gregory Duthé, Mark Girolami, Eleni Chatzi

发表机构 * Department of Engineering University of Cambridge（工程系剑桥大学）； Institute of Structural Engineering ETH Zürich（结构工程研究所苏黎世联邦理工学院）

AI总结本文提出了一种用于贝叶斯反演的几何自编码器先验框架（GABI），旨在解决从少量噪声观测中恢复物理系统全场信息这一高度不适定的问题。GABI通过学习不同几何结构系统的物理响应生成模型，构建出与几何条件相关的强先验信息，从而在反演过程中提升不确定性量化（UQ）的准确性与鲁棒性。该方法无需依赖物理方程或边界条件，利用近似贝叶斯计算（ABC）采样实现高效计算，并在多个复杂几何场景中验证了其有效性与可靠性。

2506.12075 2026-05-14 cs.IR cs.AI

T-TExTS (Teaching Text Expansion for Teacher Scaffolding): Enhancing Text Selection in High School Literature through Knowledge Graph-Based Recommendation

Nirmal Gelal, Chloe Snow, Ambyr Rios, Kathleen M. Jagodnik, Hande Küçük McGinty

发表机构 * Department of Computer Science（计算机科学系）； Department of Curriculum and Instruction（课程与教学系）； Kansas State University（堪萨斯州立大学）

AI总结本文提出了一种基于知识图谱的推荐系统 T-TExTS，旨在帮助高中英语文学教师更高效地选择主题一致且多样化的教学文本。该系统通过构建教育领域本体，并结合多种图嵌入方法进行优化，实验表明其在不同数据规模下均表现出优越的推荐性能。研究证明，结合结构化知识与教学价值信号的混合模型在保持可解释性的同时仍具有较高的推荐质量，为教育推荐系统提供了新的方法支持。

Comments Under Review

2505.01012 2026-05-14 quant-ph cs.CR cs.LG

Quantum Support Vector Regression for Robust Anomaly Detection

Kilian Tscharke, Maximilian Wendlinger, Sebastian Issel, Pascal Debus

发表机构 * Fraunhofer Institute for Applied and Integrated Security (AISEC)（弗劳恩霍夫应用与集成安全研究所（AISEC））

AI总结本文研究了量子支持向量回归（QSVR）在鲁棒异常检测中的应用，重点探讨其对噪声和对抗攻击的鲁棒性。通过在IBM量子硬件上对11个数据集进行基准测试，结果表明QSVR在噪声环境下仍能保持良好的分类性能，甚至在部分数据集上优于无噪声模拟。研究还发现QSVR对多种量子噪声具有一定的鲁棒性，但对振幅阻尼和校准误差噪声较为敏感，同时QSVR在面对对抗攻击时表现出较高的脆弱性。

Comments Accepted to International Conference on Agents and Artificial Intelligence (ICAART) 2026

2502.20427 2026-05-14 cs.CR cs.AI cs.SD eess.AS

DeePen: Penetration Testing for Audio Deepfake Detection

Nicolas Müller, Piotr Kawa, Adriana Stan, Thien-Phuc Doan, Souhwan Jung, Wei Herng Choong, Philip Sperl, Konstantin Böttinger

发表机构 * Technical University of Cluj-Napocay（克卢日-纳波卡技术大学）； AISRC, Soongsil University（Soongsil大学人工智能研究中心）

AI总结本文提出了一种名为DeePen的系统化渗透测试方法，用于评估基于机器学习的深度伪造音频检测分类器的鲁棒性。该方法无需了解或接触目标检测模型，而是通过一系列精心设计的信号处理攻击来测试模型的漏洞。研究发现，无论是实际部署的系统还是公开的学术模型，均存在可被简单操作（如时间拉伸或添加回声）欺骗的弱点，表明当前的深度伪造检测技术仍面临严峻挑战。

2502.11583 2026-05-14 stat.ML cs.LG

Distributional Autoencoders Know the Score

Andrej Leban

发表机构 * Department of Statistics, University of Michigan（密歇根大学统计学系）

AI总结本文研究了分布型主成分自编码器（DPA），旨在实现分布正确重建与编码可解释性的统一。通过理论分析，作者建立了最优水平集几何与数据分布得分之间的精确关系，揭示了DPA能够分离数据变化因素的机理，并允许直接从样本中恢复得分函数。此外，当数据服从玻尔兹曼分布时，该关系可用于单次拟合中近似最小自由能路径。研究还证明，在数据位于可由编码器逼近的流形上时，超出流形维度的潜在变量与数据分布条件独立，从而揭示了数据的内在维度。这些结果表明，单一模型可以在保证下同时学习数据分布及其内在维度，统一了无监督学习的两个长期目标。

Comments NeurIPS 2025 - camera-ready version

Journal ref Advances in Neural Information Processing Systems 38 (NeurIPS 2025), 2025

1804.01050 2026-05-14 stat.ML cs.CV cs.LG

Training VAEs Under Structured Residuals

Gara Dorta, Sara Vicente, Lourdes Agapito, Neill D. F. Campbell, Ivor Simpson

发表机构 * University of Bath（巴斯大学）； Anthropics Technology Ltd.（Anthropics技术有限公司）； University College London（伦敦大学学院）

AI总结本文研究了在变分自编码器（VAE）中如何更好地建模图像重构残差中的结构化相关性。传统VAE假设像素间的不确定性是独立的，但实际重构残差往往具有明显结构。为此，作者提出了一种新的方法，在VAE中引入结构化高斯似然预测网络，以建模残差中的相关性，并在保持模型复杂度较低的前提下，有效提升了VAE对颜色图像的不确定性建模能力与生成质量。

Comments Simplified training methodology, added more results

2605.13337 2026-05-14 cs.CR cs.LG

Context-Aware Web Attack Detection in Open-Source SIEM Systems via MITRE ATT&CK-Enriched Behavioral Profiling

Badr Alboushy, Assef Jafar, Mohamad Aljnidi, Mohamad Bashar Disoki, Aref Shaheed

发表机构 * Higher Institute for Applied Sciences and Technology（应用科学与技术高级学院）； Syrian Private University（叙利亚私立大学）； Arab International University（阿拉伯国际大学）； Latakia University（拉塔基亚大学）

AI总结该研究提出了一种基于行为分析的智能SIEM系统Smart-SIEM，用于检测开源平台中的网络攻击。其核心方法结合了MITRE ATT&CK框架的行为特征与机器学习模型，通过构建上下文感知的特征向量并采用两阶段混合模型（LightGBM和XGBoost）实现攻击检测与分类。实验表明，该方法在检测准确率和分类性能上显著优于传统规则引擎，并具备应对概念漂移的自适应重训练机制。

Comments 38 pages, 13 figures, 13 tables

2605.13315 2026-05-14 cs.ET cs.LG cs.NE cs.SY eess.SY q-bio.NC

Embodied Neurocomputation: A Framework for Interfacing Biological Neural Cultures with Scaled Task-Driven Validation

Johnson Zhou, Daniel Tanneberg, Forough Habibollahi, Alon Loeffler, Kiaran Lawson, Valentina Baccetti, Kwaku Dad Abu-Bonsrah, Candice Desouza, Finn Doensen, Bradley Watmuff, Daria Kornienko, Azin Azadi, Justin Leigh Bourke, Bernhard Sendhoff, Brett J. Kagan

发表机构 * Cortical Labs, Australia ； Honda Research Institute Europe, Germany

AI总结该研究提出了一种“具身神经计算”框架，旨在解决生物神经网络与传统硅基计算接口之间的最优编码与解码问题。通过在模拟环境中对生物神经网络代理进行闭环导航任务的参数优化，研究发现了12种能够稳定学习的配置，其任务表现优于相同交互预算下的硅基深度Q网络代理。该工作为基于生物神经网络的目标导向学习提供了基础，并推动了任务驱动神经计算和跨领域基准的建立。

2605.13284 2026-05-14 stat.ML cs.LG math.ST stat.TH

Learning Perturbations to Extrapolate Your LLM

Zetai Cen, Chenfei Gu, Jin Zhu, Ting Li, Yunxiao Chen, Chengchun Shi

发表机构 * School of Mathematics, University of Bristol（布里斯托大学数学学院）； School of Statistics and Data Science, Shanghai University of Finance and Economics（上海财经大学统计与数据科学学院）； School of Mathematics, University of Birmingham（伯明翰大学数学学院）； Department of Statistics, London School of Economics and Political Science（伦敦政治经济学院统计系）

AI总结该研究旨在提升大语言模型在未知领域中的泛化能力，提出了一种通过学习连续潜在向量的可学习变换来扰动词元前缀的方法。该方法克服了传统离散固定扰动的局限性，并通过推导无偏估计方程并利用随机梯度下降进行优化，建立了在过参数化场景下的统计性质。实验表明，该方法在合成和真实数据集上均显著优于现有先进方法。

Comments 35 pages

2605.13280 2026-05-14 cs.SE cs.AI

The Readability Spectrum: Patterns, Issues, and Prompt Effects in LLM-Generated Code

Hengzhi Ye, Fengyuan Ran, Weiwei Xu, Minghui Zhou

发表机构 * Peking university（北京大学）； Wuhan University（武汉大学）

AI总结随着大语言模型（LLM）在软件开发中的广泛应用，生成代码的可读性这一关键非功能性属性尚未得到充分研究。本文构建了一个综合的可读性模型，结合文本、结构、程序和视觉特征，系统评估了主流LLM生成代码在数千种场景下的可读性，并发现其整体可读性与人类编写的代码相当，但存在独特的可读性问题模式。研究还表明，提示设计对生成代码的可读性有一定影响，但整体效果有限，揭示了LLM生成代码在长期可维护性方面仍需进一步改进。

2605.13261 2026-05-14 cs.HC cs.AI

"It became a self-fulfilling prophecy": How Lived Experiences are Entangled with AI Predictions in Menstrual Cycle Tracking Apps

Wendy Zhou, Pelin Karaturhan, Alexandra Weilenmann, Jichen Zhu

发表机构 * IT University of Copenhagen（哥本哈根IT大学）； Department of Applied Information Technology, University of Gothenburg（应用信息科技系，哥德堡大学）

AI总结本文研究了月经周期追踪应用中人工智能预测如何与用户的实际体验相互交织，影响其对身体和心理状态的理解。通过半结构化访谈和群体自传研究，研究发现用户往往依据AI预测来理解自身经历，但预测的准确性受限于记录不完善，且界面设计缺乏对用户批判性思考的支持。研究还指出，非典型用户在与AI交互过程中常感到孤立，并据此提出了针对预测型AI功能的设计改进建议。

AI 大模型

视觉与机器人

科学与医疗