arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2605.11645 2026-05-13 cs.MA cs.LG q-fin.ST

GeomHerd: A Forward-looking Herding Quantification via Ricci Flow Geometry on Agent Interactive Simulations

Lake Yang, Junwei Su, Jingfeng Zeng, Wenhao Lu, Xingzhi Qian, Weitong Zhang, Chuan Wu, Dunhong Jin

AI总结本文提出了一种名为GeomHerd的前向预测模型，用于量化市场中代理人间的从众行为。该方法基于黎曼流形几何，直接在代理交互图上测量协调结构，避免了传统价格相关性统计方法的滞后性。通过追踪代理行为图的离散Ollivier-Ricci曲率，GeomHerd能够提前预测市场从众现象，并在多个实验场景中表现出优于传统指标的预测性能。

详情

英文摘要

Herding -- where agents align their behaviors and act collectively -- is a central driver of market fragility and systemic risk. Existing approaches to quantify herding rely on price-correlation statistics, which inherently lag because they only detect coordination after it has already moved realised returns. We propose GeomHerd, a forward-looking geometric framework that bypasses this observability lag by quantifying coordination directly on upstream agent-interaction graphs. To generate these graphs, we treat a heterogeneous LLM-driven multi-agent simulator -- each financial trader instantiated by a persona-conditioned LLM call -- as a forecastable world, and evaluate the geometric pipeline on the Cividino--Sornette continuous-spin agent-based substrate as our headline financial testbed. By tracking the discrete Ollivier--Ricci curvature of these action graphs, GeomHerd captures the structural topology of emerging coordination. Theoretically, we establish a mean-field bridge mapping our graph-theoretic metric to CSAD, the classical macroscopic herding statistic, linking GeomHerd to downstream price-dispersion measurement. Empirically, GeomHerd anticipates herding long before aggregate market baselines: on the continuous-spin substrate, our primary detector fires a median of 272 steps before order-parameter onset; a contagion detector ($β_{-}$) recalls 65% of critical trajectories 318 steps early; and on co-firing trajectories the agent-graph signal precedes price-correlation-graph baselines by 40 steps. As a complementary indicator, the effective vocabulary of agent actions contracts during cascades. The geometric signature transfers out-of-domain to the Vicsek self-driven-particle model, and a curvature-conditioned forecasting head reduces cascade-window log-return MAE over detector-conditioned and price-only baselines.

URL PDF HTML ☆

赞 0 踩 0

2605.11644 2026-05-13 cs.FL cs.LG

Finite Sentence-Interface Control for Learning Bounded-Fan-Out Linear MCFGs under Fixed Monoid Typing

Takayuki Kuriyama

AI总结本文研究在固定有限单oid同态映射下的有界分支因子线性多重上下文无关文法的正例学习问题。主要挑战在于非终结符生成的元组组件在句子中可能以不同顺序出现，为此引入了“句子接口类型”作为有限的外部控制机制，用于记录元组组件的排列方式及其在句子中的边界区间值。通过构建类型化精炼、有限特征样本和正例学习器，论文证明了在固定分支因子和固定同态映射下，该文法类可以从正例数据中极限识别，并且假设的构建可在多项式时间内完成。

2605.11638 2026-05-13 stat.ML cs.LG

Learning U-Statistics with Active Inference

Xiaoning Wang, Yuyang Huo, Liuhua Peng, Changliang Zou

AI总结该论文研究了如何在标签获取成本较高的情况下，利用主动推断方法提高U统计量的估计效率。作者提出了一种基于增强逆概率加权的U统计量框架，结合采样规则和机器学习预测，设计了最优采样策略以最小化方差，并将其扩展到基于U统计量的经验风险最小化中。实验表明，该方法在保证统计推断有效性的同时，显著提升了估计效率。

2605.11583 2026-05-13 eess.IV cs.AI cs.CV cs.LG eess.SP

NexOP: Joint Optimization of NEX-Aware k-space Sampling and Image Reconstruction for Low-Field MRI

Tal Oved, Efrat Shimron

AI总结本文提出了一种名为NexOP的深度学习框架，旨在针对低场强MRI中信噪比低的问题，联合优化多重复采集（NEX）的k空间采样策略与图像重建过程。该方法通过在扩展的k空间-NEX域内优化采样密度概率，在固定采样预算下实现更高效的采样策略，并设计了新的深度学习架构，从多个低信噪比测量中重建高质量图像。实验表明，NexOP在多种加速倍数和组织对比下均优于现有方法，且能生成非均匀采样方案，有效利用NEX维度提升成像效率与质量。

2605.11531 2026-05-13 physics.ao-ph cs.LG stat.AP

Generative climate downscaling enables high-resolution compound risk assessment by preserving multivariate dependencies

Takuro Kutsuna, Noriko N. Ishizaki, Norihiro Oyama, Hiroaki Yoshida

AI总结该研究提出了一种基于扩散模型的多变量生成框架，用于生成高分辨率的气候数据，以提升复合风险评估的准确性。该方法通过结合偏差校正技术，有效恢复了在分辨率提升后退化的变量间相关性，从而更精确地捕捉如干旱、热应激等复合灾害的关联特征。实验表明，该方法在提高单变量和空间精度的同时，显著降低了变量间相关性误差，为区域气候风险评估提供了更可靠的依据。

2605.11526 2026-05-13 math.OC cs.AI cs.LG

Efficient and provably convergent end-to-end training of deep neural networks with linear constraints

Zonglin Yang, Zhexuan Gu, Yancheng Yuan

AI总结本文研究如何高效且理论保证地进行带线性约束的深度神经网络端到端训练。为解决投影层导致的非光滑性问题，作者引入了一种高效可计算的HS-Jacobian，并证明其在多面体集上的投影操作中具有保守映射性质，从而能够无缝集成到非光滑自动微分框架中。该方法使得如Adam等高效优化算法可用于此类网络的训练，并建立了收敛性保证，实验表明其在金融、计算机视觉等多个领域表现优异。

2605.11511 2026-05-13 stat.ML cs.LG

Post-ADC Inference: Valid Inference After Active Data Collection

Shuichi Nishino, Tomohiro Shiraishi, Teruyuki Katsuoka, Ichiro Takeuchi

AI总结本文研究了在主动数据收集（ADC）后进行统计推断时的效度问题，指出传统推断方法由于数据采集过程的自适应偏差而可能失效。为此，作者提出了“后ADC推断”框架，通过结合选择性推断方法，有效校正了数据采集过程和后续数据驱动目标构建所带来的偏差，从而提供有效的p值和置信区间。该方法仅需对观测噪声做假设，适用于多种ADC过程，实验表明其在GP-UCB和TPE等方法收集的数据上具有良好的推断效度。

2605.11501 2026-05-13 cs.SE cs.AI cs.CR

Decaf: Improving Neural Decompilation with Automatic Feedback and Search

Alexander Shypula, Osbert Bastani, Edward Schwartz

AI总结本文提出了一种名为Decaf的神经反编译系统，通过引入自动反馈和搜索机制，显著提升了反编译结果的语义正确性。该方法无需依赖更多训练数据，而是利用编译器反馈指导搜索过程，从而在保持与原始源代码相似度的同时，将反编译成功率从26.0%提升至83.9%。实验表明，该方法对提升弱神经反编译模型的性能尤为有效。

Comments 15 pages, 6 figures. Preprint; under review. Code and models available at https://github.com/AlexShypula/decaf

2605.11489 2026-05-13 cs.GR cs.CV

3DGS$^3$: Joint Super Sampling and Frame Interpolation for Real-Time Large-Scale 3DGS Rendering

Yibo Zhao, Fan Gao, Youcheng Cai, Ligang Liu

AI总结 3DGS$^3$ 是一种统一的后渲染框架，旨在解决 3D 高斯点绘（3DGS）在实时渲染中超大规模场景和高分辨率下的效率瓶颈问题。该方法通过联合进行超采样和帧插值，利用可微处理的低分辨率输出，实现高分辨率与高帧率的渲染。其核心模块包括基于梯度感知的超采样网络（GASS）和轻量级时序帧插值网络（LTFI），分别提升了空间细节和时间连贯性，实验表明该方法在渲染效率和视觉质量上优于现有方法，并兼容现有的 3DGS 加速技术。

2605.11487 2026-05-13 cs.CR cs.AI cs.MA

Digital Identity for Agentic Systems: Toward a Portable Authorization Standard for Autonomous Agents

Partha Madhira

AI总结随着企业人工智能从辅助工具转向能够自主执行任务、协商结果并做出决策的自主代理，传统的身份认证已不足以满足需求，代理的授权需要具备明确性、约束性、可审计性、可撤销性和跨信任边界的一致解释性。本文通过分析保险理赔和供应链完整性等典型企业场景，揭示了现有身份与访问模型的结构性缺陷，并提出了一种基于授权载荷、约束代数和决策一致评估语义的可移植授权模型，旨在为自主代理提供跨组织、跨系统的统一授权标准。

Comments 46 pages, 10 figures

2605.11447 2026-05-13 cs.IR cs.AI

Conditional Memory Enhanced Item Representation for Generative Recommendation

Ziwei Liu, Yejing Wang, Shengyu Zhou, Xinhang Li, Xiangyu Zhao

AI总结生成式推荐（GR）是一种通过自回归生成项目语义标识符（SID）来预测目标项目的新兴范式。现有方法在构建项目级表示时面临信息丢失和结构保留的冲突，为此，本文提出了一种条件记忆增强的项目表示框架ComeIR，通过多模态引导的令牌评分、双层级记忆模块和记忆恢复预测头，有效恢复SID的结构信息与粒度细节，显著提升了生成推荐的效果与灵活性。

2605.11442 2026-05-13 cs.CR cs.AI cs.CL

Can a Single Message Paralyze the AI Infrastructure? The Rise of AbO-DDoS Attacks through Targeted Mobius Injection

Zi Liang, Ronghua Li, Yanyun Wang, Qingqing Ye, Haibo Hu

AI总结本文提出了一种新型的针对人工智能基础设施的攻击方法——Mobius 注入，该方法通过利用自主代理的语义闭包漏洞，将单条消息转化为持续递归执行的攻击指令，从而引发基于代理的定向 DDoS（AbO-DDoS）攻击。这种攻击具有轻量、隐蔽且高度可配置的特点，能够精准针对特定环境或模型提供商，实验表明其在多个主流代理系统中均能造成显著的性能恶化。为应对该威胁，研究者提出了一种基于代理组件能量分析的主动防御机制，用于检测恶意递归触发行为。

2605.11394 2026-05-13 stat.ML cs.AI cs.LG stat.AP stat.ME

Spatial Adapter: Structured Spatial Decomposition and Closed-Form Covariance for Frozen Predictors

Wen-Ting Wang, Wei-Ying Wu, Hao-Yun Huang, Xuan-Chun Wang

AI总结本文提出了一种名为 Spatial Adapter 的参数高效模块，能够在不修改原始预测模型参数的前提下，为任意冻结的初始预测器提供结构化的空间残差表示及其闭式协方差估计。该方法通过可追踪的批量 ADMM 算法，联合学习空间正则化的正交基与样本级得分，从而在残差场中提取出具有平滑性、稀疏性和正交性的低秩空间结构。该方法不仅支持对未观测位置进行克里金插值式的空间预测，还可用于不确定性量化，实验表明其在多种数据集上均能有效恢复残差空间结构，且参数量远低于传统方法。

Comments Preprint. 10 pages main text, with appendices

2605.11360 2026-05-13 cs.CR cs.AI cs.SE

Options, Not Clicks: Lattice Refinement for Consent-Driven MCP Authorization

Ying Li, Yanju Chen, Peiran Wang, Issac Khabra, Faysal Hossain Shezan, Yu Feng, Yuan Tian

AI总结随着模型上下文协议的广泛应用，如何通过用户的有意义授权来保障工具调用的安全性成为一个关键问题。本文提出了一种名为Conleash的客户端中间件，它利用风险格结构自动允许已知边界内的安全调用，同时识别并升级潜在风险，并通过策略引擎和规则细化循环实现用户定义的不变量和可复用规则。实验表明，Conleash在真实场景中表现出高准确率和低开销，并在用户研究中获得了更高的信任度和更少的交互需求。

2605.11350 2026-05-13 cs.GT cs.AI econ.TH

Human-AI Productivity Paradoxes: Modeling the Interplay of Skill, Effort, and AI Assistance

Ali Aouad, Thodoris Lykouris, Huiying Zhong

AI总结本文研究了生成式人工智能工具在工作场所和教育中广泛应用背景下，其对生产力影响的复杂机制。作者构建了一个人类与AI互动的模型，分析了技能水平、努力程度与AI辅助之间的相互作用，发现AI的不可靠性或技能发展的内生性可能导致生产力悖论，即更多AI辅助反而降低生产力。此外，研究还揭示了AI对技能分布的长期影响，指出在AI素养存在异质性的情况下，技能极化现象可能在稳态中出现。

2605.11335 2026-05-13 cs.DC cs.LG

ChunkFlow: Communication-Aware Chunked Prefetching for Layerwise Offloading in Distributed Diffusion Transformer Inference

Han Meng, Danny Willow Liu, Dong Li

AI总结本文研究了在分布式扩散变换器（DiT）推理中，如何通过通信感知的分块预取技术提升层间卸载的效率。针对现有层间卸载在计算负载较小时无法隐藏预取延迟、以及与PCIe通信冲突的问题，作者提出ChunkFlow，一种基于分块粒度的自适应卸载运行时系统，能够动态协调预取与通信操作，实现计算与通信的协同调度。实验表明，ChunkFlow在保持相近推理时间的前提下显著降低了峰值GPU内存占用，并在不同工作负载下提供了可调节的内存-延迟权衡。

2605.11315 2026-05-13 cs.SE cs.AI cs.CR

Natural Language based Specification and Verification

Zhaorui Li, Chengyu Song

AI总结本文研究如何利用大语言模型（LLM）基于自然语言生成系统规范并进行组合验证，以防止生成有漏洞的代码。与传统形式化验证依赖严格形式语言不同，该方法直接使用自然语言表达规范，简化了验证流程。初步实验表明，该方法在规范生成与验证任务中展现出良好潜力。

2605.11286 2026-05-13 eess.SP cs.SD eess.AS

Adaptive Diagonal Loading using Krylov Subspaces for Robust Beamforming

Manan Mittal, Ryan M. Corey, John R. Buck, Andrew C. Singer

AI总结本文针对大阵列麦克风在动态声学环境中进行自适应波束成形时面临的数据快照不足问题，提出了一种基于Krylov子空间的自适应对角加载方法。该方法利用Lanczos迭代构建小规模Krylov子空间，将协方差矩阵投影到低维三对角矩阵，从而高效估计其极值特征值，显著降低了计算复杂度。实验表明，该方法在保证波束成形性能和白噪声增益严格约束的同时，计算成本仅为传统特征值分解方法的很小一部分。

Comments 5 pages, 8 figures

2605.11284 2026-05-13 stat.ME cs.AI cs.LG

Rethinking external validation for the target population: Capturing patient-level similarity with a generative model

Mohammad Azizmalayeri, Ameen Abu-Hanna, Saskia Houterman, Marije M. Vis, Giovanni Cinà

AI总结该研究旨在解决外部验证中因目标人群与模型开发人群差异而导致的模型性能解释困难问题，提出了一种基于生成模型的框架，用于量化每个外部患者与开发数据的相似性，并在不同相似度子群中评估模型性能。通过使用自编码器等生成模型，该方法无需共享原始开发数据即可实现更灵活的相似性估计，提升了外部验证的可解释性与实用性。实验表明，该框架能够揭示传统外部验证所掩盖的模型性能差异，为模型的可迁移性评估提供了更科学的依据。

详情

英文摘要

Background: External validation is essential for assessing the transportability of predictive models. However, its interpretation is often confounded by differences between external and development populations. This study introduces a framework to distinguish model deficiencies from case-mix effects. Method: We propose a framework that quantifies each external patient's similarity to the development data and measures performance in subgroups with varying levels of alignment to the development distribution. We use generative models, specifically autoencoders, to estimate similarity, offering a more flexible alternative to traditional linear approaches and enabling validation without sharing the original development data. The utility of autoencoder-based similarity measure is demonstrated using synthetic data, and the framework's application is illustrated using data from the Netherlands Heart Registration (NHR) to predict mortality after transcatheter aortic valve implantation. Results: Our framework revealed substantial variation in model performance across similarity-defined subgroups, differences that remain hidden under conventional external validation yet can meaningfully alter conclusions. In several settings, conventional external validation suggested poor overall performance. However, after accounting for differences in patient characteristics, for some sub-groups, the model performance was consistent with internal validation results. Conversely, apparently acceptable overall performance could mask clinically relevant performance deficits in specific subgroups. Conclusion: The proposed framework enhances the interpretability of external validation by linking model performance to population alignment with the development data. This provides a more principled basis for deciding whether a model is transportable and to which patients it can be safely applied.

URL PDF HTML ☆

赞 0 踩 0

2605.11280 2026-05-13 gr-qc astro-ph.HE cs.AI

Discovery of Interpretable Surrogates via Agentic AI: Application to Gravitational Waves

Tousif Islam, Digvijay Wadekar, Tejaswi Venumadhav, Matias Zaldarriaga, Ajit Kumar Mehta, Javier Roulet, Barak Zackay

AI总结该研究提出了一种基于大型语言模型的智能代理工作流 GWAgent，用于从仿真数据中直接构建可解释的解析代理模型，以替代耗时的数值模拟。通过引入物理信息的先验假设，该方法在引力波波形建模中实现了高精度和显著加速，并揭示了波形中的紧凑物理结构。研究展示了该方法在分析实际引力波事件 GW200129 的轨道偏心率方面的应用，取得了优于传统方法的成果。

Comments 25 pages, 9 figures, codes available at https://github.com/tousifislam/GWAgent

2605.11269 2026-05-13 gr-qc astro-ph.HE astro-ph.IM cs.AI

gwBenchmarks: Stress-Testing LLM Agents on High-Precision Gravitational Wave Astronomy

Tousif Islam, Digvijay Wadekar, Zihan Zhou

AI总结该研究提出了一套名为 gwBenchmarks 的基准测试任务，用于评估大型语言模型（LLM）代理在高精度引力波天文学建模任务中的表现。这些任务涵盖插值、回归和高维时间序列建模，涉及数值方法、机器学习和物理引导方法，代表了大量计算资源的投入。实验表明，现有LLM代理在完成这些任务时普遍存在系统性错误，难以满足引力波研究中对精度的严格要求，反映出当前AI代理在科学建模方面仍面临重大挑战。

Comments 26 pages, 4 figures

2605.11240 2026-05-13 cs.GT cs.CY cs.LG

When to Ask a Question: Understanding Communication Strategies in Generative AI Tools

Charlotte Park, Kate Donahue, Manish Raghavan

AI总结本文研究了生成式AI工具中用户与模型之间的沟通策略，探讨了在何种情况下用户应主动提供更多信息以提升个性化与公平性。研究提出了一种平衡用户负担与偏好表达的优化目标，并基于用户偏好相关性的观察，分析了AI系统在信息推断与主动询问之间的最佳策略。实验表明，适当的信息征求能够减少偏好推断带来的系统性偏差，从而在保持效率的同时更好地融合多样化的用户视角。

2605.11229 2026-05-13 cs.CR cs.AI cs.SE

Comment and Control: Hijacking Agentic Workflows via Context-Grounded Evolution

Neil Fendley, Zhengyu Liu, Aonan Guan, Jiacheng Zhong, Yinzhi Cao

AI总结本文研究了自动化平台（如 GitHub Actions 和 n8n）中基于代理的工作流可能面临的安全风险，即攻击者通过精心构造的输入（如 GitHub 评论）操控大型语言模型代理，实现如凭证泄露和任意命令执行等恶意行为。为此，作者提出了首个检测与利用框架 JAW，通过一种名为“上下文引导进化”的新方法，结合静态路径可行性分析、动态提示溯源分析和能力分析，生成能够触发代理执行恶意操作的输入。实验表明，JAW 能够成功劫持大量 GitHub 工作流和 n8n 模板，并已负责任地向相关厂商披露漏洞，获得多家公司的认可与修复。

详情

英文摘要

Automation platforms such as GitHub Actions and n8n are increasingly adopting so-called agentic workflows, which integrate Large Language Model (LLM) agents for tasks such as code review and data synchronization. While bringing convenience for developers, this integration exposes a new risk: An adversary may control and craft certain inputs, such as GitHub issue comments, to manipulate the LLM agent for unwanted actions, such as credential exfiltration and arbitrary command execution. To our knowledge, no prior academic work has studied such a risk in agentic workflows. In this paper, we design the first detection and exploitation framework, called JAW, to hijack agentic workflows hosted on automation platforms via a novel approach called Context-Grounded Evolution. Our key idea is to evolve agentic workflow inputs under the contexts derived from hybrid program analysis for hijacking purposes. Specifically, JAW generates agentic workflow contexts through three analyses: (i) static path-feasibility analysis to identify feasible agent-invocation paths and the input constraints required to trigger them, (ii) dynamic prompt-provenance analysis to determine how that input is transformed and embedded into the LLM context, and (iii) capability analysis to identify the actions and restrictions available to the agent at runtime. Our evaluation of JAW on GitHub workflows and n8n templates showed that 4714 GitHub workflows and eight n8n templates can be successfully hijacked, for example, to leak user credentials. Our findings span 15 widely-used GitHub Actions, including official GitHub Actions for Claude Code, Gemini CLI, Qwen CLI, and Cursor CLI, and two official n8n nodes. We responsibly disclosed all findings to the affected vendors and received many acknowledgements, fixes, and bug bounties, notably from GitHub, Google, and Anthropic.

URL PDF HTML ☆

赞 0 踩 0

2605.11221 2026-05-13 q-bio.QM cs.LG

Beyond Manual Curation: Augmenting Targeted Protein Degradation Databases via Agentic Literature Extraction Workflows

Yaochen Rao, Farzaneh Jalalypour, N. M. Anoop Krishnan, Rocío Mercado

AI总结该研究旨在解决靶向蛋白降解（TPD）领域中实验数据缺乏结构化的问题，提出了一种结合专家反馈的大型语言模型（LLM）工作流，用于自动化从科学文献中提取关键实验信息。该方法通过少量专家标注的样本优化提示指令，并在分子胶和PROTAC两类TPD化合物的数据库中实现了高精度的数据提取与扩展，显著提升了数据库规模与实验信息的完整性。研究成果为TPD研究及更广泛的科学文献数据整理提供了可复用的工具和数据资源。

2605.11204 2026-05-13 eess.SY cs.LG cs.MA cs.SY math.AT

Multi-Agent System Identification with Nonlinear Sheaf Diffusion

Nivar Anwer, Hans Riess, Matthew Hale

AI总结本文研究了如何从多智能体系统的轨迹数据中恢复局部交互规律的问题，特别是在由非线性叠层拉普拉斯算子描述的系统中。该问题的核心挑战在于轨迹数据仅能反映节点状态的演化，而无法区分不同但等效的边势函数。研究通过叠层上同调揭示了恢复过程中的拓扑障碍，并提出在特定条件下可实现唯一恢复，同时展示了参数化类别的恢复条件与数据信息矩阵的正定性密切相关。实验验证了理论结果，并表明轨迹重现的准确性并不必然意味着交互规律的正确恢复。

2605.11202 2026-05-13 cs.CR cs.AI cs.LG cs.SE

Continuous Discovery of Vulnerabilities in LLM Serving Systems with Fuzzing

Yunze Zhao, Yibo Zhao, Yuchen Zhang, Zaoxing Liu, Michelle L. Mazurek

AI总结该研究针对大语言模型（LLM）推理服务系统中的安全问题，提出了一种基于模糊测试的灰色盒检测工具GRIEF，用于持续发现服务层中的漏洞。GRIEF通过处理多请求时间序列作为输入，结合轻量级检测机制，能够识别崩溃、性能异常和输出污染等问题，并确认可复现的服务层故障。实验表明，GRIEF在多个主流推理引擎中发现了15个漏洞，其中10个已被开发者确认，揭示了并发、缓存和状态复用等机制可能引发的安全隐患。

2605.11199 2026-05-13 hep-lat cs.LG

Operator Spectroscopy of Trained Lattice Samplers

Moxian Qian

AI总结本文研究了训练后的晶格采样器在场空间中的函数特性，而非仅关注其生成的系综。通过将采样器的输出（如流匹配速度、扩散得分或归一化流残差）投影到由对称性、高斯路径极限、有限体积模态和规范协变性预先选定的操作符基上，揭示了其内在结构。研究发现，在二维ϕ⁴模型中，训练后的直流通量教师不能仅由局域力基描述，其残差可分解为零模宾德分量和最低壳层有限k关联分量，特定操作符投影能有效降低残差，而其他控制方法则效果不佳。该方法适用于区分不同采样器类别，并为模型评估提供了统一的测试框架。

Comments 26 pages, 13 figures, 15 tables

2605.11191 2026-05-13 stat.ML cs.LG

Adaptive Policy Learning Under Unknown Network Interference

Aidan Gleich, Eric Laber, Alexander Volfovsky

AI总结本文研究了在未知网络干扰环境下进行自适应策略学习的问题，旨在同时学习网络中个体间的干扰动态并据此优化个体层面的干预分配以最大化累积收益。作者提出了一种基于吉布斯采样的汤普森采样算法，能够联合学习干扰网络并自适应优化干预策略，同时提供干扰网络的估计以支持后续因果分析。实验表明，该方法在多种场景下均能实现显著的累积收益提升，并具有良好的理论保证和实际效果。

2605.11188 2026-05-13 cs.CR cs.AI cs.ET

Adversarial SQL Injection Generation with LLM-Based Architectures

Ali Karakoc, H. Birkan Yilmaz

AI总结本文研究了如何利用大型语言模型（LLM）生成对抗性SQL注入攻击，以评估Web应用防火墙（WAF）的防御能力。作者提出了两种基于LLM的新方法——RADAGAS和RefleXQLi，并在多种WAF系统上进行了大规模实验，结果显示RADAGAS在AI/ML类WAF中表现出色，但在基于规则的WAF上效果有限。研究为利用LLM进行安全测试提供了重要的实证参考。

Comments 32 pages, 8 figures, 8 tables

2605.11179 2026-05-13 stat.ML cs.LG

Interpretable Machine Learning for Spatial Science: A Lie-Algebraic Kernel for Rotationally Anisotropic Gaussian Processes

Kane Warrior, Dalia Chakrabarty

AI总结许多三维空间场具有旋转各向异性，即变化方向不与坐标轴对齐。本文提出了一种可解释的旋转各向异性高斯过程核函数，通过三个主尺度和一个显式的SO(3)旋转参数化三维对称正定协方差度量，从而更直观地描述各向异性方向和尺度。该方法利用李代数指数映射将旋转表示为无约束的欧几里得坐标，同时保证协方差矩阵的有效性，并在合成数据和实际材料密度数据上验证了其优越性和可解释性。