arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2605.07019 2026-05-11 cs.CV cs.AI

LensVLM: Selective Context Expansion for Compressed Visual Representation of Text

Roy Xie, Dan Friedman, Donghan Yu, Bowen Pan, Christopher Fifty, Jang-Hyun Kim, Xianzhi Du, Zhe Gan, Vivek Rathod, Bhuwan Dhingra

AI总结本文提出了一种名为 LensVLM 的视觉语言模型框架，旨在解决在压缩图像上进行文本处理时准确率下降的问题。该方法通过在推理阶段对压缩图像进行选择性内容扩展，仅对相关区域恢复为原始分辨率，从而在保持高准确率的同时实现更高的压缩比。实验表明，LensVLM 在多个文本问答任务中表现优于现有压缩和检索基线，并且能够有效推广到多模态文档和代码理解任务。

2605.07011 2026-05-11 cs.LG

Dual-Agent Co-Training for Health Coaching via Implicit Adversarial Preference Optimization

Da Long, Lingyi Fu, Diya Michelle Rao, Jasmine Ruales Carrera, Yang Bai, Shandian Zhe

AI总结本文提出了一种基于双智能体协同训练的健康辅导方法，旨在解决传统AI健康教练在交互能力上的不足。该方法通过同时训练健康教练代理和客户模拟器，利用隐式对抗偏好优化技术，提升双方的交互质量与辅导效果。实验表明，该方法在多个关键维度上显著提升了健康辅导的质量。

2605.07010 2026-05-11 cs.LG

Inductive Power Grid Cascading Failure Analysis with GRU-Gated Graph Attention

Tianxin Zhou, Xiang Li, Haibing Lu

AI总结本文研究了在电网级联故障发生前识别脆弱输电线路的问题，提出了一种基于GRU门控图注意力网络的方法，能够在有限训练电网的数据上进行训练，并直接应用于任何未见过的电网，无需重新训练。该方法通过GRU门控机制控制节点在级联过程中的信息保留与丢弃，实验表明其在跨时间和跨领域的新电网中均具有良好的零样本迁移能力，并能有效识别出比传统结构和电气基准方法更多的脆弱线路。

Comments 10 pages, 10 figures, IEEE format

2605.07003 2026-05-11 cs.RO cs.SY eess.SY

AirBender: Adaptive Transportation of Bendable Objects Using Dual UAVs

Jiawei Xu, Longsen Gao, Rafael Fierro, David Saldaña

AI总结本文提出了一种用于双无人机协作运输可变形物体的自适应控制方法，解决了空中机器人在处理柔性物体时因控制难度大而导致的性能下降和潜在坠机问题。该方法无需依赖显式的弹性模型，能够在运行过程中实时适应物体未知的变形特性，保证轨迹跟踪的稳定性与性能。通过硬件实验验证，展示了该方法在多种场景下有效操控多旋翼无人机运输柔性物体的能力。

2605.07002 2026-05-11 cs.AI math.ST stat.ML stat.TH

Adaptive auditing of AI systems with anytime-valid guarantees

Siyu Zhou, Patrick Vossler, Venkatesh Sivaraman, Yifan Mai, Jean Feng

AI总结本文研究了如何在有限标注成本下对生成式AI系统进行自适应审计，并保证统计推断的严谨性。作者提出了一种基于“对抗性假设检验”的框架，从模型和审计方两个视角分别设定假设，并利用安全任意时刻有效推理（SAVI）方法，将审计过程转化为一种“投注式检验”，从而实现对两个对立假设的同时检验。研究表明，当审计方法足够强大时，通过严格审计可以证明AI系统具有全局鲁棒性，实验也验证了该方法在控制一类错误和统计效能方面的优越性。

2605.06997 2026-05-11 cs.LG

Echo: KV-Cache-Free Associative Recall with Spectral Koopman Operators

Anupama Sridhar, Alexander Johansen

AI总结本文提出了一种名为 Echo 的新型关联召回架构，该架构无需使用传统的键值缓存（KV-cache），通过引入谱Koopman注意力（SKA）机制，解决了状态空间模型（SSM）在长距离信息检索中的准确率骤降问题。Echo 利用谱线性系统拟合键值历史，并通过学习的幂迭代滤波器进行检索，仅需常数内存即可实现高效召回。实验表明，与纯 SSM 或 SSM 与注意力结合的模型相比，Echo 在多个基准测试中均表现出更优的召回性能，且保持了常量推理内存的特性。

2605.06993 2026-05-11 cs.AI stat.ML

Optimal Experiments for Partial Causal Effect Identification

Tobias Maringgele, Jalal Etesami

AI总结该研究探讨了如何在观测数据中部分识别因果效应的情况下，选择成本受限的最优实验以最大程度地缩小因果效应的置信区间。作者提出了一个称为“最大效用”的问题，并证明其计算复杂度为NP难。通过引入基于因果图的剪枝准则，研究有效减少了候选实验的搜索空间，并在多个基准网络上验证了方法的有效性，展示了其在实际数据中的应用潜力。

2605.06992 2026-05-11 cs.LG stat.ML

Why Does Agentic Safety Fail to Generalize Across Tasks?

Yonatan Slutzky, Yotam Alexander, Tomer Slor, Yoav Nagel, Nadav Cohen

AI总结随着AI代理在多任务环境中应用增多，如何在未知任务中保持安全执行成为一个关键问题。本文理论分析与实验表明，代理安全能力难以跨任务泛化，不仅源于训练方法的局限，更是安全本身固有的复杂性所致。研究通过线性二次控制与$H_{\infty}$鲁棒性分析，证明安全需求会显著增加任务到控制器映射的Lipschitz常数，并在无人机导航和CRM任务中验证了该结论，指出当前提升代理安全性的方法可能存在根本性不足。

2605.06990 2026-05-11 cs.CV cs.LG

TRAJGANR: Trajectory-Centric Urban Multimodal Learning via Geospatially Aligned Neural Representations

Maria Despoina Siampou, Gengchen Mai, Ni Lao, Jinmeng Rao, Neha Arora, Cyrus Shahabi, Shushman Choudhury

AI总结该论文提出了一种名为TrajGANR的轨迹中心地理空间多模态自监督学习框架，旨在解决现有方法在处理人类移动轨迹时的不足。与传统基于静态位置对齐的方法不同，TrajGANR能够对轨迹的连续运动模式与静态地理观测进行对齐，从而实现更细粒度的多模态学习。通过联合对齐轨迹、街景图像及其地理位置，该方法在多个城市交通与道路理解任务中表现出色，验证了其在地理空间多模态学习中的有效性与优势。

2605.06987 2026-05-11 cs.LG cs.GT econ.TH stat.ML

Response Time Enhances Alignment with Heterogeneous Preferences

Federico Echenique, Alireza Fallah, Baihe Huang, Michael I. Jordan

AI总结本文研究了如何在存在异质偏好标签者的情况下，提升大语言模型与人类偏好的对齐效果。传统方法通过聚合二元选择数据构建奖励模型，但忽略了标签者之间的偏好差异，导致模型无法准确学习真实的人群平均偏好。为此，作者提出利用用户响应时间作为补充信号，结合漂移-扩散模型（DDM），设计了一种能够识别异质偏好的新估计方法，有效纠正了传统方法的偏差，并在多种数据集上验证了其优越性。该方法无需用户身份信息，具有实际应用价值。

2605.06982 2026-05-11 cs.LG

FastOmniTMAE: Parallel Clause Learning for Scalable and Hardware-Efficient Tsetlin Embeddings

Ahmed K. Kadhim, Lei Jiao, Rishad Shafik, Ole-Christoffer Granmo, Mayur Kishor Shende

AI总结本文提出了一种名为 FastOmniTMAE 的新型嵌入模型，旨在提升基于逻辑的 Tsetlin 机在静态嵌入学习中的训练效率。通过将传统的串行训练过程重构为两阶段并行流程，该方法显著加快了训练速度，并在多个基准任务中保持了良好的嵌入质量。此外，研究还实现了 FastOmniTMAE 在 SoC-FPGA 平台上的加速器版本，展示了其在资源受限硬件上高效训练逻辑嵌入的能力。

2605.06979 2026-05-11 cs.LG cs.AI stat.ML

PLOT: Progressive Localization via Optimal Transport in Neural Causal Abstraction

Jonathn Chang, Arya Datla, Ziv Goldfeld

AI总结本文提出了一种名为PLOT的方法，通过最优运输理论实现神经因果抽象中的渐进式因果变量定位。该方法通过在抽象变量与候选神经位置之间建立最优运输耦合，获得全局软对应关系，并据此校准干预句柄，从而高效定位因果变量。实验表明，PLOT在保持高精度的同时显著提升了计算效率，为大规模因果抽象研究提供了有效的定位工具。

2605.06978 2026-05-11 cs.CL cs.AI

Group of Skills: Group-Structured Skill Retrieval for Agent Skill Libraries

Kun Zeng, Yu Huo, Siyu Zhang, Zi Ye, Yuecheng Zhuo, Haoyue Liu, Yuquan Lu, Junhao Wen, Xiaoying Tang

AI总结本文提出了一种名为 GoSkills 的技能检索方法，旨在解决智能体在使用大型技能库时面临的相关技能检索与实际可用性之间的差距问题。该方法通过构建以锚点为中心的技能组，生成带有角色标签的执行上下文，从而在不改变下游智能体和执行环境的前提下，提升技能检索的效率与适用性。实验表明，GoSkills 在有限技能预算下保持了可见需求的覆盖，并在奖励和智能体运行时间方面优于现有方法。

Comments 30 pages, 4 figures, 24 tables

2605.06977 2026-05-11 cs.LG cs.AI cs.IT math.IT stat.ML

$f$-Divergence Regularized RLHF: Two Tales of Sampling and Unified Analyses

Di Wu, Chengshuai Shi, Jing Yang, Cong Shen

AI总结本文研究了在强化学习从人类反馈（RLHF）中使用一般$f$-散度正则化的问题，提出了一个统一的理论框架，填补了现有研究在该方向上的理论空白。作者基于两种不同的采样原则设计了两个算法，分别通过优化主义原则和奖励扰动敏感性进行策略优化，理论分析表明这两个算法均可达到$O(\log T)$的遗憾界和$O(1/T)$的次优性间隙，为在线RLHF在一般$f$-散度正则化下的性能提供了首个理论保证。

Comments ICML 2026

2605.06966 2026-05-11 cs.RO cs.SE

Traffic Scenario Orchestration from Language via Constraint Satisfaction

Frieda Rong, Chris Zhang, Kelvin Wong, Raquel Urtasun

AI总结本文研究如何通过约束满足从自然语言描述中生成用于自动驾驶车辆闭环测试的交通场景。核心方法是将场景编排建模为约束求解问题，利用基础模型将自然语言描述转化为约束条件，再借助现成求解器生成满足精确测试需求的场景行为。该方法在多种精心设计的场景描述基准测试中表现出色，尤其在需要自我反应性规范的场景中展现出显著优势。

Comments 19 pages, 10 figures; full version of paper accepted for poster presentation at ICRA 2026

2605.06957 2026-05-11 cs.AI

Learning and Reusing Policy Decompositions for Hierarchical Generalized Planning with LLM Agents

Shirin Sohrabi, Haritha Ananthakrishnan, Harsha Kokel, Kavitha Srinivas, Michael Katz

AI总结本文提出了一种结合通用规划与分层任务分解的动态策略学习方法，用于基于大语言模型（LLM）的智能体。该方法名为HCL-GP，通过参数化策略实现跨任务实例的泛化，并从成功执行中自动提取可复用组件，构建组件库以支持组合策略生成。研究解决了自动分解、组件泛化和语义检索三个关键挑战，在AppWorld基准测试中表现出色，显著提升了任务执行的准确率与效率。

2605.06955 2026-05-11 cs.LG cs.AI

Kurtosis-Guided Denoising Score Matching for Tabular Anomaly Detection

Victor Livernoche, Jie Zan, Reihaneh Rabbany

AI总结本文提出了一种基于峰度引导的去噪得分匹配（K-DSM）方法，用于表格数据的异常检测。该方法通过分析每个特征的边缘分布形状来动态调整噪声水平，从而在保持模型简洁性的同时提升对低密度和高密度区域的检测能力。实验表明，K-DSM在半监督和全监督设置下均取得当前最优性能，并且无需复杂的多尺度训练或超参数调优。

Comments 39 pages, 10 figures, 14 tables

2605.06951 2026-05-11 cs.AI cs.LG cs.MA

Multi-Objective Constraint Inference using Inverse reinforcement learning

Syed Ihtesham Hussain Shah, Floris den Hengst, Aneta Lisowska, Annette ten Teije

AI总结本文提出了一种名为MOCI的多目标约束推理框架，旨在从不同目标的专家轨迹中联合提取共享约束和个体偏好。该方法能够有效处理多样且可能冲突的专家行为，克服了现有方法在处理异质演示和个体偏好方面的不足。实验表明，MOCI在预测性能和计算效率方面均优于现有方法，为实际约束推理和偏好学习任务提供了准确且实用的解决方案。

2605.06947 2026-05-11 cs.LG

Rollback-Free Stable Brick Structures Generation

Chenhui Xu, Ziyue Bai, Fuxun Yu, Heng Huang, Jinjun Xiong

AI总结本文研究了如何生成物理上稳定的砖块结构，提出了一个无需回退的生成方法。通过引入强化学习框架，将物理约束从推理阶段转移到训练阶段，使模型在训练过程中学习碰撞避免、全局连接性、结构咬合和形状一致性等关键特性。该方法实现了高效且高质量的稳定砖结构生成，显著提升了生成速度，并在实验中取得了当前最优的生成效果。

2605.06946 2026-05-11 cs.LG cs.AI

Adaptive Memory Decay for Log-Linear Attention

Yaxita Amin, Helen Zichen Li, Mengfan Zhang, Samet Ayhan

AI总结本文研究了序列模型中记忆容量与计算效率之间的根本性权衡问题，提出了一种自适应记忆衰减机制以改进基于对数线性注意力的模型。传统方法中，记忆衰减参数是固定的，无法根据输入内容进行调整，而本文通过一个轻量的两层多层感知机，使每个位置和每个层次的记忆衰减参数都能根据输入内容动态学习，从而提升了模型在长距离记忆任务中的表现。实验表明，该方法在多项任务中均优于基线方法，尤其在长序列场景下效果显著。

Comments 19 pages, 13 figures. Preprint

2605.06943 2026-05-11 cs.LG

ProtoSSL: Interpretable Prototype Learning from Unlabeled Time-Series Data

Steven Song, Sahil Sethi, Brett Beaulieu-Jones, Robert L. Grossman

AI总结在需要预测性能与可解释性兼顾的时间序列领域，深度神经网络虽然表现优异，但难以解释其预测依据。为此，研究提出ProtoSSL框架，通过自监督学习从无标签时间序列数据中学习可复用的可解释原型，并通过高效分配机制将其适配到下游任务中。该方法无需标签监督，显著提升了标签效率，并在多个心电图数据集和音频分类任务中优于有监督原型方法，同时在人类评估中获得了更优的可解释性评价。

2605.06941 2026-05-11 cs.LG math.OC

Causal-Aware Foundation-Model for Bilevel Optimization in Discrete Choice Settings

Shivaram Subramanian, Zhengliang Xue, Markus Ettl, Yingdong Lu, Jayant Kalagnanam

AI总结本文提出了一种用于离散选择环境中实时最优决策的因果感知基础模型框架，旨在解决服务提供商在面对具有个性化偏好的异质用户时，如何选择最优商品组合的问题。研究引入了约束三头定价优化网络（C3PO），通过模仿学习、多任务学习和情境学习等方法，在满足业务约束的前提下生成定价建议，并利用行为经济学文献中的弹性先验提升新产品的定价效果。实验表明，该模型在模拟和真实数据集上均表现出优异的情境学习能力，并在多个实际应用场景中实现了显著的定价绩效提升。

2605.06939 2026-05-11 cs.LG stat.ME stat.ML

Bias and Uncertainty in LLM-as-a-Judge Estimation

James Fiedler

AI总结本文研究了使用大型语言模型作为裁判（LLM-as-a-Judge）进行模型评估时存在的偏差和不确定性问题。作者指出，直接使用裁判输出进行性能估计会引入系统性偏差，现有校正方法的可靠性依赖于裁判质量及跨模型校准稳定性。研究通过理论分析、模拟实验和真实数据案例，揭示了共享校准在模型比较中可能导致严重偏差甚至方向错误的问题，并提出了基于裁判质量（$J$）和跨模型校准不稳定性（$ΔJ$）的诊断指标，以指导更可靠的LLM-as-a-Judge评估实践。

2605.06938 2026-05-11 cs.LG cs.AI

A Generalized Singular Value Theory for Neural Networks

Brian Charles Brown, Robert Bridges, David Grimsman, Mauricio Munoz, Sean Warnick

AI总结本文基于布朗等人提出的广义奇异值分解（GSVD）理论，证明了大多数现代神经网络架构在最终线性层之前具有左可逆的广义奇异值分解表示，且输入输出行为保持不变。研究进一步表明，该非线性部分可以设计为保持范数，使得嵌入空间中的扰动与输入空间中的变化成比例，从而实现特征空间与输入空间距离的直接校准。论文提出了一种数据驱动的算法用于从训练好的模型中估计该表示，并设计了一种有助于该分解的网络结构，同时展示了该表示在检测对抗性扰动方面的应用潜力。

2605.06937 2026-05-11 cs.LG

A Reproducible Optimisation Protocol for Calibrating Prompt-Based Large Language Model Workflows in Evidence Synthesis

Teo Susnjak

AI总结本文提出了一种可复现的优化流程，用于校准基于提示的大型语言模型在结构化证据综合任务中的工作流。该方法将科学任务的规则与可变的提示框架分离，并通过标注示例和明确任务指标对提示框架进行优化，最终将校准后的工作流保存为可检查的制品。研究以标题和摘要筛选为例进行验证，并展示了如何利用较小的学生模型执行任务，而由较大的反思模型引导提示优化过程。

2605.06934 2026-05-11 cs.LG

Learned Lyapunov Shielding for Adaptive Control

Giansalvo Cirrincione, Adriano Fagiolini

AI总结本文提出了一种用于欧拉-拉格朗日系统的自适应控制方法，通过引入三个学习组件增强传统的Slotine-Li控制器：一个结构化二次李雅普诺夫函数、一个用于修正控制输入的残差Soft Actor-Critic策略，以及一个用于估计未建模动力学的物理感知神经网络。研究设计了一个闭式安全过滤器，确保控制输出满足安全性约束，并在无需在线求解二次规划的前提下实现全局可行性与指数稳定性。实验表明，该方法在具有非线性摩擦和可变负载的2自由度机械臂和7自由度Franka Emika Panda机械臂上均表现出优越的跟踪性能与扩展性。

2605.06931 2026-05-11 cs.LG

Target-Aware Data Augmentation for SAT Prediction

Eshed Gal, Uri Ascher, Eldad Haber

AI总结本文提出了一种面向布尔可满足性（SAT）问题的靶向感知数据增强方法，无需求解器即可生成正确标记的SAT和UNSAT实例，有效解决了传统标注方式成本高、效率低的问题。该方法通过构造与目标基准结构一致的合成数据，提升了后续学习的效果，并设计了一种结合线性规划感知的图神经网络（LPGNN），能够利用约束违反残差进行信息传递，从而更好地捕捉问题的优化结构。研究展示了该方法在数据生成速度上的显著提升，证明了结构对齐的合成数据在基于图神经网络的SAT预测中的有效性。

2605.06927 2026-05-11 cs.CV cs.AI

XiYOLO: Energy-Aware Object Detection via Iterative Architecture Search and Scaling

Tony Tran, Richie R. Suganda, Bin Hu

AI总结本文提出了一种名为XiYOLO的能效感知目标检测框架，旨在在异构边缘设备上实现高检测精度与低能耗的平衡。该方法结合了迭代架构搜索、能量感知的搜索空间以及两阶段能量估计器，以寻找高效的检测模型，并通过复合缩放策略生成适用于不同部署预算的XiYOLO模型族。实验表明，XiYOLO在多个数据集和真实设备上相比YOLO基线模型，在保持较高检测精度的同时显著降低了能耗。

2605.06924 2026-05-11 cs.CV cs.AI

A$^2$RD: Agentic Autoregressive Diffusion for Long Video Consistency

Do Xuan Long, Yale Song, Min-Yen Kan, Tomas Pfister, Long T. Le

AI总结生成一致且连贯的长视频仍然是一个基础性挑战。本文提出A$^2$RD，一种基于智能体的自回归扩散架构，通过解耦创意生成与一致性约束，实现长视频的逐段合成与自我优化。该方法包含多模态视频记忆、自适应分段生成和分层运行时自改进三个核心组件，有效避免了语义漂移和叙事崩溃问题，并在多个基准测试中取得了显著提升。

Comments Project page: http://dxlong2000.github.io/AARD

2605.06919 2026-05-11 cs.CL

Can LLMs Take Retrieved Information with a Grain of Salt?

Behzad Shayegh, Mohamed Osama Ahmed, Fred Tung, Leo Feng

AI总结该研究探讨了大型语言模型在处理检索信息的不确定性时的表现，发现它们在适应上下文确定性方面存在系统性不足，如难以回忆先验知识、误解置信度表达以及过度信任复杂内容。为解决这些问题，作者提出了一种结合先验提醒、置信度校准和上下文简化的交互策略，无需修改模型权重即可平均减少25%的响应偏差，展示了交互设计在提升模型可靠性方面的有效性。研究还提供了评估模型不确定处理能力的指标及跨模型适用的改进方法。