arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2605.08007 2026-05-11 cs.LG

Interpreting Reinforcement Learning Agents with Susceptibilities

Chris Elliott, Einar Urdshals, David Quarel, Daniel Murfet

AI总结本文提出了一种基于“易感性”的方法，用于解释强化学习智能体的行为，该方法通过研究损失函数扰动对观测量后验期望值的影响来揭示模型内部特性。研究将这一技术扩展到深度强化学习的遗憾（regret）分析中，并在一个具有非平凡阶段性发展的网格世界模型中验证了其有效性。实验表明，易感性能够揭示仅通过研究策略演化无法发现的模型参数空间中的内部特征，并通过激活引导进一步验证了其解释能力。

Comments 55 pages, comments welcome

2605.08005 2026-05-11 cs.LG

STEPS: A Temporal Smooth Error Propagation Solver on the Manifolds for Test-Time Adaptation in Time Series Forecasting

Jiaqi Liu, Yifan Ouyang, Zhifei Song, Sim Kuan Goh, Ashwaq Qasem

AI总结 STEPS 是一种用于时间序列预测中测试时适应（TTA）的平滑误差传播求解器，旨在解决在分布偏移下利用有限观测进行预测时的性能下降问题。该方法将 TTA 问题建模为时间流形上的狄利克雷边值问题，通过局部求解器和全局求解器分别处理时间平滑性和跨窗口误差记忆，并结合时空流形融合技术生成稳定的修正结果。实验表明，STEPS 在多个基准数据集上显著提升了预测精度，平均相对均方误差降低达 26.82%，优于现有最强 TTA 方法。

Comments 9 pages main text, appendix included. 7 figures. Submitted to NeurIPS 2026

2605.08003 2026-05-11 cs.CV

SphereVAD: Training-Free Video Anomaly Detection via Geodesic Inference on the Unit Hypersphere

Chao Huang, Penfei Wei, Wei Wang, Jie Wen, Zhihua Wang, Li Shen, Wenqi Ren, Xiaochun Cao

AI总结视频异常检测（VAD）旨在自动识别未剪辑监控视频中偏离正常模式的事件。现有方法通常依赖大规模标注或任务特定的训练过程，限制了其在新场景中的快速部署。本文提出SphereVAD，一种无需训练、零样本的视频异常检测框架，通过在单位超球面上进行vMF似然比测地推理，充分挖掘预训练多模态大语言模型中间层特征中隐含的几何判别性。该方法通过弗雷歇特均值中心化、全场景注意力机制和测地拉近策略，实现了对异常片段的有效识别，并在多个基准数据集上取得了优于现有无监督方法的性能。

Comments 48 pages, 25 figures

2605.08000 2026-05-11 cs.CV

Rethinking Dense Optical Flow without Test-Time Scaling

Praroop Chanda, Suryansh Kumar

AI总结本文探讨了在无需测试时缩放计算的前提下，如何改进密集光流估计的问题。作者提出了一种单次前向传播的框架，通过利用预训练的基础模型中的视觉语义和几何先验信息，避免了传统的迭代优化过程，从而显著降低了计算成本。实验表明，该方法在多个基准测试中表现出色，尤其在Sintel Final数据集上取得了优于现有先进方法的性能，验证了基础模型先验在光流估计中的有效性。

Comments Accepted for publication at CVPR 2026; ViSCALE Workshop. Draft info: 10 pages, 2 figures, 4 tables

2605.07999 2026-05-11 cs.LG cs.AI

Graph-Structured Hyperdimensional Computing for Data-Efficient and Explainable Process-Structure-Property Prediction

Jingzhan Ge, Ajeeth Vellore, Ajinkya Palwe, Ahsan Khan, David Gorsich, Matthew P. Castanier, SeungYeon Kang, Farhad Imani

AI总结该研究针对复杂3D微结构制造中过程-结构-性能（PSP）预测数据稀疏、异构且交互复杂的问题，提出了一种基于图结构的高维计算框架PSP-HDC。该方法通过编码有向PSP图作为先验知识，结合可训练的标量到高维向量编码器和图对齐的绑定与捆绑操作，实现了对异构参数和噪声的鲁棒表示与预测。PSP-HDC不仅在预测性能上优于现有方法，还提供了参数级、组级和组内级的内在可解释性，为数据高效且可解释的PSP预测提供了新思路。

Comments 19 pages, 18 figures

2605.07993 2026-05-11 cs.LG stat.ME

Bayesian Sensitivity of Causal Inference Estimators under Evidence-Based Priors

Nikita Dhawan, Daniel Shen, Leonardo Cotta, Chris J. Maddison

AI总结因果推断，尤其是在观察性研究中，依赖于对真实数据生成过程的不可检验假设。本文提出了一种基于现实证据构建先验的贝叶斯敏感性分析方法，用于评估因果估计量对三种常见假设的敏感性，克服了传统最坏情况分析可能过于悲观或与先验知识冲突的问题。该方法引入了贝叶斯敏感性值（BSV），通过蒙特卡洛近似计算估计量在假设违反下的期望敏感性，并在糖尿病治疗对体重影响的观察性研究中验证了其有效性。

Comments TMLR 2026

2605.07988 2026-05-11 cs.RO

Evaluation of an Actuated Spine in Agile Quadruped Locomotion

Nico Bohlinger, Piotr Kicki, Davide Tateo, Krzysztof Walas, Jan Peters

AI总结本文研究了可驱动脊柱对四足机器人敏捷运动性能的影响。通过在MuJoCo仿真环境中使用配备单自由度脊柱的Silver Badger机器人，实验验证了脊柱在高速奔跑、爬楼梯、爬陡坡、跨障碍和爬行等场景中的优势。研究结果表明，可驱动脊柱显著提升了机器人的敏捷性，使其能够克服更高障碍和更狭窄的通道。

2605.07982 2026-05-11 cs.CL cs.CR

GLiGuard: Schema-Conditioned Classification for LLM Safeguard

Urchade Zaratiana, Mary Newhauser, George Hurn-Maloney, Ash Lewis

AI总结为确保大语言模型输出的安全性和合规性，本文提出了一种基于结构化输入的分类方法GLiGuard，通过将任务定义和标签语义编码为输入序列中的结构化标记，实现了对提示安全、响应安全、拒绝检测及多种细粒度危害类别和越狱策略的单次非自回归评估。该方法基于双向编码器架构，参数量仅为0.3B，在九个安全基准测试中取得了与7B-27B参数解码器模型相当的F1分数，同时显著提升了推理吞吐量并降低了延迟。

Comments 20 pages, 4 figures

2605.07980 2026-05-11 cs.LG cond-mat.stat-mech math.ST stat.TH

Susceptibilities and Patterning: A Primer on Linear Response in Bayesian Learning

Chris Elliott, Daniel Murfet

AI总结本文介绍了在神经网络解释中发展的易感性理论，用于分析贝叶斯学习中的线性响应。易感性定义为可观测量对数据扰动的后验期望导数，根据涨落-耗散定理等价于后验协方差。通过不同可观测量的选择，可得到不同对象，如样本损失对应影响矩阵，局部组件可观测量对应结构易感性矩阵，该矩阵与数据模式和模型组件的映射有关，并可用于寻找实现特定结构变化的数据扰动。文章从统计力学基础出发，详细阐述了易感性及其估计方法与损失景观几何的关系。

Comments 34 pages, 3 figures, comments welcome!

2605.07979 2026-05-11 cs.AI

The Limits of AI-Driven Allocation: Optimal Screening under Aleatoric Uncertainty

Santiago Cortes-Gomez, Mateo Dulce Rubio, Carlos Patino, Bryan Wilder

AI总结本文研究了在存在不可约的随机不确定性（aleatoric uncertainty）情况下，如何最优地结合算法分配与实际筛查，以提高资源分配效率。作者提出了一种两阶段分配框架，其中先对部分个体进行筛查，再基于固定预算进行资源分配，并证明最优策略是在算法分配的边缘进行筛查，同时直接针对高风险个体。研究还揭示了筛查与算法分配在不同不确定性水平下可能互补或替代，并通过社会保护和人道主义排雷的实际案例验证了该框架的有效性。

2605.07978 2026-05-11 cs.CV

Seeing Across Skies and Streets: Feedforward 3D Reconstruction from Satellite, Drone, and Ground Images

Qiwei Wang, Zhongyao Tuo, Xianghui Ze, Yujiao Shi

AI总结该研究解决了跨视角定位问题，即如何将地面图像定位到卫星地图上的具体位置。传统方法仅能估计3自由度（x, y和偏航角），而本文提出的方法Cross3R通过引入无人机图像作为中间视角，能够恢复6自由度相机姿态和三维点云，从而实现更精确的三维重建与定位。研究还构建了CrossGeo数据集，并在多个基准测试中验证了方法的有效性。

2605.07977 2026-05-11 cs.LG

Self-Play Enhancement via Advantage-Weighted Refinement in Online Federated LLM Fine-Tuning with Real-Time Feedback

Seohyun Lee, Wenzhi Fang, Dong-Jun Han, Seyyedali Hosseinalipour, Christopher G. Brinton

AI总结本文提出了一种名为SPEAR的高效在线学习算法，用于联邦大语言模型的微调。该方法通过优势加权细化机制，在无需昂贵的群体生成和真实上下文的情况下，利用反馈引导的自我对弈循环生成对比样本，从而提升模型性能。实验表明，SPEAR在多个基准数据集上优于现有先进方法，且适用于资源受限的边缘设备，具备良好的在线学习和联邦学习适应性。

Comments 27 pages

2605.07973 2026-05-11 cs.CV

HEART: Hyperspherical Embedding Alignment via Kent-Representation Traversal in Diffusion Models

Arani Roy, Shristi Das Biswas, Kaushik Roy

AI总结本文研究了文本到图像扩散模型中基于文本条件进行图像编辑的难题，指出现有方法将嵌入空间视为欧几里得空间并应用线性变换，无法准确反映语义概念的实际组织方式。通过分析发现，文本编码器的表示实际上位于超球面上，语义概念在其中呈现各向异性的分布，更适合用肯特分布描述。基于此，作者提出了HEART框架，无需训练或优化，直接在超球面上进行几何变换，实现了对图像主体和属性的直观、精确编辑，并在多种扩散模型架构上具有良好的泛化能力。

2605.07972 2026-05-11 cs.LG cs.AI stat.ML

It Just Takes Two: Scaling Amortized Inference to Large Sets

Antoine Wehenkel, Michael Kagan, Lukas Heinrich, Chris Pollard

AI总结本文研究了如何将免计算推断扩展到大规模观测集合的问题，提出了一个简单且理论基础扎实的方法，将表示学习与后验建模解耦。该方法通过在最多包含两个元素的集合上训练一个均值池化Deep Set模型，生成的编码器能够泛化到任意规模的集合，从而显著降低了训练成本并提升了推断效率。实验表明，该方法在多种高维条件生成任务中表现优异，计算成本仅为传统方法的一小部分。

2605.07969 2026-05-11 cs.LG cs.IT math.IT

When Diffusion Model Can Ignore Dimension: An Entropy-Based Theory

Ahmad Aghapour, Erhan Bayraktar

AI总结本文从信息论角度研究扩散模型在高维数据中的收敛性问题，提出了一种基于香农熵的理论分析框架。研究发现，对于高斯混合目标分布，离散化误差主要由潜在混合成分的熵控制，而非环境维度。该结果表明，当数据分布具有紧凑的潜在表示时，扩散采样在高维空间中仍能保持高效，为理解扩散模型的高效性提供了新的理论依据。

2605.07963 2026-05-11 cs.LG

Aggregation in conformal e-classification

Vladimir Vovk

AI总结本文研究了交叉确认e预测（cross-conformal e-prediction）及其改进方法，这是一种用于聚合确认e预测器的有效技术。该方法在保持预测有效性的同时，提升了计算效率和灵活性。实验表明，这些方法在实际应用中具有良好的性能和实用性。

Comments 23 pages, 10 figures

2605.07962 2026-05-11 cs.LG cs.DC

FLAM: Evaluating Model Performance with Aggregatable Measures in Federated Learning

Fabian Stricker, Jose A. Peregrina, David Bermbach, Christian Zirpins

AI总结在联邦学习中，由于数据分布在不同参与者处，模型性能评估面临挑战，传统聚合方法难以与集中式评估结果保持一致。本文分析了这一不一致的原因，提出了FLAM方法，通过可聚合的评估指标实现与集中式评估相同的结果，无需全局测试数据，从而更准确地反映模型整体性能。

Comments Accepted for publication in 2nd IEEE International Conference on Federated Learning and Intelligent Computing Systems(FLICS2026)

2605.07961 2026-05-11 cs.LG cs.CR cs.NI

Graph Representation Learning Augmented Model Manipulation on Federated Fine-Tuning of LLMs

Hanlin Cai, Kai Li, Houtianfu Wang, Haofan Dong, Yichen Li, Falko Dressler, Ozgur B. Akan

AI总结本文研究了联邦微调（FFT）场景下大型语言模型（LLMs）面临的模型操纵威胁，并提出了一种增强型模型操纵策略AugMP。该方法通过图表示学习框架捕捉良性更新之间的特征关联，指导生成具有欺骗性的恶意更新，并结合增强拉格朗日对偶形式设计迭代优化算法，以提升操纵效果与隐蔽性。实验表明，AugMP在多个LLM架构上均表现出最强的操纵性能，显著降低了全局模型和本地代理的准确率，同时有效规避了传统防御手段。

2605.07959 2026-05-11 cs.LG math.FA math.PR

Convergent Stochastic Training of Attention and Understanding LoRA

Zhengkai Sun, Dibyakanti Kumar, Alejandro F Frangi, Anirbit Mukherjee, Mingfei Sun

AI总结本文研究了在注意力机制和浅层神经网络中使用低秩适配（LoRA）方法时，如何通过随机训练方法实现模型的可训练性。作者提出一个统一的理论框架，证明在轻微正则化条件下，注意力层和LoRA参数化的回归损失满足Poincaré不等式，从而保证了随机梯度下降的收敛性。该研究首次在无需假设数据分布或网络规模的情况下，严格建立了注意力模型和LoRA结构的可训练性，为大模型的高效训练提供了理论支撑。

2605.07955 2026-05-11 cs.CV cs.AI

TimeLesSeg: Unified Contrast-Agnostic Cross-Sectional and Longitudinal MS Lesion Segmentation via a Stochastic Generative Model

Vicent Caselles-Ballester, Eloy Martínez-Heras, Giuseppe Pontillo, Zoe Mendelsohn, Elena M. Marrón, Juan Luis García Fernández, Laia Subirats, Jon Stutters, Jeremy Chataway, Frederik Barkhof, Sara Llufriu, Ferran Prados

AI总结多发性硬化症（MS）的病灶分割面临临床和影像异质性的挑战，现有深度学习方法对数据分布和输入结构变化较为敏感。本文提出TimeLesSeg，一种统一的、无需依赖对比度的病灶分割框架，能够同时处理横断面和纵向影像数据。该方法通过生成模型模拟病灶演变过程，并结合基于高斯混合模型的领域随机化技术，提升模型对不同成像条件的鲁棒性，实验表明其在多个数据集上优于现有方法。

2605.07950 2026-05-11 cs.LG

Slowly Annealed Langevin Dynamics: Theory and Applications to Training-Free Guided Generation

Atsushi Nitanda, Dake Bu, Yueming Lyu, Tanya Veeravalli

AI总结本文研究了慢速退火朗之万动力学（SALD），这是一种用于追踪移动目标分布并通过对时间进行放慢来逼近最终目标的采样方法。通过KL散度微分不等式，论文建立了非渐近收敛性保证，表明时间放慢有助于提升中间目标的追踪能力并降低路径复杂度。为实现无需训练的引导生成，作者进一步提出了速度感知的SALD（VA-SALD），该方法显式结合预训练模型的边缘分布，并利用时间放慢来修正引导引入的额外偏差，从而为基于扩散模型及相关生成模型的无训练引导生成提供了理论框架和收敛性保障。

2605.07945 2026-05-11 cs.CV

Rebalancing gradient to improve self-supervised co-training of depth, odometry and optical flow predictions

Marwane Hariat, Antoine Manzanera, David Filliat

AI总结本文提出了一种名为CoopNet的方法，通过动态调整梯度分配来提升自监督联合训练中深度、里程估计和光流预测的协同效果。该方法引入了一种基于光度重建误差分布的混合损失函数，有效协调了不同任务之间的学习进度。实验表明，CoopNet在KITTI和CityScapes数据集上优于或与现有最佳方法相当，为多任务自监督学习提供了新的思路。

2605.07943 2026-05-11 cs.RO cs.AI cs.CV cs.LG

TAVIS: A Benchmark for Egocentric Active Vision and Anticipatory Gaze in Imitation Learning

Giacomo Spigler

AI总结本文提出TAVIS，一个用于模仿学习中主动视觉与预见性注视评估的基准平台。该平台包含两个互补的任务集，分别针对头部和手部操作，基于两个仿人机器人平台构建，并引入了三种评估方法，包括对比固定摄像头的头部摄像头协议、基于认知科学的GALT指标以及程序化的分布内/外划分。实验表明，主动视觉在任务表现上具有优势，但效果依赖于任务类型，并揭示了模仿学习策略在分布偏移下的鲁棒性问题。

2605.07940 2026-05-11 cs.CV

Delta-Adapter: Scalable Exemplar-Based Image Editing with Single-Pair Supervision

Jiacheng Chen, Songze Li, Han Fu, Baoquan Zhao, Wei Liu, Yanyan Liang, Li Qing, Xudong Mao

AI总结 Delta-Adapter 是一种基于单对示例监督的可扩展图像编辑方法，能够在无需文本指导的情况下学习可迁移的编辑语义。该方法通过预训练视觉编码器提取源图与目标图之间的语义差异，并利用基于 Perceiver 的适配器将其注入预训练的图像编辑模型中，从而实现对查询图像的编辑。通过引入语义差异一致性损失，进一步提升了编辑结果的保真度与语义一致性，实验表明其在多种编辑任务上均优于现有方法，并具有更好的泛化能力。

2605.07938 2026-05-11 cs.LG

Prototype Guided Post-pretraining for Single-Cell Representation Learning

Sachini Weerasekara, Natasha Darras, Sagar Kamarthi, Colles Price, Jacqueline Isaacs

AI总结本文研究了单细胞表征学习中因细胞类型分布不均和基因表达数据协变量偏移导致的模型泛化问题。为解决这一问题，作者提出了一种名为CellRefine的后预训练方法，通过引入标记基因集作为结构先验，引导模型优化潜在嵌入空间，从而提升模型性能。实验表明，该方法在多个计算生物学任务中均能有效提升下游任务表现，最高提升达15%。

2605.07937 2026-05-11 cs.CL

Ask Early, Ask Late, Ask Right: When Does Clarification Timing Matter for Long-Horizon Agents?

Anmol Gulati, Hariom Gupta, Elias Lumer, Sahil Sen, Vamse Kumar Subbiah

AI总结本文研究了长期任务中澄清时机对智能体性能的影响，发现澄清价值随任务进展而变化，并非“越早越好”。通过引入一个可控的澄清注入框架，作者在多个任务维度和模型上系统评估了不同信息缺失下澄清时机的效果，揭示了目标、输入等不同信息类型的最优澄清时间窗口。研究还表明，当前前沿模型普遍未能在最佳时机进行澄清，为设计时序感知的澄清策略提供了重要依据。

2605.07935 2026-05-11 cs.AI cs.MA

TraceFix: Repairing Agent Coordination Protocols with TLA+ Counterexamples

Shuren Xia, Qiwei Li, Taqiya Ehsan, Jorge Ortiz

AI总结本文提出 TraceFix，一种以验证为核心的大型语言模型多智能体协调框架。该方法通过从任务描述中生成结构化的协议中间表示，并结合 TLA+ 模型检查器迭代修正协议，直至通过验证，最终将验证通过的协议编译为各智能体的系统提示并在运行时进行监控。实验表明，该方法在大量任务上实现了高效验证与执行，显著提升了任务完成率并降低了死锁和活锁的发生率。

2605.07933 2026-05-11 cs.CL

How to Train Your Latent Diffusion Language Model Jointly With the Latent Space

Viacheslav Meshchaninov, Alexander Shabalin, Egor Chimbulatov, Nikita Gushchin, Ilya Koziev, Alexander Korotin, Dmitry Vetrov

AI总结本文提出了一种联合训练的潜在扩散语言模型（LDLM），通过同时训练潜在编码器、扩散模型和解码器，构建了一个适合扩散过程的潜在空间。研究发现，直接进行联合训练会导致生成质量下降，因此作者提出了一种包含均方误差解码损失、扩散到编码器预热、自适应时间步采样和解码器输入噪声的简单训练策略，显著提升了生成效果。实验表明，LDLM在生成性能上优于现有离散和连续扩散语言模型，且推理速度提高了2到13倍，证明了联合学习潜在空间对提升潜在扩散模型在文本生成中的竞争力具有重要意义。

2605.07930 2026-05-11 cs.LG cs.AI

INO-SGD: Addressing Utility Imbalance under Individualized Differential Privacy

Xiao Tian, Jue Fan, Rachael Hwee Ling Sim, Bryan Kian Hsiang Low

AI总结本文研究了在个性化差分隐私（IDP）设置下，由于隐私要求不同导致的模型效用不平衡问题，即对隐私要求更高的数据在训练中可能被严重低估，从而影响模型在后续部署中的性能。为此，作者提出了一种名为INO-SGD的算法，通过在每个训练批次中策略性地降低隐私要求较高数据的权重，提升模型在这些数据上的表现。该算法专门设计以满足IDP要求，而现有解决效用不平衡的方法既不满足IDP，也难以适配到IDP场景中。实验验证了该方法的有效性。

Comments Accepted to the 14th International Conference on Learning Representations (ICLR-26)

2605.07925 2026-05-11 cs.CL

How Value Induction Reshapes LLM Behaviour

Arnav Arora, Natalie Schluter, Katherine Metcalf, Maartje ter Hoeve

AI总结该研究探讨了在对话型大语言模型中引入价值观对其行为的影响。研究通过使用精选的价值观子集对模型进行微调，分析了价值观诱导对模型表达其他价值观、安全性、拟人化语言使用以及问答表现的影响。结果表明，诱导特定价值观不仅会增强相关或对立价值观的表达，还可能提升模型安全性，但同时会增加模型使用拟人化语言的倾向，使其更趋迎合和验证用户。

Comments Accepted to Findings of ACL 2026