arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2605.06841 2026-05-11 cs.AI cs.LG

AGWM: Affordance-Grounded World Models for Environments with Compositional Prerequisites

Qinshi Zhang, Weipeng Deng, Zhihan Jiang, Jiaming Qu, Qianren Li, Weitao Xu, Ray LC

AI总结在基于模型的学习中，智能体通过世界模型预测轨迹来学习行为，但传统世界模型往往忽略了动作的前提条件，导致在多步预测中出现累积误差。本文提出AGWM（基于可操作性的世界模型），通过学习动作前提条件的依赖关系图（DAG），显式追踪动作的动态可执行性，从而更准确地判断当前状态下动作是否可行。实验表明，AGWM在多步预测误差、对新场景的泛化能力和可解释性方面均有显著提升。

Comments 16 pages, 3 figures, 4 tables. Appendix on pages 11-16 (main text is self-contained)

2605.06835 2026-05-11 cs.LG cs.AI

On Privacy Leakage in Tabular Diffusion Models: Influential Factors, Attacker Knowledge, and Metrics

Masoumeh Shafieinejad, D. B. Emerson, Behnoosh Zamanlooy, Elaheh Bassak, Fatemeh Tavakoli, Sara Kodeiri, Marcelo Lotif, Xi He

AI总结本文研究了表格扩散模型（TDMs）中的隐私泄露问题，分析了影响隐私泄露的关键因素、攻击者所需的知识以及相关隐私度量方法的有效性。通过黑盒和白盒设置下的成员推理攻击，研究量化了训练配置、合成策略和攻击者知识对隐私风险的影响，并指出攻击者无需完全了解训练细节或拥有大量计算资源即可成功实施攻击。此外，研究揭示了某些启发式隐私度量方法在评估隐私泄露时存在的局限性。

Comments 23 pages, 11 Figures, 12 Tables

2605.06834 2026-05-11 cs.LG

Attribution-Based Neuron Utility for Plasticity Restoration in Deep Networks

Patrick Elisii, Lucas Beauchemin, Dawer Jamshed

AI总结本文研究了深度网络在持续学习过程中因可塑性下降而导致的训练困难问题，提出了一种基于梯度归因的神经元效用度量方法——梯度与参考差（GXD），用于指导自适应重置操作以恢复网络的可训练性。该方法从理论角度出发，通过估计替换神经元的功能代价，提升了重置干预的可靠性。实验表明，GXD 能在现有重置标准失效的场景下更有效地恢复网络的持续学习能力。

2605.06832 2026-05-11 cs.CL cs.AI cs.LG

IntentGrasp: A Comprehensive Benchmark for Intent Understanding

Yuwei Yin, Chuyuan Li, Giuseppe Carenini

AI总结本文介绍了IntentGrasp，一个用于评估大语言模型（LLM）意图理解能力的综合性基准。该基准基于49个高质量、开源数据集构建，包含大规模训练集和两个评估集，广泛测试了20个主流LLM，结果显示模型在意图理解任务上表现不佳，远低于人类水平。为此，研究提出了一种意图微调（IFT）方法，显著提升了模型在意图理解任务上的性能，并展现出良好的跨领域泛化能力。

Comments IntentGrasp data is available on [Hugging Face](https://huggingface.co/datasets/yuweiyin/IntentGrasp), and the code is released on [GitHub](https://github.com/YuweiYin/IntentGrasp)

2605.06830 2026-05-11 cs.LG cs.CL

ProtSent: Protein Sentence Transformers

Dan Ofer, Oriel Perets, Michal Linial, Nadav Rappoport

AI总结本文提出了一种名为ProtSent的蛋白质句子嵌入模型，旨在提升蛋白质语言模型（pLMs）在功能、进化和结构相似性方面的表示能力。通过对比微调框架，ProtSent利用多个蛋白质对数据集进行训练，显著提升了嵌入质量。实验表明，ProtSent在多个下游任务中表现优异，尤其在远程同源检测和结构检索等任务上取得了显著提升，且无需任务特定的监督信息。

Comments 9 figures, appendix, 2 figures, open code and models

2605.06829 2026-05-11 cs.LG cs.CV cs.ET cs.IT cs.NE math.IT

A Unified Measure-Theoretic View of Diffusion, Score-Based, and Flow Matching Generative Models

Aditya Ranganath, Mukesh Singhal

AI总结本文从测度论的角度统一了扩散模型、基于分数的生成模型和流匹配模型，将其视为通过学习时间依赖的向量场来将简单参考分布转化为数据分布的过程。研究提出了一个统一的框架，揭示了这些方法在连续性和福克-普朗克方程下的共同结构，并分析了它们在采样、稳定性和计算方面的实际权衡。文章还比较了不同方法的目标函数、采样方案和离散化误差，并探讨了它们与薛定谔桥和熵最优传输的联系。

Comments 62 pages, 1 figure, jmlr preprint

2605.06825 2026-05-11 cs.AI cs.RO

Randomness is sometimes necessary for coordination

Rohan Patil, Jai Malegaonkar, Henrik I. Christensen

AI总结在协作多智能体强化学习中，当智能体具有对称观察时，使用确定性策略会导致角色无法区分。为了解决这一问题，本文提出了一种基于随机性的协调机制——Diamond Attention，通过每个智能体在每个时间步采样一个随机数，生成临时的排名顺序，从而实现有效的注意力屏蔽与协调。该方法能够在单次广播轮次中实现随机位协调协议，并支持不同规模团队的零样本部署。实验表明，该方法在对称任务和控制协调任务中均优于传统确定性方法，并验证了结构化随机性在协调中的关键作用。

2605.06822 2026-05-11 cs.LG

SHARP: A Self-Evolving Human-Auditable Rubric Policy for Financial Trading Agents

Xiwen Chen, Wenhui Zhu, Songzhu Zheng, Kashif Rasul, Yueyue Deng, Huayu Li

AI总结在金融交易领域，大型语言模型（LLMs）需要持续适应噪声大、非平稳的市场环境。现有自优化方法依赖无约束的提示优化，但在低信噪比和延迟奖励环境下容易导致策略漂移。本文提出SHARP，一种自演进的可审计规则策略框架，通过结构化的条件-动作规则限制代理推理，并利用跨样本推理定位规则缺陷，实现精准策略修正。实验表明，SHARP能显著提升模型性能并增强策略的透明性和可审计性。

2605.06821 2026-05-11 cs.LG cs.AI math.OC stat.ML

A Rod Flow Model for Adam at the Edge of Stability

Eric Regis, Sinho Chewi

AI总结本文研究了Adam优化器在稳定性边缘的行为，提出了一种称为“杆流”（rod flow）的连续时间模型。该方法将参数和一阶矩构成的联合相空间中的连续迭代过程建模为一个扩展的一维对象——“杆”，并将二阶矩作为平滑的辅助变量进行处理。该模型不仅适用于Adam，还推广到多种动量优化方法，并在多个典型机器学习任务中验证了其在稳定性边缘区域对离散迭代过程的更精确追踪能力。

2605.06819 2026-05-11 cs.LG

A Theory of Online Learning with Autoregressive Chain-of-Thought Reasoning

Ilan Doron-Arad, Idan Mehalel, Elchanan Mossel

AI总结该论文研究了具有自回归链式推理过程的在线学习理论，重点分析了在未知的自回归生成器下学习最终输出的错误界。文章区分了两种反馈形式：端到端模型仅观察最终生成的标记，而链式推理模型则能看到完整的生成轨迹，并探讨了生成步数 $M$ 对错误界的影响。研究发现，在端到端模型中，错误界随着 $M$ 呈对数增长，而在链式推理模型中，错误界与 $M$ 无关，从而揭示了中间信息对学习效率的重要作用。

详情

英文摘要

Autoregressive generation lies at the heart of the mechanism of large language models. It can be viewed as the repeated application of a next-token generator: starting from an input string (prompt), the generator is applied for $M$ steps, and the last generated token is taken as the final output. [Joshi et al., 2025] proposed a PAC model for studying the learnability of the input-output maps arising from this process. We develop an online analogue of this framework, focusing on the mistake bound of learning the final output induced by an unknown next-token generator. We distinguish between two forms of feedback. In the End-to-End model, after each round the learner observes only the final token produced after $M$ autoregressive steps. In the Chain-of-Thought model, the learner is additionally shown the entire $M$-step trajectory. Our goal is to understand how the optimal mistake bound depends on the generation horizon $M$, and to what extent observing intermediate tokens can reduce this dependence. Our main results show that the online theory of autoregressive learning exhibits a qualitative picture analogous to the statistical one found by [Hanneke et al., 2026], but with a different scale of dependence on the generation horizon. In the End-to-End model, we prove a taxonomy of possible mistake-bound growth rates in the generation horizon $M$: essentially any rate between constant and logarithmic can arise. We further show that this logarithmic ceiling is unavoidable. In the Chain-of-Thought model, we show that access to the full generated trajectory eliminates the dependence on $M$ altogether. We also analyze autoregressive linear threshold classes, and prove optimal mistake bounds, as well as a new lower bound for the statistical setting. Along the way, our results resolve several questions left open by [Joshi et al., 2025].

URL PDF HTML ☆

赞 0 踩 0

2605.06815 2026-05-11 cs.AI cs.CV

Uneven Evolution of Cognition Across Generations of Generative AI Models

Isaac Galatzer-Levy, Daniel McDuff, Xin Liu, Jed McGiffin

AI总结该研究探讨了生成式人工智能模型在不同代际间认知能力发展的不均衡现象，提出了一种心理测量框架，用于评估生成式AI的认知特征并追踪其演化过程。通过类比韦氏成人智力量表的任务，研究发现当前主流多模态模型在语言理解与工作记忆方面表现接近人类顶端水平，但在知觉推理方面则接近底部水平，显示出明显的认知结构不平衡。研究还开发了AIQ基准测试，揭示了模型在不同模态任务上的发展轨迹存在显著差异，表明当前生成模型在语言符号处理方面进展较快，但在视觉抽象推理等方面仍存在明显局限。

Comments 25 pages, 5 Figures, 3 Tables

2605.06814 2026-05-11 cs.LG

From Model to Data (M2D): Shifting Complexity from GNNs to Graphs for Transparent Graph Learning

Debolina Halder Lina, Arlei Silva

AI总结该论文提出了一种名为M2D（Model-to-Data）的模型蒸馏框架，旨在提升图神经网络（GNN）的透明性。通过将模型的复杂性转移到图数据中，M2D将复杂模型的行为以可解释的方式体现在增强的图结构中，使简单模型能够达到相近的性能。该方法不仅有助于理解不同GNN架构的性能差异，还能揭示如公平性目标和注意力聚合等关键机制，从而增强模型的可解释性与透明度。

2605.06812 2026-05-11 cs.AI

Towards Security-Auditable LLM Agents: A Unified Graph Representation

Chaofan Li, Lyuye Zhang, Jintao Zhai, Siyue Feng, Xichun Yang, Huahao Wang, Shihan Dou, Yu Ji, Yutao Hu, Yueming Wu, Yang Liu, Deqing Zou

AI总结随着基于大语言模型（LLM）的智能体系统在自主任务执行中日益复杂，其安全审计面临重大挑战。本文提出Agent-BOM，一种统一的图结构表示方法，用于建模智能体系统的静态能力基础与动态运行状态，从而填补语义层面的安全审计空白。通过将执行过程转化为可查询的审计路径，Agent-BOM能够有效识别包括内存污染、工具滥用和多智能体系统劫持等在内的隐蔽攻击行为，为复杂智能体生态系统的安全分析提供了可追溯的统一基础。

详情

英文摘要

LLM-based agentic systems are rapidly evolving to perform complex autonomous tasks through dynamic tool invocation, stateful memory management, and multi-agent collaboration. However, this semantics-driven execution paradigm creates a severe semantic gap between low-level physical events and high-level execution intent, making post-hoc security auditing fundamentally difficult. Existing representation mechanisms, including static SBOMs and runtime logs, provide only fragmented evidence and fail to capture cognitive-state evolution, capability bindings, persistent memory contamination, and cascading risk propagation across interacting agents. To bridge this gap, we propose Agent-BOM, a unified structural representation for agent security auditing. Agent-BOM models an agentic system as a hierarchical attributed directed graph that separates static capability bases, such as models, tools, and long-term memory, from dynamic runtime semantic states, such as goals, reasoning trajectories, and actions. These layers are connected through semantic edges and security attributes, transforming fragmented execution traces into queryable audit paths. Building on Agent-BOM, we develop a graph-query-based paradigm for path-level risk assessment and instantiate it with the OWASP Agentic Top 10. We further implement an auditing plugin in the OpenClaw environment to construct Agent-BOM from live executions. Evaluation on representative real-world agentic attack scenarios shows that Agent-BOM can reconstruct stealthy attack chains, including cross-session memory poisoning and tool misuse, capability supply-chain hijacking and unexpected code execution, multi-agent ecosystem hijacking, and privilege and trust abuse. These results demonstrate that Agent-BOM provides a unified and auditable foundation for root-cause analysis and security adjudication in complex agentic ecosystems.

URL PDF HTML ☆

赞 0 踩 0

2605.06809 2026-05-11 cs.CV cs.LG

LookWhen? Fast Video Recognition by Learning When, Where, and What to Compute

Ali Salamatian, Anthony Fuller, Pritam Sarkar, James R. Green, Leonid Sigal, Evan Shelhamer

AI总结该论文提出了一种名为LookWhen的视频识别框架，旨在解决传统Transformer模型在视频处理中计算成本高昂的问题。其核心思想是将视频识别分解为“何时、何处、计算什么”三个部分，通过一个浅层选择器快速筛选重要视频块，并由深层提取器处理这些关键块以生成视频表示。该方法通过引入新颖的预训练策略，有效提升了计算效率，在多个视频数据集上实现了优于现有高效模型的准确率与计算量的平衡。

2605.06797 2026-05-11 cs.LG

MIND: Monge Inception Distance for Generative Models Evaluation

Quentin Berthet, Yu-Han Wu, Clement Crepy, Romuald Elie, Klaus Greff, Michael Eli Sander

AI总结本文提出了一种用于生成模型评估的新指标——蒙日 inception 距离（MIND），旨在解决广泛使用的 Fréchet Inception 距离（FID）存在的关键问题。MIND 采用切片沃asserstein 距离，通过排序高效计算一维最优传输距离的平均值，避免了 FID 需要估计高维均值和协方差矩阵所带来的样本复杂度高和易受对抗攻击的问题。实验表明，MIND 在样本效率、计算速度和对抗鲁棒性方面均显著优于 FID，且仅需 5k 样本即可达到 FID 使用 50k 样本的评估效果。

2605.06788 2026-05-11 cs.LG cs.MA

Conformal Agent Error Attribution

Naihe Feng, Yi Sui, Shiyi Hou, Ga Wu, Jesse C. Cresswell

AI总结本文研究了多智能体系统（MAS）在失败时如何准确识别关键错误发生的位置，以实现自动恢复。为了解决基于大型语言模型的MAS生成长交互轨迹所带来的错误归因难题，作者提出了一种基于符合预测（CP）的错误归因框架，提供了有限样本、分布无关的覆盖保证。该方法引入了适用于序列数据的新算法，能够预测连续的错误区间，从而实现高效的回滚与调试，并在多种智能体和数据集上验证了其有效性。

Comments 10 pages

2605.06772 2026-05-11 cs.AI cs.HC hep-ph hep-th

When Does Critique Improve AI-Assisted Theoretical Physics? SCALAR: Structured Critic--Actor Loop for Agentic Reasoning

Vasilis Niarchos, Constantinos Papageorgakis, Alexander G. Stapleton, Sokratis Trifinopoulos

AI总结本文研究了研究人员与人工智能代理之间的互动如何影响理论物理研究的成果，提出了一种名为SCALAR的结构化批评-行动循环框架，用于量子场论和弦论问题的智能推理。该框架包含行动者、批评者和独立评判者三个组件，通过多轮对话和不同反馈策略的对比实验，揭示了不同角色配对和提示策略对推理效果的影响。研究发现，合理的批评反馈机制能显著提升模型表现，但其效果依赖于行动者与批评者的组合方式。

Comments 17 pages; 9 figures

2605.06765 2026-05-11 cs.CL cs.AI

VITA-QinYu: Expressive Spoken Language Model for Role-Playing and Singing

Jiacheng Xu, Heting Gao, Liufei Xie, Zhenchuan Yang, Lijiang Li, Yiting Chen, Bin Zhang, Meng Chen, Chaoyu Fu, Weifeng Zhao, Wenjiang Zhou

AI总结 VITA-QinYu 是首个支持角色扮演和唱歌生成的端到端口语语言模型，能够生成超越自然对话的富有表现力的语音。该模型采用混合语音-文本范式，结合多码本音频标记，实现了更丰富的副语言表达，同时保持模态分离以避免干扰。研究还构建了一个全面的数据生成管道，合成超过15.8千小时的训练数据，并在多项基准测试中取得了优越的表现，同时在对话准确性和流畅性方面也达到当前最优水平。

Comments https://tme-lyra-lab.github.io/VITA-QinYu/

2605.06764 2026-05-11 cs.LG cs.AI

Revisiting Adam for Streaming Reinforcement Learning

Florin Gogianu, Adrian Catalin Lutu, Razvan Pascanu

AI总结本文重新审视了流式强化学习中的Adam优化算法，研究了在无存储交互数据的情况下，如何实现高效且稳定的策略更新。通过分析DQN和C51等经典算法在在线学习场景中的表现，作者发现目标函数梯度的有界性和权重更新的方差调整是实现鲁棒性能的关键。基于这些发现，作者提出了一种基于资格迹的自适应Q(λ)算法，在部分Atari游戏中表现出色，显著超越了现有方法。

2605.06761 2026-05-11 cs.AI cs.CV cs.LG

Weblica: Scalable and Reproducible Training Environments for Visual Web Agents

Oğuzhan Fatih Kar, Roman Bachmann, Yuanzheng Gong, Anders Boesen Lindbo Larsen, Afshin Dehghan

AI总结该论文提出了一种名为Weblica的框架，用于构建可复现且可扩展的视觉网络代理训练环境，以解决网络环境复杂多变、难以大规模获取训练数据的问题。Weblica结合HTTP级别的缓存技术和基于大语言模型的环境生成方法，能够在保持交互行为的同时重现稳定的视觉状态，并基于真实网站和核心导航技能合成多样化的训练环境。该框架支持在数千个不同任务和环境中进行强化学习训练，其最佳模型Weblica-8B在多个网络导航基准测试中表现优于同规模的开源模型，且具有更高的计算效率和扩展性。

Comments 28 pages, 19 figures

2605.06759 2026-05-11 cs.RO

An Aerial Manipulator for Perception-Driven Flower Targeting Toward Contactless Pollination in Vertical Farming

Chenzhe Jin, Zhuohang Wu, Yifan Cai, Xiangqi Li, Jan Ming Kevin Tan, Narsimlu Kemsaram, Valerio Modugno

AI总结随着自然授粉者减少，垂直农场等受控室内农业面临授粉难题，本文提出了一种基于感知驱动的空中机械臂系统，用于实现无接触授粉中的花朵定位与精准接近。该系统集成了基于RGBD的感知、基于模型预测路径积分的飞行控制以及轻量化的2自由度机械臂，能够在模拟和真实实验环境中实现稳定飞行、可靠定位和厘米级末端执行器精度。研究验证了该空中机械臂作为未来无接触授粉系统的可靠载体和定位框架的可行性。

Comments This paper has been accepted for publication in the Proceedings of the 2026 4th International Conference on Robotics, Control and Vision Engineering (RCVE 2026), 10-12 July, 2026, Tokyo, Japan

2605.06756 2026-05-11 cs.LG cs.SY eess.SY

Physics-based Digital Twins for Integrated Thermal Energy Systems Using Active Learning

Umme Mahbuba Nabila, Paul Seurin, Linyu Lin, Majdi I. Radaideh

AI总结本文提出了一种基于主动学习的物理驱动数字孪生框架，用于集成式热能系统的实时监控与控制。该方法结合系统级Modelica仿真与四种简化的物理感知和数据驱动代理模型，通过针对性的主动学习策略提升模型的准确性与效率。实验表明，该框架在热能分配系统中实现了与传统方法相当的预测精度，同时大幅减少了所需的仿真轨迹数量，其中GRU模型表现出最佳预测性能，而SINDyC模型则在计算效率和可解释性方面具有优势。

Comments 23 pages, 12 figures, and 2 tables

2605.06755 2026-05-11 cs.LG cs.AI

Gradient Extrapolation-Based Policy Optimization

Ismam Nur Swapnil, Aranya Saha, Tanvir Ahmed Khan, Mohammad Ariful Haque, Ser-Nam Lim

AI总结本文提出了一种基于梯度外推的策略优化方法（GXPO），旨在提升基于GRPO风格的强化学习在大语言模型推理任务中的性能。GXPO通过仅使用三次反向传播即可模拟更长的局部前瞻，从而在不增加额外计算成本的前提下，更准确地指导策略更新。实验表明，GXPO在数学推理任务中显著优于现有方法，同时在计算效率上也有明显提升。

Comments 26 pages, 9 figures

2605.06747 2026-05-11 cs.CV cs.RO

HumanNet: Scaling Human-centric Video Learning to One Million Hours

Yufan Deng, Daquan Zhou

AI总结该研究提出了HumanNet，一个包含一百万小时的人类中心视频数据集，旨在解决物理交互学习中缺乏大规模、多样化和精细标注数据的问题。HumanNet涵盖了第一人称和第三人称视角下的精细动作、人-物交互、工具使用和长期行为，并提供了包括动作描述、手部和身体信号在内的交互相关标注，支持运动感知和交互感知的学习。研究还引入了一套系统化的数据构建范式，通过人类中心过滤、时间结构化、视角多样性等设计原则，将非结构化的网络视频转化为可扩展的学习基础，实验表明其在视觉-语言-动作任务中优于传统机器人数据。

Comments Github: https://github.com/DAGroup-PKU/HumanNet Project website: https://dagroup-pku.github.io/HumanNet/

2605.06741 2026-05-11 cs.LG

A Closed-Form Upper Bound for Admissible Learning-Rate Steps in Belief-Space Dynamics

Zixi Li, Youzhen Li

AI总结本文研究了信念空间动态中可接受学习率步长的上限问题，将学习率步长视为影响模型收缩性的关键因素。通过将更新过程建模为概率单形上的投影前向步骤，作者提出了一个闭式上界公式，用于确定保证收缩性的最大学习率步长。该方法为学习率的设定提供了理论依据，避免了传统依赖经验调参的局限性。

2605.06740 2026-05-11 cs.LG cs.AI

Geometric Kolmogorov--Arnold Network (GeoKAN)

Abhijit Sen, Bikram Keshari Parida, Giridas Maiti, Mahima Arya, Denys I. Bondar

AI总结本文提出了一种几何感知的Kolmogorov-Arnold网络（GeoKAN），通过学习自适应的几何坐标系来进行函数逼近，从而提升模型对复杂函数结构的表达能力。GeoKAN通过学习对角黎曼度量来变形输入空间，在局部尺度和体积变形中引入几何归纳偏置，特别适用于物理信息学习等场景。研究还开发了多种GeoKAN变体，能够根据任务需求动态调整表示分辨率，尤其适用于科学机器学习中出现的尖锐、刚性、局部化和高度非均匀问题。

Comments 46 pages, 24 figures, 13 tables

2605.06736 2026-05-11 cs.LG cs.AI cs.HC

STDA-Net: Spectrogram-Based Domain Adaptation for cross-dataset Sleep Stage Classification

Unaza Tallal, Shruti Kshirsagar, Ankita Shukla

AI总结跨数据集睡眠阶段分类因EEG通道布局、采样率、记录环境和受试人群的差异而面临挑战。本文提出STDA-Net，一种基于频谱图的无监督域适应框架，结合卷积神经网络提取频谱特征、双向LSTM建模睡眠动态，并利用对抗神经网络实现源域与目标域特征对齐，无需目标域标注数据。实验表明，该方法在多个公开数据集上取得了优于传统一维EEG方法的分类性能，具有更高的稳定性和可重复性。

Comments submitted to IEEE SMC conference

2605.06733 2026-05-11 cs.LG cs.AI

Beyond Factor Aggregation: Gauge-Aware Low-Rank Server Representations for Federated LoRA

Jinqian Chen, Chang Liu, Jihua Zhu

AI总结联邦LoRA是一种在分布式数据和有限客户端资源下实现大语言模型参数高效适应的方法。然而，现有方法直接对LoRA因子进行平均，存在语义不匹配的问题，因为相同更新可以有多种等价的因子分解形式。为此，本文提出了一种新的联邦LoRA方法GLoRA，通过估计客户端投影器的共识更新子空间，并在共享参考坐标下聚合更新，从而以低秩形式完整表示语义更新。实验表明，GLoRA在数据、资源和任务异构环境下均优于现有方法，并实现了良好的效率与性能平衡。

2605.06730 2026-05-11 cs.LG

Semantic State Abstraction Interfaces for LLM-Augmented Portfolio Decisions: Multi-Axis News Decomposition and RL Diagnostics

Likhita Yerra, Remi Uttejitha Allam

AI总结本文提出了一种名为语义状态抽象接口（SSAI）的方法，用于将稀疏的非结构化文本映射为具有可审计命名坐标的结构化表示，以在序列决策系统中分离表示假设与优化方差。研究通过四个轴（情绪、风险、置信度、波动率预测）在美股组合数据上实例化SSAI，并评估其在因子投资组合、监督回归模型和强化学习代理中的表现。尽管四因子组合取得了较高的累计收益，但其优势在统计上并不稳健，研究强调SSAI的主要贡献在于提供了一种可解释性与性能诊断的框架及可复用的评估协议，而非宣称其优于其他密集表示方法。

Comments 18 pages, 3 figures. NeurIPS 2024 manuscript style (preprint)

2605.06729 2026-05-11 cs.LG cs.AI

The E$Δ$-MHC-Geo Transformer: Adaptive Geodesic Operations with Guaranteed Orthogonality

Arash Shahmansoori

AI总结本文提出了一种新型神经网络架构——E$Δ$-MHC-Geo Transformer，通过结合流形约束超连接、深度Delta学习和Cayley变换，实现了输入自适应且无条件正交的残差连接。该模型引入了数据依赖的Cayley旋转和Householder反射的混合机制，解决了Cayley变换在处理特征值为-1情况时的局限性，并通过门控机制选择合适的正交操作。实验表明，该模型在参数规模相近的情况下，在长期稳定性、旋转损失、范数保持和反射对齐等方面均优于多个基线模型，同时层数更少。

Comments 21 pages, 8 figures; code will be available at https://github.com/arash-shahmansoori/edelta