arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2605.07215 2026-05-11 cs.RO

PISTO: Proximal Inference for Stochastic Trajectory Optimization

Hongzhe Yu, Zinuo Chang, Yongxin Chen

AI总结本文提出了一种名为PISTO的随机轨迹优化算法，通过引入KL散度正则化项，对STOMP算法的更新过程进行稳定化改进，使其具备信任区域解释并能高效计算均值更新。该方法基于变分推断框架，采用重要性加权蒙特卡洛采样估计期望，从而实现无需梯度的优化过程，能够处理非连续和不可微的成本函数。实验表明，PISTO在机械臂运动规划和MuJoCo接触丰富的任务中均优于现有方法，具有更高的成功率和更快的路径生成速度。

Comments 8 pages

2605.07214 2026-05-11 cs.AI

HMACE: Heterogeneous Multi-Agent Collaborative Evolution for Combinatorial Optimization

Yuping Yan, Jirui Han, Fei Ming, Yuanshuai Li, Yaochu Jin

AI总结 HMACE 是一种异构多智能体协作进化框架，旨在解决组合优化问题中的启发式设计难题。该方法将进化过程分解为四个协同工作的智能体，分别负责策略探索、启发式生成、评估和记忆更新，从而提升搜索的多样性和效率。实验表明，HMACE 在旅行商问题、在线装箱问题等典型组合优化问题上，相比现有单智能体和多智能体方法，在解的质量与计算效率之间取得了更优的平衡。

2605.07213 2026-05-11 cs.CV

LoHGNet: Infrared Small Target Detection through Lorentz Geometric Encoding with High-Order Relation Learning

Qianwen Ma, Yang Xu, Shangwei Deng, Xiaobo Li, Haofeng Hu

AI总结红外小目标检测（IRSTD）由于目标特征稀疏且背景干扰严重，仍面临诸多挑战。为克服现有方法在特征表示和上下文关系建模方面的局限，本文提出LoHGNet，该方法结合洛伦兹几何编码与高阶关系学习，通过在双曲空间中进行特征建模，增强了对弱小目标的层次化几何表征能力，并利用高阶关系模块建模目标与背景之间的复杂依赖关系，显著提升了复杂场景下的检测性能。实验结果表明，LoHGNet在三个数据集上均表现出优异的检测准确率和场景适应性。

2605.07212 2026-05-11 cs.LG cs.AI cs.HC cs.NE eess.SP

Same Brain, Different Prediction: How Preprocessing Choices Undermine EEG Decoding Reliability

Dengzhe Hou, Zihao Wu, Lingyu Jiang, Zirui Li, Fangzhou Lin, Kazunori D. Yamada

AI总结该研究探讨了脑电图（EEG）解码过程中预处理选择对模型预测稳定性的影响，指出当前深度学习模型通常在未明确报告的单一预处理流程下进行训练和评估，导致预测结果高度不稳定。研究将预处理选择形式化为反事实干预空间，并展示了不同预处理方式下预测结果的显著变化，甚至在某些情况下超过42%的预测结果会反转。为此，作者提出了三种工具以量化、分解并减少这种不稳定性，包括基于沃尔什-哈达玛变换的分解方法、预处理不确定性指标以及一种基于图结构的正则化策略。

2605.07211 2026-05-11 cs.LG cs.AI

HARMONY: Bridging the Personalization-Generalization Gap by Mitigating Representation Skew in Heterogeneous Split Federated Learning

Jiseok Youn, You Rim Choi, Goodsol Lee, Sangtae Ha, Hyung-Sin Kim, Saewoong Bahk

AI总结在异构拆分联邦学习中，由于客户端架构差异和数据分布不均衡，现有方法面临表示偏差问题，导致服务器端对未知类别预测性能下降。本文提出HARMONY框架，通过改进元学习以支持不同参数和架构的个性化提取器，并在服务器端引入对比学习以对齐特征表示，从而缓解表示偏差。HARMONY在保持客户端个性化和不共享原始标签的前提下，显著提升了模型在有无未知类别情况下的测试准确率。

Comments 7 pages (except references), 5 figures

2605.07209 2026-05-11 cs.CL cs.AI cs.LG

Hallucination Detection via Activations of Open-Weight Proxy Analyzers

Akshita Singh, Prabesh Paudel, Siddhartha Roy

AI总结本文提出了一种基于代理分析器的框架，用于检测大型语言模型中的幻觉。该方法通过一个小型的本地开放权重模型读取已生成文本，并利用其内部激活信息来识别幻觉，适用于闭源API如GPT-4或任何开放权重模型。研究构建了18个基于Transformer处理机制的特征，并在多个数据集上训练了一个堆叠集成模型，实验表明该方法在多个分析器架构上均优于现有方法，且模型规模与性能之间并无明显正相关。

Comments 12 pages, 4 figures. Code available at https://github.com/hallu-detect/llm_hallucination_detection

2605.07208 2026-05-11 cs.LG

FAME: Forecasting Academic Impact via Continuous-Time Manifold Evolution

Jianrong Ding, Jianyuan Zhong, Zhengyan Shi, Qiang Xu

AI总结该研究提出了一种名为FAME的时空框架，用于预测学术论文的影响力。FAME通过结合文本特征和验证过的知识流动图，构建动态潜在空间，捕捉科学主题的演化轨迹，从而更准确地评估论文的潜在影响。实验表明，FAME在三个快速发展的领域中显著优于现有的大型语言模型，在多维影响力预测任务中表现出色，并能有效提升LLM的预测性能。

2605.07204 2026-05-11 cs.LG

Arrow: A Foundation Model for Causal Discovery

Ryan Thompson, He Zhao, Daniel M. Steinberg, Edwin V. Bonilla

AI总结本文提出了一种名为Arrow的基础模型，用于在观测表格数据上实现零样本因果发现。该模型通过将有向无环图分解为无向骨架和拓扑序，确保图的无环性，并利用基于Transformer的架构对变量进行上下文建模，从而预测图的边概率和节点顺序，生成因果图。Arrow在多种合成和真实数据集上表现出色，相比现有方法具有更低的推理成本，展示了大规模预训练在因果发现任务中的有效性。

2605.07201 2026-05-11 cs.CL cs.AI cs.LG

PSK@EEUCA 2026: Fine-Tuning Large Language Models with Synthetic Data Augmentation for Multi-Class Toxicity Detection in Gaming Chat

Srikar Kashyap Pulipaka

AI总结本文介绍了我们针对EEUCA 2026共享任务“理解游戏社区中的有毒行为”所提出的系统，任务要求将《坦克世界》聊天消息分类为六类毒性内容。我们尝试了多种方法，包括基于编码器的模型、使用LoRA微调的指令调优大语言模型、层次分类、一对多策略以及集成方法。最终系统结合了Llama 3.1 8B模型与精心校准的5%合成数据增强，取得了0.6234的F1宏平均分，在35支参赛队伍中排名第四，并分析了数据标注模式对模型泛化能力的影响，揭示了验证集性能与测试集表现不一致的“验证陷阱”现象。

Comments Accepted to the EEUCA workshop at ACL 2026

2605.07199 2026-05-11 cs.AI cs.LG

Three-in-One World Model: Energy-Based Consistency, Prediction, and Counterfactual Inference for Marketing Intervention

Junichiro Niimi

AI总结该论文提出了一种名为“Three-in-One”的世界模型，用于统一处理营销干预中的消费者异质性、内部状态变化和显式干预问题。该模型基于深度玻尔兹曼机（DBM）学习消费者的潜在信念表示，并通过轻量化的任务适配器实现一致性评估、结果预测和反事实推理三个任务。实验表明，该模型在保留消费者异质性特征方面优于现有方法，尤其在处理价格与促销干预的混淆因素时表现突出。

2605.07195 2026-05-11 cs.CV

See Tomorrow, Act Today: Foresight-Driven Autonomous Driving

Bozhou Zhang, Nan Song, Yuang Wang, Jiankang Deng, Xiatian Zhu, Li Zhang

AI总结当前端到端自动驾驶规划方法多为反应式，仅基于历史和当前观测预测未来动作。本文提出ForeSight框架，将自动驾驶重新定义为前瞻性决策过程，通过预训练世界模型生成可能的未来场景，并基于这些想象的未来进行动作规划，从而实现更具预见性的决策。实验表明，该方法在NAVSIM和nuScenes数据集上显著优于现有先进方法，验证了其有效性。

Comments CVPR Findings 2026

2605.07194 2026-05-11 cs.CV cs.AI cs.LG

Closed-Form Linear-Probe Dataset Distillation for Pre-trained Vision Models

Bincheng Peng, Guang Li, Ping Liu, Takahiro Ogawa, Miki Haseyama

AI总结本文研究了如何将大规模训练集压缩为小规模合成数据集，以保留对预训练视觉模型进行线性探针任务的训练效果。作者提出了一种闭式线性探针数据蒸馏方法（CLP-DD），通过双层优化框架，直接利用预训练特征的闭式解进行合成图像生成，并采用温度缩放的交叉熵损失进行优化。实验表明，该方法在计算效率和性能上均优于现有方法，尤其在ImageNet-1K数据集上表现突出。

2605.07193 2026-05-11 cs.LG

Coupling Models for One-Step Discrete Generation

Fred Zhangzhi Peng, Avishek Joey Bose, Anru R. Zhang, Alexander Tong

AI总结本文提出了一种名为Coupling Models的一步式离散生成模型，旨在解决传统生成方法依赖自回归解码或迭代优化的问题。该模型通过学习离散序列与高斯潜变量之间的直接耦合关系，实现单步生成，避免了复杂的连续流和手动指定的数据-噪声耦合。实验表明，Coupling Models在多个任务中显著优于现有的一步式基线方法，展示了其在离散生成任务中的有效性。

Comments Code is available at https://github.com/pengzhangzhi/Coupling-Models

2605.07192 2026-05-11 cs.CV

AsyncEvGS: Asynchronous Event-Assisted Gaussian Splatting for Handheld Motion-Blurred Scenes

Jun Dai, Renbiao Jin, Bo Xu, Yutian Chen, Linning Xu, Mulin Yu, Tianfan Xue, Shi Guo

AI总结本文提出了一种异步RGB-事件双摄像头系统及相应的重建框架AsyncEvGS，用于解决手持设备在严重运动模糊场景下的三维重建问题。该方法利用事件相机的高时间分辨率特性，结合视觉几何变换器（VGGT）进行跨域姿态估计，提升3D高斯溅射（3DGS）的初始化鲁棒性，并通过结构驱动的事件损失和视图特定一致性正则化项优化重建过程。此外，作者还构建了一个高分辨率的RGB-事件数据集AsyncEv-Deblur，实验表明该方法在多个基准数据集上均取得了领先的重建效果。

2605.07191 2026-05-11 cs.CV cs.LG

Attention Transfer Is Not Universally Effective for Vision Transformers

Huaiyuan Qin, Muli Yang, Gabriel James Goenawan, Peng Hu, Chen Gong, Xi Peng, Hongyuan Zhu

AI总结该研究指出，尽管近期有工作表明仅通过注意力迁移即可从预训练的教师视觉Transformer（ViT）中恢复其全部性能，但这一方法在多个ViT家族中并不普遍有效。研究发现，部分ViT家族在注意力迁移后表现甚至低于从头训练的基线，问题根源在于学生模型与教师模型之间的架构不匹配。通过向学生模型引入教师模型的原生架构组件，可以完全解决这些家族的迁移失败问题，表明注意力迁移的有效性依赖于学生模型对教师架构的匹配程度。

2605.07186 2026-05-11 cs.CL cs.AI

The Text Uncanny Valley: Non-Monotonic Performance Degradation in LLM Information Retrieval

Zekai Tong, Ruiyao Xu, Aryan Shrivastava, Chenhao Tan, Ari Holtzman

AI总结本文研究了大语言模型（LLM）在处理不完美文本时的信息检索性能变化，发现当文本中插入空格导致词语碎片化时，模型的检测准确率呈现U型曲线变化，称之为“文本诡异谷”。研究提出一种模式转换假说，认为模型在接近正常文本时以词级模式处理，而在高度碎片化文本中则切换为字符级模式，而诡异谷区域则是两种模式失效的过渡地带。实验表明，这种性能下降在噪声文本场景中具有重要意义，且对模型的精确词汇对齐依赖程度不同，影响程度也有所差异。

Comments 18 pages, 9 figures

2605.07182 2026-05-11 cs.LG

Star Elastic: Many-in-One Reasoning LLMs with Efficient Budget Control

Ali Taghibakhshi, Ruisi Cai, Saurav Muralidharan, Sharath Turuvekere Sreenivas, Aditya Vavre, Ameya Sunil Mahabaleshwarkar, Bilal Kartal, Sheldon Liang, Marcin Chochowski, Zijia Chen, Akhiad Bercovich, Ran Zilberstein, Ran El-Yaniv, Yonatan Geifman, Daniel Korzekwa, Yoshi Suhara, Oluwatobi Olabiyi, Ashwath Aithal, Nima Tajbakhsh, Pavlo Molchanov

AI总结 Star Elastic 是一种新型的大型语言模型（LLM）后训练方法，通过一次训练过程生成多个嵌套子模型，大幅降低训练成本并提升推理效率。该方法引入弹性预算控制机制，允许根据任务难度动态选择不同子模型进行推理，从而在准确率和延迟之间取得更好的平衡。实验表明，Star Elastic 在保持模型性能的同时，相比从头训练和现有压缩方法分别减少了360倍和7倍的训练成本，并支持多种架构的嵌套与知识蒸馏，适用于大规模模型的高效部署。

详情

英文摘要

Training a family of large language models (LLMs), either from scratch or via iterative compression, is prohibitively expensive and inefficient, requiring separate training runs for each model in the family. In this paper, we introduce Star Elastic, a novel LLM post-training method that adds N nested submodels to a given parent reasoning model using the compute of one run (N-fold savings) via a single post-training job. Beyond reducing training costs, Star Elastic also addresses a fundamental limitation of efficient reasoning: the rigidity of static architectures, which forces the allocation of constant resources regardless of token difficulty. By unlocking elastic budget control, Star Elastic enables a novel inference scheme that uses different submodels for each reasoning phase (thinking and answering). Star Elastic supports (1) nesting along the SSM, embedding channel, MoE, and FFN axes, (2) learning nested submodels via an end-to-end trainable router, and (3) curriculum-based knowledge distillation. Building on the Nemotron Elastic framework, we apply Star Elastic to the NVIDIA Nemotron Nano models, with a particular focus on hybrid Mixture-of-Experts (MoE) architectures: from Nemotron Nano v3 (30B/3.6A), we generate 23B (2.8A) and 12B (2.0A) variants with 160B training tokens. All nested models match or outperform independently trained baselines of comparable size and achieve a 360x reduction versus pretraining from scratch and a 7x reduction over state-of-the-art compression. Crucially, elastic budget control advances the accuracy-latency Pareto frontier, achieving up to 16% higher accuracy and 1.9x lower latency via dynamic per-phase model selection. We further extend Star Elastic to quantized regimes via Quantization-Aware Distillation (QAD), producing nested NVFP4 and FP8 elastic checkpoints that preserve zero-shot slicing while delivering smaller deployment footprints.

URL PDF HTML ☆

赞 0 踩 0

2605.07181 2026-05-11 cs.CV

SatSurfGS: Generalizable 2D Gaussian Splatting for Sparse-View Satellite Surface Reconstruction

Min Chen, Wei Guo, Bin Wang, Wen Li, Tong Fang, Jinbo Zhang, Junqi Zhao, Hong Kuang, Han Hu, Xuming Ge, Qing Zhu, Bo Xu

AI总结稀疏视角卫星图像表面重建面临多视角匹配可靠性空间异质性的挑战，主要由于光照差异大、纹理弱及重复纹理等问题导致几何约束稀疏且局部不可靠。为解决这一问题，本文提出SatSurfGS方法，基于2D高斯点扩散技术构建了一个可泛化的重建框架，通过特征学习、高斯参数估计和训练优化三个层面显式建模局部几何可靠性，并引入置信度感知的特征融合模块、跨阶段自一致性残差引导模块以及置信度双向路由损失，有效提升了重建质量与泛化能力。实验表明，该方法在渲染质量、重建精度和推理效率方面均优于现有主流方法。

详情

英文摘要

Sparse-view satellite image surface reconstruction remains highly challenging, fundamentally because the reliability of multi-view matching under satellite imaging conditions is strongly spatially heterogeneous. Affected by large photometric differences, weak textures, and repetitive textures, multi-view geometric constraints are often sparse, unevenly distributed, and locally unreliable. Although 2D Gaussian Splatting (2DGS) is more suitable than 3D Gaussian Splatting (3DGS) for the explicit representation of continuous surfaces, research on generalizable feed-forward 2DGS frameworks for sparse-view satellite surface reconstruction is still lacking. To address this issue, we propose SatSurfGS, a generalizable sparse-view surface reconstruction method for satellite imagery based on 2DGS. The proposed method builds a coarse-to-fine Gaussian attribute prediction framework and explicitly models local geometric reliability at three levels: feature learning, Gaussian parameter estimation, and training optimization. Specifically, we propose a confidence-aware monocular multi-view feature fusion module to adaptively integrate monocular priors and multi-view matching features according to local confidence; a cross-stage self-consistency residual guidance module to stabilize stage-wise Gaussian parameter refinement using the residual between the rendered height map from the previous stage and the current-stage MVS height map, together with confidence information; and a confidence bidirectional routing loss to achieve differentiated allocation of geometric and appearance supervision. Experiments on satellite datasets show that the proposed method achieves improved rendering quality, surface reconstruction accuracy, cross-dataset generalization, and inference efficiency compared with representative generalizable baselines and competitive per-scene optimization methods.

URL PDF HTML ☆

赞 0 踩 0

2605.07180 2026-05-11 cs.CL

Learning Agent Routing From Early Experience

Yimin Wang, Jiahao Qiu, Xuan Qi, Xinzhe Juan, Jingzhe Shi, Zelin Zhao, Hongru Wang, Shilong Liu, Mengdi Wang

AI总结该研究探讨了在实际冷启动场景下，如何有效路由查询到轻量级大语言模型（LLM）推理或完整智能体执行的问题。提出了一种无需训练的路由框架 BoundaryRouter，通过早期行为经验和规则引导推理来决定查询的处理方式，从而提升效率与性能。实验表明，该方法相比直接使用大模型推理或基于提示的路由方式，在推理时间和性能上均有显著提升。

Comments 17 pages

2605.07178 2026-05-11 cs.CV

Masks Can Talk: Extracting Structured Text Information from Single-Modal Images for Remote Sensing Change Detection

Kai Zheng, Hang-Cheng Dong, Jiatong Pan, Zhenkai Wu, Fupeng Wei, Wei Zhang

AI总结本文研究了如何从单模态遥感图像中提取结构化文本信息以提升变化检测的性能。作者提出了一种名为S2M的框架，通过直接利用变化检测数据集中已有的标注掩膜，自动生成结构化的四元组描述（在哪里、是什么、如何变化、多少），从而提供精确且无噪声的多模态监督信号。实验表明，该方法在新的Gaza-Change-v2数据集上取得了优于现有方法的性能，验证了掩膜本身蕴含的结构化信息在变化检测任务中的巨大潜力。

详情

英文摘要

Remote sensing change detection is pivotal for urban monitoring, disaster assessment, and environmental resource management. Yet, unimodal deep learning methods frequently confuse genuine semantic changes with visually similar but irrelevant variations. Recent multimodal approaches incorporate text as auxiliary supervision, but their descriptions are either semantically coarse and unstructured or model-generated and thus noisy. Critically, all of them overlook a simple fact: fine-grained change semantics are already implicitly encoded in the ground-truth mask labels that come standard with every change detection dataset. These masks know where the change happened, what the land-cover types were before and after, how the transition occurred, and how many objects were involved. In this paper, we propose S2M, a framework that obtains structured textual features directly from change labels at zero additional annotation cost. Specifically, each change region is automatically transcribed into a semantic quadruple (where, what, how, how many) and converted into several fixed-template text descriptions, providing precise, dense, and noise-free multimodal supervision. We adopts a two-stage training strategy to fine-tune on remote sensing imagery firstly for robust domain-specific representation, after which a multimodal decoder with a bi-directional contrastive loss is introduced to achieve deep alignment between visual features and structured textual embeddings. To validate our method, we construct Gaza-Change-v2, a new multi-class change detection (MCD) dataset about the Gaza Strip. On this MCD dataset, S2M achieves a Sek of 17.80\% and an F$_{\text{scd}}$ of 66.14\%, notably surpassing even multimodal methods that leverage large language models. Our work demonstrates that masks can indeed talk. They tell us exactly what, where, how, and how many changes have occurred.

URL PDF HTML ☆

赞 0 踩 0

2605.07175 2026-05-11 cs.LG cs.AI

Learning Multi-Relational Graph Representations for DNA Methylation-Based Biological Age Estimation

Qing Qing, Xikun Zhang, Zhongyuan Zhang, Jiarui Liu, Xingtong Yu, Xiaotao Shen, Ziqi Xu, Qixin Zhang, Zhe Wang, Renqiang Luo

AI总结该研究旨在基于DNA甲基化数据更准确地预测生物年龄，提出了一种名为RelAge-GNN的多关系图神经网络框架。该方法通过构建三个互补的图结构，捕捉CpG位点之间的共甲基化模式、基因组共定位关系以及基因层面的关联，并利用独立的图神经网络分支进行建模，再通过可学习的门控机制融合不同图的表示。实验表明，RelAge-GNN在大规模数据集上表现出更高的预测准确性和与实际年龄的相关性，同时在检测疾病相关的年龄加速方面也更具敏感性，具有重要的生物学解释价值。

2605.07174 2026-05-11 cs.AI

Repeated Deceptive Path Planning against Learnable Observer

Shiyue Cao, Pei Xu, Likun Yang, Lei Cui, Shizhao Yu, Shiyu Zhang, Yongjian Ren, Xiaotang Chen, Kaiqi Huang

AI总结本文研究了在可学习观察者面前的欺骗路径规划问题，即智能体如何隐藏其真实目的地。传统方法假设观察者是静态的，但实际中观察者可通过学习历史轨迹进行适应。为此，作者提出了重复欺骗路径规划（RDPP）框架，并设计了欺骗元规划（DeMP）方法，通过双层优化机制实现短期策略调整与长期模型更新，有效缓解了适应滞后问题，显著提升了对学习型观察者的欺骗能力。

Comments Full version of the extended abstract accepted at AAMAS 2026

2605.07172 2026-05-11 cs.CL

Topology-Enhanced Alignment for Large Language Models: Trajectory Topology Loss and Topological Preference Optimization

Yurui Pan, Ke Xu, Bo Peng

AI总结本文提出了一种基于拓扑结构的大型语言模型对齐方法，通过引入轨迹拓扑损失（TTL）和拓扑偏好优化（TPO），利用0维持久同调分析语义轨迹的全局几何特性，提升模型生成内容的语义连贯性和对齐效果。该方法在监督微调（SFT）和直接偏好优化（DPO）中分别引入拓扑正则化，使模型生成轨迹更符合语义桥梁结构，并在多个基准测试中表现出优于传统非拓扑方法的性能，同时保持或提升了生成内容的安全性。

Comments Accepted to ACL 2026. 15 pages

2605.07171 2026-05-11 cs.LG cs.SY eess.SY stat.ML

Cost-Ordered Feasibility for Multi-Armed Bandits with Cost Subsidy

Ishank Juneja, Carlee Joe-Wong, Osman Yağan

AI总结本文研究了在成本补贴约束下的多臂老虎机问题，目标是在保证最小奖励的前提下最小化总成本。针对奖励约束相对于未知最优奖励的情况，作者提出了一个名为Cost-Ordered Feasibility（COF）的算法，该算法通过智能地整合各臂的采样信息，评估低成本臂的可行性，并在理论上证明了其累积成本和质量遗憾的上界。实验表明，COF在理论分析和实际性能上均优于现有方法。

2605.07170 2026-05-11 cs.CL

A Reproducible Multi-Architecture Baseline for Token-Level Chinese Metaphor Identification under the MIPVU Framework

Yufeng Wu

AI总结该研究针对中文隐喻识别中的词级任务，提出了一种可复现的多架构基线方法，基于PSU中文隐喻语料库进行实验。研究系统比较了三种模型架构，包括基于中文RoBERTa的编码器微调、结合现代汉语词典构建的MelBERT模型，以及使用QLoRA微调的Qwen3.5-9B生成模型。实验结果显示，MelBERT在测试集上的F1值达到0.7281，显著优于其他模型，并揭示了生成模型在召回率上的局限性及部分任务设计的问题。研究还提供了完整的训练脚本和数据资源，为后续中文隐喻识别研究提供参考。

2605.07166 2026-05-11 cs.LG

Neurosymbolic Imitation Learning with Human Guidance: A Privileged Information Approach

Nikhilesh Prabhakar, Varun Balaji, Athresh Karanam, Kristian Kersting, Sriraam Natarajan

AI总结本文提出了一种结合神经网络与符号方法的模仿学习框架，旨在解决纯神经方法样本需求大、易过拟合以及纯符号方法难以处理高维数据的问题。该方法利用训练期间可获得的额外特权信息（如注视数据），有效提升了模型的泛化能力与学习效率。实验结果验证了该方法在复杂环境中的有效性与优越性。

Comments Under Review for ECML-PKDD 2026

2605.07164 2026-05-11 cs.CL

Rethinking Experience Utilization in Self-Evolving Language Model Agents

Weixiang Zhao, Yingshuo Wang, Yichen Zhang, Yanyan Zhao, Yu Zhang, Yang Wu, Dandan Tu, Bing Qin, Ting Liu

AI总结本文研究了自进化语言模型代理中经验利用这一关键设计维度，指出现有工作多关注经验的构建与更新，而忽视了运行时如何有效使用经验。为此，作者提出了ExpWeaver，一种在推理过程中将经验作为可选资源动态调用的轻量方法，实验表明其在多种框架和环境下均优于传统经验使用策略，并可通过训练进一步增强效果。研究揭示了ExpWeaver能够根据决策需求和推理不确定性选择性调用经验，推动从“存储什么经验”向“何时如何使用经验”的研究范式转变。

Comments 30 pages, 20 figures, 7 tables

2605.07162 2026-05-11 cs.CL

CLIPer: Tailoring Diverse User Preference via Classifier-Guided Inference-Time Personalization

Jinyan Su, Jinpeng Zhou, Claire Cardie, Wen Sun

AI总结本文提出了一种名为CLIPer的轻量级个性化方法，通过在推理时利用分类器模型引导大语言模型生成符合用户多样化偏好的响应，如帮助性、简洁性和幽默感等。该方法无需对模型进行大量微调，仅带来极小的额外计算开销，实现了对单维度和多维度用户偏好的可控且细致的个性化。实验表明，CLIPer在个性化语言生成方面具有良好的可扩展性和有效性。

2605.07157 2026-05-11 cs.LG

Learned Lagrangian Models of PDEs via Euler-Lagrange Residual Minimization

Lyra Zhornyak, Eric Forgoston, M. Ani Hsieh

AI总结本文提出了一种利用学习到的连续拉格朗日量直接预测偏微分方程系统动力学的方法，通过最小化欧拉-拉格朗日残差实现稳定长期预测。该方法基于优化的积分器，在局部时空区域上采用无网格近似辛结构，有效分离模型误差与积分误差，避免了固定离散化带来的全局耦合问题。实验表明，该方法在双摆、一维和二维波动方程等场景中表现出与经典辛方法相当的精度，并能适应空间变化动力学和任意边界条件。

Comments 9 pages, 8 figures, 2 tables, 7 pages of appendices

2605.07156 2026-05-11 cs.CV

Hierarchical Perfusion Graphs for Tumor Heterogeneity Modeling in Glioma Molecular Subtyping

Han Jang, Junhyeok Lee, Heeseong Eum, Joon Jang, Yoseob Han, Seung Hong Choi, Kyu Sung Choi

AI总结该研究提出了一种基于动态对比增强MRI的非侵入性方法HiPerfGNN，用于胶质瘤分子亚型的精准分类。该方法通过矢量量化变分自编码器从原始时间-强度曲线中学习离散的血流动力学表示，并结合结构MRI构建层次化图神经网络，以捕捉肿瘤异质性特征。实验表明，该模型在内部和外部数据集上均表现出优异的分类性能，验证了血流动力学信息在放射基因组学中的重要价值。

Comments Accepted at MICCAI 2026. 11 pages, 2 figures, 2 tables