arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2604.21456 2026-05-12 cs.LG cs.RO

Tempered Sequential Monte Carlo for Trajectory and Policy Optimization with Differentiable Dynamics

Heng Yang

AI总结本文提出了一种基于采样的框架，用于在可微动力学模型下进行有限时间轨迹和策略优化，将控制器设计转化为推断问题。核心方法是通过最小化KL散度正则化的轨迹成本期望，得到一个随着温度降低而集中于低成本解的“玻尔兹曼倾斜”控制器参数分布，并引入温控序列蒙特卡洛（TSMC）方法高效采样，结合哈密顿蒙特卡洛方法保持粒子多样性。实验表明，TSMC在多种轨迹和策略优化任务中表现优异，优于现有先进方法。

Comments Robotics: Science and Systems 2026

2604.18901 2026-05-12 cs.LG cs.AI cs.CL

Harmful Intent as a Geometrically Recoverable Feature of LLM Residual Streams

Isaac Llorente-Saguer

AI总结该研究探讨了大型语言模型中有害意图在残差流中的几何可恢复特征。通过在多种架构和对齐方式的模型中进行实验，发现有害意图在残差流激活中具有线性可分性，并提出了一种基于软AUC优化的方向提取方法，实现了高检测性能。研究还揭示了检测方向对提取协议的依赖性，表明不同处理方式可能影响有害意图的识别效果。

Comments 26 pages, 1(+6) figures, 4(+14) tables. Code at https://github.com/isaac-6/harm-directions

2604.17693 2026-05-12 cs.LG cs.AI cs.MA

COSAC: Counterfactual Credit Assignment in Sequential Cooperative Teams

Shripad Deshmukh, Jayakumar Subramanian, Raghavendra Addanki, Nikos Vlassis

AI总结在顺序合作团队中，由于每个智能体按固定顺序行动并共享单一团队奖励，个体信用分配问题难以解决。本文提出COSAC，一种无需评论家的个体策略梯度方法，通过单次岭回归拟合团队奖励的加性分解，实现去耦个体学习信号，并利用当前策略的虚构延续计算个体反事实优势，从而避免额外环境调用。COSAC在理论分析中展示了其偏差和方差的可控性，并在实验中表现出更低的优越性均方误差和学习遗憾，尤其在AI2推理任务中收敛速度优于其他无评论家方法。

2604.14345 2026-05-12 cs.LG cs.AI stat.ML

PAC-MCTS: Bias-Aware Pruning for Robust LLM-Guided Search and Planning

Tianhao Qian

AI总结在自主推理和具身规划中，随着搜索深度增加，候选动作空间呈指数级扩展，导致计算资源消耗巨大。本文提出PAC-MCTS，一种基于偏差感知的剪枝框架，通过将节点扩展建模为有界偏差下的最佳臂识别问题，推导出样本复杂度上界和信息论下界，明确了安全剪枝的条件。实验表明，PAC-MCTS在Blocksworld和ALFWorld任务中显著提升了搜索效率和鲁棒性，减少了API调用次数并提高了样本效率。

Comments 18 pages, 4 figures

2604.13710 2026-05-12 cs.CV

SLQ: Bridging Modalities via Shared Latent Queries for Retrieval with Frozen MLLMs

Haoran Lou, Ziyan Liu, Chunxiao Fan, Yuexin Wu, Yue Ming, Hao Wu, Kai Zuo, Yibo Chen, Xu Tang

AI总结本文提出了一种名为SLQ的参数高效调优框架，用于在不修改预训练多模态大语言模型（MLLM）参数的前提下，将其适配于检索任务。SLQ通过引入共享潜在查询（Shared Latent Queries）将文本和图像信息编码到统一的嵌入空间中，从而实现跨模态检索。此外，研究还构建了KARR-Bench基准测试集，用于评估模型在知识感知推理检索方面的能力。实验表明，SLQ在多个数据集上表现优异，验证了非侵入式适配策略在保持预训练语义表示的同时提升检索效果的有效性。

Comments Accepted to ICML-2026

2604.13068 2026-05-12 cs.CL cs.LG

Detection Without Correction: A Robust Asymmetry in Activation-Based Hallucination Probing

Dip Roy, Rajiv Misra, Sanjay Kumar Singh, Anisha Roy

AI总结该研究探讨了基于激活的线性探测方法在检测和纠正语言模型幻觉中的有效性。通过在多个不同规模的模型上进行实验，发现虽然线性探测在大模型中能有效检测幻觉，但其方向引导的激活调整却无法成功纠正幻觉。研究还指出，输出置信度方法在大模型上的检测性能优于激活探测，并强调了激活探测的独特价值在于其能够在输出前进行预生成标记，这为幻觉检测提供了新的部署场景。

2604.12592 2026-05-12 cs.CV

ELoG-GS: Dual-Branch Gaussian Splatting with Luminance-Guided Enhancement for Extreme Low-light 3D Reconstruction

Yuhao Liu, Dingju Wang, Ziyang Zheng

AI总结本文提出了一种用于极端低光环境下高质量三维重建的方法ELoG-GS，旨在解决从退化多视角图像中恢复几何一致且逼真的三维场景的问题。该方法结合了基于学习的点云初始化和亮度引导的颜色增强策略，提升了高斯泼溅在低光条件下的稳定性和视觉真实感。实验表明，该方法在NTIRE 2026挑战赛基准上显著优于现有方法，在官方平台的测试中取得了较高的PSNR和SSIM指标。

Comments Our method achieved a ranking of 9 out of 148 participants in Track 1 of the NTIRE 3DRR Challenge, as reported on the official competition website: https://www.codabench.org/competitions/13854/

2604.08243 2026-05-12 cs.CL

Self-Debias: Self-correcting for Debiasing Large Language Models

Xuan Feng, Shuai Zhao, Luwei Xiao, Tianlong Gu, Bo An

AI总结尽管大语言模型（LLMs）展现出强大的推理能力，但其内在的社会偏见往往在思维链（CoT）过程中不断传播，导致“偏见传播”问题。为解决这一问题，本文提出了一种名为Self-Debias的渐进式框架，通过将去偏过程重新定义为一种策略性的资源再分配问题，使模型具备内在的自我纠正能力。该方法采用细粒度的轨迹级优化目标，并结合在线自我改进机制，仅需少量标注样本即可高效激活模型的自我修正能力，在去除偏见的同时保持其通用推理能力。

Comments ICML 2026

2604.07522 2026-05-12 cs.CV

Training-free Spatially Grounded Geometric Shape Encoding (Technical Report)

Yuhang He

AI总结本文提出了一种无需训练的通用二维几何形状编码方法XShapeEnc，用于将任意空间定位的二维几何形状编码为具有可逆性、适应性和频率丰富性等特性的紧凑表示。该方法通过将形状分解为标准化几何和姿态向量，并利用正交Zernike基进行编码，结合频率传播操作增强表达能力，从而在多种形状感知任务中展现出良好的理论有效性与应用潜力。

Comments Training-Free 2D Geometric Shape Encoding

2604.07383 2026-05-12 cs.LG

SCOT: Multi-Source Cross-City Transfer with Optimal-Transport Soft-Correspondence Objective

Yuyao Wang, Min Yang, Meng Chen, Weiming Huang, Yilong Yin, Yongshun Gong

AI总结本文研究了跨城市数据迁移中的标签稀缺问题，提出了一种基于最优运输的软对应目标（SCOT）框架，用于在不同城市之间建立显式的区域对应关系。SCOT 通过 Sinkhorn 算法实现非对称区域集的软匹配，并结合对比学习和循环重建正则化提升迁移效果与稳定性。该方法在多源迁移任务中表现出更高的准确性和鲁棒性，同时提供了可解释的对齐质量诊断信息。

Comments 34 pages, 19 figures, 23 tables

2604.06689 2026-05-12 cs.LG stat.ML

Generative Cross-Entropy: A Strictly Proper Loss for Data-Efficient Classification

Qipeng Zhan, Zhuoping Zhou, Li Shen

AI总结本文提出了一种名为生成交叉熵（GenCE）的新分类损失函数，旨在提高数据稀缺场景下的样本效率。该方法通过引入生成学习的思想，在不改变网络结构或拟合额外密度模型的前提下，对传统交叉熵损失进行改进。GenCE 基于贝叶斯重写条件似然，并在小批量近似下实现跨类样本的训练信号耦合，理论证明其在一定条件下是严格正确的评分规则，实验表明其在多个数据集和不同场景下均优于传统损失函数，且具有更好的概率校准和分布外检测能力。

2604.03687 2026-05-12 cs.CV

SciLT: Long-tailed Image Classification under Scientific Image Domains

Jiahao Chen, Bing Su

AI总结本文研究了科学图像领域中的长尾分类问题，针对现有方法在自然图像上表现良好但在科学图像上效果有限的现象，提出了一种新的框架SciLT。该方法通过自适应特征融合和双监督学习，有效利用基础模型的多级表示，特别是在尾部类别上表现出色，实验表明SciLT在三个科学图像基准上均优于现有方法，为科学长尾分类提供了有力的解决方案和实用基准。

2604.02608 2026-05-12 cs.LG

Steerable but Not Decodable: Function Vectors Operate Beyond the Logit Lens

Mohammed Suhail B Nadaf

AI总结该研究探讨了激活空间中函数向量（FVs）的行为特性，发现它们在引导模型生成特定输出时表现良好，但无法通过传统的logit镜头解码出对应答案。研究在多个模型和任务上验证，表明FVs编码的是计算指令而非答案方向，且其引导能力与解码能力之间存在显著差异。这一发现挑战了线性表示假设，对基于词汇投影的安全监控方法提出了新的挑战。

Comments 43 pages, 14 figures, 34 tables

2604.02438 2026-05-12 cs.LG

Mitigating Data Scarcity in Spaceflight Applications for Offline Reinforcement Learning Using Physics-Informed Deep Generative Models

Alex E. Ballentine, Nachiket U. Bapat, Raghvendra V. Cowlagi

AI总结本文研究了在航天飞行等数据稀缺场景下，如何通过引入物理信息的深度生成模型来缓解离线强化学习中的数据不足问题。作者提出了一种基于互信息的分裂变分自编码器（MI-VAE），该模型能够学习观测轨迹与物理模型预测之间的差异，并生成符合物理约束的合成数据。实验表明，使用MI-VAE生成的数据显著提升了强化学习策略的性能，展示了该方法在复杂、数据受限环境中的有效性与鲁棒性。

2604.01532 2026-05-12 cs.AI

PHMForge: Evaluating LLM Agents on Industrial Prognostics through MCP-Native, Algorithm-Grounded Tools

Tianjun Feng, Yunfeng Chen, Chun-Yi Tsai, Yihan Sun, Ayan Das, Kaoutar El Maghraoui, Shuxin Lin, Dhaval Patel

AI总结本文介绍了PHMForge，一个用于评估大型语言模型（LLM）代理在工业预测性维护（PHM）任务中表现的评测环境。该环境基于模型上下文协议（MCP）构建，集成了99个由领域专家编写的工业场景和39个封装了PHM算法的工具，能够准确区分代理的推理能力与工具使用能力。实验表明，尽管前沿LLM在调用工具方面表现较强，但在任务规划和工具序列执行上仍存在显著不足，突显了当前LLM在工业关键安全任务中的局限性。

Comments 23 pages, 3 figures

2604.01151 2026-05-12 cs.AI cs.LG cs.MA

Detecting Multi-Agent Collusion Through Multi-Agent Interpretability

Aaron Rose, Carissa Cullen, Sahar Abdelnabi, Philip Torr, Brandon Gary Kaplowitz, Christian Schroeder de Witt

AI总结随着大型语言模型代理在多智能体系统中的应用增多，隐蔽协作带来的风险日益突出，而传统的监督方式难以有效检测。本文提出NARCBench基准，用于评估在环境分布偏移下的协作检测能力，并设计了五种基于模型内部表示的探针技术，从群体层面识别多智能体间的协作行为。实验表明，这些方法在多种模型和协作场景中表现出良好的检测性能，且检测效果与模型能力密切相关，为多智能体可解释性研究提供了新的思路和工具。

详情

英文摘要

As LLM agents are increasingly deployed in multi-agent systems, they introduce risks of covert coordination that may evade standard forms of human oversight. While linear probes on model activations have shown promise for detecting deception in single-agent settings, collusion is inherently a multi-agent phenomenon, and the use of internal representations for detecting collusion between agents remains unexplored. We introduce NARCBench, a benchmark for evaluating collusion detection under environment distribution shift, and propose five probing techniques that aggregate per-agent deception scores to classify scenarios at the group level, evaluated across four open-weight models (Qwen3-32B, Llama-3.1-70B, DeepSeek-R1 32B, GPT-OSS-20B) and six probe architectures. We frame this as a distributed anomaly detection problem, identifying three collusion signatures that map onto distinct anomaly types and detection paradigms. Every model reaches 1.00 AUROC in-distribution; on our strongest model (Llama-3.1-70B), our five probing techniques achieve 0.73 to 0.93 AUROC when transferred zero-shot to structurally different multi-agent scenarios and 0.99 to 1.00 on a steganographic blackjack card-counting task, with detection performance scaling with model capability. We find that no single probing technique dominates across all collusion types, consistent with the framework's prediction that different anomaly types require different detection paradigms. This work takes a step toward multi-agent interpretability: extending white-box inspection from single models to multi-agent contexts, where detection requires aggregating signals across agents. These results suggest that model internals provide a complementary signal to text-level monitoring for detecting multi-agent collusion. Code and data available at https://github.com/aaronrose227/narcbench.

URL PDF HTML ☆

赞 0 踩 0

2603.26089 2026-05-12 cs.LG cs.AI cs.CL

Selective Deficits in LLM Mental Self-Modeling in a Behavior-Based Test of Theory of Mind

Christopher Ackerman

AI总结该研究探讨了大型语言模型（LLMs）在心智理论（Theory of Mind）任务中的表现，特别是其对自身和他人心理状态的建模能力。研究设计了一种基于行为的实验范式，要求模型在策略性行动中运用心理状态表示，而非仅进行描述。结果发现，2025年中之前发布的模型在所有任务中表现不佳，而近期模型在他人心理建模上达到人类水平，但在自我建模任务中仍需借助推理痕迹辅助，且表现出类似有限工作记忆的认知负荷效应。研究还揭示了推理模型通过策略性欺骗等机制完成任务的潜在机制。

Comments 22 pages, 13 figures, 1 table

2603.22016 2026-05-12 cs.LG cs.AI cs.CL

ROM: Real-time Overthinking Mitigation via Streaming Detection and Intervention

Xinyan Wang, Xiaogeng Liu, Chaowei Xiao

AI总结大型推理模型在得出正确答案后仍常进行冗余验证和重复尝试，导致计算资源浪费甚至推翻正确结论。本文提出ROM框架，通过实时检测推理过程中的关键边界并进行干预，有效减少冗余推理，提升推理效率。实验表明，ROM在多个基准数据集上均提升了模型准确率并显著缩短了响应长度，且具有良好的跨模型泛化能力。

Comments Code is available at https://github.com/SaFo-Lab/ROM

2603.22003 2026-05-12 cs.RO

VP-VLA: Visual Prompting as an Interface for Vision-Language-Action Models

Zixuan Wang, Yuxin Chen, Yuqi Liu, Jinhui Ye, Pengguang Chen, Changsheng Lu, Shu Liu, Bei Yu, Jiaya Jia

AI总结本文提出了一种名为VP-VLA的视觉语言动作模型框架，旨在解决现有模型在空间精度和分布外场景鲁棒性方面的不足。该方法通过结构化的视觉提示接口将高层推理与底层执行解耦，其中“System 2 Planner”负责分解指令并生成目标对象和位置的视觉提示，而“System 1 Controller”则基于这些提示生成精确的底层控制动作。实验表明，VP-VLA在仿真和现实环境中均优于当前最先进的端到端模型。

Comments Project page: https://visualprompt-vla.github.io/

2603.19670 2026-05-12 cs.LG

Load--Reserve Wasserstein Propagation for Isotropic Diffusion Samplers

Zicheng Lyu, Zengfeng Huang

AI总结本文研究了各向同性扩散采样器在逆时间传播过程中的稳定性问题，提出了一种基于负载-储备Wasserstein传播的分析方法。该方法通过认证的漂移剖面构建自适应传播界面，结合反射耦合与Hardy容量量化传播成本与收缩速率，能够更准确地反映扩散过程中的几何特性。实验表明，该方法在处理不同高度和结构的扩散窗口时具有更好的鲁棒性和解释性。

2603.19222 2026-05-12 cs.CV cs.LG

Spectrally-Guided Diffusion Noise Schedules

Carlos Esteves, Ameesh Makadia

AI总结本文研究了如何为像素扩散模型设计更高效的噪声调度策略，以提升图像生成质量。作者提出了一种基于图像频谱特性的噪声调度方法，通过理论分析确定噪声水平的上下界，从而设计出更紧凑、更有效的噪声调度方案。实验表明，该方法在单阶段像素扩散模型中，尤其是在低步数生成场景下，显著提升了生成效果。

Comments Accepted to ICML'26

2603.18113 2026-05-12 cs.LG cs.AI

VC-Soup: Value-Consistency Guided Multi-Value Alignment for Large Language Models

Hefei Xu, Le Wu, Yu Wang, Min Hou, Han Wu, Zhen Zhang, Meng Wang

AI总结随着大型语言模型在内容生成、交互和决策中的广泛应用，如何使其与人类价值观对齐已成为可信人工智能的核心目标。当需要对齐多个可能存在冲突的价值观时，现有方法如奖励重加权、基于提示的监督微调和模型合并仍面临训练成本高和对齐性能下降等挑战。为此，本文提出VC-Soup方法，从数据价值一致性角度出发，通过设计一致性度量指标过滤低一致性的偏好对，并结合参数合并策略，有效缓解价值观冲突，实现多价值之间的平衡对齐。

Comments 12 pages; Accepted to WWW2026

2603.16253 2026-05-12 cs.CV cs.AI

Grounding the Score: Explicit Visual Premise Verification for Reliable Vision-Language Process Reward Models

Junxin Wang, Dai Guan, Weijie Qiu, Zhihang Li, Yongbo Gai, Zhengyi Yang, Mengyu Zhou, Erchao Zhao, Xiaoxi Jiang, Guanjun Jiang

AI总结本文研究了视觉语言过程奖励模型（VL-PRM）在推理过程中因感知与推理耦合而导致的评分偏差问题，提出了一种名为显式视觉前提验证（EVPV）的轻量验证接口，通过显式检查步骤所依赖的视觉前提的可靠性，将感知不确定性与逻辑评估解耦，从而提升推理评分的准确性与鲁棒性。实验表明，EVPV在多个视觉与多模态推理基准上有效提升了步骤验证和重排序性能，并验证了其改进源于前提验证的准确性而非偶然的提示效应。

Comments 27 pages, 4 figures, 10 tables. Evaluated on VisualProcessBench and six multimodal reasoning benchmarks (LogicVista, MMMU, MathVerse-VO, MathVision, MathVista, WeMath). Includes ablations and causal analysis via controlled constraint corruption. Code: https://github.com/Qwen-Applications/EVPV-PRM

2603.14694 2026-05-12 cs.CV cs.AI cs.LG

Robust Building Damage Detection in Cross-Disaster Settings Using Domain Adaptation

Asmae Mouradi, Shruti Kshirsagar

AI总结该研究针对灾害管理中远程感知图像的建筑损毁检测问题，提出了基于领域自适应的两阶段集成方法，以解决不同地理区域间数据分布差异导致的模型性能下降问题。通过将xView2方法适配到Ida-BD数据集，并系统分析数据增强对分类性能的影响，实验表明领域自适应对提升模型鲁棒性至关重要。研究在未见过的Ida-BD测试集上实现了0.5552的Macro-F1分数，验证了该方法在跨灾害场景中的有效性与可靠性。

Comments accepted for publication IEEE ICHMS

2603.13224 2026-05-12 cs.CV cs.AI

Visual-ERM: Reward Modeling for Visual Equivalence

Ziyu Liu, Shengyuan Ding, Xinyu Fang, Xuanlang Dai, Penghui Yang, Jianze Liang, Jiaqi Wang, Kai Chen, Dahua Lin, Yuhang Zang

AI总结该研究针对视觉到代码任务中模型重建图表、表格和SVG等结构化视觉输入时的挑战，提出了一种新的奖励模型Visual-ERM，用于提供细粒度、可解释且任务无关的反馈。该模型直接在渲染的视觉空间中评估生成质量，有效解决了现有奖励信号对细微视觉差异感知不足的问题。实验表明，结合Visual-ERM的强化学习方法显著提升了模型在图表、表格和SVG解析任务中的表现，并在新构建的基准VC-RewardBench上展现出优越的性能。

Comments Project: https://github.com/InternLM/Visual-ERM

2603.09103 2026-05-12 cs.LG eess.SP

Probabilistic Hysteresis Factor Prediction for Electric Vehicle Batteries with Graphite Anodes Containing Silicon

Runyao Yu, Viviana Kleine, Philipp Gromotka, Thomas Rudolf, Adrian Eisenmann, Gautham Ram Chandra Mouli, Peter Palensky, Jochen L. Cremer

AI总结本文研究了含硅的石墨负极电动汽车电池中电压滞后因子的预测问题，该问题对电池荷电状态（SoC）估计构成了挑战。为解决现有方法在不确定性量化和计算效率方面的不足，作者提出了一种基于数据驱动的概率滞后因子预测方法，并设计了数据标准化框架以适应不同工况下的驾驶循环。实验表明，该方法在多种未见过的车辆模型中具有良好的泛化能力，有助于推动先进电池技术的应用。

Comments 11 pages, 5 figures, 6 tables

2603.09007 2026-05-12 cs.SD cs.AI

Gender Fairness in Audio Deepfake Detection: Performance and Disparity Analysis

Aishwarya Fursule, Shruti Kshirsagar, Anderson R. Avila

AI总结本文研究了音频深度伪造检测中的性别公平性问题，分析了现有检测模型在不同性别上的性能差异。作者基于ASVspoof 5数据集，采用ResNet-18分类器，并结合四种音频特征进行评估，同时与基线模型AASIST进行对比。通过引入五种公平性指标，研究发现即使整体误识率差异较小，模型在性别上的错误分布仍存在显著差异，强调了传统性能指标的局限性，突出了公平性评估在构建更公正、可靠音频深度伪造检测系统中的重要性。

Comments Paper Accepted to IEEE CAI Conference 2026

2603.05495 2026-05-12 cs.LG math.OC

Cheap Thrills: Effective Amortized Optimization Using Inexpensive Labels

Khai Nguyen, Petros Ellinas, Anvita Bhagavathula, Priya L. Donti

AI总结该论文提出了一种高效的优化方法，旨在利用低成本标签提升代理模型的训练效果。研究通过分阶段策略，先使用低成本但不完美的标签进行监督预训练，再结合基于优势损失的终止方案，最后通过自监督学习进一步优化模型。实验表明，该方法在多个复杂领域中实现了更快的收敛速度和更高的精度，同时大幅降低了计算成本。

Comments in submission

2603.05301 2026-05-12 cs.AI

Uniform Inductive Spatio-Temporal Kriging

Lewei Xie, Haoyu Zhang, Yulong Chen, Liangjun You, Zongxian Yang, Yifan Zhang

AI总结本文研究了在观测数据不完整的情况下进行归纳时空克里金插值的问题，提出了一种名为UniSTOK的通用框架。该方法引入了可靠性引导信号调节（RSR）和残差偏差校准（RBC）两个模块，分别用于增强可靠观测信号并校准预测偏差，从而提升时空信号插值的准确性。实验表明，UniSTOK在多个真实数据集上显著优于现有方法。

2603.04415 2026-05-12 cs.CL cs.CV

Dual Tuning for Reasoning Efficacy-Driven Data Curation in Multimodal LLM Training

Ruobing Zheng, Tianqi Li, Jianing Li, Qingpei Guo, Yi Yuan, Jingdong Chen

AI总结该研究探讨了如何通过数据筛选提升多模态大语言模型在推理任务中的训练效果。提出了一种名为Dual Tuning的框架，能够评估给定任务下推理训练是否有效，并确定哪些数据更适合用于推理训练或直接答案训练。该方法通过联合分析模型能力、任务特性及推理数据质量，为多模态模型的训练数据选择和后续训练策略匹配提供了定量依据。

Comments Project Page: https://digital-avatar.github.io/ai/ThinkingBoundary/