arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

检索范围排序方式

检索时间范围

重置

HOT 人工智能、机器人等 9

cs.AI 人工智能 cs.CV 计算机视觉 cs.CL 自然语言处理 cs.RO 机器人 cs.LG 机器学习 cs.SD 声音 cs.ET 新兴技术 eess.AS 音频语音 eess.IV 图像视频

CS 计算机 41

cs 计算机 cs.AI 人工智能 cs.AR 硬件架构 cs.CC 计算复杂性 cs.CE 计算工程 cs.CG 计算几何 cs.CL 自然语言处理 cs.CR 密码安全 cs.CV 计算机视觉 cs.CY 计算机与社会 cs.DB 数据库 cs.DC 分布式计算 cs.DL 数字图书馆 cs.DM 离散数学 cs.DS 数据结构 cs.ET 新兴技术 cs.FL 形式语言 cs.GL 综述文献 cs.GR 图形学 cs.GT 博弈论 cs.HC 人机交互 cs.IR 信息检索 cs.IT 信息论 cs.LG 机器学习 cs.LO 计算机逻辑 cs.MA 多智能体 cs.MM 多媒体 cs.MS 数学软件 cs.NA 数值分析 cs.NE 神经进化 cs.NI 网络架构 cs.OH 其他计算机 cs.OS 操作系统 cs.PF 性能 cs.PL 编程语言 cs.RO 机器人 cs.SC 符号计算 cs.SD 声音 cs.SE 软件工程 cs.SI 社会信息网络 cs.SY 系统控制

ECON 经济学 4

econ 经济学 econ.EM 计量经济 econ.GN 一般经济 econ.TH 理论经济

EESS 电气与系统 5

eess 电气与系统 eess.AS 音频语音 eess.IV 图像视频 eess.SP 信号处理 eess.SY 系统控制

MATH 数学 33

math 数学 math.AC 交换代数 math.AG 代数几何 math.AP 偏微分方程 math.AT 代数拓扑 math.CA 经典分析 math.CO 组合数学 math.CT 范畴论 math.CV 复变函数 math.DG 微分几何 math.DS 动力系统 math.FA 泛函分析 math.GM 一般数学 math.GN 一般拓扑 math.GR 群论 math.GT 几何拓扑 math.HO 历史综述 math.IT 信息论 math.KT K理论 math.LO 逻辑 math.MG 度量几何 math.MP 数学物理 math.NA 数值分析 math.NT 数论 math.OA 算子代数 math.OC 优化控制 math.PR 概率 math.QA 量子代数 math.RA 环与代数 math.RT 表示论 math.SG 辛几何 math.SP 谱理论 math.ST 统计理论

PHYSICS 物理 55

astro-ph 天体物理 astro-ph.CO 宇宙学 astro-ph.EP 地球行星 astro-ph.GA 星系物理 astro-ph.HE 高能天体 astro-ph.IM 天文仪器 astro-ph.SR 太阳恒星 cond-mat 凝聚态 cond-mat.dis-nn 无序神经 cond-mat.mes-hall 介观纳米 cond-mat.mtrl-sci 材料科学 cond-mat.other 其他凝聚态 cond-mat.quant-gas 量子气体 cond-mat.soft 软凝聚态 cond-mat.stat-mech 统计力学 cond-mat.str-el 强关联电子 cond-mat.supr-con 超导 gr-qc 广义相对论 hep-ex 高能实验 hep-lat 格点高能 hep-ph 高能唯象 hep-th 高能理论 math-ph 数学物理 nlin 非线性科学 nlin.AO 自适应系统 nlin.CD 混沌动力学 nlin.CG 胞自动机 nlin.PS 斑图孤子 nlin.SI 可积系统 nucl-ex 核物理实验 nucl-th 核物理理论 physics 物理 physics.acc-ph 加速器物理 physics.ao-ph 大气海洋 physics.app-ph 应用物理 physics.atm-clus 原子分子团簇 physics.atom-ph 原子物理 physics.bio-ph 生物物理 physics.chem-ph 化学物理 physics.class-ph 经典物理 physics.comp-ph 计算物理 physics.data-an 数据分析 physics.ed-ph 物理教育 physics.flu-dyn 流体动力学 physics.gen-ph 普通物理 physics.geo-ph 地球物理 physics.hist-ph 物理史哲 physics.ins-det 仪器探测 physics.med-ph 医学物理 physics.optics 光学 physics.plasm-ph 等离子体 physics.pop-ph 科普物理 physics.soc-ph 物理与社会 physics.space-ph 空间物理 quant-ph 量子物理

Q-BIO 定量生物 11

q-bio 定量生物 q-bio.BM 生物分子 q-bio.CB 细胞行为 q-bio.GN 基因组学 q-bio.MN 分子网络 q-bio.NC 神经认知 q-bio.OT 其他定量生物 q-bio.PE 种群进化 q-bio.QM 定量方法 q-bio.SC 亚细胞过程 q-bio.TO 组织器官

Q-FIN 定量金融 10

q-fin 定量金融 q-fin.CP 计算金融 q-fin.EC 经济学 q-fin.GN 一般金融 q-fin.MF 数学金融 q-fin.PM 投资组合 q-fin.PR 证券定价 q-fin.RM 风险管理 q-fin.ST 统计金融 q-fin.TR 交易微观结构

STAT 统计 7

stat 统计 stat.AP 统计应用 stat.CO 统计计算 stat.ME 统计方法 stat.ML 机器学习 stat.OT 其他统计 stat.TH 统计理论

2605.10598 2026-05-12 cs.AI

Budget-Efficient Automatic Algorithm Design via Code Graph

Maxime Bouscary, Manxi Wu, Saurabh Amin

发表机构 * Operations Research Center（运筹学研究中心）； Department of Civil and Environmental Engineering（土木与环境工程系）； University of California, Berkeley（加州大学伯克利分校）； Laboratory for Information & Decision Systems（信息与决策系统实验室）

AI总结该研究提出了一种基于代码图的高效自动算法设计方法，旨在解决现有方法在计算资源利用上的低效问题。通过将算法表示为有向无环图，并利用大语言模型生成局部代码修正，而非完整算法，从而更高效地探索算法空间并实现更优的搜索效率。实验表明，该方法在相同计算预算下优于传统方法，并揭示了上下文丰富性对模型性能的影响条件。

2605.10593 2026-05-12 cs.AI cs.CL cs.HC cs.SE

LLARS: Enabling Domain Expert & Developer Collaboration for LLM Prompting, Generation and Evaluation

Philipp Steigerwald, Mara Stieler, Jennifer Burghardt, Eric Rudolph, Jens Albrecht

发表机构 * Technische Hochschule Nürnberg Georg Simon Ohm（图恩-努尔堡技术大学乔治·西蒙·奥姆学院）； Faculty of Computer Science, Centre for Artificial Intelligence (KIZ)（计算机科学学院，人工智能中心（KIZ））； Faculty of Social Sciences, Institute for E-Counselling（社会科学学院，电子咨询研究所）

AI总结 LLARS 是一个开源平台，旨在促进领域专家与开发者在构建基于大语言模型（LLM）的系统时的协作。该平台集成了协作提示工程、批量生成和混合评估三个紧密关联的模块，支持实时协作、可控成本的输出生成以及结合人类与LLM评估者的多维度评估方法。研究显示，LLARS 能有效提升跨学科协作效率，简化工作流程并提高模型-提示组合的优化效果。

Comments Accepted at IJCAI-ECAI 2026 Demonstrations Track. Demo video: https://youtu.be/3QaKouwr4gU

2605.10588 2026-05-12 cs.CV

Thinking with Novel Views: A Systematic Analysis of Generative-Augmented Spatial Intelligence

Yanbing Zhang, Bo Wang, Jianhui Liu, Nan Jiang, Jiaxiu Jiang, Haoze Sun, Yijun Yang, Shenghe Zheng, Lin Song, Haoyang Huang, Nan Duan, Wenbo Li

发表机构 * Joy Future Academy（未来Joy学院）

AI总结当前大型多模态模型（LMMs）在需要视角依赖理解的空间推理任务中表现不佳，主要受限于单一静态视角的观察。为此，研究提出了一种名为“Thinking with Novel Views（TwNV）”的新范式，通过在推理过程中引入生成新视角的合成图像，提升模型对空间关系的理解能力。实验表明，TwNV在多个空间子任务和不同架构的LMM上均显著提升了性能，验证了新视角生成在增强模型空间智能方面的有效性。

Comments Submitted to NeurIPS 2026

2605.10586 2026-05-12 cs.CV

CausalGS: Learning Physical Causality of 3D Dynamic Scenes with Gaussian Representations

Nengbo Lu, Minghua Pan

发表机构 * Guilin University of Electronic Technology（桂林电子科技大学）

AI总结本文提出了一种名为CausalGS的框架，旨在仅从多视角视频中学习复杂三维动态场景的物理因果关系，无需依赖显式先验知识。其核心是一个逆物理推理模块，通过联合推断场景的初始速度场和内在材料属性，将动态过程分解为两个因素进行建模，并利用可微分物理模拟器进行物理正则化的学习。实验表明，CausalGS在长期未来帧外推和新视角插值任务中均优于现有方法，展示了其从视觉观测中自主学习物理属性交互和因果关系的能力。

Comments ICMR2026 Accepted

2605.10585 2026-05-12 cs.LG

Controllability in preference-conditioned multi-objective reinforcement learning

Pau de las Heras Molins, Beyazit Yalcinkaya, Lasse Peters, David Fridovich-Keil, Georgios Bakirtzis

发表机构 * LTCI, Télécom Paris, Institut Polytechnique de Paris（LTCI，巴黎电信学院，巴黎理工学院）； University of California, Berkeley（加州大学伯克利分校）； TU Delft（代尔夫特理工大学）； The University of Texas at Austin（德克萨斯大学奥斯汀分校）

AI总结本文研究了偏好条件下的多目标强化学习中的可控性问题，即用户偏好变化是否能可靠地引导智能体行为变化。作者指出，现有评估指标无法有效衡量这一特性，导致智能体可能对偏好输入不敏感。为此，本文提出了一种新的评估指标，以更准确地衡量偏好条件智能体的可控性，从而推动多目标强化学习中偏好适应能力的进一步发展。

2605.10579 2026-05-12 cs.CL

VISTA: A Generative Egocentric Video Framework for Daily Assistance

Yu-Hsiang Liu, Yu-Chien Tang, An-Zi Yen

发表机构 * Department of Computer Science, National Yang Ming Chiao Tung University（国立阳明交通大学计算机科学系）

AI总结本文提出了一种名为VISTA的生成式第一人称视频框架，旨在为日常辅助任务中的AI代理提供高质量的训练与评估数据。该框架通过五步脚本生成流程结合因果逆向推理，生成多样且逻辑严谨的干预场景，涵盖反应式和主动式两种代理自主级别。VISTA支持用户自定义和优化场景，为日常任务提供可扩展且可控的视频基准，为真实环境中AI代理的训练与评估提供了替代方案。

Comments pre-print

2605.10576 2026-05-12 cs.CV cs.AI

SenseBench: A Benchmark for Remote Sensing Low-Level Visual Perception and Description in Large Vision-Language Models

Chen Zhong, Xiao An, Jiaxing Sun, Zihan Gui, Guangyi Yang, Wei He

发表机构 * Wuhan University（武汉大学）； Shanghai Artificial Intelligent Laboratory（上海人工智能实验室）

AI总结本文提出 SenseBench，首个专门用于评估大语言视觉模型在遥感低级视觉感知与描述能力的基准测试平台。该研究针对当前图像质量评估方法无法准确描述遥感退化现象的问题，构建了包含6大类22个细粒度退化类型的10,000余个精心标注样本，并设计了感知与描述两种评估协议，揭示了现有模型在遥感领域存在的领域偏差、多退化混淆等关键问题，为推动遥感低级视觉感知模型的发展提供了有力支持。

2605.10572 2026-05-12 cs.LG

Online Sharp-Calibrated Bayesian Optimization

Marshal Arijona Sinaga, Julien Martinelli, Teemu Turpeinen, Samuel Kaski

发表机构 * ELLIS Institute Finland（芬兰ELLIS研究所）； Aalto University（阿尔托大学）； University of Manchester（曼彻斯特大学）

AI总结本文研究了在线贝叶斯优化中如何同时实现不确定性估计的尖锐性与校准性的问题。作者提出了一种新的在线尖锐校准贝叶斯优化算法（OSCBO），通过将核超参数选择建模为约束在线学习问题，实现了对高斯过程模型不确定性的自适应优化。该方法在保持子线性遗憾界的同时，在多个合成与实际基准测试中表现出优异的性能。

2605.10569 2026-05-12 cs.AI

Deep Arguing

Adam Gould, Francesca Toni

发表机构 * Department of Computing（计算系）； Imperial College London（帝国理工学院伦敦校区）

AI总结本文提出了一种名为“Deep Arguing”的新型神经符号方法，旨在提升深度学习模型在多模态数据分类任务中的可解释性。该方法将深度神经网络与论证构建和推理相结合，使模型能够生成支持预测结果的论证结构，并通过可微分的论证语义进行训练，从而同时学习特征表示和论证交互。实验表明，该方法在保持预测性能的同时，能够提供具有说服力的案例解释，提升了模型的可解释性和推理能力。

2605.10567 2026-05-12 cs.CV

VeloGauss: Learning Physically Consistent Gaussian Velocity Fields from Videos

Nengbo Lu, Bin Zhao

发表机构 * Guangxi Key Laboratory of Robot Intelligent Perception and Control（广西机器人智能感知与控制重点实验室）； School of Artificial Intelligence, Guilin University of Electronic Technology（人工智能学院，桂林电子科技大学）

AI总结本文提出了一种名为 VeloGauss 的方法，旨在仅从动态多视角视频中联合建模三维场景的几何、外观和物理信息，而无需依赖任何物理先验。该方法通过引入物理编码和粒子动力学系统，学习每个高斯粒子的运动场，并结合全局物理约束以确保场景的物理一致性。实验表明，VeloGauss 在新视角插值和未来帧外推任务中均取得了优于现有方法的性能。

Comments ICME2026 Accepted

2605.10564 2026-05-12 cs.CV cs.RO

DeepSight: Long-Horizon World Modeling via Latent States Prediction for End-to-End Autonomous Driving

Lingjun Zhang, Changjie Wu, Linzhe Shi, Jiangyang Li, Jiaxin Liu, Lei Yang, Hang Zhang, Mu Xu, Hong Wang

发表机构 * Tsinghua University（清华大学）； Amap, Alibaba Group（阿里巴巴集团Amap）； Nanyang Technological University（南洋理工大学）

AI总结本文提出了一种名为DeepSight的端到端自动驾驶世界模型，通过在鸟瞰图（BEV）空间中并行预测连续未来帧的潜在语义特征，实现了对长期未来世界状态的建模。该方法还引入了一种高效且自适应的文本推理机制，结合额外的社会知识和推理能力，以提升复杂长尾场景下的驾驶性能。实验表明，该方法在闭合回路 Bench2drive 基准测试中达到了最先进的效果。

Comments ICML 2026

2605.10563 2026-05-12 cs.CL cs.AI

ThreatCore: A Benchmark for Explicit and Implicit Threat Detection

Davide Bruni, Carlo Bardazzi, Maurizio Tesconi

发表机构 * Computer Science Department, University of Pisa, Italy（比萨大学计算机科学系）； Institute of Informatics and Telematics, National Research Council, Italy（意大利国家研究委员会信息与电信学研究院）

AI总结 ThreatCore 是一个用于细粒度威胁检测的公开基准数据集，旨在区分明确威胁、隐含威胁和非威胁内容，解决了当前自然语言处理中威胁检测定义不统一、缺乏标准化的问题。该数据集通过整合多个公开资源并基于统一的威胁定义进行系统性重新标注，揭示了现有标签的显著不一致性，并通过人工验证的合成样本来增强对隐含威胁的覆盖。实验表明，隐含威胁比明确威胁更难检测，而引入语义角色标注作为中间表示有助于提升模型性能，凸显了ThreatCore在推动细粒度威胁检测研究中的重要价值。

2605.10560 2026-05-12 cs.CL

ICT-NLP at SemEval-2026 Task 3: Less Is More -- Multilingual Encoder with Joint Training and Adaptive Ensemble for Dimensional Aspect Sentiment Regression

Liyuan Huang, Jiawei He, Wutao Shen, Lin Li, Jin Zhang

发表机构 * State Key Laboratory of AI Safety（人工智能安全国家重点实验室）； Institute of Computing Technology, Chinese Academy of Sciences（中国科学院计算技术研究所）； University of Chinese Academy of Sciences（中国科学院大学）

AI总结本文介绍了我们在SemEval-2026任务3（维度方面情感回归）中的系统设计，提出了一种轻量且资源高效的多语言解决方案，完全基于预训练编码器，无需依赖大语言模型或外部语料。我们采用联合多语言和多领域训练策略以提升跨语言迁移能力并缓解数据稀疏问题，引入了有界回归变换以提高训练稳定性并约束预测范围，同时通过子集搜索实现自适应集成以降低预测方差。实验结果表明，我们的系统在多个语言数据集上表现优异，取得了多项前列成绩。

2605.10555 2026-05-12 cs.AI

Agent-First Tool API: A Semantic Interface Paradigm for Enterprise AI Agent Systems

Kai Pan

发表机构 * A2A Lab（A2A实验室）

AI总结随着AI代理从研究原型转向企业级生产系统，其使用的工具接口仍基于以人类为中心的CRUD范式。本文提出了一种名为“Agent-First Tool API”的语义接口范式，通过六动词语义协议、标准化工具契约和双层治理管道，解决了传统API与自主代理需求之间的五大架构不匹配问题。该方法在实际多租户SaaS平台中得到验证，显著提升了任务成功率并减少了人工干预，证明了其在企业AI代理系统中的有效性与优越性。

2605.10551 2026-05-12 cs.LG

It's All Connected: Topology-Aware Structural Graph Encoding Improves Performance on Polymer Prediction

H. Ibrahim Erdogan, Punith Raviswamy, Nikita Agrawal, Yannik Köster, Stefan Zechel, Ulrich S. Schubert, Ruben Mayer, Christopher Kuenneth

发表机构 * Faculty of Engineering Science, University of Bayreuth, Germany（拜罗伊特大学工程科学学院）； Faculty of Mathematics, Physics & Computer Science, University of Bayreuth, Germany（拜罗伊特大学数学、物理与计算机科学学院）； Laboratory of Organic and Macromolecular Chemistry (IOMC), Friedrich Schiller University Jena, Germany（耶拿弗里德里希·施莱尔大学有机与大分子化学实验室）； Jena Center for Soft Matter (JCSM), Friedrich Schiller University Jena, Germany（耶拿软物质中心（JCSM））； Helmholtz Institute for Polymers in Energy Applications Jena (HIPOLE Jena), Germany（耶拿聚合物能源应用研究所（HIPOLE 耶拿））； Helmholtz Zentrum Berlin für Materialien und Energie GmbH (HZB), Germany（柏林材料与能源研究中心（HZB））

AI总结该研究针对聚合物性质预测中图神经网络（GNN）面临的数据稀缺和结构复杂性问题，提出了一种基于分子质量分布的拓扑感知图构建方法，直接编码聚合物链尺度的结构信息。通过结合丰富的化学特征描述符和自监督预训练策略，该方法在仅有381个聚合物样本的数据集上显著提升了预测性能，相比传统重复单元图方法，其均方根误差降低了5.1%。实验表明，图构建方式与预训练策略的结合是性能提升的关键，且方法适用于多种GNN架构。

Comments 9 pages, 4 figures

2605.10547 2026-05-12 cs.LG

PhysEDA: Physics-Aware Learning Framework for Efficient EDA With Manhattan Distance Decay

Zetao Yang

发表机构 * School of Mathematics and Statistics（数学与统计学学院）

AI总结本文提出了一种基于物理先验知识的高效电子设计自动化（EDA）学习框架PhysEDA，旨在解决传统注意力机制和强化学习方法在EDA任务中面临的计算复杂度高和数据稀缺导致的过拟合问题。该方法通过引入曼哈顿距离衰减的物理特性作为归纳偏置，设计了具有线性复杂度的物理结构化线性注意力模块，并结合基于势能的奖励塑造策略，有效提升了模型在跨尺度迁移和稀疏奖励场景下的性能。实验表明，PhysEDA在多个EDA任务中实现了显著的性能提升和计算效率优化。

Comments 9 pages, 4 figures, plus appendix. Code and data to be released upon publication

2605.10546 2026-05-12 cs.LG

Higher Resolution, Better Generalization: Unlocking Visual Scaling in Deep Reinforcement Learning

Raphael Trumpp, Ömer Veysel Çağatan, Barış Akgün, Marco Caccamo

发表机构 * TUM School of Engineering and Design（技术大学慕尼黑工程与设计学院）； Technical University of Munich（技术大学慕尼黑）； KUIS AI Center（KUIS人工智能中心）； Koç University（科克大学）； Department of Computer Engineering（计算机工程系）

AI总结本文研究了深度强化学习中视觉输入分辨率对策略学习的影响，指出当前常用的方法往往过度降低图像分辨率，而高分辨率输入在适当网络架构支持下能显著提升性能和泛化能力。研究发现，传统Impala编码器在分辨率提升时参数量呈二次增长，限制了性能提升，而改用全局平均池化后的Impoola架构则能有效解耦参数量与分辨率，实现跨不同分辨率和网络宽度的性能提升，最高可提升28%。实验表明，高分辨率有助于策略更精确地感知小物体或远距离目标，为视觉强化学习的可扩展性提供了新方向。

2605.10544 2026-05-12 cs.CL

Where Does Long-Context Supervision Actually Go? Effective-Context Exposure Balancing

Jinchang Zhu, Jindong Li, Chengyu Zou, Rong Fu, Chao Wang, Haowei He, Menglin Yang

发表机构 * The Hong Kong University of Science and Technology (Guangzhou)（香港科技大学（广州））； Institute of Artificial Intelligence (TeleAI), China Telecom（人工智能研究院（TeleAI），中国电信）

AI总结本文研究了长上下文适应中监督分配的问题，指出当前方法在训练过程中未能有效提升目标标记的长上下文监督。为此，作者提出了EXACT方法，通过逆频率分配权重，增强对长有效上下文目标的监督。实验表明，EXACT在多个模型配置上显著提升了长上下文推理性能，同时保持了标准任务的表现，验证了监督分配对长上下文适应的关键作用。

2605.10541 2026-05-12 cs.AI cs.LG

Bridging Sequence and Graph Structure for Epigenetic Age Prediction

Yao Li, Xikun Zhang, Xiaotao Shen, Sonika Tyagi, Xin Zheng, Jiaxing Huang, Feng Xia

发表机构 * School of Computing and Information Systems（计算与信息系）； The University of Melbourne（墨尔本大学）； School of Computing Technologies（计算技术系）； RMIT University（皇家墨尔本理工学院）； Lee Kong Chian School of Medicine（李科金医学院）； Nanyang Technological University（南洋理工大学）； Department of Data Science and Artificial Intelligence（数据科学与人工智能系）； Hong Kong Polytechnic University（香港理工大学）

AI总结本文研究了如何结合DNA甲基化位点的序列信息与图结构，以更准确地预测表观遗传年龄。作者提出了一种统一的序列-图整合框架，通过轻量级的门控调制机制，将八维DNA序列统计特征与图卷积相结合，从而更有效地建模甲基化信号。该方法在3,707个血液甲基化样本上的测试表现优于现有最佳图模型，表明结合生物信息的统计特征在该任务中比基于卷积神经网络的序列编码更具优势。

2605.10537 2026-05-12 cs.CL

Mela: Test-Time Memory Consolidation based on Transformation Hypothesis

Lungchuan Chen

发表机构 * MusubiAI

AI总结本文提出了一种基于记忆巩固理论的测试时记忆整合方法Mela，其核心是引入分层记忆模块（HMM），该模块包含两个不同更新频率的子模块，分别生成抽象的高层表示和细粒度的 episodic 细节表示，并在推理时动态组合形成最终记忆输出。通过将HMM集成到Transformer解码器中，Mela实现了在测试阶段进行在线记忆整合的增强语言模型，在不同规模的语言建模任务中均优于传统Transformer基线，并在固定预训练上下文长度下表现出对更长上下文的更好适应性。

2605.10536 2026-05-12 cs.LG cs.AI

HH-SAE: Discovering and Steering Hierarchical Knowledge of Complex Manifolds

Honghan Wu, Tianyan Wang, Jiacong Mi, Zhoyang Jiang, Yunsoo Kim

发表机构 * University of Glasgow（格拉斯哥大学）； University of International Relations（国际关系大学）； University College London（伦敦大学学院）

AI总结本文提出了一种名为HH-SAE的混合分层自编码器，用于解决高维关键领域中语义创新被密集背景信息掩盖的“特征密度冲突”问题。该方法通过将流形分解为上下文、原子和复合三个层次，实现了对复杂结构知识的发现与引导。实验表明，HH-SAE在跨领域零样本检测等任务中表现出色，并在知识引导的合成任务中显著提升了性能，验证了其在高精度高风险环境中的有效性。

2605.10533 2026-05-12 cs.LG

ConfoundingSHAP: Quantifying confounding strength in causal inference

Marie Brockschmidt, Santo M. A. R. Thies, Maresa Schröder, Dennis Frauen, Valentyn Melnychuk, Maximilian Muschalik, Eyke Hüllermeier, Stefan Feuerriegel

发表机构 * LMU Munich（慕尼黑大学）； Munich Center for Machine Learning (MCML)（慕尼黑机器学习中心）； German Research Center for Artificial Intelligence (DFKI)（德国人工智能研究中心）

AI总结在因果推断中，混杂变量会影响处理分配和结果，但在观察性研究中，处理分配机制未知，难以确定哪些协变量是混杂变量。本文提出ConfoundingSHAP，一种基于Shapley值的方法，用于量化每个协变量的混杂强度。该方法通过设计专门的Shapley博弈模型，区别于传统SHAP用于解释处理效应异质性的应用，并结合可扩展的TabPFN估计方法，避免了对大量调整集的重复拟合，有效提升了因果推断中对混杂变量识别的实用性与效率。

2605.10531 2026-05-12 cs.AI

A Reflective Storytelling Agent for Older Adults: Integrating Argumentation Schemes and Argument Mining in LLM-Based Personalised Narratives

Jayalakshmi Baskar, Vera C. Kaelin, Kaan Kilic, Helena Lindgren

发表机构 * Umeå University, Department of Computing Science（乌尔姆大学计算机科学系）

AI总结本研究探讨了基于知识驱动的大型语言模型（LLM）讲故事能否支持老年人与数字伴侣进行有目的的叙事互动。为解决LLM在幻觉和透明度方面的局限性，研究提出了一种结合知识图谱、用户建模、论证理论和论证挖掘的反思式叙事代理，用于引导和审查叙事生成过程。实验结果显示，该系统生成的叙事在文化认同性和个人相关性方面受到用户认可，而基于论证的叙事目的和幻觉风险指标对叙事质量和用户接受度有显著影响。

Comments Submitted to ACM Transactions on Intelligent Systems and Technology (TIST)

2605.10529 2026-05-12 cs.AI cs.LG

PrimeKG-CL: A Continual Graph Learning Benchmark on Evolving Biomedical Knowledge Graphs

Yousef A. Radwan, Yao Li, Qing Qing, Ziqi Xu, Xingtong Yu, Jiaxing Huang, Renqiang Luo, Xikun Zhang

发表机构 * Technology, Innovation, Entrepreneurship Department（技术、创新与创业系）； King Abdullah University of Science and Technology（国王阿卜杜勒阿齐兹大学）； School of Computing and Information Systems（计算与信息系）； The University of Melbourne（墨尔本大学）； College of Computer Science and Technology（计算机科学与技术学院）； School of Computing Technologies（计算技术学院）； Jilin University（吉林大学）； RMIT University（皇家墨尔本理工大学）； Department of Systems Engineering and Engineering Management（系统工程与工程管理系）； The Chinese University of Hong Kong（香港中文大学）； Department of Data Science and Artificial Intelligence（数据科学与人工智能系）； Hong Kong Polytechnic University（香港理工大学）

AI总结该研究提出了一个名为 PrimeKG-CL 的持续图学习基准，专门用于评估在动态演变的生物医学知识图谱上的学习方法。该基准基于九个权威生物医学数据库构建，包含真实的时序快照和多模态节点特征，并设计了多种任务和测试划分方式，以更贴近实际场景。实验表明，解码器选择与持续学习策略之间存在显著交互影响，且多模态特征对任务性能有明显提升，而某些现有方法在大规模数据下难以有效运行。

2605.10523 2026-05-12 cs.CV

Improving Human Image Animation via Semantic Representation Alignment

Chang Liu, Mengting Chen, Yixuan Huang, Haoning Wu, Chen Ju, Shuai Xiao, Jinsong Lan, Yanfeng Wang

发表机构 * School of Artificial Intelligence, Shanghai Jiao Tong University, China（上海交通大学人工智能学院，中国）； Alibaba Group, China（阿里巴巴集团，中国）

AI总结本文研究如何通过语义表示对齐来提升人体图像动画生成的质量，解决在生成长视频或复杂动作时出现的肢体扭曲和面部失真问题。提出了一种名为 SemanticREPA 的新方法，通过结构对齐模块和身份对齐模块，分别对齐视频潜在表示中的结构信息与深度特征、生成视频的身份特征与人脸识别特征，从而提升生成结果的结构稳定性和身份一致性。该方法在复杂动作生成和角色一致性方面表现出色，为人体动画生成提供了更高质量和更灵活的解决方案。

Comments Accepted by CVPR 2026 workshop

2605.10521 2026-05-12 cs.CV cs.AI

DuetFair: Coupling Inter- and Intra-Subgroup Robustness for Fair Medical Image Segmentation

Yiqi Tian, Sangjoon Park, Bo Zeng, Pengfei Jin, Yujin Oh, Quanzheng Li

发表机构 * Center for Advanced Medical Computing and Analysis, Massachusetts General Hospital and Harvard Medical School（先进医学计算与分析中心，麻省总医院和哈佛医学院）； Department of Industrial Engineering, University of Pittsburgh（工业工程系，匹兹堡大学）； Department of Radiation Oncology, College of Medicine, Yonsei University（放射肿瘤学系，延世大学医学院）； Institute for Innovation in Digital Healthcare, Yonsei University（数字医疗创新研究所，延世大学）； Department of Biomedical Systems Informatics, College of Medicine, Yonsei University（生物医学系统信息学系，延世大学医学院）

AI总结医学图像分割模型在不同子群体中的表现可能存在差异，现有公平性方法大多关注提升子群体平均性能，忽略了子群体内部可能存在的隐藏失效问题。为此，本文提出DuetFair机制，通过联合考虑子群体间适应与子群体内鲁棒性，引入FairDRO方法，结合分布感知的专家混合模型与子群体条件分布鲁棒优化，有效提升了模型在不同子群体中的公平性与分割性能。实验表明，FairDRO在多个医学图像分割基准上取得了优越的公平性与性能提升。

Comments 16 pages, 2 figures

2605.10518 2026-05-12 cs.CL cs.AI

Infinite Mask Diffusion for Few-Step Distillation

Jaehoon Yoo, Wonjung Kim, Chanhyuk Lee, Seunghoon Hong

发表机构 * Korea Advanced Institute of Science and Technology (KAIST)（韩国科学技术院）

AI总结本文提出了一种名为Infinite Mask Diffusion Model（IMDM）的新型扩散模型，用于解决语言模型知识蒸馏中的少步生成问题。传统掩码扩散模型（MDM）因使用确定性单状态掩码而受到因子化误差的限制，难以实现高效少步生成。IMDM通过引入随机无限状态掩码，有效降低了理论误差下限，从而在保持MDM优势的同时提升了生成效率。实验表明，IMDM在少量步骤下优于现有蒸馏方法，尤其在LM1B和OpenWebText数据集上表现突出。

2605.10516 2026-05-12 cs.AI

Consistency as a Testable Property: Statistical Methods to Evaluate AI Agent Reliability

Harsh Raj, Niranjan Orkat, Suvrorup Mukherjee, Aritra Guha, Cheryl Flynn, Subhabrata Majumdar

发表机构 * Northeastern University（东北大学）； University of Pécs（佩奇大学）； University of Michigan（密歇根大学）； AT&T Chief Data Office（AT&T首席数据办公室）； Indian Institute of Management Bangalore（班加罗尔印度管理学院）

AI总结本文提出了一套严格的AI智能体可靠性度量方法，通过语义保持扰动下的一致性来量化智能体的可靠性。研究引入了基于$U$-统计量的输出级可靠性评估和基于核方法的轨迹级稳定性分析，揭示了智能体核心能力与执行鲁棒性之间的区别。实验表明，轨迹级一致性指标比传统方法具有更高的诊断灵敏度，有助于识别和解决影响智能体在高风险实际环境中部署的架构问题。

Comments 33 pages, 5 figures, 2 tables

2605.10510 2026-05-12 cs.LG cs.AI

CMKL: Modality-Aware Continual Learning for Evolving Biomedical Knowledge Graphs

Yousef A. Radwan, Yao Li, Qing Qing, Ziqi Xu, Qixin Zhang, Yongcheng Jing, Renqiang Luo, Xikun Zhang

发表机构 * Technology, Innovation, Entrepreneurship Department（技术、创新与创业部门）； King Abdullah University of Science and Technology（卡塔尔科技大学）； School of Computing and Information Systems（计算与信息系统学院）； The University of Melbourne（墨尔本大学）； College of Computer Science and Technology（计算机科学与技术学院）； Jilin University（吉林大学）； School of Computing Technologies（计算技术学院）； RMIT University（皇家墨尔本理工大学）； College of Computing and Data Science（计算与数据科学学院）； Nanyang Technological University（南洋理工大学）

AI总结本文提出了一种名为CMKL的持续学习框架，用于处理动态演化的生物医学知识图谱，能够同时利用结构、文本和分子等多模态信息。该方法通过混合专家路由机制融合多模态数据，并结合EWC正则化和多样化的多模态回放缓冲区，有效保护已学知识，减少遗忘。实验表明，CMKL在持续实体分类和关系预测任务中均显著优于现有方法，尤其在多模态信息的利用上表现出明显优势。

详情

英文摘要

Biomedical knowledge graphs are increasingly large, dynamic, and multimodal, driven by rapid advances in biotechnology such as high-throughput sequencing. Machine learning models can infer previously unobserved biomedical relationships and characterize biomedical entities in these graphs, but existing knowledge graph embedding methods and their continual learning extensions either assume static graph structure or fail to exploit multimodal information under evolving data distributions. They also apply uniform regularization across all model parameters, ignoring that different modalities may exhibit distinct forgetting dynamics as the graph evolves. We propose the Continual Multimodal Knowledge Graph Learner (CMKL), a CL framework for biomedical KGs that natively encodes structure, text, and molecules, fuses them through a Mixture-of-Experts (MoE) router, and protects previously learned knowledge with standard EWC regularization and a K-means-diverse multimodal replay buffer. We evaluate CMKL on a 129K-entity biomedical continual benchmark with 10 tasks. On continual biomedical entity classification, CMKL reaches AP 0.591 versus 0.370 for the strongest structural baseline, a 60% gain that is driven by access to multimodal features and preserved across the sequence with near-zero forgetting (AF 0.008). On continual relationship prediction, CMKL reaches AP $0.062$, matching Naive Sequential and EWC (0.058) within seed noise and outperforming Joint Training (0.047, p=0.045) and LKGE (0.039). A frozen-text ablation reaches AP 0.136, more than double any jointly trained model, yet that signal is unreachable by margin-ranking gradients: the greedy-modality asymmetry lives at the representation level, not the fusion level, and MoE routing manages it by suppressing the unreachable modality without forcing it through a learned bottleneck. Code: github.com/yradwan147/cmkl-neurips2026

URL PDF HTML ☆

赞 0 踩 0

2605.10504 2026-05-12 cs.CL

Learning Less Is More: Premature Upper-Layer Attention Specialization Hurts Language Model Pretraining

Jinchang Zhu, Jindong Li, Yuwen Hao, Chengyu Zou, Rong Fu, Menglin Yang

发表机构 * The Hong Kong University of Science and Technology (Guangzhou)（香港科技大学（广州））

AI总结本文研究了在语言模型预训练过程中，上层注意力机制过早固化可能对模型性能产生的负面影响。作者发现，在GPT类模型中，上层注意力在底层特征尚未稳定时就形成尖锐的注意力模式，导致模型表现下降。通过在训练初期临时减缓上层Q/K投影的学习速度，可以在不改变其他参数的情况下提升最终的困惑度和下游任务准确率。研究还指出，乘法门控的前馈网络是抑制底层残差特征更新的关键因素，并揭示了上层Q/K的学习时机是解码器结构与优化过程之间的重要交互点。