arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

检索范围排序方式

检索时间范围

重置

HOT 人工智能、机器人等 9

cs.AI 人工智能 cs.CV 计算机视觉 cs.CL 自然语言处理 cs.RO 机器人 cs.LG 机器学习 cs.SD 声音 cs.ET 新兴技术 eess.AS 音频语音 eess.IV 图像视频

CS 计算机 41

cs 计算机 cs.AI 人工智能 cs.AR 硬件架构 cs.CC 计算复杂性 cs.CE 计算工程 cs.CG 计算几何 cs.CL 自然语言处理 cs.CR 密码安全 cs.CV 计算机视觉 cs.CY 计算机与社会 cs.DB 数据库 cs.DC 分布式计算 cs.DL 数字图书馆 cs.DM 离散数学 cs.DS 数据结构 cs.ET 新兴技术 cs.FL 形式语言 cs.GL 综述文献 cs.GR 图形学 cs.GT 博弈论 cs.HC 人机交互 cs.IR 信息检索 cs.IT 信息论 cs.LG 机器学习 cs.LO 计算机逻辑 cs.MA 多智能体 cs.MM 多媒体 cs.MS 数学软件 cs.NA 数值分析 cs.NE 神经进化 cs.NI 网络架构 cs.OH 其他计算机 cs.OS 操作系统 cs.PF 性能 cs.PL 编程语言 cs.RO 机器人 cs.SC 符号计算 cs.SD 声音 cs.SE 软件工程 cs.SI 社会信息网络 cs.SY 系统控制

ECON 经济学 4

econ 经济学 econ.EM 计量经济 econ.GN 一般经济 econ.TH 理论经济

EESS 电气与系统 5

eess 电气与系统 eess.AS 音频语音 eess.IV 图像视频 eess.SP 信号处理 eess.SY 系统控制

MATH 数学 33

math 数学 math.AC 交换代数 math.AG 代数几何 math.AP 偏微分方程 math.AT 代数拓扑 math.CA 经典分析 math.CO 组合数学 math.CT 范畴论 math.CV 复变函数 math.DG 微分几何 math.DS 动力系统 math.FA 泛函分析 math.GM 一般数学 math.GN 一般拓扑 math.GR 群论 math.GT 几何拓扑 math.HO 历史综述 math.IT 信息论 math.KT K理论 math.LO 逻辑 math.MG 度量几何 math.MP 数学物理 math.NA 数值分析 math.NT 数论 math.OA 算子代数 math.OC 优化控制 math.PR 概率 math.QA 量子代数 math.RA 环与代数 math.RT 表示论 math.SG 辛几何 math.SP 谱理论 math.ST 统计理论

PHYSICS 物理 55

astro-ph 天体物理 astro-ph.CO 宇宙学 astro-ph.EP 地球行星 astro-ph.GA 星系物理 astro-ph.HE 高能天体 astro-ph.IM 天文仪器 astro-ph.SR 太阳恒星 cond-mat 凝聚态 cond-mat.dis-nn 无序神经 cond-mat.mes-hall 介观纳米 cond-mat.mtrl-sci 材料科学 cond-mat.other 其他凝聚态 cond-mat.quant-gas 量子气体 cond-mat.soft 软凝聚态 cond-mat.stat-mech 统计力学 cond-mat.str-el 强关联电子 cond-mat.supr-con 超导 gr-qc 广义相对论 hep-ex 高能实验 hep-lat 格点高能 hep-ph 高能唯象 hep-th 高能理论 math-ph 数学物理 nlin 非线性科学 nlin.AO 自适应系统 nlin.CD 混沌动力学 nlin.CG 胞自动机 nlin.PS 斑图孤子 nlin.SI 可积系统 nucl-ex 核物理实验 nucl-th 核物理理论 physics 物理 physics.acc-ph 加速器物理 physics.ao-ph 大气海洋 physics.app-ph 应用物理 physics.atm-clus 原子分子团簇 physics.atom-ph 原子物理 physics.bio-ph 生物物理 physics.chem-ph 化学物理 physics.class-ph 经典物理 physics.comp-ph 计算物理 physics.data-an 数据分析 physics.ed-ph 物理教育 physics.flu-dyn 流体动力学 physics.gen-ph 普通物理 physics.geo-ph 地球物理 physics.hist-ph 物理史哲 physics.ins-det 仪器探测 physics.med-ph 医学物理 physics.optics 光学 physics.plasm-ph 等离子体 physics.pop-ph 科普物理 physics.soc-ph 物理与社会 physics.space-ph 空间物理 quant-ph 量子物理

Q-BIO 定量生物 11

q-bio 定量生物 q-bio.BM 生物分子 q-bio.CB 细胞行为 q-bio.GN 基因组学 q-bio.MN 分子网络 q-bio.NC 神经认知 q-bio.OT 其他定量生物 q-bio.PE 种群进化 q-bio.QM 定量方法 q-bio.SC 亚细胞过程 q-bio.TO 组织器官

Q-FIN 定量金融 10

q-fin 定量金融 q-fin.CP 计算金融 q-fin.EC 经济学 q-fin.GN 一般金融 q-fin.MF 数学金融 q-fin.PM 投资组合 q-fin.PR 证券定价 q-fin.RM 风险管理 q-fin.ST 统计金融 q-fin.TR 交易微观结构

STAT 统计 7

stat 统计 stat.AP 统计应用 stat.CO 统计计算 stat.ME 统计方法 stat.ML 机器学习 stat.OT 其他统计 stat.TH 统计理论

2603.16593 2026-05-12 cs.RO

Scalable Inspection Planning via Flow-based Mixed Integer Linear Programming

Adir Morgan, Kiril Solovey, Oren Salzman

发表机构 * Technion--Israel Institute of Technology, Haifa, Israel（技术离子-以色列理工学院，海法，以色列）

AI总结本文研究了机器人在给定兴趣点（POIs）集合中进行检测的路径规划问题，旨在找到最短的机器人路径以完成检测任务。为了解决该问题的复杂性，作者提出了一种基于网络流的混合整数线性规划（MILP）方法，将核心约束条件转化为网络流模型，并设计了专用的分支定界求解器，从而显著提升了求解效率和解的质量。实验表明，该方法在大规模场景下表现出优越的可扩展性，并大幅缩小了最优解的差距。

2603.12275 2026-05-12 cs.CL cs.LG

GONE: Structural Knowledge Unlearning via Neighborhood-Expanded Distribution Shaping

Chahana Dahal, Ashutosh Balasubramaniam, Zuobin Xiong

发表机构 * University of Nevada, Las Vegas（内华达大学拉斯维加斯分校）； Indian Institute of Technology Guwahati（印度理工学院古瓦哈提分校）

AI总结本文提出GONE，一个用于评估大语言模型中结构化知识遗忘能力的基准，旨在解决现有方法在处理关系型、多跳推理知识时的不足。该研究引入了基于知识图谱的基准和一种名为NEDS的新框架，通过利用图结构中的邻居信息来精确控制遗忘事实与语义邻域之间的边界，有效提升了知识遗忘的效果与局部性。实验表明，NEDS在多个基准上表现出色，具有较高的遗忘效率和局部保持能力。

2603.11969 2026-05-12 cs.CV

AstroSplat: Physics-Based Gaussian Splatting for Rendering and Reconstruction of Small Celestial Bodies

Jennifer Nolan, Travis Driver, John Christian

发表机构 * Georgia Institute of Technology（佐治亚理工学院）

AI总结本文提出了一种基于物理的高斯点绘（Gaussian Splatting）框架AstroSplat，用于小天体（如小行星）表面的渲染与重建。该方法引入行星反射模型，显式建模表面材质属性与光照交互，克服了传统基于球谐函数的外观参数化方法在物理特性表达上的不足。实验表明，AstroSplat在NASA“黎明”任务的真实图像上表现出更优的渲染效果和表面重建精度。

Comments 10 pages, 6 figures, conference

2603.11566 2026-05-12 cs.CV

R4Det: 4D Radar-Camera Fusion for High-Performance 3D Object Detection

Zhongyu Xia, Yousen Tang, Yongtao Wang, Zhifeng Wang, Weijun Qin

发表机构 * Wangxuan Institute of Computer Technology, Peking University（北京大学王轩计算机技术研究所）； EBTech Co. Ltd（EBTech公司）

AI总结本文提出了一种名为R4Det的4D雷达-相机融合方法，用于提升自动驾驶中的3D目标检测性能。针对现有方法在深度估计、时序融合和小目标检测方面的不足，R4Det引入全景深度融合模块增强深度估计精度，设计无需依赖车辆姿态的可变形门控时序融合模块，并构建实例引导的动态细化模块以提升小目标检测能力。实验表明，R4Det在TJ4DRadSet和VoD数据集上取得了最先进的3D检测效果。

Comments Accepted to CVPR 2026

2603.10126 2026-05-12 cs.RO cs.AI

AR-VLA: True Autoregressive Action Expert for Vision-Language-Action Models

Yutong Hu, Jan-Nico Zaech, Nikolay Nikolov, Yuanqi Yao, Sombit Dey, Giuliano Albanese, Renaud Detry, Luc Van Gool, Danda Paudel

发表机构 * KU Leuven, Dept. Mechanical Engineering, Research unit Robotics, Automation and Mechatronics（库勒恩大学，机械工程系，机器人、自动化与机电一体化研究单位）； KU Leuven, Dept. Electrical Engineering, Research unit Processing Speech and Images（库勒恩大学，电气工程系，语音和图像处理研究单位）

AI总结本文提出了一种独立的自回归（AR）动作专家AR-VLA，它能够在可刷新的视觉-语言前缀条件下，生成连续的因果动作序列。与现有视觉-语言-动作（VLA）模型和扩散策略不同，该动作专家通过长时记忆保持自身历史信息，具备内在的上下文感知能力，有效解决了快速控制与慢速推理之间的频率不匹配问题。实验表明，AR-VLA在保持或超越现有反应式VLA任务成功率的同时，展现出更强的历史感知能力和更平滑的动作轨迹，为训练高效机器人策略提供了可扩展的结构基础。

Comments RSS 2026 accepted

2603.09970 2026-05-12 cs.CL

CREATE: Testing LLMs for Associative Creativity

Manya Wadhwa, Tiasa Singha Roy, Harvey Lederman, Junyi Jessy Li, Greg Durrett

发表机构 * New York University（纽约大学）； The University of Texas at Austin（德克萨斯大学奥斯汀分校）

AI总结 CREATE 是一个用于评估大语言模型关联创造力能力的基准测试。该任务要求模型生成连接概念的路径，路径需具备高特异性和多样性，模型生成的路径越多且质量越高，得分越高。研究发现，当前最先进的模型在创造性任务中表现更优，但因搜索空间庞大，基准测试难以饱和，且思维模型在高token预算下也不一定更具优势。CREATE 为提升模型关联创造力提供了实验平台。

2603.09465 2026-05-12 cs.CV cs.AI

EvoDriveVLA: Evolving Driving VLA Models via Collaborative Perception-Planning Distillation

Jiajun Cao, Xiaoan Zhang, Xiaobao Wei, Liyuqiu Huang, Zijian Wang, Hanzhen Zhang, Zhengyu Jia, Wei Mao, Hao Wang, Xianming Liu, Shuchang Zhou, Yang Wang, Shanghang Zhang

发表机构 * State Key Laboratory of Multimedia Information Processing, School of Computer Science, Peking University（多媒体信息处理国家重点实验室，计算机学院，北京大学）； XPeng Motors（小鹏汽车）

AI总结本文提出了一种名为EvoDriveVLA的协作感知-规划蒸馏框架，旨在解决视觉语言动作模型在自动驾驶中解冻视觉编码器后感知性能下降以及长期规划不稳定的问题。该方法结合了自锚定感知约束和未来感知轨迹优化，通过自锚定教师模型引导学生模型关注关键区域，并利用未来感知的引导教师进行轨迹优化与不确定性建模，从而提升模型的感知与规划能力。实验表明，EvoDriveVLA在nuScenes和NAVSIM数据集上均取得了优越的性能。

Comments 19 pages, 5 figures, 5 tables

2603.08588 2026-05-12 cs.LG cs.AI

Towards Batch-to-Streaming Deep Reinforcement Learning for Continuous Control

Riccardo De Monte, Matteo Cederle, Gian Antonio Susto

发表机构 * Department of Information Engineering University of Padova（信息工程系帕多瓦大学）

AI总结本文研究了如何将现有的批量深度强化学习方法适配到流式处理场景中，以满足资源受限硬件的需求。作者提出了两种新型流式深度强化学习算法——S2AC和SDAC，它们在保持与先进批量RL方法兼容的同时，能够在标准基准上达到与现有流式方法相当的性能，且无需繁琐的超参数调整。研究还探讨了从批量到流式的过渡问题，并提出了一种有效保持预训练策略性能的方法。

2603.08065 2026-05-12 cs.LG cs.CL

Deterministic Differentiable Structured Pruning for Large Language Models

Weiyu Huang, Pengle Zhang, Xiaolu Zhang, Jun Zhou, Jun Zhu, Jianfei Chen

发表机构 * Department of Computer Science and Technology, Tsinghua University, Beijing, China（清华大学计算机科学与技术系）

AI总结该研究提出了一种确定性可微分结构化剪枝方法（DDP），用于降低大语言模型的推理成本。与以往依赖随机硬混凝土松弛的方法不同，DDP 直接优化离散 l0 目标的确定性软替代目标，消除了随机性，从而减少训练与测试间的不匹配并加快收敛。实验表明，该方法在多个密集和 MoE 模型上实现了接近原模型的性能，且在 20% 稀疏度下优于现有方法，并在实际部署中显著提升了推理速度。

Comments Published at ICML26;

2603.04783 2026-05-12 cs.AI cs.CL

Breaking Contextual Inertia: Reinforcement Learning with Single-Turn Anchors for Stable Multi-Turn Interaction

Xingwu Chen, Zhanqiu Zhang, Yiwen Guo, Difan Zou

发表机构 * Department of XXX, University of YYY, Location, Country（XXX系，YYY大学，地点，国家）； School of ZZZ, Institute of WWW, Location, Country（ZZZ学院，WWW研究所，地点，国家）

AI总结尽管大型语言模型在单轮对话中表现出强大的推理能力，但在多轮交互中却容易因信息逐步揭示或需要更新而出现性能下降，其根本原因是“上下文惯性”——模型倾向于固守先前的推理路径，忽视后续输入的修正信息。为此，研究提出了一种基于单轮锚点的强化学习方法RLSTA，利用模型在单轮任务中的优势作为稳定参考点，引导其在多轮交互中动态调整推理过程，从而打破上下文惯性。实验表明，RLSTA在多个领域均表现出优越的性能和良好的泛化能力，无需外部验证即可实现稳定有效的多轮对话。

2603.03756 2026-05-12 cs.LG cs.CE cs.CL

MOOSE-Star: Unlocking Tractable Training for Scientific Discovery by Breaking the Complexity Barrier

Zonglin Yang, Lidong Bing

发表机构 * MiroMind AI

AI总结尽管大型语言模型在科学发现中展现出潜力，但现有研究多关注推理或反馈驱动的训练，而未直接建模生成推理过程 $P(h|b)$。本文提出 MOOSE-Star 框架，通过分解子任务、动机引导的分层搜索和有界组合等方法，将训练复杂度从指数级降低到对数级，实现了 $P(h|b)$ 的可扩展训练。为支持该框架，研究者还发布了包含 108,717 篇分解论文的 TOMATO-Star 数据集，实验证明 MOOSE-Star 能够随着训练数据和推理预算持续扩展，而直接采样方法则受限于复杂度瓶颈。

Comments Accepted by ICML 2026

2603.03239 2026-05-12 cs.CV

COP-GEN: Latent Diffusion Transformer for Copernicus Earth Observation Data

Miguel Espinosa, Eva Gmelich Meijling, Valerio Marsocci, Elliot J. Crowley, Mikolaj Czerkawski

发表机构 * School of Engineering University of Edinburgh（工程学院爱丁堡大学）； European Space Agency (ESA)（欧洲航天局）； Asterisk Labs（Asterisk实验室）

AI总结该研究提出了一种名为COP-GEN的多模态潜扩散变换器，用于生成Copernicus地球观测数据，能够建模不同传感器（如光学、雷达、高程和土地覆盖）在原生空间分辨率下的联合分布。通过将跨模态映射参数化为条件分布，COP-GEN实现了灵活的任意到任意条件生成，包括无需任务特异性再训练的零样本模态转换。实验表明，该模型在保持高峰值保真度的同时，能够生成多样且物理一致的观测结果，并在构建的基准数据集上展现出显著优于现有方法的生成能力。

2603.01960 2026-05-12 cs.LG cs.AI

TiledAttention: a CUDA Tile SDPA Kernel for PyTorch

Taimur Khan

发表机构 * Helmholtz Centre for Environmental Research - UFZ（环境保护研究霍普夫研究所）

AI总结 TiledAttention 是一种用于 NVIDIA GPU 的缩放点积注意力（SDPA）前向计算算子，旨在加速 SDPA 相关研究。该方法基于 FlashAttention 的在线 softmax 形式，采用 cuTile/TileIR 实现策略，支持在 Python 层面对调度策略进行修改，从而实现高性能与高度可定制化的平衡。实验表明，TiledAttention 在标准 eager 注意力路径上实现了显著加速，并可直接集成到 PyTorch 工作流中，为注意力机制的高效研究提供了实用工具。

2603.00541 2026-05-12 cs.LG stat.ML

Spectral Condition for $μ$P under Width-Depth Scaling

Chenyu Zheng, Rongzhen Wang, Xinyu Zhang, Chongxuan Li

发表机构 * Gaoling School of AI, Renmin University of China（中国人民大学东城区人工智能学院）

AI总结随着生成式基础模型在宽度和深度上同时扩展，稳定特征学习和可靠的超参数迁移面临挑战。本文提出了一种统一的谱域框架，用于在联合宽度-深度缩放下实现最大更新参数化（$μ$P），明确了权重及其每步更新的范数应如何随宽度和深度变化，并揭示了从单变换（$k=1$）到多变换（$k\geq 2$）的转变。该框架适用于多种优化器，实验表明其在GPT-2类语言模型中能实现稳定的特征学习和鲁棒的超参数迁移，优于传统参数化和$ k=1 $情况下的$ μ $P方法。

Comments 76 pages, 13 figures, 40 tables

2602.23928 2026-05-12 cs.CL

The Astonishing Ability of Large Language Models to Parse Jabberwockified Language

Gary Lupyan, Senyi Yang

发表机构 * Department of Psychology, University of Wisconsin-Madison（威斯康星大学麦迪逊分校心理学系）

AI总结本研究展示了大型语言模型在解析严重退化的英语文本方面具有惊人的能力。通过将内容词随机替换为无意义字符串生成的“Jabberwockified”文本，模型仍能恢复出接近原意的常规英语句子。这一结果表明，句法结构和封闭类词汇等线索对词义的约束远超以往认知，也为理解语言处理机制提供了重要启示。

Comments Submitted to the 2026 Annual Meeting of the Cognitive Science Society

2602.22953 2026-05-12 cs.AI

General Agent Evaluation

Elron Bandel, Asaf Yehudai, Lilach Eden, Yehoshua Sagron, Yotam Perlitz, Elad Venezian, Natalia Razinkov, Natan Ergas, Shlomit Shachor Ifergan, Segev Shlomov, Michal Jacovi, Leshem Choshen, Liat Ein-Dor, Yoav Katz, Michal Shmueli-Scheuer

发表机构 * IBM Research（IBM研究院）； MIT（麻省理工学院）

AI总结该研究系统评估了通用智能体在不同协议和陌生环境中的性能，比较了工具调用、MCP、代码生成和CLI等多种智能体架构。研究提出了统一的协议和评估框架，构建了首个开放的通用智能体排行榜，涵盖多种基础模型和基准任务。实验发现，通用智能体无需领域定制即可适应不同任务，但架构选择对性能影响显著，且开源模型在通用性方面存在明显不足。

Comments Presented at the ICLR 2026 Workshop on Agents in the Wild

详情

英文摘要

General-purpose agents perform tasks in unfamiliar environments without domain-specific manual customization. Yet no study has systematically measured how agent architecture shapes performance across heterogeneous protocols and diverse unfamiliar environments. This is the first systematic study, comparing tool-calling, MCP, code-generation, and CLI agents on the same benchmarks with the same models. Two gaps blocked such a study: existing harnesses require per-benchmark wiring or fixed protocol classes (web for BrowserGym, CLI for Harbor), and benchmarks themselves expect human-authored prompts, context, and integration glue. To enable this study, we contribute (1) a unifying protocol that bridges existing benchmark and agent protocols; (2) an evaluation harness that surfaces any benchmark to any general-purpose agent and backbone model; and (3) the first Open General Agent Leaderboard of agent configurations, a full factorial over 5 agent architectures x 5 backbone LLMs (three closed-source, two open-weight) x 6 benchmarks spanning software engineering, customer service, deep research, and personal assistance. We find that (i) general agents adapt to every tested domain without per-domain customization; (ii) agent architecture choice swings results by up to 12pp within a single model, yet backbone model choice dominates overall performance; (iii) on 4 of 6 tested benchmarks, top general agents are indistinguishable from the leading heavily-customized domain-specific agents; (iv) open-weight models tested exhibit "generality sinks" absent from frontier closed-source models: they consistently collapse on specific agent architectures or benchmarks; (v) a behavioral failure analysis reveals architecture-distinctive error signatures that aggregate scoring cannot discriminate. Code, harness, leaderboard, and traces are at https://www.exgentic.ai.

URL PDF HTML ☆

赞 0 踩 0

2602.22611 2026-05-12 cs.LG

Mitigating Membership Inference in Intermediate Representations with Differentially Private Training

Jiayang Meng, Tao Huang, Chen Hou, Guolong Zheng, Hong Chen

发表机构 * School of Information, Renmin University of China, Beijing, China（中国人民大学信息学院，北京，中国）； School of Computer Science（计算机科学学院）； Big Data, Minjiang University, Fuzhou, Fujian, China（大数据，闽江大学，福州，福建，中国）

AI总结在嵌入式接口（EaaI）场景中，预训练模型被用于生成中间表示（IRs），这些表示可能泄露训练数据成员信息，从而被用于成员推理攻击（MIA）。本文提出了一种基于差分隐私的分层训练方法LM-DP-SGD，通过分析各层的MIA风险，动态调整隐私保护强度，从而在保证模型效用的同时更有效地缓解中间表示中的成员推理问题。实验表明，该方法在相同隐私预算下能够显著降低IR级别的MIA风险，实现了更优的隐私与效用平衡。

2602.21307 2026-05-12 cs.LG

SymTorch: Symbolic Distillation of Neural Networks

Elizabeth S. Z. Tan, Adil Soubki, Miles Cranmer

发表机构 * Department of Applied Mathematics and Theoretical Physics（应用数学与理论物理系）

AI总结本文提出了一种名为 SymTorch 的符号蒸馏方法，旨在揭示神经网络组件所学习的数学函数，并将其表示为可解释的闭式表达式。该方法基于 PySR 实现，适用于多种网络架构，并成功应用于物理定律的自动发现、模型解释性提升以及提升神经网络效率等方面。研究展示了 SymTorch 在符号回归、模型解释和资源优化中的广泛适用性与优越性能。

2602.18866 2026-05-12 cs.LG stat.ML

$(α,β)$-Stability for Boosting Vector-Valued Prediction

Jian Qian, Shu Ge

发表机构 * The University of Hong Kong（香港大学）； Independent Researcher（独立研究者）

AI总结本文研究了向量值预测中的提升（boosting）方法，提出了基于几何中位数的$(α,β)$-稳定性概念，用于分析聚合过程如何将弱预测器的性能提升为强预测器。作者在多种自然散度度量下刻画了该稳定性性质，并基于此提出了一种通用的提升框架\geomedboost，该框架通过指数重加权和几何中位数聚合实现，能够在弱学习器条件下保证经验散度误差的指数衰减，并进一步推导出总体误差的上界。

2602.17546 2026-05-12 cs.CL cs.LG

Learning to Stay Safe: Adaptive Regularization Against Safety Degradation during Fine-Tuning

Jyotin Goel, Souvik Maji, Pratik Mazumder

发表机构 * Indian Institute of Technology Jodhpur（印度理工学院乔浦尔）

AI总结本文研究了在微调过程中如何防止语言模型的安全性下降问题，提出了一种自适应正则化框架，能够根据安全风险动态调整正则化策略，从而在保持模型实用性的同时提升其安全性。该方法通过两种方式估计训练过程中的安全风险：一种是基于判别器对训练批次进行高风险评分，另一种是利用轻量分类器分析中间激活特征预测有害意图。实验表明，该方法在多种模型和攻击场景下均能有效降低攻击成功率，且不增加推理时的开销。

Comments Work in progress (48 pages)

2602.17251 2026-05-12 cs.LG

SCOPE: Structured Prototype-Guided Adaptation for EEG Foundation Models with Limited Labels

Jingying Ma, Feng Wu, Yucheng Xing, Qika Lin, Tianyu Liu, Chenyu Liu, Ziyu Jia, Mengling Feng

发表机构 * Saw Swee Hock School of Public Health, National University of Singapore（新加坡国立大学 Saw Swee Hock 公共卫生学院）； Institute of Data Science, National University of Singapore（新加坡国立大学数据科学研究所）； Guangzhou Research Translation and Innovation Institute, National University of Singapore（新加坡国立大学广州研究翻译与创新研究所）； College of Computing and Data Science, Nanyang Technological University（南洋理工大学计算与数据科学学院）； Beijing Key Laboratory of Brainnetome and Brain-Computer Interface, Institute of Automation, Chinese Academy of Sciences（中国科学院自动化研究所脑网络与脑机接口重点实验室）； Brainnetome Center, Institute of Automation, Chinese Academy of Sciences（中国科学院自动化研究所脑网络中心）

AI总结本文研究了在仅有少量标注样本的情况下，如何有效地适配脑电图基础模型（EFMs）。针对EFMs在有限标签下适应时出现的校准偏差、预测崩溃和表示漂移等问题，提出了一种结构化置信感知的原型引导框架SCOPE。该方法通过构建群体级外部监督和生成置信感知伪标签，提升了无标签样本的可靠性，并引入轻量的原型适配器以冻结EFMs的预训练表示，从而在多种任务和数据比例下均表现出优异的性能和效率。

2602.10868 2026-05-12 cs.LG

The Sample Complexity of Uniform Approximation for Multi-Dimensional CDFs and Fixed-Price Mechanisms

Matteo Castiglioni, Anna Lunghi, Alberto Marchesi

发表机构 * Politecnico di Milano（米兰理工学院）

AI总结本文研究了在仅获得一位反馈信息的情况下，学习多维累积分布函数（CDF）的均匀近似所需的样本复杂度。研究发现，样本复杂度在维度上几乎不变，仅以对数形式依赖于维度。该结果为小市场中的固定价格机制学习提供了紧致的样本复杂度界和新的遗憾界。

2602.09789 2026-05-12 cs.LG

When Less is More: The LLM Scaling Paradox in Context Compression

Ruishan Guo, Yibing Liu, Guoxin Ma, Yan Wang, Yueyang Zhang, Long Xia, Kecheng Chen, Zhiyuan Sun, Daiting Shi

发表机构 * Baidu Inc.（百度公司）； Tsinghua University（清华大学）； Xi’an Jiaotong University（西安交通大学）； City University of Hong Kong（香港城市大学）

AI总结本文研究了在上下文压缩任务中，大语言模型参数规模增加所带来的“规模-保真度悖论”：尽管增大压缩模型的规模可以降低重建误差，但却可能降低重建内容的忠实度。研究发现，这一现象主要由“知识覆盖”和“语义漂移”两种机制引起，并通过嵌入几何和重建确定性分析揭示了大模型在语义子空间中组织记忆的特性，导致表示模糊、覆盖和恢复能力下降。研究结果对现有上下文压缩评估体系提出了补充，并揭示了在从生成可信内容转向忠实保留原始信息的目标下，模型扩展规律可能失效。

Comments 22 pages, 7 figures, conference

2602.08617 2026-05-12 cs.LG

ERIS: Enhancing Privacy and Scalability in Federated Learning via Federated Shard Aggregation

Dario Fenoglio, Pasquale Polverino, Jacopo Quizi, Martin Gjoreski, Akash Dhasade, Marc Langheinrich

发表机构 * Università della Svizzera italiana（瑞士意大利大学）； Carnegie Mellon University（卡内基梅隆大学）

AI总结本文提出了一种名为ERIS的联邦学习框架，通过引入联邦分片聚合（FSA）机制，在提升隐私性的同时解决大规模模型训练中的可扩展性问题。ERIS将客户端更新划分为互不重叠的分片，并在多个客户端聚合器上分布式聚合，从而消除中心化聚合瓶颈、限制单个观察者可获取的信息，并在重组后保持与集中式联邦学习相同的更新效果。实验表明，ERIS在保持模型性能的同时，有效减少了通信开销并增强了对成员推理和重构攻击的鲁棒性。

2602.07940 2026-05-12 cs.AI

MePo: Meta Post-Refinement for Rehearsal-Free General Continual Learning

Guanglong Sun, Hongwei Yan, Liyuan Wang, Zhiqi Kang, Shuang Cui, Hang Su, Jun Zhu, Yi Zhong

发表机构 * School of Life Sciences, IDG/McGovern Institute for Brain Research, Tsinghua University, Beijing, China（生命科学学院，IDG/麦克戈维脑研究 institute，清华大学，北京，中国）； Tsinghua-Peking Center for Life Sciences（清华-北京大学生命科学中心）； Dept. of Comp. Sci. and Tech., Institute for AI, Tsinghua-Bosch Joint ML Center, THBI Lab, BNRist Center, Tsinghua University, Beijing, China（计算机科学与技术系，人工智能研究所，清华-博世联合机器学习中心，THBI实验室，BNRist中心，清华大学，北京，中国）； Department of Psychological and Cognitive Sciences, Tsinghua University, Beijing, China（心理学与认知科学系，清华大学，北京，中国）； Univ. Grenoble Alpes, Inria, CNRS, Grenoble INP, LJK, Grenoble, France（格勒诺布尔阿尔卑斯大学，Inria，CNRS，格勒诺布尔INP，LJK，格勒诺布尔，法国）； Institute of Software Chinese Academy of Sciences, Beijing, China（软件研究所，中国科学院，北京，中国）

AI总结为应对外部环境的不确定性变化，智能系统需要从复杂动态环境中持续学习并实时响应，这一能力被称为通用持续学习（GCL）。尽管利用预训练模型（PTMs）已显著提升了传统持续学习的性能，但在处理单一过程中多样化且时间混合的信息时仍存在局限。本文提出了一种名为MePo的元后优化方法，通过构建伪任务序列和双层元学习框架，增强PTMs在无回放场景下的持续学习能力，并通过初始化元协方差矩阵提升表征对齐的鲁棒性，实验证明该方法在多个GCL基准上取得了显著性能提升。

2602.06550 2026-05-12 cs.LG cs.AI

Dynamics-Aligned Shared Hypernetworks for Contextual RL under Discontinuous Shifts

Jan Benad, Pradeep Kr. Banerjee, Frank Röder, Nihat Ay, Martin V. Butz, Manfred Eppe

发表机构 * Institute for Data Science Foundations, TUHH, Germany（数据科学基础研究所，德意志高等技术大学，德国）； Santa Fe Institute, USA（新墨西哥州圣达菲研究所，美国）； Neuro-Cognitive Modeling Group, University of Tübingen, Germany（图宾根大学神经认知建模小组，德国）

AI总结在上下文强化学习中，当潜在上下文不连续变化并导致动作对环境的影响发生突变时，零样本泛化仍是一个核心挑战。本文提出DMA*-SH框架，通过一个仅基于动力学预测训练的共享超网络生成适配器权重，用于动态模型、策略和动作价值函数，从而引入与不连续上下文变化相匹配的归纳偏置。该方法结合输入输出归一化和随机输入掩码，提升了上下文推断的稳定性，并在新设计的Actuator Inversion Benchmark基准上实现了优于现有方法的零样本泛化性能。

2602.06527 2026-05-12 cs.AI

HyPER: Bridging Exploration and Exploitation for Scalable LLM Reasoning with Hypothesis Path Expansion and Reduction

Shengxuan Qiu, Haochen Huang, Shuzhang Zhong, Pengfei Zuo, Meng Li

发表机构 * Institute for Artificial Intelligence, Peking University, Beijing（北京大学人工智能研究院）； Huawei（华为）； School of Integrated Circuits, Peking University, Beijing（北京大学集成电路学院）

AI总结该论文提出了一种名为HyPER的方法，旨在解决大规模语言模型推理中探索与利用之间的平衡问题。HyPER通过动态控制假设路径的扩展与缩减，在固定计算预算下优化推理过程，从而提升推理准确率并减少计算资源消耗。该方法无需额外训练，适用于混合专家模型，实验表明其在多个基准测试中显著提升了准确率并降低了计算成本。

2602.05391 2026-05-12 cs.CV

Efficient Dataset Distillation for Pre-Trained Self-Supervised Models via Statistical Flow Matching

Qianxin Xia, Jiawei Du, Xin Zhang, Yuhan Zhang, Jielei Wang, Guoming Lu

发表机构 * University of Electronic Science（电子科技大学）

AI总结该论文研究了如何高效地对预训练自监督模型进行数据集蒸馏，以生成一个体积小但性能接近原始数据集的合成数据集。为了解决传统方法在计算和内存上的高开销问题，作者提出了一种基于统计流匹配的新方法，通过对齐原始数据中目标类与非目标类中心的统计流来优化合成图像，大幅降低了计算资源需求。实验表明，该方法在保持甚至提升性能的同时，相比现有方法减少了10倍的GPU内存占用和4倍的运行时间，并提出了一种分类器继承策略以进一步提升效率和性能。

2602.04712 2026-05-12 cs.CV cs.AI eess.IV

SAR-RAG: ATR Visual Question Answering by Semantic Search, Retrieval, and MLLM Generation

David F. Ramirez, Tim Overman, Kristen Jaskie, Joe Marvin, Andreas Spanias

发表机构 * SenSIP Center, School of ECEE, Arizona State University（SenSIP中心，电子与计算机工程学院，亚利桑那州立大学）； Prime Solutions Group Inc（Prime Solutions Group公司）

AI总结本文提出了一种用于合成孔径雷达（SAR）图像自动目标识别（ATR）的视觉上下文图像检索增强生成（ImageRAG）辅助AI方法，名为SAR-RAG。该方法结合多模态大语言模型（MLLM）与语义嵌入向量数据库，通过检索已知目标类型的图像示例，提升对SAR图像中军事车辆的识别准确率。实验表明，SAR-RAG在检索、分类和尺寸回归等指标上均优于传统MLLM方法，显著提升了ATR任务的性能。

Comments Accepted to 2026 SPIE Defense + Security, Automatic Target Recognition XXXVI

2602.04284 2026-05-12 cs.AI cs.LG

Agent-Omit: Adaptive Context Omission for Efficient LLM Agents

Yansong Ning, Jun Fang, Naiqiang Tan, Hao Liu

发表机构 * AI Thrust, The Hong Kong University of Science（香港科学与技术大学人工智能前沿）； Didichuxing Co. Ltd（滴滴出行有限公司）

AI总结在多轮智能体与环境交互过程中，如何高效管理智能体的上下文（如思考和观察）是提升其性能的关键问题。现有方法通常对交互轨迹一视同仁，忽视了不同轮次中思考和观察的必要性与价值差异。为此，本文提出Agent-Omit，一种统一的训练框架，使大语言模型智能体能够自适应地省略冗余的思考和观察内容。实验表明，该方法在多个基准测试中表现出优异的性能与效率平衡。

Comments ICML 2026

AI 大模型

视觉与机器人

科学与医疗