arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

检索范围排序方式

检索时间范围

重置

HOT 人工智能、机器人等 9

cs.AI 人工智能 cs.CV 计算机视觉 cs.CL 自然语言处理 cs.RO 机器人 cs.LG 机器学习 cs.SD 声音 cs.ET 新兴技术 eess.AS 音频语音 eess.IV 图像视频

CS 计算机 41

cs 计算机 cs.AI 人工智能 cs.AR 硬件架构 cs.CC 计算复杂性 cs.CE 计算工程 cs.CG 计算几何 cs.CL 自然语言处理 cs.CR 密码安全 cs.CV 计算机视觉 cs.CY 计算机与社会 cs.DB 数据库 cs.DC 分布式计算 cs.DL 数字图书馆 cs.DM 离散数学 cs.DS 数据结构 cs.ET 新兴技术 cs.FL 形式语言 cs.GL 综述文献 cs.GR 图形学 cs.GT 博弈论 cs.HC 人机交互 cs.IR 信息检索 cs.IT 信息论 cs.LG 机器学习 cs.LO 计算机逻辑 cs.MA 多智能体 cs.MM 多媒体 cs.MS 数学软件 cs.NA 数值分析 cs.NE 神经进化 cs.NI 网络架构 cs.OH 其他计算机 cs.OS 操作系统 cs.PF 性能 cs.PL 编程语言 cs.RO 机器人 cs.SC 符号计算 cs.SD 声音 cs.SE 软件工程 cs.SI 社会信息网络 cs.SY 系统控制

ECON 经济学 4

econ 经济学 econ.EM 计量经济 econ.GN 一般经济 econ.TH 理论经济

EESS 电气与系统 5

eess 电气与系统 eess.AS 音频语音 eess.IV 图像视频 eess.SP 信号处理 eess.SY 系统控制

MATH 数学 33

math 数学 math.AC 交换代数 math.AG 代数几何 math.AP 偏微分方程 math.AT 代数拓扑 math.CA 经典分析 math.CO 组合数学 math.CT 范畴论 math.CV 复变函数 math.DG 微分几何 math.DS 动力系统 math.FA 泛函分析 math.GM 一般数学 math.GN 一般拓扑 math.GR 群论 math.GT 几何拓扑 math.HO 历史综述 math.IT 信息论 math.KT K理论 math.LO 逻辑 math.MG 度量几何 math.MP 数学物理 math.NA 数值分析 math.NT 数论 math.OA 算子代数 math.OC 优化控制 math.PR 概率 math.QA 量子代数 math.RA 环与代数 math.RT 表示论 math.SG 辛几何 math.SP 谱理论 math.ST 统计理论

PHYSICS 物理 55

astro-ph 天体物理 astro-ph.CO 宇宙学 astro-ph.EP 地球行星 astro-ph.GA 星系物理 astro-ph.HE 高能天体 astro-ph.IM 天文仪器 astro-ph.SR 太阳恒星 cond-mat 凝聚态 cond-mat.dis-nn 无序神经 cond-mat.mes-hall 介观纳米 cond-mat.mtrl-sci 材料科学 cond-mat.other 其他凝聚态 cond-mat.quant-gas 量子气体 cond-mat.soft 软凝聚态 cond-mat.stat-mech 统计力学 cond-mat.str-el 强关联电子 cond-mat.supr-con 超导 gr-qc 广义相对论 hep-ex 高能实验 hep-lat 格点高能 hep-ph 高能唯象 hep-th 高能理论 math-ph 数学物理 nlin 非线性科学 nlin.AO 自适应系统 nlin.CD 混沌动力学 nlin.CG 胞自动机 nlin.PS 斑图孤子 nlin.SI 可积系统 nucl-ex 核物理实验 nucl-th 核物理理论 physics 物理 physics.acc-ph 加速器物理 physics.ao-ph 大气海洋 physics.app-ph 应用物理 physics.atm-clus 原子分子团簇 physics.atom-ph 原子物理 physics.bio-ph 生物物理 physics.chem-ph 化学物理 physics.class-ph 经典物理 physics.comp-ph 计算物理 physics.data-an 数据分析 physics.ed-ph 物理教育 physics.flu-dyn 流体动力学 physics.gen-ph 普通物理 physics.geo-ph 地球物理 physics.hist-ph 物理史哲 physics.ins-det 仪器探测 physics.med-ph 医学物理 physics.optics 光学 physics.plasm-ph 等离子体 physics.pop-ph 科普物理 physics.soc-ph 物理与社会 physics.space-ph 空间物理 quant-ph 量子物理

Q-BIO 定量生物 11

q-bio 定量生物 q-bio.BM 生物分子 q-bio.CB 细胞行为 q-bio.GN 基因组学 q-bio.MN 分子网络 q-bio.NC 神经认知 q-bio.OT 其他定量生物 q-bio.PE 种群进化 q-bio.QM 定量方法 q-bio.SC 亚细胞过程 q-bio.TO 组织器官

Q-FIN 定量金融 10

q-fin 定量金融 q-fin.CP 计算金融 q-fin.EC 经济学 q-fin.GN 一般金融 q-fin.MF 数学金融 q-fin.PM 投资组合 q-fin.PR 证券定价 q-fin.RM 风险管理 q-fin.ST 统计金融 q-fin.TR 交易微观结构

STAT 统计 7

stat 统计 stat.AP 统计应用 stat.CO 统计计算 stat.ME 统计方法 stat.ML 机器学习 stat.OT 其他统计 stat.TH 统计理论

2602.10032 2026-05-14 cs.CV cs.RO

Perception with Guarantees: Certified Pose Estimation via Reachability Analysis

Tobias Ladner, Yasser Shoukry, Matthias Althoff

发表机构 * Technical University of Munich, Germany（慕尼黑技术大学）； University of California, Irvine, USA（加州大学 Irvine 分校）

AI总结该论文研究了在安全关键型系统中如何通过视觉信息实现具有严格保证的三维姿态估计问题。作者提出了一种仅依赖于单目图像和已知目标几何形状的认证姿态估计方法，通过可达性分析和形式化神经网络验证技术，对姿态进行形式化边界约束，从而在最坏情况下也能保证估计的安全性。实验表明，该方法在合成与真实场景中均能高效且准确地完成定位任务，为安全关键型应用提供了可靠保障。

Comments Accepted at Computed Aided Verification (CAV'2026)

2602.09628 2026-05-14 cs.RO

TeleGate: Whole-Body Humanoid Teleoperation via Gated Expert Selection with Motion Prior

Jie Li, Bing Tang, Feng Wu

发表机构 * School of Computer Science and Technology, University of Science and Technology of China（中国科学技术大学计算机科学与技术学院）； AnyWit Robotics Co., Ltd., Shushan District, Hefei, Anhui, China（安徽合肥蜀山 district AnyWit 机器人有限公司）

AI总结本文提出了一种名为TeleGate的全身人形机器人远程操作框架，旨在解决现有方法在复杂动态运动中性能下降的问题。该方法通过训练一个轻量级的门控网络，在运行时根据本体感觉状态和参考轨迹动态选择专家策略，从而保留各领域专家策略的完整能力。此外，引入基于VAE的运动先验模块，从历史观测中提取隐含的未来运动意图，实现对需要预测的运动（如跳跃和起立）的前瞻性控制。实验表明，TeleGate在仅使用2.5小时动作捕捉数据训练的情况下，能够在多种动态运动中实现高精度的实时远程操作，显著优于基线方法。

Comments Accepted by RSS 2026. Project page: https://anywitresearch.github.io/TeleGate/

2602.08920 2026-05-14 cs.LG

Diffusion-Inspired Reconfiguration of Transformers for Uncertainty Calibration

Manh Cuong Dao, Quang Hung Pham, Phi Le Nguyen, Thao Nguyen Truong, Bryan Kian Hsiang Low, Trong Nghia Hoang

发表机构 * National University of Singapore（新加坡国立大学）； Hanoi University of Science and Technology（河内科学技术大学）； National Institute of Advanced Industrial Science and Technology（国家先进工业科学与技术研究院）； Washington State University（华盛顿州立大学）

AI总结本文研究了预训练Transformer模型在不确定性校准方面的不足，提出了一种受扩散过程启发的重构方法。该方法将每个特征变换模块建模为概率映射，通过组合这些映射构建出类似扩散过程的概率路径，从而实现不确定性在模型各层的合理传播。实验表明，该方法在保持原有预测性能的同时，显著提升了模型在多个视觉和语言任务中的不确定性校准能力。

2602.06475 2026-05-14 cs.LG

Towards Generalizable Reasoning: Group Causal Counterfactual Policy Optimization for LLM Reasoning

Jingyao Wang, Peizheng Guo, Wenwen Qiang, Jiahuan Zhou, Huijie Guo, Changwen Zheng, Hui Xiong

发表机构 * Institute of Software, Chinese Academy of Sciences（中国科学院软件研究所）； University of Chinese Academy of Sciences（中国科学院大学）； Wangxuan Institute of Computer Technology, Peking University（北京大学王宣计算机技术研究所）； The Hong Kong University of Science and Technology (Guangzhou)（香港科技大学（广州））

AI总结该研究针对大语言模型（LLM）在推理任务中过度依赖最终答案正确性而忽视推理过程的问题，提出了一种基于因果反事实的策略优化方法。通过将多候选推理过程视为因果反事实实验，该方法设计了一种新的奖励机制，同时鼓励推理过程的鲁棒性和有效性，从而提升模型的推理泛化能力。实验表明，该方法在多个基准测试中表现出优越的推理性能。

2602.06138 2026-05-14 cs.LG

Flow Matching for Offline Reinforcement Learning with Discrete Actions

Fairoz Nower Khan, Nabuat Zaman Nahim, Ruiquan Huang, Haibo Yang, Peizhong Ju

发表机构 * Department of Computer Science, University of Kentucky（计算机科学系，肯塔基大学）； Department of Computing and Information Sciences, Rochester Institute of Technology（计算与信息科学系，罗切斯特理工学院）

AI总结本文研究了如何将流匹配方法扩展到具有离散动作空间的离线强化学习问题中。作者提出了一种基于连续时间马尔可夫链的通用框架，并采用Q加权流匹配目标进行训练，同时支持多目标优化。该方法在多智能体环境下通过因子化条件路径缓解联合动作空间的指数增长问题，并在理论和实验上验证了其有效性，尤其在高维控制、多智能体游戏和多目标动态偏好等场景中表现优异。此外，该框架还可通过动作量化应用于连续控制问题，提供了性能与复杂度之间的灵活权衡。

2602.06104 2026-05-14 cs.LG stat.ML

Pragmatic Curiosity: A Unified Framework for Hybrid Learning and Optimization via Active Inference

Yingke Li, Anjali Parashar, Enlu Zhou, Chuchu Fan

发表机构 * Department of Aeronautics and Astronautics（航空与航天系）； Massachusetts Institute of Technology（麻省理工学院）； School of Industrial and Systems Engineering（工业与系统工程系）； Georgia Institute of Technology（佐治亚理工学院）

AI总结该论文提出了一种名为“实用好奇心”（Pragmatic Curiosity, PraC）的统一框架，用于结合学习与优化的混合场景，通过主动推理实现高效的决策。该方法通过权衡任务相关潜在符号的信息增益与结果的预期遗憾，指导候选查询的选择，从而在减少不确定性的同时提升任务性能。研究展示了PraC在多个复杂场景中的应用，包括固定符号的决策监控、局部符号的目标主动搜索以及未知偏好的复合贝叶斯优化，表现出降低决策风险、提升关键结果区域覆盖能力和联合学习预测与偏好结构的优势。

2602.05000 2026-05-14 cs.LG cs.AI cs.CL

Entropy Aware Reward Guidance for Diffusion Language Model Alignment

Atula Tejaswi, Litu Rout, Constantine Caramanis, Sanjay Shakkottai, Sujay Sanghavi

发表机构 * The University of Texas at Austin（德克萨斯大学奥斯汀分校）

AI总结本文研究了在离散扩散语言模型中使用奖励引导（Reward Guidance）进行对齐的问题，针对离散输出无法直接求导的挑战，提出了一种新的机制EntRGi，通过动态结合连续松弛的token和采样的硬token，并基于模型预测熵进行插值，从而在保持奖励模型可靠性的同时提升优化准确性。实验表明，该方法在测试时适配和奖励引导强化学习等场景下均优于现有方法，具有显著的性能提升。

Comments Preprint

2602.04923 2026-05-14 cs.LG

Imposing Boundary Conditions on Neural Operators via Learned Function Extensions

Sepehr Mousavi, Siddhartha Mishra, Laura De Lorenzis

发表机构 * Department of Mechanical and Process Engineering, ETH Zurich, Switzerland（机械与过程工程系，苏黎世联邦理工学院，瑞士）； Seminar for Applied Mathematics, ETH Zurich, Switzerland（应用数学研讨会，苏黎世联邦理工学院，瑞士）； ETH AI Center, Zurich, Switzerland（苏黎世联邦理工学院人工智能中心，瑞士）

AI总结该论文提出了一种通过学习函数扩展来为神经算子施加边界条件的通用框架，解决了神经算子在处理复杂、非齐次边界条件时的局限性。其核心方法是将边界数据映射到整个空间域的潜在伪扩展上，使标准算子学习架构能够有效利用边界信息。实验表明，该方法在多个偏微分方程问题上取得了优于现有方法的高精度结果，且无需跨数据集调整超参数，展示了其在科学机器学习中的有效性和实用性。

2602.04264 2026-05-14 cs.LG cs.AI cs.NA math.NA

Exponential Approximation Rates and Parameter Efficiency of Learnable Bernstein Activations

Ibrahim Albool, Malak Gamal El-Din, Salma Elmalaki, Yasser Shoukry

发表机构 * Department of Electrical Engineering and Computer Science, University of California, Irvine（电气工程与计算机科学系，加州大学 Irvine 分校）

AI总结本文研究了可学习伯恩斯坦激活函数（Learnable Bernstein Activations）在深度神经网络中的表示能力和参数效率。通过理论分析，作者证明了采用此类激活的DeepBern-Nets网络在逼近误差上具有指数级衰减的速率，远优于传统的ReLU结构。实验表明，DBNs在多个科学数据集上实现了显著的参数减少和更快的收敛速度，验证了其结构优势。

Comments 20 pages

2602.02977 2026-05-14 cs.CV cs.AI cs.LG

Aligning Forest and Trees in Images & Long Captions for Visually Grounded Understanding

Byeongju Woo, Zilin Wang, Byeonghyun Pak, Sangwoo Mo, Stella X. Yu

发表机构 * Agency for Defense Development（国防发展局）； University of Michigan（密歇根大学）； POSTECH

AI总结该研究针对视觉语言模型在理解长而细节丰富的图像描述时存在的问题，提出了一种基于局部-整体结构的层次化学习方法。核心方法是通过CAFT模型，在中间表示层对齐局部文本与图像区域，在最终表示层实现全局图像与文本的对齐，从而更准确地捕捉细粒度视觉信息。该模型在多个长文本检索任务中取得了最先进的性能，并且无需显式的区域标注即可实现文本语义在图像区域中的定位。

Comments Preprint

2602.02350 2026-05-14 cs.AI cs.LG cs.MA

Context Learning for Multi-Agent Discussion

Xingyuan Hua, Sheng Yue, Xinyi Li, Yizhe Zhao, Jinrui Zhang, Ju Ren

发表机构 * Department of Computer Science and Technology, Tsinghua University（清华大学计算机科学与技术系）； School of Cyber Science and Technology, Sun Yat-sen University Shenzhen Campus（中山大学深圳校区网络科学与技术学院）； College of Computer Science, Northwest University（西北大学计算机学院）； State Key Laboratory of Internet Architecture, Tsinghua University（清华大学互联网体系结构实验室）

AI总结多智能体讨论（MAD）任务中，多个大语言模型通过结构化讨论协作解决问题，但现有方法常因个体上下文不一致导致讨论不协调、难以达成共识。本文提出一种多大语言模型上下文学习方法（M2CL），通过为每个智能体学习上下文生成器，动态生成每轮讨论的上下文指令，从而提升讨论的一致性和准确性。实验表明，M2CL在多项复杂任务中性能显著优于现有方法，提升幅度达20%至50%，同时具备良好的迁移能力和计算效率。

2602.02001 2026-05-14 cs.LG cs.AI

Preserve-Then-Quantize: Balancing Rank Budgets for Quantization Error Reconstruction in LLMs

Yoonjun Cho, Dongjae Jeon, Soeun Kim, Moongyu Jeon, Albert No

发表机构 * Department of Computer Science, Yonsei University（延世大学计算机科学系）； Department of Artificial Intelligence, Yonsei University（延世大学人工智能系）

AI总结该论文研究了如何在大语言模型的后训练量化（PTQ）中减少精度损失，提出了一种名为“Preserve-Then-Quantize”的方法，通过在量化前保留权重矩阵的主要奇异子空间，仅对残差部分进行量化，并利用剩余的秩用于误差重建。该方法引入了结构化残差重建（SRR）框架，在理论指导下平衡量化暴露能量与不可恢复误差，有效提升了量化后的模型性能，并支持高效的量化参数微调，实验表明其在多个任务和量化设置下均取得了显著的性能提升。

Comments Accepted at ICML 2026. Project page: https://ai-isl.github.io/srr

2602.01453 2026-05-14 cs.LG

The Horizon Threshold in Cooperative Multi-Agent Reward-Free Exploration

Idan Barnea, Orin Levy, Yishay Mansour

发表机构 * Tel Aviv University（特拉维夫大学）； Google Research（谷歌研究）

AI总结本文研究了在无奖励探索（reward-free exploration）设置下的合作多智能体强化学习问题，多个智能体共同探索未知的有限时间地平线马尔可夫决策过程（MDP），以学习其动态特性。研究采用分阶段学习框架，每个阶段智能体独立执行策略并观察轨迹，重点分析学习阶段数与智能体数量之间的权衡关系。研究发现，地平线长度 $H$ 决定了性能拐点，并提出了一种计算高效的算法，在 $H$ 阶段内使用 $\tilde{O}(S^6 H^6 A / ε^2)$ 个智能体即可获得动态的 $ε$ 近似，同时证明了当阶段数小于 $H$ 时，智能体数量必须指数级增长才能保证精度，从而表明 $Θ(H)$ 阶段是实现多项式智能体数量的必要且充分条件。

2602.00616 2026-05-14 cs.AI

SPOT: Selective Prompt Projection via Total Variation for Inference-Only Safe Text-to-Image Generation

Minhyuk Lee, Hyekyung Yoon, Myungjoo Kang

发表机构 * Seoul National University（首尔国立大学）

AI总结本文研究了在不修改预训练生成模型的前提下，如何在文本到图像生成过程中安全地抑制不适当内容的生成。提出了一种名为SPOT的方法，通过在推理阶段选择性地将输入提示投影到安全提示集，利用总变分理论控制风险变化，从而在保持良性提示生成质量的同时降低生成内容的风险。实验表明，SPOT在多个数据集和扩散模型架构上均能有效提升生成内容的安全性，同时保持对原始提示的良好响应。

2601.23143 2026-05-14 cs.AI

THINKSAFE: Self-Generated Safety Alignment for Reasoning Models

Seanie Lee, Sangwoo Park, Yumin Choi, Gyeongman Kim, Minki Kang, Jihun Yun, Dongmin Park, Jongho Park, Sung Ju Hwang

发表机构 * KAIST（韩国科学技术院）； KRAFTON（KRAFTON公司）； UC Berkeley（加州大学伯克利分校）

AI总结大型推理模型在生成长链推理时往往过于追求任务合规性，导致对有害提示的防御能力下降。为此，研究提出了THINKSAFE框架，通过自我生成的安全对齐方法，在无需外部教师模型的情况下恢复模型的安全性。该方法基于KL散度投影理论，利用轻量级拒绝引导机制，在保持推理能力的同时显著提升模型的安全性，并在多个模型上验证了其有效性与高效性。

Comments 17 pages, 13 figures

2601.22853 2026-05-14 cs.CV

Inference-Time Dynamic Modality Selection for Incomplete Multimodal Classification

Siyi Du, Xinzhe Luo, Declan P. O'Regan, Chen Qin

发表机构 * Department of Electrical and Electronic Engineering & I-X（电气与电子工程系及I-X）

AI总结本文研究了多模态深度学习在面对不完整模态数据时的分类问题，提出了一种在推理阶段动态选择模态的框架DyMo，以解决传统方法中丢弃或恢复缺失模态所带来的信息损失或噪声引入问题。DyMo通过一种新的选择算法，在测试时自适应地识别并融合可靠的恢复模态，最大化任务相关的多模态信息，并设计了相应的奖励函数和网络架构，实验表明其在多种数据缺失场景下均优于现有方法。

Comments 27 pages (including appendix), accepted by ICLR 2026

2601.22816 2026-05-14 cs.LG stat.ML

Cascaded Flow Matching for Heterogeneous Tabular Data with Mixed-Type Features

Markus Mueller, Kathrin Gruber, Dennis Fok

发表机构 * Econometric Institute, Erasmus University Rotterdam, Rotterdam, The Netherlands（荷兰埃因霍温鲁特兰大学经济研究所）

AI总结本文提出了一种用于生成包含离散和连续混合特征的表格数据的级联流匹配方法，以解决现有模型在生成混合类型特征时的困难。该方法首先生成表格数据的低分辨率版本，再通过一种新的引导条件概率路径和数据依赖耦合机制，在高分辨率模型中生成更精确的混合特征。实验表明，该方法在生成样本的真实性和分布细节捕捉方面表现优异，检测得分提升了51.9%。

Comments published at ICML 2026

2601.22409 2026-05-14 cs.LG cs.AI stat.ML

Optimization, Generalization and Differential Privacy Bounds for Gradient Descent on Kolmogorov-Arnold Networks

Puyu Wang, Junyu Zhou, Philipp Liznerski, Marius Kloft

发表机构 * RPTU Kaiserslautern-Landau（凯斯布鲁克-兰道大学）

AI总结本文研究了梯度下降在Kolmogorov-Arnold网络（KAN）上的优化动态、泛化性能及差分隐私保障。通过理论分析，作者得出了关于训练过程、泛化误差和隐私预算的通用界，并在逻辑斯蒂损失下证明了对数宽度的网络即可实现与迭代次数和样本量相关的优化与泛化速率。在差分隐私设置中，研究进一步表明所需噪声与输入维度和隐私参数相关，并揭示了在隐私保护下网络宽度不仅需满足充分性，还需满足必要性，揭示了隐私与非隐私训练之间的本质差异。

Comments 42 pages, 3 figures

Journal ref ICML 2026

2601.21892 2026-05-14 cs.CV cs.AI

Improving Classifier-Free Guidance of Flow Matching via Manifold Projection

Jian-Feng Cai, Haixia Liu, Zhengyi Su, Chao Wang

发表机构 * Department of Mathematics, The Hong Kong University of Science ； IAS Center for AI for Scientific Discoveries, The Hong Kong University of Science ； School of Mathematics ； Statistics \& Institute of Interdisciplinary Research for Mathematics ； Applied Science \& Hubei Key Laboratory of Engineering Modeling ； Scientific Computing, Huazhong University of Science ； Department of Statistics ； Data Science, Southern University of Science

AI总结本文研究了如何改进基于流匹配模型的无分类器引导（CFG）方法，提出了通过流匹配中的速度场与平滑距离函数梯度之间的关系，对CFG进行原理性解释。基于此，作者将CFG采样重新表述为具有流形约束的同伦优化问题，并通过增量梯度下降实现流形投影，进一步结合Anderson加速提升计算效率与稳定性。该方法无需额外训练，有效提升了生成质量、提示对齐度及对引导尺度的鲁棒性，并在多个大型模型上取得了显著改进。

Comments 26 pages, 14 figures

2601.21731 2026-05-14 cs.LG

Mechanistic Evidence for Spectral Structures in Prior-Data Fitted Networks

Kaustubh Sharma, Srijan Tiwari, Ojasva Nema, Parikshit Pareek

发表机构 * Indian Institute of Technology Roorkee (IIT Roorkee)（印度理工学院罗尔基分校）

AI总结该研究探讨了Prior-Data Fitted Networks（PFNs）内部是否学习了可识别的贝叶斯结构，而非仅仅记忆输入输出映射。通过实验发现，PFNs能够学习到结构化的谱表示，并且这些表示可以从潜在的注意力得分中线性解码，且集中在低维子空间中。研究还提出了一种滤波器组解码器，能够将冻结的PFNs潜在表示映射为显式的谱密度，从而重建出与高斯过程回归相当的核函数，表明PFNs的先验信息不仅是隐式的，而且可以显式提取并用于实际任务。

2601.21577 2026-05-14 cs.LG

Collaborative Parameter Learning: Mitigating Forgetting via Parameter-Level Gradient Analysis

Mutian Yang, Zisen Zhan, Yutong Chen, Haolin Li, Kaiwen Wang, Kaili Zheng, Yuguang Wang, Qi Wang, Jiandong Gao, Ji Wu

发表机构 * Department of Electronic Engineering, Tsinghua University, Beijing, China（清华大学电子工程系，北京，中国）； Institute of Medical Technology, Peking University Health Science Center, Peking University, Beijing, China（北京大学医学部医学技术研究所，北京大学，北京，中国）； College of Information Science and Engineering, Northeastern University, Shenyang, China（东北大学信息科学与工程学院，沈阳，中国）； College of AI, Tsinghua University, Beijing, China（清华大学人工智能学院，北京，中国）； Beijing National Research Center for Information Science and Technology, Beijing, China（北京信息科学与技术国家研究中心，北京，中国）

AI总结在知识注入过程中，大语言模型容易出现灾难性遗忘问题，即学习新知识时会覆盖已有知识。本文通过参数级梯度分析，识别出两类参数：导致遗忘的冲突参数和缓解遗忘的协作参数，并提出协作参数学习（CPL）方法，仅更新协作参数以减轻遗忘。实验表明，CPL在保持较少遗忘的同时显著提升了模型的学习能力，并降低了显存和计算时间消耗。

2601.19931 2026-05-14 cs.CL

CascadeMind at SemEval-2026 Task 4: A Hybrid Neuro-Symbolic Cascade for Narrative Similarity

Sebastien Kawada, Dylan Holyoak

发表机构 * Kaons ； Epoch Learn

AI总结本文研究了叙事相似性任务中的模型决策机制，提出了一种混合神经符号级联系统CascadeMind。该方法通过分析大语言模型的自洽性样本投票结果，根据投票一致性动态调整计算资源分配，对高置信度案例进行共识处理，对分歧案例进行多轮采样，仅在极少数完美平票案例中引入符号系统。实验表明，该方法在SemEval-2026任务中取得了72.75%的测试成绩，主要贡献在于展示了基于置信度的计算资源调度比引入辅助表示更为有效。

Comments 7 pages, 2 figures, 5 tables. Accepted paper for SemEval-2026 Task 4 at ACL. Code: https://github.com/chreia/CascadeMind-ACL

2601.19208 2026-05-14 cs.CL cs.LG

How Do Transformers Learn to Associate Tokens: Gradient Leading Terms Bring Mechanistic Interpretability

Shawn Im, Changdae Oh, Zhen Fang, Sharon Li

发表机构 * University of Wisconsin–Madison（威斯康星大学麦迪逊分校）； University of Technology Sydney（悉尼技术大学）

AI总结该研究探讨了Transformer模型如何从自然语言数据中学习并建立词之间的语义关联，例如“bird”与“flew”之间的联系。通过分析训练动态并利用梯度的主项近似，研究提出了权重的闭式表达式，揭示了Transformer中每组权重可以表示为三个基础函数的简单组合，反映了语料库的统计特性。实验表明，理论分析与实际大语言模型中学习到的权重高度一致，为理解Transformer中语义关联的形成提供了机制性解释。

Comments ICLR 2026

2601.17326 2026-05-14 cs.CV cs.HC

SymbolSight: Minimizing Inter-Symbol Interference for Reading with Prosthetic Vision

Jasmine Lesner, Michael Beyeler

发表机构 * Department of Computer Science, University of California, Santa Barbara（计算机科学系，加州大学圣芭芭拉分校）； Department of Psychological & Brain Sciences, University of California, Santa Barbara（心理学与脑科学系，加州大学圣芭芭拉分校）

AI总结该研究针对视网膜假体视觉恢复中阅读困难的问题，提出了一种名为SymbolSight的计算框架，旨在通过优化视觉符号设计来减少符号间干扰。研究利用语言的双字统计特性，选择字母到符号的映射方式，以降低相邻字母间的识别混淆。实验表明，这种方法在阿拉伯语、保加利亚语和英语中显著减少了预测的识别错误，展示了符号设计优化在提升低带宽视觉假体阅读性能中的潜力。

Comments Accepted to IEEE EMBC 2026. 7 pages, 6 figures, 2 tables

2601.16806 2026-05-14 cs.AI cs.RO

An Efficient Insect-inspired Approach for Visual Point-goal Navigation

Yihe Lu, Barbara Webb

发表机构 * School of Informatics, University of Edinburgh（爱丁堡大学信息学院）

AI总结本文提出了一种受昆虫启发的高效视觉点目标导航模型，结合了与联想学习和路径整合相关的两种昆虫脑结构的抽象模型。该方法在视觉导航任务中表现出与当前先进模型相当的性能，但计算成本大幅降低，并在更真实的模拟环境中展示了其对干扰的鲁棒性。

Comments This work has been submitted to the IEEE for possible publication

2601.15161 2026-05-14 cs.CL cs.AI

Automated Rubrics for Reliable Evaluation of Medical Dialogue Systems

Yinzhu Chen, Abdine Maiga, Hossein A. Rahmani, Emine Yilmaz

发表机构 * AI Center, University College London（伦敦大学学院人工智能中心）

AI总结随着大型语言模型在医疗决策支持中的应用增加，如何可靠评估其输出成为关键问题。本文提出了一种基于检索增强的多智能体框架，用于自动生成针对具体对话实例的评估标准，从而更准确地识别临床意图偏差和潜在风险。该方法通过分解检索到的权威医学证据并结合用户交互约束，形成可验证的细粒度评估准则，在多个医疗对话数据集上表现出色，显著优于现有基线模型，并有效指导了模型响应的优化。

2601.14104 2026-05-14 cs.RO cs.CV

When Backdoors Meet Partial Observability: Attacking Real-World Reinforcement Learning

Tairan Huang, Qingqing Ye, Yulin Jin, Jiawei Lian, Yaxin Xiao, Yi Wang, Haibo Hu

发表机构 * Department of Electrical and Electronic Engineering（电气与电子工程系）

AI总结本文研究了在部分可观测的现实环境中对强化学习（RL）策略进行后门攻击的问题，指出传统攻击方法在多模态观测（如视觉和激光雷达）共存的场景下存在局限性。为此，作者提出了一种基于扩散模型的后门攻击框架（DGBA），通过可打印的视觉触发器，在不干扰任务性能的前提下实现对RL策略的隐蔽操控。实验表明，该方法在物理机器人平台上的攻击效果优于现有方法，具有较高的实用性和隐蔽性。

2601.13359 2026-05-14 cs.CL cs.CR cs.LG

Sockpuppetting: Jailbreaking LLMs by Combining Prefilling with Optimization

Asen Dotsinski, Panagiotis Eustratiadis

发表机构 * University of Amsterdam（阿姆斯特丹大学）

AI总结本文研究了一种针对大语言模型的新型越狱攻击方法，称为“Sockpuppetting”，通过在模型输出的前缀中注入特定序列，诱导模型生成不符合安全策略的响应。研究提出了一种结合预填充（prefill）和优化后缀的混合攻击策略，显著提升了攻击成功率。实验表明，该方法在多个主流模型上均表现出较高的有效性，揭示了当前开放权重模型在防御输出前缀注入方面亟需加强。

Comments 13 pages, 6 figures

2601.11942 2026-05-14 cs.LG quant-ph

Geometric Preconditioning and Curriculum Optimization for Trainable Variational Quantum Regression

Qingyu Meng, Yangshuai Wang

发表机构 * Shanghai Jiao Tong University-Chongqing Institute of Artificial Intelligence（上海交通大学-重庆人工智能研究院）； Department of Mathematics, National University of Singapore（新加坡国立大学数学系）

AI总结该论文研究了可训练变分量子回归中的训练难题，针对全局损失、有限采样随机性和电路深度增加导致的梯度信号弱或病态问题，提出了一种结合几何预处理和课程优化的混合量子-经典回归方法。核心方法包括一个可控容量的经典嵌入，作为可学习的几何预处理器，用于重塑输入分布并保持低维量子瓶颈，同时采用课程学习策略逐步增加电路深度并切换优化方式。实验表明，该混合量子神经网络在有限规模的回归任务中相比纯量子网络具有更低的误差，支持了其在训练性方面的优势。

2601.09636 2026-05-14 cs.AI cs.CV cs.HC cs.LG

PersonalAlign: Hierarchical Implicit Intent Alignment for Personalized GUI Agent with Long-Term User-Centric Records

Yibo Lyu, Gongwei Chen, Rui Shao, Weili Guan, Liqiang Nie

发表机构 * Harbin Institute of Technology, Shenzhen（哈尔滨工业大学（深圳））； Shenzhen Loop Area Institute（深圳环城区域研究院）

AI总结本文提出 PersonalAlign，一种面向个性化图形用户界面（GUI）代理的分层隐式意图对齐方法，旨在通过利用用户的长期行为记录来理解模糊指令中的隐含偏好并主动预测用户潜在操作。为此，研究者构建了 AndroidIntent 基准数据集，并设计了 Hierarchical Intent Memory Agent（HIM-Agent）来持续更新和组织用户的个性化偏好与行为模式。实验表明，HIM-Agent 在执行与主动协助任务上分别提升了 15.7% 和 7.3%。

Comments Accepted to ACL26 Main

AI 大模型

视觉与机器人

科学与医疗