arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

检索范围排序方式

检索时间范围

重置

HOT 人工智能、机器人等 9

cs.AI 人工智能 cs.CV 计算机视觉 cs.CL 自然语言处理 cs.RO 机器人 cs.LG 机器学习 cs.SD 声音 cs.ET 新兴技术 eess.AS 音频语音 eess.IV 图像视频

CS 计算机 41

cs 计算机 cs.AI 人工智能 cs.AR 硬件架构 cs.CC 计算复杂性 cs.CE 计算工程 cs.CG 计算几何 cs.CL 自然语言处理 cs.CR 密码安全 cs.CV 计算机视觉 cs.CY 计算机与社会 cs.DB 数据库 cs.DC 分布式计算 cs.DL 数字图书馆 cs.DM 离散数学 cs.DS 数据结构 cs.ET 新兴技术 cs.FL 形式语言 cs.GL 综述文献 cs.GR 图形学 cs.GT 博弈论 cs.HC 人机交互 cs.IR 信息检索 cs.IT 信息论 cs.LG 机器学习 cs.LO 计算机逻辑 cs.MA 多智能体 cs.MM 多媒体 cs.MS 数学软件 cs.NA 数值分析 cs.NE 神经进化 cs.NI 网络架构 cs.OH 其他计算机 cs.OS 操作系统 cs.PF 性能 cs.PL 编程语言 cs.RO 机器人 cs.SC 符号计算 cs.SD 声音 cs.SE 软件工程 cs.SI 社会信息网络 cs.SY 系统控制

ECON 经济学 4

econ 经济学 econ.EM 计量经济 econ.GN 一般经济 econ.TH 理论经济

EESS 电气与系统 5

eess 电气与系统 eess.AS 音频语音 eess.IV 图像视频 eess.SP 信号处理 eess.SY 系统控制

MATH 数学 33

math 数学 math.AC 交换代数 math.AG 代数几何 math.AP 偏微分方程 math.AT 代数拓扑 math.CA 经典分析 math.CO 组合数学 math.CT 范畴论 math.CV 复变函数 math.DG 微分几何 math.DS 动力系统 math.FA 泛函分析 math.GM 一般数学 math.GN 一般拓扑 math.GR 群论 math.GT 几何拓扑 math.HO 历史综述 math.IT 信息论 math.KT K理论 math.LO 逻辑 math.MG 度量几何 math.MP 数学物理 math.NA 数值分析 math.NT 数论 math.OA 算子代数 math.OC 优化控制 math.PR 概率 math.QA 量子代数 math.RA 环与代数 math.RT 表示论 math.SG 辛几何 math.SP 谱理论 math.ST 统计理论

PHYSICS 物理 55

astro-ph 天体物理 astro-ph.CO 宇宙学 astro-ph.EP 地球行星 astro-ph.GA 星系物理 astro-ph.HE 高能天体 astro-ph.IM 天文仪器 astro-ph.SR 太阳恒星 cond-mat 凝聚态 cond-mat.dis-nn 无序神经 cond-mat.mes-hall 介观纳米 cond-mat.mtrl-sci 材料科学 cond-mat.other 其他凝聚态 cond-mat.quant-gas 量子气体 cond-mat.soft 软凝聚态 cond-mat.stat-mech 统计力学 cond-mat.str-el 强关联电子 cond-mat.supr-con 超导 gr-qc 广义相对论 hep-ex 高能实验 hep-lat 格点高能 hep-ph 高能唯象 hep-th 高能理论 math-ph 数学物理 nlin 非线性科学 nlin.AO 自适应系统 nlin.CD 混沌动力学 nlin.CG 胞自动机 nlin.PS 斑图孤子 nlin.SI 可积系统 nucl-ex 核物理实验 nucl-th 核物理理论 physics 物理 physics.acc-ph 加速器物理 physics.ao-ph 大气海洋 physics.app-ph 应用物理 physics.atm-clus 原子分子团簇 physics.atom-ph 原子物理 physics.bio-ph 生物物理 physics.chem-ph 化学物理 physics.class-ph 经典物理 physics.comp-ph 计算物理 physics.data-an 数据分析 physics.ed-ph 物理教育 physics.flu-dyn 流体动力学 physics.gen-ph 普通物理 physics.geo-ph 地球物理 physics.hist-ph 物理史哲 physics.ins-det 仪器探测 physics.med-ph 医学物理 physics.optics 光学 physics.plasm-ph 等离子体 physics.pop-ph 科普物理 physics.soc-ph 物理与社会 physics.space-ph 空间物理 quant-ph 量子物理

Q-BIO 定量生物 11

q-bio 定量生物 q-bio.BM 生物分子 q-bio.CB 细胞行为 q-bio.GN 基因组学 q-bio.MN 分子网络 q-bio.NC 神经认知 q-bio.OT 其他定量生物 q-bio.PE 种群进化 q-bio.QM 定量方法 q-bio.SC 亚细胞过程 q-bio.TO 组织器官

Q-FIN 定量金融 10

q-fin 定量金融 q-fin.CP 计算金融 q-fin.EC 经济学 q-fin.GN 一般金融 q-fin.MF 数学金融 q-fin.PM 投资组合 q-fin.PR 证券定价 q-fin.RM 风险管理 q-fin.ST 统计金融 q-fin.TR 交易微观结构

STAT 统计 7

stat 统计 stat.AP 统计应用 stat.CO 统计计算 stat.ME 统计方法 stat.ML 机器学习 stat.OT 其他统计 stat.TH 统计理论

2602.18435 2026-05-15 cs.LG

CAKE: Confidence in Assignments via K-partition Ensembles

Aggelos Semoglou, John Pavlopoulos

发表机构 * Department of Informatics, Athens University of Economics and Business（经济与商业大学信息学院）； Archimedes Research Unit, Athena Research Center（阿提卡研究中心阿基米德研究单位）

AI总结本文提出了一种名为CAKE的方法，用于评估聚类结果中每个数据点的分配置信度。该方法通过结合聚类集成中的分配稳定性与局部几何一致性，生成一个0到1之间的可解释置信度评分。实验表明，CAKE能够有效识别聚类中的模糊点和稳定核心点，为后续聚类任务中的样本选择与优先级排序提供有力支持。

Comments 37 pages, including appendix

Journal ref Machine Learning with Applications, Volume 24, 2026, Article 100915

2602.17949 2026-05-15 cs.CL cs.AI

CUICurate: A GraphRAG-based Framework for Automated Clinical Concept Curation for NLP applications

Victoria Blake, Jamie Novak, Mathew Miller, Sze-yuan Ooi, Blanca Gallego

发表机构 * Centre for Big Data Research in Health, University of New South Wales（健康大数据研究中心，新南威尔士大学）； Eastern Heart Clinic, Prince of Wales Hospital（东部心脏诊所，王室医院）； NSW Ambulance Aeromedical Operations, Bankstown Helicopter Base（新南威尔士州急救航空医疗运作，班克stown直升机基地）； Department of Anaesthesia, Saint George Hospital（麻醉科，圣乔治医院）； Department of Cardiology, Prince of Wales Hospital（心内科，王室医院）； School of Clinical Medicine, University of New South Wales（临床医学学院，新南威尔士大学）

AI总结本文提出CUICurate，一个基于图检索增强生成（GraphRAG）的框架，用于自动化构建临床概念集，以支持自然语言处理应用。该方法利用UMLS知识图谱进行语义检索，结合大语言模型对候选概念进行过滤和分类，实现了比手动构建更全面、更一致的临床概念集。实验表明，CUICurate在多个异构临床概念任务中表现出色，生成的集合不仅规模更大，且具有较高的召回率和稳定性，为临床NLP和表型分析提供了高效、可扩展的解决方案。

Comments 6 figures, 4 tables

2602.15019 2026-05-15 cs.AI cs.IR

Hunt Globally: Wide Search AI Agents for Drug Asset Scouting in Investing, Business Development, and Competitive Intelligence

Vlad Vinogradov, Alisa Vinogradova, Luba Greenwood, Ilya Yasny, Dmitry Kobyzev, Shoman Kasbekar, Kong Nguyen, Dmitrii Radkevich, Roman Doronin, Andrey Doronichev

发表机构 * Bioptic

AI总结本文研究了在生物医药投资、业务发展和竞争情报中，如何高效发现非美国来源的潜在药物资产。针对当前AI系统在多语言、异构信息源中召回率低、易产生幻觉的问题，作者提出了一种基于树结构的自学习Bioptic Agent，并构建了一个涵盖多语言、多代理的基准测试平台。实验表明，该方法在资产发现任务中显著优于多个主流大模型，验证了其在完整性和准确性上的优势。

2602.14068 2026-05-15 cs.CV

CoCoEdit: Content-Consistent Image Editing via Region Regularized Reinforcement Learning

Yuhui Wu, Chenxi Xie, Ruibin Li, Liyi Chen, Qiaosi Yi, Lei Zhang

发表机构 * The Hong Kong Polytechnic University, Hong Kong（香港理工大学）； OPPO Research Institute, ShenZhen, China（OPPO研究院，深圳，中国）

AI总结 CoCoEdit 是一种基于区域正则化强化学习的内容一致图像编辑框架，旨在解决现有模型在编辑目标区域时容易导致非目标区域发生不期望变化的问题。该方法通过引入像素级相似性奖励和区域正则化机制，有效提升了编辑质量与内容一致性。实验表明，CoCoEdit 在多个基准测试中取得了与先进模型相当的编辑效果，并在内容一致性方面表现出显著优势。

Comments Accepted by ICML 2026

2602.11871 2026-05-15 cs.CL cs.LG

DMAP: A Distribution Map for Text

Tom Kempton, Julia Rozanova, Parameswaran Kamalaruban, Maeve Madigan, Karolina Wresilo, Yoann L. Launay, David Sutton, Stuart Burrell

发表机构 * University of Manchester, UK（曼彻斯特大学，英国）； Featurespace, a Visa Solution（Visa解决方案的Featurespace）； Risk and Security AI Lab, Visa Inc., UK（Visa公司的风险与安全AI实验室，英国）； University of Cambridge, UK（剑桥大学，英国）

AI总结本文提出了一种名为DMAP的方法，通过语言模型将文本映射到单位区间内的样本集合，从而联合编码词序和概率信息，为文本分析提供了数学基础。该方法能够高效、模型无关地分析文本，并在生成参数验证、机器生成文本检测和模型指纹分析等三个案例中展现出广泛的应用价值。DMAP在普通硬件上即可高效计算，具有通用性强、适用范围广的特点，为基于大语言模型的文本分析研究提供了新的基础。

Comments ICLR 2026

2602.10346 2026-05-15 cs.CL cs.LG

Geometry-Aware Decoding with Wasserstein-Regularized Truncation and Mass Penalties for Large Language Models

Arash Gholami Davoodi, Navid Rezazadeh, Seyed Pouyan Mousavi Davoudi, Pouya Pezeshkpour

发表机构 * Carnegie Mellon University（卡内基梅隆大学）； Megagon Labs（Megagon实验室）； University of California, Irvine（加州大学伊文斯顿分校）

AI总结大型语言模型在开放生成任务中需在多样性与逻辑一致性之间取得平衡。本文提出一种基于几何感知的截断方法Top-W，通过引入Wasserstein距离并结合概率质量与熵的权衡，使截断后的分布更贴近原始分布，同时提升生成质量。实验表明，Top-W在多个基准测试中显著优于现有方法，不仅提高了准确性，还增强了生成内容的创造性。

Comments 20 pages, 3 figures, 8 tables, ICML 2026

2602.09969 2026-05-15 cs.LG econ.EM stat.ML

Causal Multi-Task Demand Learning

Varun Gupta, Vijay Kamble

发表机构 * Dept. of Operations and Information Systems University of Utah（运营与信息系统系犹他大学）； Dept. of Information and Decision Sciences University of Illinois Chicago（信息与决策科学系伊利诺伊大学芝加哥分校）

AI总结本文研究了一个由零售定价驱动的多任务需求学习问题，旨在估计不同决策场景下的异质性线性价格响应函数。由于每个场景的协变量丰富但价格变化有限，作者提出了一种新的元学习框架，通过利用跨任务信息进行迁移学习，解决因内生性导致的估计偏差问题。该方法在每个任务中假设存在至少两个局部外生的价格点，从而在保证因果识别的前提下提升需求参数估计的准确性，并在真实和合成数据上验证了其有效性。

2602.08874 2026-05-15 cs.CL cs.CR

Do Reasoning LLMs Refuse What They Infer in Long Contexts?

Yu Fu, Haz Sameen Shahgir, Huanli Gong, Zhipeng Wei, N. Benjamin Erichson, Yue Dong

发表机构 * International Computer Science Institute（国际计算机科学研究所）； College of Engineering, University of California, Berkeley（加州大学伯克利分校工程学院）； Berkeley Lab（伯克利实验室）

AI总结本文研究了长上下文大语言模型在面对隐含有害意图时的安全性问题。作者提出了一种新的威胁模型——组合推理攻击，通过将有害请求拆分为语义不完整的片段并嵌入长上下文中，使模型在推理过程中需要组合这些片段才能显式推断出有害目标。实验表明，当前前沿模型在直接识别有害请求时拒绝率较高，但在需要组合推理的情况下拒绝率显著下降，揭示了模型在长上下文中存在明显的安全漏洞。

Comments 33 pages, 6 figures

2602.07441 2026-05-15 cs.LG cs.AI

Proximal Action Replacement for Behavior Cloning Actor-Critic in Offline Reinforcement Learning

Jinzong Dong, Wei Huang, Jianshu Zhang, Zhuo Chen, Xinzhe Yuan, Qinying Gu, Zhaohui Jiang, Nanyang Ye

发表机构 * School of Automation, Central South University（中南大学自动化学院）； Shanghai AI Laboratory（上海人工智能实验室）； Shanghai Jiao Tong University（上海交通大学）

AI总结本文研究了离线强化学习中行为克隆（BC）正则化策略的局限性，指出当数据集动作次优时，盲目模仿会限制策略的性能提升。为此，作者提出了一种名为近端动作替换（PAR）的方法，通过用更优的动作替换数据集中的次优动作，结合值函数的局部上升方向和不确定性约束，提升训练稳定性。实验表明，PAR能有效提升多种BC正则化方法的性能，并在结合基础TD3+BC时达到先进水平。

2602.07045 2026-05-15 cs.CV cs.AI

VLRS-Bench: A Vision-Language Reasoning Benchmark for Remote Sensing

Zhiming Luo, Di Wang, Haonan Guo, Jing Zhang, Bo Du

发表机构 * School of Computer Science, Wuhan University（武汉大学计算机学院）

AI总结为了推动多模态大语言模型在遥感领域的应用，研究者提出了首个专注于复杂遥感推理的视觉语言推理基准VLRS-Bench。该基准围绕认知、决策和预测三个核心维度构建，包含2000对问答对，涵盖14项任务和最多八个时间阶段，旨在评估模型在遥感场景下的复杂推理能力。通过融合遥感领域先验知识和专家经验，VLRS-Bench有效提升了任务的地理空间真实性和推理难度，揭示了当前先进模型在该领域的显著瓶颈，为未来研究提供了重要参考。

2602.05285 2026-05-15 cs.LG

Robust Inference-Time Steering of Protein Diffusion Models via Embedding Optimization

Minhuan Li, Jiequn Han, Pilar Cossio, Luhuan Wu

发表机构 * Flatiron Institute（Flatiron研究所）

AI总结本文研究了如何在蛋白质结构生成中，通过优化嵌入空间来实现对扩散模型的鲁棒引导。作者提出了一种名为EmbedOpt的方法，在推理阶段通过直接优化模型的条件嵌入，使结构先验与实验约束对齐，从而避免传统后验采样方法中可能出现的不稳定问题。实验表明，EmbedOpt在稀疏距离约束和冷冻电镜图拟合任务中表现优异，且对超参数具有较高的鲁棒性。

2602.04657 2026-05-15 cs.CV

TRIO: Token Reduction via Inference-Objective Guidance for Efficient Vision-Language Models

Haokui Zhang, Congyang Ou, Dawei Yan, Peng Wang, Qingsen Yan, Yu Zhang, Ying Li, Rong Xiao

发表机构 * School of Cyberspace Security, Northwestern Polytechnical University（网络安全学院，西北工业大学）； School of Computer Science, Northwestern Polytechnical University（计算机学院，西北工业大学）； Intellifusion（智融科技）

AI总结 TRIO 是一种通过推理目标指导实现视觉-语言模型高效推理的视觉标记压缩方法。该方法从推理目标出发，将视觉标记压缩转化为保持输出结果不变性的过程，并通过设计的局部代理损失生成标记级梯度显著性，指导标记重排序与选择。TRIO 免于训练，兼容 FlashAttention，适用于实际部署，可在保留 97.2% 原始性能的同时显著提升推理速度与降低计算开销。

2602.04473 2026-05-15 cs.CV

CC-Pan: Channel-wise Compression based Diffusion for Efficient Pan-Sharpening

Junjie Li, Congyang Ou, Haokui Zhang, Guoting Wei, Shengqin Jiang, Ying Li

发表机构 * School of Cyberspace Security, Northwestern Polytechnical University（网络安全学院，西北工业大学）； Nanjing University of Science and Technology（南京理工大学）； School of Computer Science, Nanjing University of Information Science and Technology（计算机科学学院，南京信息工程大学）

AI总结本文提出了一种基于通道压缩的扩散模型CC-Pan，用于高效实现多光谱与全色图像的融合（Pan-Sharpening）。该方法通过训练一个通道独立的变分自编码器，将高分辨率多光谱图像编码为紧凑的潜在表示，从而支持不同传感器的多光谱图像并加速推理过程。同时，通过设计的单向和双向交互控制结构引入光谱物理特性及全色图像，结合轻量化的跨带注意力模块，显著提升了融合精度和光谱一致性。实验表明，CC-Pan在多个数据集上优于现有扩散模型，并实现了2-3倍的加速效果，具有良好的跨传感器泛化能力。

2602.04265 2026-05-15 cs.LG cs.AI

Boosting LLM Reasoning via Human-Inspired Reward Shaping

Wenze Lin, Zhen Yang, Xitai Jiang, Xiaoteng Ma, Gao Huang

发表机构 * Tsinghua University（清华大学）； Southern University of Science and Technology（南方科技大学）； Mind Lab

AI总结该研究针对大语言模型（LLM）推理能力提升的问题，提出了一种受人类学习行为启发的动态奖励框架T2T。该方法通过区分问题掌握程度，分别采用“厚化”和“薄化”两个阶段的奖励机制：在错误尝试时鼓励广泛探索，在正确解答后则通过长度惩罚促进推理凝练。实验表明，T2T在多个数学基准测试中显著优于现有方法，有效提升了模型的推理性能。

2602.03814 2026-05-15 cs.AI cs.LG

Conformal Thinking: Risk Control for Reasoning on a Compute Budget

Xi Wang, Anushri Suresh, Alvin Zhang, Rishi More, William Jurayj, Benjamin Van Durme, Mehrdad Farajtabar, Daniel Khashabi, Eric Nalisnick

发表机构 * Johns Hopkins University, Baltimore, Maryland, USA（约翰霍普金斯大学，巴尔的摩，马里兰州，美国）； Apple, USA（苹果公司，美国）

AI总结本文研究了如何在计算资源有限的情况下，通过控制推理过程中的风险来提升大语言模型的推理效率。作者提出了一种名为“共形思考”的风险控制框架，通过设定上界和下界阈值，分别在模型自信时停止推理（可能产生错误输出）和提前终止无法解决的实例（可能过早停止），从而在保证风险可控的前提下最小化计算开销。实验表明，该方法在多种推理任务和模型中均能有效提升计算效率，同时满足用户设定的风险目标。

Comments ICMl 2026

2602.03417 2026-05-15 cs.CL

FactNet: A Billion-Scale Knowledge Graph for Multilingual Factual Grounding

Yingli Shen, Wen Lai, Jie Zhou, Xueren Zhang, Yudong Wang, Kangyang Luo, Shuo Wang, Ge Gao, Alexander Fraser, Maosong Sun

发表机构 * Tsinghua University（清华大学）； Technical University of Munich（慕尼黑技术大学）； ModelBest Inc.（ModelBest公司）； Minzu University of China（民族大学）

AI总结本文提出FactNet，一个包含10亿规模的多语言事实知识图谱，旨在解决大语言模型在非英语语言中生成内容时缺乏可检索证据支持的问题。FactNet将17亿个Wikidata断言与来自316个母语维基百科的30.1亿个证据指针相结合，通过确定性构建流程确保每个证据单元均可追溯至原始来源。此外，研究还构建了FactNet-Bench评估套件，用于知识图谱补全、问答和事实核查任务，并验证了FactNet在跨语言知识迁移中的有效性。

2602.01664 2026-05-15 cs.AI cs.LG

FlowSteer: Towards Agents Designing Agentic Workflows via Reinforced Progressive Canvas Editing

Mingda Zhang, Wenjin Liu, Tiesunlong Shen, Qika Lin, Rui Mao, Erik Cambria, Xiaoying Tang, Haoran Luo

发表机构 * The Chinese University of Hong Kong, Shenzhen（香港中文大学（深圳））； Nanyang Technological University（南洋理工大学）； National University of Singapore（新加坡国立大学）

AI总结 FlowSteer 是一种新型智能体设计代理工作流的范式，旨在解决当前工作流构建中依赖人工、缺乏全局反馈和无法在线修复错误等问题。该方法引入了可执行的流程画布环境，通过强化学习逐步进行原子编辑，实现工作流的端到端自动设计。实验表明，FlowSteer 在多个数据集上显著优于现有方法，且支持多种操作符库和大语言模型后端，具有良好的通用性和扩展性。

Comments 51 pages, 6 figures, 5 tables. Project page: http://flowsteer.org/

2602.01359 2026-05-15 cs.LG cs.AI

PaAno: Patch-Based Representation Learning for Time-Series Anomaly Detection

Jinju Park, Seokho Kang

发表机构 * Department of Industrial Engineering, Sungkyunkwan University（成均馆大学工业工程系）

AI总结尽管近期时间序列异常检测研究越来越多地采用如Transformer和基础模型等大型神经网络架构，但这些方法计算成本高、内存消耗大，难以应用于实时和资源受限的场景，且在严格评估下性能提升不明显。本文提出了一种基于块的表示学习方法PaAno，该方法通过从时间序列中提取短时域块，并使用1D卷积神经网络将其嵌入为向量表示，结合三元组损失和预训练任务损失进行训练，以捕捉块中的有用时间模式。在推理阶段，通过比较正常块与当前块的嵌入向量计算异常分数，实验表明PaAno在TSB-AD基准测试中表现优异，显著优于包括大型架构在内的现有方法。

Comments Accepted by the 14th International Conference on Learning Representations (ICLR 2026)

2602.00992 2026-05-15 cs.RO

Geometry-Aware Sampling-Based Motion Planning on Riemannian Manifolds

Phone Thiha Kyaw, Jonathan Kelly

发表机构 * Institute for Aerospace Studies, University of Toronto（航空航天研究 institute，多伦多大学）

AI总结本文研究了在黎曼流形上进行几何感知的采样式运动规划问题，旨在在考虑配置空间非欧几里得几何结构的情况下，规划出避障且路径长度最短的运动轨迹。作者提出了一种直接在黎曼流形上运行的采样式规划框架，引入了一种计算高效的黎曼测地距离近似方法，并设计了基于黎曼自然梯度的局部规划器。实验表明，该方法在多种机器人系统中均能生成比传统欧几里得方法和经典数值解法更优的轨迹。

Comments Accepted to the 17th World Symposium on the Algorithmic Foundations of Robotics (WAFR), Oulu, Finland, Jun 15-17, 2026

2602.00807 2026-05-15 cs.CV cs.RO

Any3D-VLA: Enhancing VLA Robustness via Diverse Point Clouds

Xianzhe Fan, Shengliang Deng, Xiaoyang Wu, Yuxiang Lu, Zhuoling Li, Mi Yan, Yujia Zhang, Zhizheng Zhang, He Wang, Hengshuang Zhao

发表机构 * School of Computing and Data Science, The University of Hong Kong, Hong Kong SAR, China（计算与数据科学学院，香港大学，香港特别行政区，中国）； School of Computing（计算学院）； Peking University, Beijing, China（北京大学，北京，中国）

AI总结现有视觉-语言-动作（VLA）模型通常以二维图像作为视觉输入，这限制了它们在复杂场景中的空间理解能力。为提升VLA模型的性能，本文提出Any3D-VLA，通过引入多样化的点云数据增强三维感知能力，并在训练过程中融合仿真、传感器和模型估计的点云，学习跨域通用的三维表示。实验表明，该方法有效提升了模型性能并缓解了领域差异问题。

Comments ICML 2026

2602.00520 2026-05-15 cs.LG

NEST: Nested Event Stream Transformer for Sequences of Multisets

Minghui Sun, Haoyu Gong, Xingyu You, Jillian Hurst, Benjamin Goldstein, Matthew Engelhard

发表机构 * Department of Biostatistics & Bioinformatics, Duke University（生物统计学与生物信息学系，杜克大学）； Department of Biomedical Engineering, Duke University（生物医学工程系，杜克大学）； Department of Pediatrics, Duke University（儿科学系，杜克大学）

AI总结事件流数据通常具有层次结构，表现为多个事件共现的多重集合序列。现有基础模型大多将其扁平化处理，导致计算效率低且集合级表示质量不高。本文提出嵌套事件流变换器（NEST），保留原始层次结构，引入掩码集合建模（MSM）方法，有效提升预训练效率和下游任务性能。

Comments 10-page main text

2601.23072 2026-05-15 cs.LG

SplineFlow: Flow Matching for Dynamical Systems with B-Spline Interpolants

Santanu Subhash Rathod, Pietro Liò, Xiao Zhang

发表机构 * CISPA Helmholtz Center for Information Security（CISPA海德堡信息安全研究中心）； Department of Computer Science and Technology（计算机科学与技术系）； University of Cambridge（剑桥大学）

AI总结本文提出了一种名为SplineFlow的流匹配算法，用于更准确地建模动态系统中的状态演化过程。该方法采用B样条插值来构建条件路径，克服了传统线性插值在处理高阶动态和不规则采样数据时的不足，从而在保证多边际约束的前提下实现更稳定、更平滑的动力学建模。实验表明，SplineFlow在多种确定性和随机动态系统以及细胞轨迹推断任务中均优于现有方法。

Comments 36 pages, 35 tables, 22 figures

2601.21656 2026-05-15 cs.LG

TabClustPFN: A Prior-Fitted Network for Tabular Data Clustering

Tianqi Zhao, Guanyang Wang, Yan Shuo Tan, Qiong Zhang

发表机构 * Renmin University of China（中国人民大学）； Rutgers University（罗格斯大学）； National University of Singapore（新加坡国立大学）

AI总结本文提出了一种名为TabClustPFN的新型网络，用于解决表格数据聚类这一基础而具有挑战性的问题。该方法基于先验适配网络（PFN），通过在合成数据上进行预训练，实现了对未知数据集的一次性聚类，无需重新训练或调整超参数。TabClustPFN能够处理异构的数值和类别特征，并适应多种聚类结构，实验表明其在合成数据和真实数据集上均优于传统及深度聚类方法，具有良好的鲁棒性和实用性。

2601.21349 2026-05-15 cs.LG cs.AI

L2R: Low-Rank and Lipschitz-Controlled Routing for Mixture-of-Experts

Minghao Yang, Ren Togo, Guang Li, Takahiro Ogawa, Miki Haseyama

发表机构 * Hokkaido University（北海道大学）

AI总结本文提出了一种名为L2R的统一路由框架，用于改进混合专家（MoE）模型中的路由机制。L2R通过在共享的低秩潜在路由空间中进行专家分配，并引入饱和内积评分（SIPS）来显式控制路由函数的Lipschitz行为，从而提升路由几何的平滑性和稳定性。此外，L2R还采用参数高效的多锚点路由机制以增强专家的表达能力。实验表明，L2R在语言和视觉任务中均能有效提升路由性能和模型整体表现。

2601.21174 2026-05-15 cs.LG

Breaking the Reasoning Horizon in Entity Alignment Foundation Models

Yuanning Cui, Zequn Sun, Wei Hu, Kexuan Xin, Zhangjie Fu

发表机构 * Nanjing University of Information Science and Technology（南京信息工程大学）； State Key Laboratory for Novel Software Technology, Nanjing University（南京大学软件新技术国家重点实验室）； National Institute of Healthcare Data Science, Nanjing University（南京大学健康数据科学国家研究院）； University of Queensland（昆士兰大学）； Engineering Research Center of Digital Forensics, Ministry of Education, Nanjing University of Information Science and Technology（南京信息工程大学数字取证工程研究中心）

AI总结实体对齐是知识图谱融合的关键任务，但现有模型在面对未见过的知识图谱时缺乏迁移能力。本文提出了一种基于并行编码策略的实体对齐基础模型，通过利用种子对齐对作为局部锚点，引导信息流并同时初始化两个并行编码流，有效缩短了推理路径，提升了对稀疏异构结构的适应能力。此外，模型引入了合并关系图和可学习交互模块，以建模全局依赖并实现精准匹配，实验表明该方法在未见过的知识图谱上具有良好的泛化性能。

2601.21151 2026-05-15 cs.LG physics.ao-ph

Learning to Advect: A Neural Semi-Lagrangian Architecture for Weather Forecasting

Carlos A. Pereira, Stéphane Gaudreault, Valentin Dallerit, Christopher Subich, Shoyon Panday, Siqi Wei, Sasa Zhang, Siddharth Rout, Eldad Haber, Raymond J. Spiteri, David Millard, Emilia Diaconescu

发表机构 * Recherche en prévision numérique atmosphérique, Environnement et Changement climatique Canada（环境与气候变化加拿大大气数值预报研究）； Department of Earth, Ocean and Atmospheric Sciences, University of British Columbia（不列颠哥伦比亚大学地球、海洋和大气科学系）； Department of Computer Science, University of Saskatchewan（萨斯喀彻温大学计算机科学系）； Department of Mechanical Engineering, Rochester Institute of Technology（罗切斯特理工学院机械工程系）

AI总结该研究提出了一种名为PARADIS的物理启发式天气预测模型，旨在解决传统机器学习方法在刻画大气输送等物理过程时的效率与准确性问题。其核心方法是将天气动力学分解为输送、扩散和反应三个模块，并通过神经半拉格朗日算子实现基于轨迹的全球输送过程建模，从而在保持物理结构的同时提升预测性能。实验表明，PARADIS在ERA5基准测试中表现出良好的确定性预测能力，尤其在短期预报和中长期预报的谱保真度方面具有显著优势。

2601.19924 2026-05-15 cs.CL cs.AI cs.LG

OPT-Engine: Benchmarking the Limits of LLMs in Optimization Modeling via Complexity Scaling

Yitian Chen, Cheng Cheng, Yinan Sun, Zi Ling, Dongdong Ge

发表机构 * Shanghai University of Finance and Economics（上海财经大学）； Booth School of Business, University of Chicago（芝加哥大学商学院）； Antai School of Economics and Management, Shanghai Jiao Tong University（上海交通大学安泰经济管理学院）

AI总结本文研究了大语言模型（LLMs）在优化建模领域的性能和可扩展性，提出了一种名为OPT-ENGINE的可扩展基准框架，用于系统评估从线性规划到混合整数规划等经典运筹学问题的自动建模与求解能力。通过该框架，研究发现基于纯文本推理的方法在任务复杂度增加时存在鲁棒性不足的问题，而结合外部计算工具虽能提升局部计算能力，却难以满足全局优化约束。研究进一步指出，当前最先进的求解器集成推理方法在自动构建约束条件方面仍面临主要瓶颈，为下一代优化建模大语言模型的发展提供了明确方向。

Journal ref Proceedings of the 43rd International Conference on Machine Learning, Seoul, South Korea. PMLR 306, 2026

2601.15620 2026-05-15 cs.LG

Closing the Gap on the Sample Complexity of 1-Identification

Zitian Li, Wang Chi Cheung

发表机构 * Department of Industrial Systems Engineering & Management（工业系统工程与管理系）

AI总结本文研究了多臂老虎机中的1-识别问题，即判断是否存在某个臂的平均奖励超过给定阈值 $μ_0$，否则输出“None”。作者提出了一个新的优化框架，推导出在至少存在一个合格臂的情况下，最小样本复杂度的下界，并设计了一种新算法，其上界与下界在多项式对数因子内一致，从而填补了该问题在样本复杂度分析上的空白。

2601.03969 2026-05-15 cs.AI cs.CL

Anti-Length Shift: Dynamic Outlier Truncation for Training Efficient Reasoning Models

Wei Wu, Liyi Chen, Congxi Xiao, Tianfu Wang, Qimeng Wang, Chengqiang Lu, Yan Gao, Yi Wu, Yao Hu, Hui Xiong

发表机构 * University of Science and Technology of China（中国科学技术大学）； Xiaohongshu Inc.（小红书公司）； The Hong Kong University of Science and Technology (Guangzhou)（香港科技大学（广州））

AI总结本文研究了大语言模型在训练过程中因强化学习奖励机制导致的“长度偏移”现象，即模型在简单问题上生成冗余推理内容的问题。为此，作者提出了一种动态异常截断（DOT）方法，在训练时选择性地抑制冗余输出，同时保留对复杂问题的长推理能力。结合辅助KL正则化和预测性动态采样，该方法有效提升了模型的推理效率与性能，实验表明其在多个任务上显著优于现有方法。

Comments Accepted by ACL2026

2601.03630 2026-05-15 cs.CL

Reasoning Model Is Superior LLM-Judge, Yet Suffers from Biases

Hui Huang, Xuanxin Wu, Muyun Yang, Yuki Arase

发表机构 * Institute of Science Tokyo（东京科学研究院）； Harbin Institute of Technology（哈尔滨工业大学）； The University of Osaka（大阪大学）

AI总结本文首次系统比较了大型推理模型（LRMs）与非推理大语言模型（LLMs）在判断任务中的表现，发现LRMs在判断准确性、指令遵循能力以及对对抗攻击的鲁棒性方面均优于非推理模型，但同时也存在较强的评估偏差。为此，作者提出了一种轻量级的评估策略PlanJudge，通过引导模型在判断前生成明确的评估计划，有效缓解了偏差问题，同时保持了整体判断准确性。

Comments Accepted by ACL 2026 Workshop EvalEval

AI 大模型

视觉与机器人

科学与医疗