arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

检索范围排序方式

检索时间范围

重置

HOT 人工智能、机器人等 9

cs.AI 人工智能 cs.CV 计算机视觉 cs.CL 自然语言处理 cs.RO 机器人 cs.LG 机器学习 cs.SD 声音 cs.ET 新兴技术 eess.AS 音频语音 eess.IV 图像视频

CS 计算机 41

cs 计算机 cs.AI 人工智能 cs.AR 硬件架构 cs.CC 计算复杂性 cs.CE 计算工程 cs.CG 计算几何 cs.CL 自然语言处理 cs.CR 密码安全 cs.CV 计算机视觉 cs.CY 计算机与社会 cs.DB 数据库 cs.DC 分布式计算 cs.DL 数字图书馆 cs.DM 离散数学 cs.DS 数据结构 cs.ET 新兴技术 cs.FL 形式语言 cs.GL 综述文献 cs.GR 图形学 cs.GT 博弈论 cs.HC 人机交互 cs.IR 信息检索 cs.IT 信息论 cs.LG 机器学习 cs.LO 计算机逻辑 cs.MA 多智能体 cs.MM 多媒体 cs.MS 数学软件 cs.NA 数值分析 cs.NE 神经进化 cs.NI 网络架构 cs.OH 其他计算机 cs.OS 操作系统 cs.PF 性能 cs.PL 编程语言 cs.RO 机器人 cs.SC 符号计算 cs.SD 声音 cs.SE 软件工程 cs.SI 社会信息网络 cs.SY 系统控制

ECON 经济学 4

econ 经济学 econ.EM 计量经济 econ.GN 一般经济 econ.TH 理论经济

EESS 电气与系统 5

eess 电气与系统 eess.AS 音频语音 eess.IV 图像视频 eess.SP 信号处理 eess.SY 系统控制

MATH 数学 33

math 数学 math.AC 交换代数 math.AG 代数几何 math.AP 偏微分方程 math.AT 代数拓扑 math.CA 经典分析 math.CO 组合数学 math.CT 范畴论 math.CV 复变函数 math.DG 微分几何 math.DS 动力系统 math.FA 泛函分析 math.GM 一般数学 math.GN 一般拓扑 math.GR 群论 math.GT 几何拓扑 math.HO 历史综述 math.IT 信息论 math.KT K理论 math.LO 逻辑 math.MG 度量几何 math.MP 数学物理 math.NA 数值分析 math.NT 数论 math.OA 算子代数 math.OC 优化控制 math.PR 概率 math.QA 量子代数 math.RA 环与代数 math.RT 表示论 math.SG 辛几何 math.SP 谱理论 math.ST 统计理论

PHYSICS 物理 55

astro-ph 天体物理 astro-ph.CO 宇宙学 astro-ph.EP 地球行星 astro-ph.GA 星系物理 astro-ph.HE 高能天体 astro-ph.IM 天文仪器 astro-ph.SR 太阳恒星 cond-mat 凝聚态 cond-mat.dis-nn 无序神经 cond-mat.mes-hall 介观纳米 cond-mat.mtrl-sci 材料科学 cond-mat.other 其他凝聚态 cond-mat.quant-gas 量子气体 cond-mat.soft 软凝聚态 cond-mat.stat-mech 统计力学 cond-mat.str-el 强关联电子 cond-mat.supr-con 超导 gr-qc 广义相对论 hep-ex 高能实验 hep-lat 格点高能 hep-ph 高能唯象 hep-th 高能理论 math-ph 数学物理 nlin 非线性科学 nlin.AO 自适应系统 nlin.CD 混沌动力学 nlin.CG 胞自动机 nlin.PS 斑图孤子 nlin.SI 可积系统 nucl-ex 核物理实验 nucl-th 核物理理论 physics 物理 physics.acc-ph 加速器物理 physics.ao-ph 大气海洋 physics.app-ph 应用物理 physics.atm-clus 原子分子团簇 physics.atom-ph 原子物理 physics.bio-ph 生物物理 physics.chem-ph 化学物理 physics.class-ph 经典物理 physics.comp-ph 计算物理 physics.data-an 数据分析 physics.ed-ph 物理教育 physics.flu-dyn 流体动力学 physics.gen-ph 普通物理 physics.geo-ph 地球物理 physics.hist-ph 物理史哲 physics.ins-det 仪器探测 physics.med-ph 医学物理 physics.optics 光学 physics.plasm-ph 等离子体 physics.pop-ph 科普物理 physics.soc-ph 物理与社会 physics.space-ph 空间物理 quant-ph 量子物理

Q-BIO 定量生物 11

q-bio 定量生物 q-bio.BM 生物分子 q-bio.CB 细胞行为 q-bio.GN 基因组学 q-bio.MN 分子网络 q-bio.NC 神经认知 q-bio.OT 其他定量生物 q-bio.PE 种群进化 q-bio.QM 定量方法 q-bio.SC 亚细胞过程 q-bio.TO 组织器官

Q-FIN 定量金融 10

q-fin 定量金融 q-fin.CP 计算金融 q-fin.EC 经济学 q-fin.GN 一般金融 q-fin.MF 数学金融 q-fin.PM 投资组合 q-fin.PR 证券定价 q-fin.RM 风险管理 q-fin.ST 统计金融 q-fin.TR 交易微观结构

STAT 统计 7

stat 统计 stat.AP 统计应用 stat.CO 统计计算 stat.ME 统计方法 stat.ML 机器学习 stat.OT 其他统计 stat.TH 统计理论

2505.17353 2026-05-15 cs.CV cs.AI cs.LG eess.IV

Dual Ascent Diffusion for Inverse Problems

Minseo Kim, Axel Levy, Gordon Wetzstein

发表机构 * Stanford University（斯坦福大学）

AI总结本文研究了如何利用扩散模型解决逆问题中的病态问题，提出了一种基于对偶上升优化框架的新方法。该方法在图像恢复任务中表现出更优的图像质量、更强的噪声鲁棒性以及更快的计算速度，同时能更真实地反映观测数据。该工作为逆问题求解提供了更高效且准确的解决方案。

Comments Project page: https://soniaminseokim.github.io/ddiff/

2502.16060 2026-05-15 cs.LG cs.AI eess.SP

Tokenizing Single-Channel EEG with Time-Frequency Motif Learning

Jathurshan Pradeepkumar, Xihao Piao, Zheng Chen, Jimeng Sun

发表机构 * University of Illinois Urbana-Champaign（伊利诺伊大学厄巴纳-香槟分校）； SANKEN, Osaka University（大阪大学SANKEN）

AI总结本文提出了一种名为TFM-Tokenizer的新颖EEG分词框架，通过从单通道脑电图信号中学习时间-频率模式词汇并将其编码为离散标记，解决了EEG分词这一重要难题。该方法采用双路径架构与时间-频率掩码机制，能够生成鲁棒的模式表示，并适用于多种下游模型，包括轻量级变压器和现有基础模型。实验表明，该分词器在多个EEG基准数据集上显著提升了性能，具有更好的泛化能力和设备适应性。

Comments Accepted to ICLR 2026

2502.00270 2026-05-15 cs.LG cs.AI stat.ML

DUET: Optimizing Training Data Mixtures via Feedback from Unseen Evaluation Tasks

Zhiliang Chen, Gregory Kang Ruey Lau, Chuan-Sheng Foo, Bryan Kian Hsiang Low

发表机构 * National University of Singapore（新加坡国立大学）； Agency for Research, Science, Technology and Research (A*STAR)（研究、科技与研发机构）

AI总结本文研究了如何在未知的下游评估任务下优化大型语言模型的训练数据混合问题。由于实际任务数据往往不可见，传统数据选择方法难以适用，作者提出了一种基于反馈的优化方法DUET，结合影响函数与贝叶斯优化，实现了无需任务数据先验知识的全局到局部的数据混合优化。实验表明，DUET在多种语言任务中优于现有方法，展示了其在未知任务设置下的有效性。

Comments Accepted to ICLR 2026 main conference

2411.18104 2026-05-15 cs.CL cs.AI cs.LG

Training and Evaluating Language Models with Template-based Data Generation

Yifan Zhang

发表机构 * University of California Los Angeles（加州大学洛杉矶分校）

AI总结本文针对大语言模型在复杂多步骤推理任务（如数学问题求解）中的不足，提出了一种基于模板的数据生成方法（TDG），利用前沿大模型GPT-4自动生成参数化元模板，从而合成大量高质量的问题与解答。研究构建了包含700多万道小学数学题的TemplateMath Part I：TemplateGSM数据集，每个问题均配有可编程验证的解法，有效解决了数据稀缺问题，并为模型对齐提供了基于可验证奖励的强化学习机制，推动了具备强大推理能力的新一代大语言模型的发展。

Comments Published in ICLR 2025 DATA-FM Workshop. Project Page: https://github.com/iiis-ai/TemplateMath

2410.06431 2026-05-15 cs.LG

Functional-level Uncertainty Quantification for Calibrated Fine-tuning on LLMs

Ruijia Niu, Dongxia Wu, Rose Yu, Yi-An Ma

发表机构 * Department of Computer Science and Engineering, University of California San Diego（加州大学圣地亚哥分校计算机科学与工程系）

AI总结本文研究了大语言模型在微调过程中不确定性量化的问题，针对现有方法在有限适配数据下容易过度自信的缺陷，提出了一种基于功能层面的不确定性量化方法UQ4CT。该方法通过混合专家微调框架，在训练过程中引入校准损失，使模型的功能层面置信度与预测正确性对齐，从而提升模型的校准性能。实验表明，UQ4CT在多个基准任务中显著降低了预期校准误差，同时保持了较高的准确率，并在分布偏移情况下表现出更强的鲁棒性。

2605.15172 2026-05-15 cs.CR cs.CL

MetaBackdoor: Exploiting Positional Encoding as a Backdoor Attack Surface in LLMs

Rui Wen, Mark Russinovich, Andrew Paverd, Jun Sakuma, Ahmed Salem

发表机构 * Institute of Science Tokyo（东京科学研究院）； Microsoft Azure（微软Azure）； Microsoft Security Response Center（微软安全响应中心）

AI总结本文提出了一种新型的后门攻击方法MetaBackdoor，利用大语言模型中的位置编码作为触发机制，无需修改输入文本内容即可激活后门。研究发现，基于位置信息的触发器能够有效激活隐蔽的后门行为，使模型在满足特定长度条件时泄露敏感信息或执行恶意操作。该方法扩展了大语言模型后门攻击的威胁模型，揭示了位置编码这一此前被忽视的攻击面，为防御策略的设计提出了新的挑战。

详情

英文摘要

Backdoor attacks pose a serious security threat to large language models (LLMs), which are increasingly deployed as general-purpose assistants in safety- and privacy-critical applications. Existing LLM backdoors rely primarily on content-based triggers, requiring explicit modification of the input text. In this work, we show that this assumption is unnecessary and limiting. We introduce MetaBackdoor, a new class of backdoor attacks that exploits positional information as the trigger, without modifying textual content. Our key insight is that Transformer-based LLMs necessarily encode token positions to process ordered sequences. As a result, length-correlated positional structure is reflected in the model's internal computation and can be used as an effective non-content trigger signal. We demonstrate that even a simple length-based positional trigger is sufficient to activate stealthy backdoors. Unlike prior attacks, MetaBackdoor operates on visibly and semantically clean inputs and enables qualitatively new capabilities. We show that a backdoored LLM can be induced to disclose sensitive internal information, including proprietary system prompts, once a length condition is satisfied. We further demonstrate a self-activation scenario, where normal multi-turn interaction can move the conversation context into the trigger region and induce malicious tool-call behavior without attacker-supplied trigger text. In addition, MetaBackdoor is orthogonal to content-based backdoors and can be composed with them to create more precise and harder-to-detect activation conditions. Our results expand the threat model of LLM backdoors by revealing positional encoding as a previously overlooked attack surface. This challenges defenses that focus on detecting suspicious text and highlights the need for new defense strategies that explicitly account for positional triggers in modern LLM architectures.

URL PDF HTML ☆

赞 0 踩 0

2605.15154 2026-05-15 stat.ML cs.LG

RoSHAP: A Distributional Framework and Robust Metric for Stable Feature Attribution

Lanxin Xiang, Liang Shi, Youhui Ye, Boyu Jiang, Dawei Zhou, Feng Guo

发表机构 * Department of Statistics（统计学系）； Virginia Tech（弗吉尼亚理工大学）； Transportation Institute（交通运输研究所）； Department of Computer Science（计算机科学系）

AI总结本文提出了一种名为RoSHAP的分布框架和鲁棒度量方法，用于实现更稳定的特征归因分析。该方法基于SHAP值，通过引导重采样和核密度估计建模特征归因分数的分布，并在温和正则条件下证明其聚合值渐近服从高斯分布，从而降低了分布估计的计算成本。RoSHAP不仅提升了特征排名的稳定性，还在模拟和实际数据实验中表现出优于传统单次归因方法的性能，同时使用更少的特征即可达到与全特征模型相当的预测效果。

2605.15127 2026-05-15 cs.HC cs.AI

Understanding How International Students in the U.S. Are Using Conversational AI to Support Cross-Cultural Adaptation

Laleh Nourian, Anisa Callis, Stephanie Patterson, Jadeline Miao, Jamison Heard, Garreth W. Tigwell

发表机构 * Rochester Institute of Technology（罗切斯特理工学院）； School of Information（信息学院）

AI总结本文研究了在美国留学的国际学生如何使用对话式人工智能来支持跨文化适应。通过调查和访谈，研究揭示了国际学生在面临文化适应挑战时对AI工具的使用模式、动机及局限性。研究发现，AI被视为应对即时问题的“急救工具”，但学生也期望其能发展为长期支持伙伴。研究为设计更贴合国际学生需求的AI支持系统提供了重要建议。

Comments 33 pages, single column. 4 figures, 9 tables

2605.15085 2026-05-15 stat.ML cs.LG stat.AP stat.ME

From Data to Action: Accelerating Refinery Optimization with AI

Dániel Pfeifer, Ábrahám Papp, Tibor Bernáth, Tamás Zoltán Varga, Márk Czifra, Botond Szilágyi, Edith Alice Kovács

发表机构 * Budapest University of Technology and Economics（布达佩斯技术与经济大学）

AI总结本文研究了如何利用人工智能加速炼油厂优化过程，针对线性规划（LP）方法在实际应用中面临的解释与应用难题，提出结合机器学习的方法以提升决策支持。核心方法包括改进的异常检测工具和高维数据处理策略，有效识别了炼油厂调度与规划中的业务机会与数据供应错误，为优化结果的可信度提供了新的洞察。

Comments 34 pages, 17 figures

2605.15082 2026-05-15 stat.ML cs.LG math.ST stat.TH

Average Gradient Outer Product in kernel regression provably recovers the central subspace for multi-index models

Libin Zhu, Damek Davis, Dmitriy Drusvyatskiy, Maryam Fazel

发表机构 * Department of Mathematics, University of Washington, Seattle, WA 98195（华盛顿大学数学系，华盛顿州西雅图98195）； Wharton Department of Statistics and Data Science, University of Pennsylvania, Philadelphia, PA 19104, USA（宾夕法尼亚大学沃顿统计与数据科学系，美国费城19104）； Department of Mathematics, U. Washington, Seattle, WA 98195（华盛顿大学数学系，华盛顿州西雅图98195）； Department of Electrical & Computer Engineering, University of Washington, Seattle, WA 98195, and Amazon, Inc（华盛顿大学电气与计算机工程系，华盛顿州西雅图98195，亚马逊公司）

AI总结本文研究了在样本数量少于精确预测所需的情况下，如何通过学习预测器发现数据中的低维结构。具体来说，考虑从有限数据对中恢复多指标多项式模型 $f^*(x)=h(Ux)$ 的问题，其中输入仅通过未知的 $r$ 维中心子空间的投影来影响输出。作者提出了一种简单方法：拟合核岭回归（KRR）并计算拟合预测器的平均梯度外积（AGOP），证明其前 $r$ 个特征向量可准确恢复该子空间，即使预测误差仍较大时也成立。研究还表明，当目标函数的低阶部分包含所有预测相关方向时，子空间恢复所需的样本量远低于精确预测所需的样本量，揭示了预测与表示之间的差异。

Comments 95 pages, 12 figures

2605.15058 2026-05-15 cs.NE cs.AI

NeuroTrain: Surveying Local Learning Rules for Spiking Neural Networks with an Open Benchmarking Framework

Alessio Caviglia, Filippo Marostica, Roberta Bardini, Alessandro Savino, Stefano Di Carlo

发表机构 * Politecnico di Torino, Control and Computer Engineering Department（托里尼理工大学控制与计算机工程系）

AI总结本文综述了脉冲神经网络（SNN）训练算法的最新进展，系统梳理了包括替代梯度反向传播、局部学习规则、生物启发可塑性机制等在内的多种方法，并提出了一个统一的分类体系。为支持可复现的研究，作者开发了开源框架NeuroTrain，实现了多种典型算法，提供了统一、模块化且可扩展的基准测试平台。该工作整合了分散的文献资源，明确了当前挑战与未来研究方向，为高效、可扩展的SNN训练提供了重要参考。

2605.15032 2026-05-15 eess.SP cs.LG

Multi-Block Attention for Efficient Channel Estimation in IRS-Assisted mmWave MIMO

Mehrdad Momen-Tayefeh, Mehrshad Momen-Tayefeh, Maryam Sabbaghian

发表机构 * School of Electrical and Computer Engineering, University of Tehran（德黑兰理工大学电子与计算机工程学院）； Department of Computer Engineering, Sharif University of Technology（谢赫·伊斯兰技术大学计算机工程系）

AI总结本文研究了智能反射表面（IRS）辅助毫米波MIMO系统中的高效信道估计问题，提出了基于深度学习的多块注意力（MBA）框架，用于降低训练开销并提升估计精度。该方法通过选择性关闭IRS元素并结合两阶段网络结构，分别进行空间相关性恢复和噪声抑制，有效减少了信道估计中的误差传播。实验表明，MBA方法在保持低计算复杂度的同时，显著降低了导频开销并提升了信道估计性能。

Journal ref IEEE Transactions on Communications, vol. 73, no. 12, pp. 13891-13903, Dec. 2025

2605.15030 2026-05-15 cs.CR cs.AI

WARD: Adversarially Robust Defense of Web Agents Against Prompt Injections

Tri Cao, Yulin Chen, Hieu Cao, Yibo Li, Khoi Le, Thong Nguyen, Yuexin Li, Yufei He, Yue Liu, Shuicheng Yan, Bryan Hooi

发表机构 * National University of Singapore（新加坡国立大学）； University of Science（科学大学）； Vietnam National University, Ho Chi Minh City（越南国家大学，胡志明市）

AI总结本文提出WARD，一种针对网络代理的对抗性鲁棒防御方法，用于抵御HTML内容或视觉界面中的提示注入攻击。WARD基于大规模数据集WARD-Base和专门设计的攻击数据集WARD-PIG进行训练，并引入了A3T自适应对抗训练框架，通过记忆驱动的攻击者与防御者共进化过程提升模型鲁棒性。实验表明，WARD在分布外基准上实现了接近完美的召回率，保持较低的误报率，并在分布偏移和针对性攻击下仍表现出高效稳定的防御性能。

Comments Code and models: https://github.com/caothientri2001vn/WARD-WebAgent

2605.15026 2026-05-15 cs.OS cs.AI cs.PF

SemaTune: Semantic-Aware Online OS Tuning with Large Language Models

Georgios Liargkovas, Mihir Nitin Joshi, Hubertus Franke, Kostis Kaffes

发表机构 * Columbia University（哥伦比亚大学）； IBM Research（IBM研究院）

AI总结 SemaTune 是一种基于大语言模型的语义感知在线操作系统调优框架，旨在提升长期运行服务的性能。该方法通过整合系统参数、监控数据、配置历史等信息构建决策上下文，结合快速和慢速反馈回路进行调优，并在更新前进行类型验证，从而在保证模型开销和系统稳定性的同时，实现对操作系统控制语义的理解。实验表明，SemaTune 在多个基准测试中显著优于传统方法，提升了稳定阶段的性能表现，并有效避免了系统性能的严重下降。

Comments 17 pages, 12 figures

2605.14983 2026-05-15 cs.GT cs.AI cs.CY cs.MA

Agreement, Diversity, and Polarization Indices for Approval Elections

Piotr Faliszewski, Jitka Mertlová, Krzysztof Sornat, Stanisław Szufa, Tomasz Wąs

发表机构 * AGH University of Kraków（克拉科夫AGH大学）； Czech Technical University in Prague（布拉格捷克技术大学）； University of Geneva（日内瓦大学）； University of Oxford（牛津大学）

AI总结本文研究了如何通过指数量化批准选举中选民之间的一致性、多样性和极化程度。提出了一系列归一化的指数，用于衡量选举中这些特征，并分析了它们的性质。研究还利用这些指数绘制了新的批准选举图谱，并比较了来自多个真实数据集的选举之间的异同。

2605.13338 2026-05-15 cs.CR cs.AI

Inducing Overthink: Hierarchical Genetic Algorithm-based DoS Attack on Black-Box Large Language Reasoning Models

Shuqiang Wang, Wei Cao, Jiaqi Weng, Jialing Tao, Licheng Pan, Hui Xue, Zhixuan Chu

发表机构 * The State Key Laboratory of Blockchain and Data Security, Zhejiang University（区块链与数据安全国家重点实验室，浙江大学）； Alibaba Group（阿里巴巴集团）

AI总结本文研究了大型推理模型（LRMs）在面对不完整或逻辑不一致输入时容易“过度思考”的漏洞，该行为会导致推理过程冗长且耗能，可能被用于发起拒绝服务（DoS）攻击。作者提出了一种基于分层遗传算法的黑盒攻击框架，通过系统性地扰动输入问题的逻辑结构，诱导模型产生更长的推理过程。实验表明，该方法在多个先进推理模型上显著放大了输出长度，并具有良好的迁移性，凸显了“过度思考”作为现代推理系统共有的潜在安全风险。

Comments Accepted at ICML 2026. Code available at: https://github.com/EndlessCao/Overthink-HGA

Journal ref Proceedings of the 43rd International Conference on Machine Learning (ICML 2026), PMLR 306, 2026

2512.16768 2026-05-15 stat.ML cs.LG math.PR

On The Hidden Biases of Flow Matching Samplers

Soon Hoe Lim

发表机构 * KTH Royal Institute of Technology（皇家理工学院）； Nordita（北欧理论物理研究所）； Stockholm University（斯德哥尔摩大学）

AI总结本文研究了流匹配（Flow Matching）采样器在有限样本情况下的隐藏偏差问题。通过将总体期望替换为样本平均，并用有限样本替代目标分布，作者提出了一种经验流匹配模型的层次结构。针对仿射条件流，文中推导了精确的经验最小化解，并识别出一种平滑插值机制，使得终端分布恰好为核混合估计量。研究揭示了经验流匹配中的多重偏差来源，包括目标分布替换带来的统计目标变化、经验最小化解可能不是梯度场，以及边际路径无法唯一确定粒子动力学等问题。

Comments 41 pages

2502.03672 2026-05-15 physics.comp-ph cs.LG cs.NA math.NA

Physically consistent predictive reduced-order modeling by enhancing Operator Inference with state constraints

Hyeonghun Kim, Boris Kramer

发表机构 * Department of Mechanical and Aerospace Engineering, University of California San Diego, CA, United States（机械与航空航天工程系，加州大学圣地亚哥分校，加州，美国）

AI总结本文提出了一种增强算子推断方法的新策略，通过在降阶模型中嵌入状态约束，以提高对复杂多物理系统（如焦炭燃烧）的预测稳定性与物理一致性。该方法引入基于关键性能指标的正则化超参数选择方式，并在实际应用中展示了其在稳定性、准确性和外推能力方面的优越性。

Comments 33 pages, 13 figures

2412.14291 2026-05-15 math.OC cs.LG stat.ML

Projected gradient methods for nonconvex and stochastic smooth optimization: new complexities and auto-conditioned stepsizes

Guanghui Lan, Tianjiao Li, Yangyang Xu

发表机构 * School of Industrial and Systems Engineering, Georgia Institute of Technology（工业与系统工程学院，佐治亚理工学院）； Department of Mathematical Sciences, Rensselaer Polytechnic Institute（数学科学系，伦塞拉尔理工学院）

AI总结本文提出了一类新的投影梯度（PG）方法，用于在凸紧集上最小化光滑但不一定凸的目标函数。研究引入了“自适应条件化”投影梯度（AC-PG）方法，在无需输入梯度的Lipschitz常数或进行线搜索的情况下，达到了与现有最佳方法相当的迭代复杂度。此外，文章将PG方法推广到随机优化场景，提出了随机投影梯度（SPG）和方差缩减随机梯度（VR-SPG）方法，并在不同Oracle设置下获得了新的复杂度界，同时为这些方法设计了自适应步长策略，保证了收敛性。

2304.03641 2026-05-15 math.OC cs.LG cs.NA math.NA

A Block Coordinate Descent Method for Nonsmooth Composite Optimization under Orthogonality Constraints

Ganzhao Yuan

发表机构 * Shenzhen University of Advanced Technology (SUAT)（深圳先进技术大学（SUAT））

AI总结本文研究了在正交约束下的非光滑复合优化问题，这类问题在统计学习和数据科学中有广泛应用，但因其目标函数非光滑且约束非凸，求解较为困难。作者提出了一种基于块坐标下降的新方法OBCD，每次迭代更新解矩阵的$k$行（$k \geq 2$），通过求解一个小规模的非光滑优化子问题实现。该方法具有计算高效、可行性强的特点，并在理论上证明了其更新方案的完备性及收敛性，实验结果表明该方法优于现有方法。

Comments Future versions of this paper can be found at arXiv:2304.03641

2012.14425 2026-05-15 cs.CR cs.LG

Vendor-Conditioned Contrastive Learning for Predicting Organizational Cyber Threat Targets

Benjamin M. Ampel

发表机构 * Department of Computer Science（计算机科学系）； Georgia State University（佐治亚州立大学）

AI总结该研究旨在识别网络攻击中针对的组织目标，提出了一种基于CySecBERT的对比学习框架TRACE，通过结合时间信息和供应商条件优化组织分类与表示学习，提升在时间分布偏移下的鲁棒性。研究利用涵盖九个漏洞数据库和黑客论坛的多源大规模语料库，构建了包含129,126个样本的七类组织数据集，在时间分布外测试中取得了97.00%的宏F1分数，显著优于多种经典机器学习和深度学习方法。

Comments 6 pages, 3 figures

2605.14960 2026-05-15 cs.GR cs.CG cs.CV

Meschers: Geometry Processing of Impossible Objects

Ana Dodik, Isabella Yu, Kartik Chandra, Jonathan Ragan-Kelley, Joshua Tenenbaum, Vincent Sitzmann, Justin Solomon

发表机构 * MIT CSAIL（麻省理工学院计算机科学与人工智能实验室）； MIT（麻省理工学院）

AI总结本文研究了如何用计算机准确表示“不可能物体”——一类在现实中无法存在但人类可以感知的几何构造。传统方法通过切割或弯曲深度轴来实现，但会导致局部几何变化或光照处理困难，影响后续图形处理。为此，作者提出了一种名为 Meschers 的网格表示方法，基于离散外微分几何理论，能够有效支持渲染、光照和距离计算等应用，并实现了对不可能物体的逆向渲染，优于传统方法。

Journal ref ACM Trans. Graph. 44, 4, Article 70 (August 2025)

2605.14941 2026-05-15 eess.SP cs.HC cs.LG

nASR: An End-to-End Trainable Neural Layer for Channel-Level EEG Artifact Subspace Reconstruction in Real-Time BCI

Shantanu Sarkar, Jose L. Contreras-Vidal

发表机构 * Doctoral Candidate of Electrical & Computer Engineering, Univ. of Houston（电气与计算机工程博士候选人，休斯顿大学）； Faculty of Electrical & Computer Engineering, Univ. of Houston（电气与计算机工程系，休斯顿大学）

AI总结该研究提出了一种端到端可训练的神经网络层nASR，用于实时脑机接口（BCI）中的通道级EEG伪影子空间重构。传统ASR方法依赖固定阈值参数，易影响有效神经信号，而nASR通过引入两个可学习的阈值参数，实现了伪影检测与后续解码的联合优化，有效提升了信号质量与解码性能。实验表明，nASR在分类准确率和推理速度上均优于传统方法，适用于对延迟和性能要求较高的实时BCI应用。

Comments Preprint. Submitted to IEEE SMC 2026 (under review)

2605.14939 2026-05-15 physics.plasm-ph cs.LG

Real-time virtual circuits for plasma shape control via neural network emulators

Alasdair Ross, George K. Holt, Kamran Pentland, Adriano Agnello, Nicola C. Amorisco, Pedro Cavestany, Aran Garrod, Timothy Nunn, Charles Vincent, Graham McArdle

发表机构 * STFC Hartree Centre, Sci-Tech Daresbury（STFC哈特ree中心，科技达尔斯伯里）； United Kingdom Atomic Energy Authority, Culham Campus（英国原子能局，库勒姆校园）

AI总结该研究旨在解决托卡马克等离子体形状控制中实时调节多个强耦合参数的问题，提出了一种基于神经网络的虚拟电路（VC）实时生成方法。通过构建包含一百多万个模拟Grad–Shafranov平衡态的数据库，研究开发了能够实时生成状态感知虚拟电路的神经网络模型，从而实现对等离子体形状参数的独立控制。该方法不仅提高了控制精度和鲁棒性，还为复杂等离子体场景下的实时控制提供了可扩展的解决方案。

2605.14883 2026-05-15 eess.SP cs.HC cs.LG

BCI-Based Assessment of Ocular Response Time Using Dynamic Time Warping Leveraging an RDWT-Driven Deep Neural Framework

Shantanu Sarkar, Sai Shashank Gandavarapu, Jeff Feng, Saurabh Prasad, Reza Khanbabaie, Jose L. Contreras-Vidal

发表机构 * Dept. of ECE, IUCRC BRAIN, Cullen College of Engineering University of Houston, Houston, USA ； Dept. of Data Science, Cullen College of Engineering University of Houston, Houston, USA ； Dept. of Industrial Design, IUCRC BRAIN, Gerald D.Hines College of Arch. \& Design University of Houston, Houston, USA ； Neurotechnology \& BCI Cognixion Inc. Toronto, Ontario, Canada

AI总结该研究提出了一种基于脑机接口（BCI）的方法，用于评估眼部反应时间，以辅助轻度脑外伤（mTBI）的早期诊断。研究结合了脑电图（EEG）与增强现实（AR）引导的前庭/眼动筛查（VOMS）任务，利用冗余离散小波变换（RDWT）驱动的深度神经网络框架处理EEG信号，并通过动态时间规整（DTW）计算眼部反应时间。实验结果表明，该方法在区分不同受试者的眼动行为方面具有显著效果，尤其在追踪任务中表现出良好的时间差异识别能力，为多模态mTBI评估提供了新的技术途径。

Comments Submitted to IEEE SMC 2026 (under review)

2605.14879 2026-05-15 cs.MA cs.GT cs.LG

Temporal Fair Division in Multi-Agent Systems: From Precise Alternation Metrics to Scalable Coordination Proxies

Nikolaos Al. Papadopoulos

发表机构 * University of Macedonia（希腊米科诺斯大学）

AI总结本文研究多智能体系统中时间维度上的公平分配问题，提出了一种新的度量方法——旋转周期性（RP），以及滑动窗口度量ALT，用于评估多智能体在重复资源竞争中的时间公平性。研究通过引入“完美交替”（PA）作为时间公平的典型解，将时间公平分解为旋转得分（RS）和等待期评估（WPE）两个子指标，显著提升了计算效率。实验表明，RP在保持高区分度的同时，相比ALT具有更高的计算效率，两者结合可为时间公平分配提供有效的诊断工具。

Comments 15 pages, 3 figures, 8 tables. Submitted to ACM Transactions on Economics and Computation, Special Issue on Fair Division

2605.14866 2026-05-15 cs.SE cs.AI

Towards In-Depth Root Cause Localization for Microservices with Multi-Agent Recursion-of-Thought

Lingzhe Zhang, Tong Jia, Kangjin Wang, Chiming Duan, Minghua He, Rongqian Wang, Xi Peng, Meiling Wang, Gong Zhang, Renhai Chen, Ying Li

发表机构 * Peking University（北京大学）； Huawei Theory Lab（华为理论实验室）

AI总结随着微服务系统因动态交互和运行环境变化而日益复杂，故障频率不断上升，准确的根因定位（RCL）对系统可靠性至关重要。现有基于传统机器学习和深度学习的方法在可解释性和跨部署迁移能力方面存在不足，而基于大语言模型（LLM）的方法虽有所改进，但仍面临上下文爆炸和串行推理结构导致的诊断效率与准确性问题。本文提出RCLAgent，一个基于多智能体递归思维的微服务根因定位框架，通过并行推理分解诊断过程，显著提升了定位精度和推理效率。

2605.14860 2026-05-15 math.OC cs.LG

A Non-Monotone Preconditioned Trust-Region Method for Neural Network Training

Andrea Angino, Bindi Çapriqi, Shega Likaj, Ken Trotti, Rolf Krause

发表机构 * UniDistance Suisse（UniDistance瑞士）； King Abdullah University of Science and Technology（卡布斯大学）； Università della Svizzera italiana（瑞士意大利大学）

AI总结本文提出了一种非单调预条件信任区域方法（NAPTS），用于大规模神经网络训练。该方法基于加性预条件信任区域策略（APTS），引入非单调接受准则和非线性加性施瓦茨预条件子，结合并行子域修正与全局粗空间方向，有效提升了训练效率。实验表明，NAPTS在保持精度的同时，将CPU时间减少了30%，并显著降低了被拒绝的迭代步数。

Comments 7 pages, 2 figures,

2605.14851 2026-05-15 cs.MA cs.AI

IFPV: An Integrated Multi-Agent Framework for Generative Operational Planning and High-Fidelity Plan Verification

Zhigao Huang, Zhengqing Hu, Dong Chen, Shaohan Zhang, Zhao Jin, Bo Zhang, Han Wu, Mingliang Xu

发表机构 * School of Computer and Artificial Intelligence, Zhengzhou University（郑州大学计算机与人工智能学院）； Engineering Research Center of Intelligent Swarm Systems, Ministry of Education（教育部智能群体系统工程研究中心）； National Supercomputing Center in Zhengzhou（郑州国家超算中心）； Henan Research Center for Large Model Technology（河南省大模型技术与新质软件工程研究中心）

AI总结本文提出了一种集成多智能体框架IFPV，用于生成作战计划并进行高保真度的计划验证。该框架包含两个紧密耦合的模块：多视角分层智能体MPHA用于生成作战行动序列，以及对抗认知仿真引擎ACSE用于高保真度的对抗验证。实验表明，IFPV在任务成功率和操作成本方面优于传统方法，验证模块也显著提升了对候选计划潜在漏洞的识别能力。

Comments Submitted to Neurocomputing

2605.14828 2026-05-15 stat.ML cs.LG stat.ME

K-Models: a Flexible and Interpretable Method for Ordinal Clustering with Application to Antigen-Antibody Interaction Profiles

Giulia Patanè, Alessandra Menafoglio, Alexander Krauth, Peter Fechner, Luca Dede', Bianca Maria Colosimo, Federica Nicolussi

发表机构 * MOX, Department of Mathematics, Politecnico di Milano（数学系，米兰理工学院MOX部门）； Department of Mechanical Engineering, Politecnico di Milano（机械工程系，米兰理工学院）

AI总结该研究提出了一种名为K-Models的新型聚类方法，用于处理具有序数关系的函数型数据，旨在在保证聚类性能的同时提升模型的可解释性。该方法通过引入序数约束，估计生成观测函数型数据的随机过程中的关键要素，从而更准确地识别数据的内在结构。研究通过仿真和实际应用（如抗原-抗体相互作用的反射传感器数据）验证了该方法的有效性，展示了其在具有潜在序数结构的数据分析中的优越性和实用性。

AI 大模型

视觉与机器人

科学与医疗