arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2605.12919 2026-05-14 cs.CV

GuardMarkGS: Unified Ownership Tracing and Edit Deterrence for 3D Gaussian Splatting

Utae Jeong, Jaewan Choi, Junseok Lee, Jongheon Jeong, Sang Ho Yoon, ByoungSoo Koh, Sangpil Kim

AI总结本文提出了一种名为 GuardMarkGS 的统一保护框架，旨在解决 3D Gaussian Splatting（3DGS）资产在版权归属追踪与防止未经授权编辑之间的双重风险。该方法结合了全局水印优化与对抗性编辑抑制策略，通过分离潜在特征、扰动编辑轨迹以及选择性增强对抗更新，实现了版权归属可追溯与编辑行为有效遏制的双重目标。实验表明，该框架在保持渲染质量的同时，有效平衡了水印准确性与编辑抑制效果。

Comments Preprint

2605.12918 2026-05-14 cs.CL

CommonWhy: A Dataset for Evaluating Entity-Based Causal Commonsense Reasoning in Large Language Models

Armin Toroghi, Faeze Moradi Kalarde, Scott Sanner

AI总结为了有效与现实世界交互，大型语言模型（LLMs）需要具备基于实体的常识推理能力，这要求模型将具体实体的事实知识与常识推理相结合。本文提出CommonWhy数据集，包含15,000个“为什么”问题，用于评估模型在因果关系上的常识推理能力，并作为知识图谱问答（KGQA）的基准，所有问题答案均可在Wikidata中找到。与现有KGQA数据集不同，CommonWhy重点考察因果推理而非单纯的事实检索，实验表明当前先进模型在该任务上仍存在事实幻觉和因果推理失败等问题。

2605.12917 2026-05-14 cs.CV cs.LG

Adaptive Conformal Prediction for Reliable and Explainable Medical Image Classification

One Octadion, Novanto Yudistira, Lailil Muflikhah

AI总结该研究针对医学图像分类中深度学习模型过度自信的问题，提出了一种自适应的置信度预测方法，以提高诊断的可靠性和可解释性。通过改进RAPS方法，引入自适应Lambda准则，有效控制预测集的覆盖偏差，确保在不同输入难度下均保持较高的覆盖性能。实验表明，该方法在多个医学图像数据集上实现了高覆盖率与小预测集大小的平衡，且具有良好的跨领域泛化能力，适用于对安全性要求高的医疗AI应用。

Comments To appear in IEA/AIE 2026 (Springer LNAI)

2605.12913 2026-05-14 cs.LG

Revisiting DAgger in the Era of LLM-Agents

Changhao Li, Rushi Qiang, Jiawei Huang, Chenxiao Gao, Chao Zhang, Niao He, Bo Dai

AI总结本文研究了在大语言模型代理（LLM-Agents）时代下如何改进长期任务的学习方法，针对现有监督微调和强化学习方法的不足，重新引入并改进了数据聚合（DAgger）算法。该方法通过在每一步骤中融合学生策略与教师策略生成轨迹，并利用教师提供的监督标签进行训练，从而有效缓解协变量偏移问题并提供丰富的反馈。实验表明，该方法在软件工程任务中显著提升了模型性能，优于现有主流方法。

2605.12904 2026-05-14 cs.LG

VIP-COP: Context Optimization for Tabular Foundation Models

Yilong Chen, Xueying Ding, Leman Akoglu

AI总结表格基础模型（TFMs）在结构化数据的上下文学习中表现出色，但其性能受到上下文长度限制的制约，难以处理超出预训练规模的数据。本文提出VIP-COP方法，通过评估训练样本和特征对预测的重要性，实现对上下文的优化选择，有效抑制噪声并聚焦关键信息。该方法具备高效、预算感知、模型无关、可解释且鲁棒等优势，在多个大规模高维任务中显著优于现有方法，为表格基础模型的测试时上下文优化树立了新的标杆。

2605.12897 2026-05-14 cs.RO

DynoJEPP: Joint Estimation, Prediction and Planning in Dynamic Environments

Mikolaj Kliniewski, Jesse Morris, Yiduo Wang, Ian R. Manchester, Viorela Ila

AI总结 DynoJEPP 是一个基于因子图的框架，旨在动态环境中联合优化状态估计、预测与路径规划。为了解决传统方法中预测和规划信息反馈导致估计污染和不安全行为的问题，DynoJEPP 引入了一种新型有向因子，以确保信息在因子图中的单向流动。实验表明，该方法对安全导航至关重要，而合作版 DynoJEPP 进一步支持机器人在预测和规划中融入协作对象的行为，提升了整体系统的鲁棒性与安全性。

2605.12894 2026-05-14 cs.AI cs.CL

Beyond Cooperative Simulators: Generating Realistic User Personas for Robust Evaluation of LLM Agents

Harshita Chopra, Kshitish Ghate, Aylin Caliskan, Tadayoshi Kohno, Chirag Shah, Natasha Jaques

AI总结该研究旨在解决大型语言模型（LLM）代理在面对真实用户多样化行为时表现不佳的问题，提出了一种名为Persona Policies（PPol）的可插拔控制层，用于生成具有真实行为特征的用户角色，从而提升代理的鲁棒性。通过将角色生成建模为基于LLM的进化程序搜索，该方法优化Python生成器以发现符合任务目标的行为模式，并生成多样化的用户角色。实验表明，PPol显著提升了用户模拟的真实性与代理任务成功率，为基于模拟器的评估和训练提供了新的有效方法。

Comments Preprint under review

2605.12882 2026-05-14 cs.CL cs.CV

CiteVQA: Benchmarking Evidence Attribution for Trustworthy Document Intelligence

Dongsheng Ma, Jiayu Li, Zhengren Wang, Yijie Wang, Jiahao Kong, Weijun Zeng, Jutao Xiao, Jie Yang, Wentao Zhang, Bin Wang, Conghui He

AI总结 CiteVQA 是一个用于评估可信文档智能的新型基准，旨在解决当前文档问答系统中忽视证据溯源的问题。该基准要求模型在回答问题的同时提供具体的引用区域，从而同时评估答案的正确性和引用的准确性。通过引入严格归因准确率（SAA）指标，CiteVQA 揭示了现有大型语言模型在答案正确但引用错误方面的普遍问题，为提升文档理解系统的可靠性提供了新的评估工具。

2605.12879 2026-05-14 cs.LG

ASAP: Amortized Doubly-Stochastic Attention via Sliced Dual Projection

Huy Tran, Max Milkert, David Hyde

AI总结本文提出了一种名为ASAP的新方法，用于高效实现双重随机注意力机制。该方法结合了Sinkhorn缩放的训练优势和切片双投影的推理优化，通过在训练阶段学习参数映射，在推理阶段用固定操作替代迭代缩放，从而显著提升计算效率。实验表明，ASAP在保持低成本训练的同时，在语言和视觉任务中表现出与现有方法相当甚至更优的性能。

2605.12876 2026-05-14 cs.LG

Certified Robustness under Heterogeneous Perturbations via Hybrid Randomized Smoothing

Blaise Delattre, Hengyu Wu, Paul Caillon, Wei Yang Bryan Lim, Yang Cao

AI总结该论文研究了在异构扰动下如何为多模态模型提供认证鲁棒性的问题，提出了一种统一的随机平滑框架，能够处理离散和连续混合输入的联合扰动。通过分析离散与连续噪声的联合似然排序，该方法得到了一个严格推广图像和文本单独扰动认证的闭式一维鲁棒性证书。该框架在多模态安全过滤任务中得到了验证，提供了首个针对文本-图像交互依赖场景下联合离散和连续扰动的模型无关的Neyman-Pearson认证。

Comments ICML 2026. Code: https://github.com/tdsai-lab/hybrid-randomized-smoothing

2605.12874 2026-05-14 cs.LG

Descriptive Collision in Sparse Autoencoder Auto-Interpretability: When One Explanation Describes Many Features

Jordan F. McCann

AI总结本文研究了稀疏自编码器（SAE）在语言模型解释性任务中的一种新问题——描述性碰撞，即多个不同的特征被赋予相同的自然语言解释。作者通过分析大量人工标注的SAE特征数据，发现同一解释常被重复使用，导致特征区分度下降。为此，他们提出了两个新的评估指标，用于修正现有方法对特征解释性的高估问题，从而提升自动解释性的准确性与可靠性。

Comments 11 pages, 2 figures, 3 tables

2605.12872 2026-05-14 cs.LG

SMA: Submodular Modality Aligner For Data Efficient Multimodal Learning

Truong Pham, Anay Majee, Rishabh Iyer

AI总结尽管多模态基础模型在近期取得了显著进展，但它们依赖大量配对数据，限制了其在数据稀缺场景下的应用。本文提出了一种基于子模态互信息的组合式对齐方法——SMA，通过将多组增强和描述视为集合，捕捉更丰富的跨模态结构，从而在有限数据下实现更有效的多模态对齐。实验表明，SMA在少样本分类和检索任务中表现出色，仅需数万样本即可达到强多模态泛化能力，显著优于传统方法。

2605.12855 2026-05-14 cs.CV

Prediction of Rectal Cancer Regrowth from Longitudinal Endoscopy

Jorge Tapias Gomez, Despoina Kanata, Aneesh Rangnekar, Christina Lee, Hannah Williams, Hannah Thompson, J. Joshua Smith, Francisco Sanchez-Vega, Mert R. Sabuncu, Julio Garcia-Aguilar, Harini Veeraraghavan

AI总结该研究提出了一种基于纵向内镜图像的深度学习方法TREX，用于预测接受“观察等待”治疗的直肠癌患者肿瘤的复发情况。TREX通过结合治疗后复查和随访期间的图像，利用双交叉注意力机制和预训练的Swin Transformer模型，在无需图像配准的情况下提取并融合特征，从而区分完全缓解与局部复发。实验表明，TREX在复发检测和早期预警方面均优于现有方法，并在临床验证中表现出与专业医生相当的诊断准确性。

Comments 14 Pages, 9 figures, 2 tables

2605.12852 2026-05-14 cs.LG q-bio.QM

Multitask Multimodal Fusion with Tabular Foundation Models for Peak and Durability Prediction of Pertussis Booster Response

Divya Sitani

AI总结该研究旨在同时预测百日咳加强疫苗接种后的免疫反应峰值和持续时间，这两个过程由不同的生物学机制驱动。研究提出了一种多任务多模态融合模型，结合冻结的TabPFN-v2编码器、双标签对比损失、缺失校准的模态丢弃和注意力融合机制，以应对数据模态异质性、缺失值和任务间关联弱的挑战。实验表明，该模型在两个预测任务上均优于传统方法，且结果与免疫学机制一致，揭示了不同模态对峰值和持续时间预测的特异性贡献。

Comments 22 pages, 8 figures, 4 tables. Code available at https://github.com/Divya1205/cmi-pb-multitask

详情

英文摘要

Pertussis booster vaccination produces immune responses that vary widely across individuals in both peak magnitude and long-term durability. These two phases are governed by partly distinct biological compartments:peak reflects acute B-cell activation and antibody secretion, while durability reflects the establishment of long-term humoral memory. Yet most computational models target only one, missing the full boost-and-wane trajectory. Jointly predicting both is non-trivial because the two endpoints are biologically dissociated rather than redundant; samples are small, modalities are heterogeneous with structured missingness, and the two tasks rely on different measurement windows. We propose a multi-task contrastive multimodal fusion architecture combining frozen TabPFN-v2 per-modality encoders, a dual-label supervised contrastive loss that treats two subjects as a positive pair if they agree on the Task 1 label or the Task 2 label, modality dropout calibrated to empirical missingness, and missingness-masked attention fusion. Applied to a curated subset of the CMI-PB pertussis booster dataset (n = 158 subjects, four modalities, 44.9% with at least one modality missing; Spearman r = -0.58 between peak and durability, n = 96), the model achieves test AUROC 0.797 (95% CI [0.621, 0.948]) for peak response and 0.755 (95% CI [0.519, 0.945]) for durability, with both significant under joint label permutation (N = 1000; p = 0.002 and p = 0.045). Across logistic regression, XGBoost, and MLP baselines on raw features and on TabPFN embeddings, the proposed model is the only one whose 95% CIs lie above chance on both tasks simultaneously. Per-modality contribution analyses recover task-specific modality contributions consistent with the underlying immunology: peak prediction is carried by cytokine signatures, while durability is carried by baseline antibody features.

URL PDF HTML ☆

赞 0 踩 0

2605.12851 2026-05-14 cs.CV cs.AI

PRISM: Perinuclear Ring-based Image Segmentation Method for Acute Lymphoblastic Leukemia Classification

Larissa Ferreira Rodrigues Moreira, Leonardo Gabriel Ferreira Rodrigues, Rodrigo Moreira, André Ricardo Backes

AI总结该研究针对急性淋巴细胞白血病（ALL）分类中外周血涂片图像分析的挑战，提出了一种基于核周环的图像分割方法PRISM。该方法通过围绕细胞核构建自适应同心区域，替代传统的细胞质轮廓分割，从而在无需精确细胞边界检测的情况下提取鲁棒的细胞质特征。实验表明，该方法结合传统分类器的校准集成，在分类准确率和AUC指标上均表现出色，分别达到98.46%和0.9937。

Comments Paper accepted for publication at the XXVI Simpósio Brasileiro de Computação Aplicada à Saúde (SBCAS 2026), Ouro Preto, MG, Brazil

2605.12845 2026-05-14 cs.CV cs.AI

AssemblyBench: Physics-Aware Assembly of Complex Industrial Objects

Danrui Li, Jiahao Zhang, Bernhard Egger, Moitreya Chatterjee, Suhas Lohit, Tim K. Marks, Anoop Cherian

AI总结本文提出AssemblyBench，一个包含2,789个工业对象的合成数据集，包含多模态装配说明、对应的3D部件模型及装配轨迹，旨在解决工业装配中复杂形状和装配路径的问题。研究还提出基于Transformer的模型AssemblyDyno，能够联合预测装配顺序和部件轨迹，相比现有方法在装配姿态估计和轨迹可行性方面表现更优，其中轨迹可行性通过物理仿真进行评估。

Comments Accepted at CVPR 2026

2605.12843 2026-05-14 cs.LG cs.AI

Bayesian Model Merging

Kaiyang Li, Shaobo Han, Qing Su, Shihao Ji

AI总结本文提出了一种名为Bayesian Model Merging（BMM）的模型合并方法，旨在在无需联合重训练的情况下将多个任务专家模型合并为一个统一模型。该方法采用了一种双层优化框架，内层基于锚定模型的强先验进行激活驱动的贝叶斯回归，得到高效的闭式解；外层则通过贝叶斯优化全局搜索各模块的超参数。此外，BMM还揭示了激活统计量与任务向量之间的关键对齐关系，从而实现了无需辅助数据的无数据变体。实验表明，BMM在多个基准测试中均优于现有方法，尤其在多任务视觉与语言任务中表现出色。

2605.12838 2026-05-14 cs.AI

Multimodal Hidden Markov Models for Persistent Emotional State Tracking

Anamika Ragu, Aneesh Jonelagadda

AI总结本文提出了一种基于多模态情感表示的轻量级隐马尔可夫模型框架，用于追踪对话中持续的情感状态变化。该方法利用粘性因子HDP-HMM对来自视频、音频和文本的多模态情感特征进行建模，能够更准确地捕捉对话中长期的情感阶段。实验表明，该模型在计算成本远低于基于大语言模型的方法的前提下，能够生成更具可解释性的情感序列，并在临床数据集上验证了其在情感阶段恢复和提升对话质量方面的有效性。

Comments 8 pages, 2 figures

2605.12835 2026-05-14 cs.AI

PROMETHEUS: Automating Deep Causal Research Integrating Text, Data and Models

Sridhar Mahadevan

AI总结 PROMETHEUS 是一个将文本、数据和模型整合为因果地图的框架，旨在自动化深度因果研究。该方法通过构建局部因果预测状态模型的集合，形成可导航的因果图谱，支持对不同区域的因果声明进行比较与整合。研究展示了该框架在多个实际案例中的应用，包括从文献中提取因果关系以及基于原始数据进行反事实验证，显著提升了因果推理的系统性和可解释性。

Comments 27 pages

2605.12831 2026-05-14 cs.LG

Quantifying Potential Observation Missingness in Inverse Reinforcement Learning

Leo Benac, Abhishek Sharma, Alihan Huyuk, Finale Doshi-Velez

AI总结逆强化学习（IRL）通过示范数据推断奖励函数，是建模和理解决策行为的重要工具。然而，现实中的行为数据可能存在未被记录的观测信息，导致专家行为看似次优，从而影响奖励函数的学习。本文提出了一种方法，用于量化专家行为在缺失观测情况下的潜在最优性，并开发了相应的算法，通过多个实验验证其在导航任务、癌症治疗模拟和ICU治疗数据中的有效性。

2605.12826 2026-05-14 cs.CV cs.AI

FRAME: Forensic Routing and Adaptive Multi-path Evidence Fusion for Image Manipulation Detection

Kaixiang Zhao, Tianrun Yu, Aoxu Zhang, Junhao Su, Porter Jenkins, Amanda Hughes

AI总结随着图像编辑工具和生成式人工智能的普及，数字图像的真实性验证变得愈发困难。为了解决现有方法在鲁棒性、证据碎片化和泛化能力方面的不足，本文提出了一种名为FRAME的新方法，通过多路径分析空间组织多种取证算法，自适应选择适合的取证路径并融合互补证据，从而提升检测与定位性能。FRAME在保持多源取证线索可解释性的基础上，提供了更稳健且灵活的图像取证方案，并在多种篡改场景中展现出良好的效果。

Comments Accepted to CVPR 2026 SAFE Workshop

2605.12823 2026-05-14 cs.LG physics.chem-ph physics.comp-ph q-bio.BM

Hessian Matching for Machine-Learned Coarse-Grained Molecular Dynamics

Sanya Murdeshwar, Sanjit Shashi, Kevin Bachelor, William Noid, Ashwin Lokapally, Razvan Marinescu

AI总结该研究提出了一种基于Hessian向量积匹配的机器学习粗粒化分子动力学方法，旨在提升粗粒化势能函数对自由能曲率的建模能力。通过引入随机探针向量，该方法在不显式构造Hessian矩阵的情况下，将二阶曲率信息融入粗粒化势能函数中，从而提高了模拟的准确性。实验表明，该方法在多个蛋白质体系中显著优于传统的梯度匹配方法，尤其在慢模动力学指标上表现出更优的性能。

Comments 15 pages, 4 figures, 1 table

2605.12817 2026-05-14 cs.LG cs.AI cs.CL

Training Large Language Models to Predict Clinical Events

Benjamin Turtel, Paul Wilczewski, Kris Skotheim

AI总结该研究旨在利用纵向临床记录训练大型语言模型以预测临床事件。通过将时间顺序的MIMIC-III病历转化为包含过去病史、未来事件问题及后续记录标签的预测示例，构建了涵盖药物、手术、器官支持、微生物学和死亡率等多方面的预测数据集。研究采用LoRA微调方法显著提升了模型的预测性能，并在无需人工设计结构特征或专用分类器的情况下实现了对临床预测的可复用监督学习。

2605.12816 2026-05-14 cs.LG

AGOP as Explanation: From Feature Learning to Per-Sample Attribution in Image Classifiers

Raj Kiran Gupta Katakam

AI总结本文研究了平均梯度外积（AGOP）在神经网络特征学习中的作用，并探索其作为图像分类器中单样本解释方法的潜力。提出了一种新的归因方法AGOP-Weighted，结合了训练分布先验以提升像素重要性识别的准确性，并引入了两种变体AGOP-Local和AGOP-Global。实验表明，该方法在多个基准上显著优于现有归因方法，尤其在计算效率和小分辨率图像处理方面表现突出。

Comments 8 pages. Accepted at the 4th World Conference on eXplainable Artificial Intelligence (XAI 2026), Late-Breaking Work track, Fortaleza, Brazil, July 1-3, 2026

详情

英文摘要

The Average Gradient Outer Product (AGOP) governs feature learning in neural networks: the Neural Feature Ansatz states that weight Gram matrices at each layer align with the corresponding AGOP matrices computed over the training distribution. We ask a complementary question: can this same quantity serve as a post-hoc attribution method for explaining individual predictions? We introduce AGOP-Weighted: a novel attribution method that multiplies the per-sample gradient by sqrt(diag(M) / max diag(M)), a training-distribution prior that suppresses gradient noise and amplifies consistently important pixels -- a combination not present in any prior attribution method. We formalise two companion variants -- AGOP-Local (per-sample gradient, equivalent to VanillaGrad) and AGOP-Global (diag(M) directly as a zero-cost saliency map) -- and implement an efficient training-time accumulation hook; AGOP-Global then requires zero inference cost (disk lookup) while AGOP-Weighted requires only a single gradient pass. We conduct the first rigorous comparison of AGOP attribution against Integrated Gradients (IG), SmoothGrad, GradCAM, and VanillaGrad across two benchmarks with pixel-level ground truth: (i) the synthetic XAI-TRIS benchmark (four classification scenarios, 8x8 images, CNN8by8) and (ii) the photorealistic CLEVR-XAI benchmark (ResNet-18 fine-tuned from ImageNet). AGOP-Weighted achieves 44% higher mIoU than IG on linear tasks; AGOP-Global achieves 7x higher mIoU than IG on multiplicative tasks (where IG falls below random) at zero inference cost. Both findings generalise to ResNet-18 on CLEVR-XAI (+18% and +37% respectively). We further show that GradCAM fails on small-resolution images due to spatial resolution collapse, and that diag(M) quality improves monotonically throughout training even after classification accuracy has plateaued.

URL PDF HTML ☆

赞 0 踩 0

2605.12809 2026-05-14 cs.LG cs.AI

Correcting Influence: Unboxing LLM Outputs with Orthogonal Latent Spaces

Shixing Yu, Promit Ghosal, Kyra Gan

AI总结该研究旨在提高大语言模型在医疗等关键领域中的可靠性，通过识别模型预测所依赖的训练数据中的具体 token。为解决现有方法在 token 独立性假设和分解性上的局限，作者提出了一种基于正交潜在空间的框架，利用稀疏自编码器学习近似独立的潜在特征，并通过雅可比向量积和逆 Hessian 近似实现 token 级别的影响分析。实验表明，该方法能有效识别出稀疏且可解释的 token 集合，有助于增强模型可信度和决策透明性。

2605.12805 2026-05-14 cs.LG cs.AI

Discrete MeanFlow: One-Step Generation via Conditional Transition Kernels

Fairoz Nower Khan, Nabuat Zaman Nahim, Md Sajid Ahmed, Ruiquan Huang, Peizhong Ju

AI总结该论文提出了一种名为 Discrete MeanFlow 的新方法，用于在离散状态空间中实现一步生成。与连续空间中的 MeanFlow 不同，它通过连续时间马尔可夫链的条件转移核来建模概率质量的转移，并定义了一个平均离散速率来衡量转移概率在时间区间内的变化。该方法通过边界构建设计直接参数化转移核，确保生成过程无需迭代去噪或微分方程求解，只需一次前向传播和分类采样即可完成生成，实验表明其在有限状态马尔可夫链和合成序列生成任务中具有高精度。

2605.12803 2026-05-14 cs.LG

Pitfalls of Unlabeled Disagreement-Based Drift Detection in Streaming Tree Ensembles

Lara Sá Neves, Afonso Lourenço, Lizy K. John, Goreti Marreiros

AI总结本文研究了在未标记数据流中基于分歧的漂移检测方法在增量决策树集成中的应用问题。作者通过构造批次特定的分歧度量并进行实验，发现该方法在多层感知机集成中表现良好，但在增量决策树集成中却显著劣于基于损失的检测方法。研究认为，这是由于增量决策树结构扩张为主的特性限制了模型的适应性，使得分歧无法准确反映其学习潜力。文章指出，利用增量决策树的规则分解特性进行重构，可能为提升其适应性提供新方向。

Comments Published as a conference paper at CAO Workshop at ICLR 2026

2605.12798 2026-05-14 cs.LG cs.AI cs.CL

Emergent and Subliminal Misalignment Through the Lens of Data-Mediated Transfer

Baris Askin, Muhammed Ustaomeroglu, Anupam Nayak, Gauri Joshi, Guannan Qu, Carlee Joe-Wong

AI总结该研究探讨了在有限有害数据集上微调大语言模型时可能引发的“涌现性对齐偏差”（EM）和“潜意识学习”（SL）现象。研究认为，这类偏差并非由单一有害示例引起，而是数据结构、任务难度与模型能力之间相互作用的结果。通过实验发现，当微调与评估提示具有相似功能结构、存在更多连贯有害补全空间，或目标行为已被模型可靠学习时，偏差更容易出现。研究还首次对比了在策略外与策略内蒸馏下偏差的传递机制，强调应从数据和训练流程的整体视角理解对齐偏差的成因。

2605.12792 2026-05-14 cs.LG

SoK: A Comprehensive Analysis of the Current Status of Neural Tangent Generalization Attacks with Research Directions

Thushari Hapuarachchi, Kaiqi Xiong

AI总结本文对神经切线泛化攻击（NTGA）的现状进行了全面分析，并指出了其优缺点及改进方向。NTGA是首个在黑盒环境下实现的干净标签泛化攻击，用于应对深度神经网络训练中使用未经授权数据的问题。研究通过实验验证了NTGA在对抗训练和图像变换下的脆弱性，并发现近期提出的其他干净标签攻击在数据保护效果上已超越NTGA，从而揭示了进一步研究NTGA的必要性。

2605.12790 2026-05-14 cs.RO

Few-Shot Physics-Informed Neural Network for Shape Reconstruction of Concentric-Tube Robots

Navid Feizi, Filipe C. Pedrosa, Rajni V. Patel, Jagadeesan Jayender

AI总结本文提出了一种基于物理信息的神经网络（PINN），用于具有三个预弯曲管的六自由度同心管机器人（CTR）的运动学建模。该方法将科瑟拉杆的微分方程嵌入神经网络，并通过少量观测数据进行训练，实现了对机器人形状、扭转角、扭矩、弯曲力矩和姿态的完整状态估计。实验表明，该模型在形状误差方面优于纯物理模型，且计算效率高，适用于实时控制。

Comments to be published in 2026 IEEE International Conference on Robotics & Automation proceedings