arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2604.11674 2026-05-12 cs.RO cs.AI

AffordSim: A Scalable Data Generator and Benchmark for Affordance-Aware Robotic Manipulation

Mingyang Li, Haofan Xu, Haowen Sun, Xinzhe Chen, Sihua Ren, Liqi Huang, Xinyang Sui, Chenyang Miao, Jiawei Ye, Qiongjie Cui, Zeyang Liu, Xingyu Chen, Xuguang Lan

AI总结 AffordSim 是一个可扩展的数据生成器和基准平台，旨在提升机器人对物体功能区域的感知能力，以实现更精准的操控任务。该方法结合开放词汇的3D功能预测，根据自然语言任务描述生成场景、定位功能区域并生成对应的抓取动作，从而提高任务执行的成功率。AffordSim 在多种机器人平台和复杂物体上进行了验证，表现出优异的模拟到现实的迁移能力，并在多个关键任务中取得了接近人工标注数据的性能。

2604.08577 2026-05-12 cs.LG cs.AI

Distributionally Robust Token Optimization in RLHF

Yeping Jin, Jiaming Hu, Ioannis Ch. Paschalidis

AI总结该研究针对大语言模型在面对细微输入变化时可能出现的性能下降问题，提出了一种分布鲁棒的标记优化方法（DRTO）。该方法结合了基于人类反馈的强化学习（RLHF）与分布鲁棒优化（DRO），通过构建f-散度模糊集来增强模型对困难响应片段的学习。实验表明，DRTO在多个推理任务中显著提升了模型在分布偏移下的表现，优于传统方法。

2604.07098 2026-05-12 cs.LG cs.CL

Selective Neuron Amplification in Transformer Language Models

Ryyan Akhtar, Payal Pahwa, Monika Arora

AI总结本文研究了大型语言模型在看似理解的任务上仍可能出现失败的问题，发现这主要不是因为知识缺失，而是模型内部某些电路在推理时未被充分激活。为此，作者提出了选择性神经元增强（Selective Neuron Amplification，SNA）方法，通过在推理时增强与任务相关的神经元活动，而无需修改模型参数。该方法在模型不确定时效果显著，表明部分模型失败是由于激活不足而非能力不足。

Comments 11 pages, 3 figures. Preprint. Code and experiments conducted independently

2604.06720 2026-05-12 cs.CV

Exploring 6D Object Pose Estimation with Deformation

Zhiqiang Liu, Rui Song, Duanmu Chuangqi, Jiaojiao Li, David Ferstl, Yinlin Hu

AI总结本文提出DeSOPE，一个用于6自由度（6DoF）变形物体位姿估计的大规模数据集。传统6D位姿估计方法通常假设物体为刚性或可变形的关节结构，但在实际应用中，物体因磨损、碰撞或形变而偏离标准形状，导致方法失效。为此，DeSOPE包含26类常见物体在标准形态和三种变形状态下的高精度3D扫描数据，并配有133K帧的RGB-D图像和665K个位姿标注，为研究变形物体的位姿估计提供了重要资源。

Comments Accepted at CVPR 2026

2604.04306 2026-05-12 cs.CV cs.AI

HighFM: Towards a Foundation Model for Learning Representations from High-Frequency Earth Observation Data

Stella Girtsou, Konstantinos Alexis, Giorgos Giannopoulos, Charalambos Kontoes

AI总结随着气候相关灾害频发，实时监测和预警需求日益迫切。本文提出 HighFM，一种面向高时间分辨率多光谱遥感数据的基座模型，通过利用超过 2TB 的 SEVIRI 卫星影像，改进了掩码自编码框架以学习稳健的时空表征，并在云检测和火灾识别任务中取得了优于传统方法和近期地理空间基座模型的性能，展示了地静止卫星数据在实时遥感应用中的巨大潜力。

2603.28902 2026-05-12 cs.AI

ChartDiff: A Large-Scale Benchmark for Comprehending Pairs of Charts

Rongtian Ye

AI总结 ChartDiff 是首个大规模跨图表对比理解基准，旨在解决现有图表理解任务中缺乏多图表比较分析的问题。该基准包含 8,541 对来自不同数据源、图表类型和视觉风格的图表，每对图表均配有由大语言模型生成并经人工验证的摘要，描述趋势、波动和异常等差异。研究评估了通用模型、图表专用模型和流水线方法的性能，发现通用模型在生成质量上表现最佳，而专用模型和流水线方法虽在 ROUGE 分数上较高，但在人工评估中表现较差，揭示了词句重叠与实际摘要质量之间的不匹配。

Comments 21 pages, 17 figures, accepted to ACL 2026: the 4th Workshop on Advances in Language and Vision Research

2603.26680 2026-05-12 cs.CL cs.AI

AlpsBench: An LLM Personalization Benchmark for Real-Dialogue Memorization and Preference Alignment

Jianfei Xiao, Xiang Yu, Chengbing Wang, Wuqiang Zheng, Xinyu Lin, Kaining Liu, Hongxun Ding, Yang Zhang, Wenjie Wang, Fuli Feng, Xiangnan He

AI总结随着大语言模型（LLMs）逐渐演变为终身AI助手，模型个性化成为关键研究方向。然而，目前缺乏一个标准的评估基准来推动这一领域的发展。为此，本文提出AlpsBench，一个基于真实人机对话构建的LLM个性化评估基准，包含2500个长期交互序列和人工验证的结构化记忆数据，用于评估个性化信息的提取、更新、检索与应用等核心任务，揭示了当前模型在个性化处理方面存在的多项挑战，并为未来研究提供了全面的评估框架。

2603.21901 2026-05-12 cs.CV

CLEAR: Context-Aware Learning with End-to-End Mask-Free Inference for Adaptive Video Subtitle Removal

Qingdong He, Chaoyi Wang, Peng Tang, Yifan Yang, Xiaobin Hu

AI总结 CLEAR 是一种无需掩码的端到端视频字幕去除框架，旨在在保持时间一致性的同时区分字幕与背景内容。该方法采用两阶段设计，第一阶段通过自监督正交约束学习解耦的字幕表示，第二阶段利用LoRA参数微调和生成反馈机制进行动态上下文调整，从而实现无需真实掩码的自适应推理。CLEAR 在参数效率和跨语言泛化能力方面表现优异，仅需基础扩散模型0.77%的参数即可在多个中文字幕数据集上超越依赖掩码的基线方法，并在六种语言中展现出强大的零样本泛化能力。

Comments Accepted by ICML 2026 (Spotlight)

2603.18256 2026-05-12 cs.LG cs.AI

MolRGen: A Training and Evaluation Setting for De Novo Molecular Generation with Reasonning Models

Philippe Formont, Maxime Darrin, Ismail Ben Ayed, Pablo Piantanida

AI总结 MolRGen 是一个用于从头生成分子的训练与评估框架，旨在解决基于推理的大语言模型在分子生成任务中缺乏有效奖励机制的问题。该框架包含约4,500个蛋白口袋目标，生成5万个结合对接评分与分子性质的多目标优化提示，并通过实时计算奖励来评估模型生成的分子质量。研究引入了多样性感知的Top-k指标，并利用验证器对大型语言模型进行微调，展示了其在分子设计中提升性能的潜力。

2603.16964 2026-05-12 cs.CV cs.LG

Behavior-Centric Extraction of Scenarios from Highway Traffic Data and their Domain-Knowledge-Guided Clustering using CVQ-VAE

Niklas Roßberg, Sinan Hasirlioglu, Mohamed Essayed Bouzouraa, Wolfgang Utschick, Michael Botsch

AI总结该研究旨在从高速公路交通数据中标准化提取场景，并基于领域知识进行聚类，以支持自动驾驶系统的行为评估。研究提出了一种基于“场景即规范”概念的场景提取方法，并结合CVQ-VAE模型实现领域知识引导的聚类过程，提升了场景分类的可解释性和一致性。实验表明，该方法能够可靠地从真实数据中提取场景，并有效融合领域知识，为自动驾驶系统的验证提供了更高效和标准化的场景分类框架。

Comments Accepted as a conference paper in IEEE Intelligent Vehicles Symposium (IV) 2026, Detroit, MI, United States

2603.16593 2026-05-12 cs.RO

Scalable Inspection Planning via Flow-based Mixed Integer Linear Programming

Adir Morgan, Kiril Solovey, Oren Salzman

AI总结本文研究了机器人在给定兴趣点（POIs）集合中进行检测的路径规划问题，旨在找到最短的机器人路径以完成检测任务。为了解决该问题的复杂性，作者提出了一种基于网络流的混合整数线性规划（MILP）方法，将核心约束条件转化为网络流模型，并设计了专用的分支定界求解器，从而显著提升了求解效率和解的质量。实验表明，该方法在大规模场景下表现出优越的可扩展性，并大幅缩小了最优解的差距。

2603.12275 2026-05-12 cs.CL cs.LG

GONE: Structural Knowledge Unlearning via Neighborhood-Expanded Distribution Shaping

Chahana Dahal, Ashutosh Balasubramaniam, Zuobin Xiong

AI总结本文提出GONE，一个用于评估大语言模型中结构化知识遗忘能力的基准，旨在解决现有方法在处理关系型、多跳推理知识时的不足。该研究引入了基于知识图谱的基准和一种名为NEDS的新框架，通过利用图结构中的邻居信息来精确控制遗忘事实与语义邻域之间的边界，有效提升了知识遗忘的效果与局部性。实验表明，NEDS在多个基准上表现出色，具有较高的遗忘效率和局部保持能力。

2603.11969 2026-05-12 cs.CV

AstroSplat: Physics-Based Gaussian Splatting for Rendering and Reconstruction of Small Celestial Bodies

Jennifer Nolan, Travis Driver, John Christian

AI总结本文提出了一种基于物理的高斯点绘（Gaussian Splatting）框架AstroSplat，用于小天体（如小行星）表面的渲染与重建。该方法引入行星反射模型，显式建模表面材质属性与光照交互，克服了传统基于球谐函数的外观参数化方法在物理特性表达上的不足。实验表明，AstroSplat在NASA“黎明”任务的真实图像上表现出更优的渲染效果和表面重建精度。

Comments 10 pages, 6 figures, conference

2603.11566 2026-05-12 cs.CV

R4Det: 4D Radar-Camera Fusion for High-Performance 3D Object Detection

Zhongyu Xia, Yousen Tang, Yongtao Wang, Zhifeng Wang, Weijun Qin

AI总结本文提出了一种名为R4Det的4D雷达-相机融合方法，用于提升自动驾驶中的3D目标检测性能。针对现有方法在深度估计、时序融合和小目标检测方面的不足，R4Det引入全景深度融合模块增强深度估计精度，设计无需依赖车辆姿态的可变形门控时序融合模块，并构建实例引导的动态细化模块以提升小目标检测能力。实验表明，R4Det在TJ4DRadSet和VoD数据集上取得了最先进的3D检测效果。

Comments Accepted to CVPR 2026

2603.10165 2026-05-12 cs.CL cs.AI cs.CV cs.LG

OpenClaw-RL: Train Any Agent Simply by Talking

Yinjie Wang, Xuyang Chen, Xiaolong Jin, Mengdi Wang, Ling Yang

AI总结 OpenClaw-RL 是一种创新的强化学习框架，通过利用用户反馈、工具输出和界面状态变化等“下一步状态”信号，实现对智能体的在线优化。该框架在基础设施上采用服务器-客户端架构，分离信号提取与策略优化过程，提升训练效率；在方法上提出混合强化学习目标，结合稀疏但精细的指令信号和广泛可用的评估信号，提升学习稳定性。研究展示了 OpenClaw-RL 在个性化代理和通用代理任务中的广泛应用，特别是在长期任务中表现出色。

Comments Code: https://github.com/Gen-Verse/OpenClaw-RL

2603.10126 2026-05-12 cs.RO cs.AI

AR-VLA: True Autoregressive Action Expert for Vision-Language-Action Models

Yutong Hu, Jan-Nico Zaech, Nikolay Nikolov, Yuanqi Yao, Sombit Dey, Giuliano Albanese, Renaud Detry, Luc Van Gool, Danda Paudel

AI总结本文提出了一种独立的自回归（AR）动作专家AR-VLA，它能够在可刷新的视觉-语言前缀条件下，生成连续的因果动作序列。与现有视觉-语言-动作（VLA）模型和扩散策略不同，该动作专家通过长时记忆保持自身历史信息，具备内在的上下文感知能力，有效解决了快速控制与慢速推理之间的频率不匹配问题。实验表明，AR-VLA在保持或超越现有反应式VLA任务成功率的同时，展现出更强的历史感知能力和更平滑的动作轨迹，为训练高效机器人策略提供了可扩展的结构基础。

Comments RSS 2026 accepted

2603.09970 2026-05-12 cs.CL

CREATE: Testing LLMs for Associative Creativity

Manya Wadhwa, Tiasa Singha Roy, Harvey Lederman, Junyi Jessy Li, Greg Durrett

AI总结 CREATE 是一个用于评估大语言模型关联创造力能力的基准测试。该任务要求模型生成连接概念的路径，路径需具备高特异性和多样性，模型生成的路径越多且质量越高，得分越高。研究发现，当前最先进的模型在创造性任务中表现更优，但因搜索空间庞大，基准测试难以饱和，且思维模型在高token预算下也不一定更具优势。CREATE 为提升模型关联创造力提供了实验平台。

2603.09465 2026-05-12 cs.CV cs.AI

EvoDriveVLA: Evolving Driving VLA Models via Collaborative Perception-Planning Distillation

Jiajun Cao, Xiaoan Zhang, Xiaobao Wei, Liyuqiu Huang, Zijian Wang, Hanzhen Zhang, Zhengyu Jia, Wei Mao, Hao Wang, Xianming Liu, Shuchang Zhou, Yang Wang, Shanghang Zhang

AI总结本文提出了一种名为EvoDriveVLA的协作感知-规划蒸馏框架，旨在解决视觉语言动作模型在自动驾驶中解冻视觉编码器后感知性能下降以及长期规划不稳定的问题。该方法结合了自锚定感知约束和未来感知轨迹优化，通过自锚定教师模型引导学生模型关注关键区域，并利用未来感知的引导教师进行轨迹优化与不确定性建模，从而提升模型的感知与规划能力。实验表明，EvoDriveVLA在nuScenes和NAVSIM数据集上均取得了优越的性能。

Comments 19 pages, 5 figures, 5 tables

2603.08588 2026-05-12 cs.LG cs.AI

Towards Batch-to-Streaming Deep Reinforcement Learning for Continuous Control

Riccardo De Monte, Matteo Cederle, Gian Antonio Susto

AI总结本文研究了如何将现有的批量深度强化学习方法适配到流式处理场景中，以满足资源受限硬件的需求。作者提出了两种新型流式深度强化学习算法——S2AC和SDAC，它们在保持与先进批量RL方法兼容的同时，能够在标准基准上达到与现有流式方法相当的性能，且无需繁琐的超参数调整。研究还探讨了从批量到流式的过渡问题，并提出了一种有效保持预训练策略性能的方法。

2603.08065 2026-05-12 cs.LG cs.CL

Deterministic Differentiable Structured Pruning for Large Language Models

Weiyu Huang, Pengle Zhang, Xiaolu Zhang, Jun Zhou, Jun Zhu, Jianfei Chen

AI总结该研究提出了一种确定性可微分结构化剪枝方法（DDP），用于降低大语言模型的推理成本。与以往依赖随机硬混凝土松弛的方法不同，DDP 直接优化离散 l0 目标的确定性软替代目标，消除了随机性，从而减少训练与测试间的不匹配并加快收敛。实验表明，该方法在多个密集和 MoE 模型上实现了接近原模型的性能，且在 20% 稀疏度下优于现有方法，并在实际部署中显著提升了推理速度。

Comments Published at ICML26;

2603.04783 2026-05-12 cs.AI cs.CL

Breaking Contextual Inertia: Reinforcement Learning with Single-Turn Anchors for Stable Multi-Turn Interaction

Xingwu Chen, Zhanqiu Zhang, Yiwen Guo, Difan Zou

AI总结尽管大型语言模型在单轮对话中表现出强大的推理能力，但在多轮交互中却容易因信息逐步揭示或需要更新而出现性能下降，其根本原因是“上下文惯性”——模型倾向于固守先前的推理路径，忽视后续输入的修正信息。为此，研究提出了一种基于单轮锚点的强化学习方法RLSTA，利用模型在单轮任务中的优势作为稳定参考点，引导其在多轮交互中动态调整推理过程，从而打破上下文惯性。实验表明，RLSTA在多个领域均表现出优越的性能和良好的泛化能力，无需外部验证即可实现稳定有效的多轮对话。

2603.03756 2026-05-12 cs.LG cs.CE cs.CL

MOOSE-Star: Unlocking Tractable Training for Scientific Discovery by Breaking the Complexity Barrier

Zonglin Yang, Lidong Bing

AI总结尽管大型语言模型在科学发现中展现出潜力，但现有研究多关注推理或反馈驱动的训练，而未直接建模生成推理过程 $P(h|b)$。本文提出 MOOSE-Star 框架，通过分解子任务、动机引导的分层搜索和有界组合等方法，将训练复杂度从指数级降低到对数级，实现了 $P(h|b)$ 的可扩展训练。为支持该框架，研究者还发布了包含 108,717 篇分解论文的 TOMATO-Star 数据集，实验证明 MOOSE-Star 能够随着训练数据和推理预算持续扩展，而直接采样方法则受限于复杂度瓶颈。

Comments Accepted by ICML 2026

2603.03239 2026-05-12 cs.CV

COP-GEN: Latent Diffusion Transformer for Copernicus Earth Observation Data

Miguel Espinosa, Eva Gmelich Meijling, Valerio Marsocci, Elliot J. Crowley, Mikolaj Czerkawski

AI总结该研究提出了一种名为COP-GEN的多模态潜扩散变换器，用于生成Copernicus地球观测数据，能够建模不同传感器（如光学、雷达、高程和土地覆盖）在原生空间分辨率下的联合分布。通过将跨模态映射参数化为条件分布，COP-GEN实现了灵活的任意到任意条件生成，包括无需任务特异性再训练的零样本模态转换。实验表明，该模型在保持高峰值保真度的同时，能够生成多样且物理一致的观测结果，并在构建的基准数据集上展现出显著优于现有方法的生成能力。

详情

英文摘要

Earth observation applications increasingly rely on data from multiple sensors, including optical, radar, elevation, and land-cover. Relationships between modalities are fundamental for data integration but are inherently non-injective: identical conditioning information can correspond to multiple physically plausible observations, and should be parametrised as conditional distributions. Deterministic models, by contrast, collapse toward conditional means and fail to represent the uncertainty and variability required for tasks such as data completion and cross-sensor translation. We introduce COP-GEN, a multimodal latent diffusion transformer that models the joint distribution of heterogeneous EO modalities at their native spatial resolutions. By parameterising cross-modal mappings as conditional distributions, COP-GEN enables flexible any-to-any conditional generation, including zero-shot modality translation without task-specific retraining. Experiments show that COP-GEN generates diverse yet physically consistent realisations while maintaining strong peak fidelity across optical, radar, and elevation modalities. Qualitative and quantitative analyses demonstrate that the model captures meaningful cross-modal structure and adapts its output uncertainty as conditioning information increases. We release a stochastic benchmark built from multi-temporal Sentinel-2 observations that enables distribution-level comparison of generative EO models. On this benchmark, COP-GEN covers 90% of the real observation manifold and 63% of its per-band reflectance range, while the strongest competing method collapses to 2.8% and 18%, respectively. These results highlight the importance of stochastic generative modeling for EO and motivate evaluation protocols beyond single-reference, pointwise metrics. Website: https://miquel-espinosa.github.io/cop-gen

URL PDF HTML ☆

赞 0 踩 0

2603.01960 2026-05-12 cs.LG cs.AI

TiledAttention: a CUDA Tile SDPA Kernel for PyTorch

Taimur Khan

AI总结 TiledAttention 是一种用于 NVIDIA GPU 的缩放点积注意力（SDPA）前向计算算子，旨在加速 SDPA 相关研究。该方法基于 FlashAttention 的在线 softmax 形式，采用 cuTile/TileIR 实现策略，支持在 Python 层面对调度策略进行修改，从而实现高性能与高度可定制化的平衡。实验表明，TiledAttention 在标准 eager 注意力路径上实现了显著加速，并可直接集成到 PyTorch 工作流中，为注意力机制的高效研究提供了实用工具。

2603.00541 2026-05-12 cs.LG stat.ML

Spectral Condition for $μ$P under Width-Depth Scaling

Chenyu Zheng, Rongzhen Wang, Xinyu Zhang, Chongxuan Li

AI总结随着生成式基础模型在宽度和深度上同时扩展，稳定特征学习和可靠的超参数迁移面临挑战。本文提出了一种统一的谱域框架，用于在联合宽度-深度缩放下实现最大更新参数化（$μ$P），明确了权重及其每步更新的范数应如何随宽度和深度变化，并揭示了从单变换（$k=1$）到多变换（$k\geq 2$）的转变。该框架适用于多种优化器，实验表明其在GPT-2类语言模型中能实现稳定的特征学习和鲁棒的超参数迁移，优于传统参数化和$ k=1 $情况下的$ μ $P方法。

Comments 76 pages, 13 figures, 40 tables

2602.23928 2026-05-12 cs.CL

The Astonishing Ability of Large Language Models to Parse Jabberwockified Language

Gary Lupyan, Senyi Yang

AI总结本研究展示了大型语言模型在解析严重退化的英语文本方面具有惊人的能力。通过将内容词随机替换为无意义字符串生成的“Jabberwockified”文本，模型仍能恢复出接近原意的常规英语句子。这一结果表明，句法结构和封闭类词汇等线索对词义的约束远超以往认知，也为理解语言处理机制提供了重要启示。

Comments Submitted to the 2026 Annual Meeting of the Cognitive Science Society

2602.22953 2026-05-12 cs.AI

General Agent Evaluation

Elron Bandel, Asaf Yehudai, Lilach Eden, Yehoshua Sagron, Yotam Perlitz, Elad Venezian, Natalia Razinkov, Natan Ergas, Shlomit Shachor Ifergan, Segev Shlomov, Michal Jacovi, Leshem Choshen, Liat Ein-Dor, Yoav Katz, Michal Shmueli-Scheuer

AI总结该研究系统评估了通用智能体在不同协议和陌生环境中的性能，比较了工具调用、MCP、代码生成和CLI等多种智能体架构。研究提出了统一的协议和评估框架，构建了首个开放的通用智能体排行榜，涵盖多种基础模型和基准任务。实验发现，通用智能体无需领域定制即可适应不同任务，但架构选择对性能影响显著，且开源模型在通用性方面存在明显不足。

Comments Presented at the ICLR 2026 Workshop on Agents in the Wild

详情

英文摘要

General-purpose agents perform tasks in unfamiliar environments without domain-specific manual customization. Yet no study has systematically measured how agent architecture shapes performance across heterogeneous protocols and diverse unfamiliar environments. This is the first systematic study, comparing tool-calling, MCP, code-generation, and CLI agents on the same benchmarks with the same models. Two gaps blocked such a study: existing harnesses require per-benchmark wiring or fixed protocol classes (web for BrowserGym, CLI for Harbor), and benchmarks themselves expect human-authored prompts, context, and integration glue. To enable this study, we contribute (1) a unifying protocol that bridges existing benchmark and agent protocols; (2) an evaluation harness that surfaces any benchmark to any general-purpose agent and backbone model; and (3) the first Open General Agent Leaderboard of agent configurations, a full factorial over 5 agent architectures x 5 backbone LLMs (three closed-source, two open-weight) x 6 benchmarks spanning software engineering, customer service, deep research, and personal assistance. We find that (i) general agents adapt to every tested domain without per-domain customization; (ii) agent architecture choice swings results by up to 12pp within a single model, yet backbone model choice dominates overall performance; (iii) on 4 of 6 tested benchmarks, top general agents are indistinguishable from the leading heavily-customized domain-specific agents; (iv) open-weight models tested exhibit "generality sinks" absent from frontier closed-source models: they consistently collapse on specific agent architectures or benchmarks; (v) a behavioral failure analysis reveals architecture-distinctive error signatures that aggregate scoring cannot discriminate. Code, harness, leaderboard, and traces are at https://www.exgentic.ai.

URL PDF HTML ☆

赞 0 踩 0

2602.22611 2026-05-12 cs.LG

Mitigating Membership Inference in Intermediate Representations with Differentially Private Training

Jiayang Meng, Tao Huang, Chen Hou, Guolong Zheng, Hong Chen

AI总结在嵌入式接口（EaaI）场景中，预训练模型被用于生成中间表示（IRs），这些表示可能泄露训练数据成员信息，从而被用于成员推理攻击（MIA）。本文提出了一种基于差分隐私的分层训练方法LM-DP-SGD，通过分析各层的MIA风险，动态调整隐私保护强度，从而在保证模型效用的同时更有效地缓解中间表示中的成员推理问题。实验表明，该方法在相同隐私预算下能够显著降低IR级别的MIA风险，实现了更优的隐私与效用平衡。

2602.21307 2026-05-12 cs.LG

SymTorch: Symbolic Distillation of Neural Networks

Elizabeth S. Z. Tan, Adil Soubki, Miles Cranmer

AI总结本文提出了一种名为 SymTorch 的符号蒸馏方法，旨在揭示神经网络组件所学习的数学函数，并将其表示为可解释的闭式表达式。该方法基于 PySR 实现，适用于多种网络架构，并成功应用于物理定律的自动发现、模型解释性提升以及提升神经网络效率等方面。研究展示了 SymTorch 在符号回归、模型解释和资源优化中的广泛适用性与优越性能。

2602.18866 2026-05-12 cs.LG stat.ML

$(α,β)$-Stability for Boosting Vector-Valued Prediction

Jian Qian, Shu Ge

AI总结本文研究了向量值预测中的提升（boosting）方法，提出了基于几何中位数的$(α,β)$-稳定性概念，用于分析聚合过程如何将弱预测器的性能提升为强预测器。作者在多种自然散度度量下刻画了该稳定性性质，并基于此提出了一种通用的提升框架\geomedboost，该框架通过指数重加权和几何中位数聚合实现，能够在弱学习器条件下保证经验散度误差的指数衰减，并进一步推导出总体误差的上界。