arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2605.06870 2026-05-13 cs.LG

Continuous First, Discrete Later: VQ-VAEs Without Dimensional Collapse

Xinyu Zhao, Nikita Karagodin, Hamed Hassani, Sinan Hersek, Paul Pu Liang, Yury Polyanskiy

AI总结本文研究了VQ-VAE在训练过程中出现的维度坍塌问题，即编码表示退化到极低维子空间的现象，并揭示了这一问题会导致难以突破的下界损失。作者提出了一种简单有效的解决方法——在引入VQ之前先进行自编码器的预训练（AE Warm-Up），从而恢复编码表示的维度。实验表明，该方法在图像和音频任务中均显著提升了重建质量与感知性能，同时提高了码本的有效维度。

2605.06732 2026-05-13 cs.LG

On Training in Imagination

Nadav Timor, Ravid Shwartz-Ziv, Micah Goldblum, Yann LeCun, David Harel

AI总结本文研究了基于想象的模型强化学习中，使用学习到的动力学模型和奖励模型进行策略训练时，模型误差对策略优化和回报的影响。作者扩展了现有分析，推导出在功率律假设下最优的样本分配比例，以最小化回报误差的上界，并指出降低动力学、奖励和策略的Lipschitz常数有助于紧化这一界。此外，作者分析了REINFORCE算法在存在噪声奖励情况下的表现，发现零均值噪声不影响梯度估计的无偏性，但会增加方差，并提出了在固定预算下如何权衡 rollout 数量与奖励噪声的优化问题。

2605.06440 2026-05-13 cs.LG cs.CV

Hyperbolic Concept Bottleneck Models

Daniel Uyterlinde, Swasti Shreya Mishra, Pascal Mettes

AI总结该论文提出了一种名为Hyperbolic Concept Bottleneck Models（HypCBM）的新型可解释神经网络框架，用于提升模型的可解释性。与传统将概念嵌入欧几里得空间的方法不同，HypCBM将概念组织在语义层次结构中，并利用双曲空间的几何特性，通过不对称的几何包含关系来表示概念激活，从而更自然地捕捉概念间的层次关系。该方法无需额外监督或学习模块即可实现稀疏且层次感知的激活，并在保持人类可解释性的同时，展现出更强的层次一致性和对输入噪声的鲁棒性。

Comments 24 pages, 14 figures

2605.06314 2026-05-13 cs.LG

When Does $\ell_2$-Boosting Overfit Benignly? High-Dimensional Risk Asymptotics and the $\ell_1$ Implicit Bias

Ye Su, Jian Li, Yong Liu

AI总结本文研究了在高维设置下，$\ell_2$-Boosting 算法在 $\ell_1$ 隐含偏差下的良性过拟合行为。通过结合凸高斯极小极大定理与截断高斯矩的渐近展开，作者分析了连续时间 $\ell_2$-Boosting 的风险特性，揭示了其在纯噪声模型下以对数速率衰减的过拟合现象，并指出在存在信号时，该机制仍可能成立，但信号-噪声分解仍是开放问题。此外，作者还提出了一个无需调参的早停规则，能够在 $\ell_1$ 约束下达到最优的预测性能。

2605.06218 2026-05-13 cs.LG

AffineLens: Capturing the Continuous Piecewise Affine Functions of Neural Networks

Yi Wei, Xuan Qi, Furao Shen, Jian Zhao, Vittorio Murino, Cigdem Beyan

AI总结 AffineLens 是一种用于分析神经网络中分段仿射函数结构的统一框架，旨在准确捕捉神经网络输入输出映射的连续分段仿射特性。该方法通过计算神经元诱导的超平面排列和多面体结构，逐层枚举并可视化网络的仿射区域，从而提供对网络表达能力的直观理解与量化评估。AffineLens 支持包括批量归一化、池化、残差连接等多种现代网络组件，并通过实证研究揭示了不同网络设计对函数几何特性的影响。

2605.05971 2026-05-13 cs.LG

Training Transformers for KV Cache Compressibility

Yoav Gelberg, Yam Eitan, Michael Bronstein, Yarin Gal, Haggai Maron

AI总结随着长上下文语言模型的发展，Key-Value（KV）缓存的内存和解码时访问成本已成为关键瓶颈。本文提出了一种在训练过程中引导Transformer模型学习可压缩表示的方法，即KV-压缩感知训练（KV-CAT），通过在训练时稀疏化KV缓存，促使模型生成更利于后续压缩的内部表示。实验表明，该方法有效提升了后续压缩方法在检索、长上下文问答和压缩前缀续写等任务中的性能表现。

Comments 32 pages, 4 figures

2605.05922 2026-05-13 cs.CV

Think, then Score: Decoupled Reasoning and Scoring for Video Reward Modeling

Yuan Wang, Ouxiang Li, Yulong Xu, Borui Liao, Jiajun Liang, Jinghan Li, Meng Wang, Xintao Wang, Pengfei Wan, Kuien Liu, Xiang Wang

AI总结该论文提出了一种名为DeScore的视频奖励模型，旨在解决现有模型在推理与评分耦合时存在的优化瓶颈问题。其核心方法是将推理与评分过程解耦，先由多模态大语言模型生成详细的推理过程，再通过独立的评分模块预测最终奖励。该方法在保证模型可解释性和泛化能力的同时，提升了训练稳定性与效率。

2605.04946 2026-05-13 cs.LG stat.ML

Training-Time Batch Normalization Reshapes Local Partition Geometry in Piecewise-Affine Networks

Xuan Qi, Yi Wei, Fanqi Yu, Furao Shen, Vittorio Murino, Cigdem Beyan

AI总结本文研究了训练过程中批量归一化（BN）在分段仿射网络中的几何影响，揭示了BN如何通过调整神经元的参考超平面，改变局部区域的划分结构。研究发现，BN在每个神经元上定义了一个以小批量中心为基准的超平面，其切换超平面的偏移量以标准化坐标表示，与原始偏置无关。这一机制提高了局部划分的精细程度，并在深度网络中具有局部传递性，为理解BN在训练阶段的函数级几何作用提供了新视角。

2605.04647 2026-05-13 cs.RO

ReflectDrive-2: Reinforcement-Learning-Aligned Self-Editing for Discrete Diffusion Driving

Huimin Wang, Yue Wang, Bihao Cui, Pengxiang Li, Ben Lu, Mingqian Wang, Tong Wang, Chuan Tang, Teng Zhang, Kun Zhan

AI总结本文提出 ReflectDrive-2，一种基于强化学习对齐的离散扩散规划器，用于自动驾驶任务。该方法通过独立的动作专家生成离散轨迹标记，并利用并行掩码解码生成轨迹，支持在原地进行轨迹编辑。通过两阶段训练策略，结合结构感知扰动和强化学习优化，显著提升了轨迹生成与编辑的性能。实验表明，ReflectDrive-2 在 NAVSIM 上实现了较高的 PDMS 分数，并具备较高的推理效率。

2605.04539 2026-05-13 cs.CL cs.AI

RLearner-LLM: Balancing Logical Grounding and Fluency in Large Language Models via Hybrid Direct Preference Optimization

Qiming Bao, Juho Leinonen, Paul Denny, Michael J. Witbrock

AI总结该论文提出了一种名为RLearner-LLM的新方法，旨在解决大型语言模型在知识密集型生成任务中逻辑准确性与流畅性之间的平衡问题。研究通过引入混合直接偏好优化（Hybrid-DPO）技术，结合基于DeBERTa-v3的自然语言推理信号和验证器LLM评分，无需人工标注即可提升模型的逻辑对齐能力。实验表明，该方法在多个学术领域中显著提升了模型的逻辑推理能力，同时保持了生成流畅性，并在多个基础模型上实现了有效的性能提升。

2605.02906 2026-05-13 cs.LG

An End-to-End Framework for Building Large Language Models for Software Operations

Jingkai He, Pengfei Chen, Chenghui Wu, Shuang Liang, Ye Li, Gou Tan, Xiadao Wen, Chuanfu Zhang

AI总结本文提出了一种面向软件运维领域的端到端大语言模型构建框架 OpsLLM，旨在解决当前运维场景下大模型因数据质量低、知识碎片化和学习效率不足而难以实现高效智能运维的问题。该框架引入了人工参与的数据筛选机制和领域过程奖励模型，有效提升了模型在运维问答和根因分析任务中的准确性和可靠性。实验表明，OpsLLM 在多个难度级别的任务中均优于现有开源和闭源模型，并且已开源三个不同参数规模的版本及相应的微调数据集。

2605.00939 2026-05-13 cs.LG cs.AI

From Flat Facts to Sharp Hallucinations: Detecting Stubborn Errors via Gradient Sensitivity

Yee Zhing Liew, Andrew Huey Ping Tan, Anwar P. P. Abdul Majeed

AI总结本文研究了传统语言模型中难以检测的“顽固性幻觉”问题，即模型在错误信息上表现出高度自信的情况。作者提出了一种基于梯度敏感性的几何检测方法——嵌入扰动梯度敏感性（EPGS），通过在输入嵌入中加入高斯噪声并测量梯度幅值的变化，来区分稳定知识与脆弱记忆。实验表明，该方法在检测高置信度事实错误方面显著优于基于熵和表示的基线方法。

Comments Accepted to ICML 2026. Camera-ready version

2604.24801 2026-05-13 cs.LG cs.AI

Architecture Determines Observability of Transformers

Thomas Carmichael

AI总结该研究探讨了Transformer模型中架构对可观测性的影响，指出自回归Transformer在输出置信度监控下仍可能产生无法被检测的错误。研究发现，激活信号中包含的决策质量信息主要由模型架构和训练过程决定，而非输出置信度本身。实验表明，通过控制输出置信度可大幅减少激活探针信号，而剩余信号的可观测性取决于架构和训练方式，为模型监控和训练设计提供了新的视角。

Comments 31 pages, 8 figures, 14 tables. v3 of arXiv:2604.24801. Code v5.1.0: https://github.com/tmcarmichael/nn-observability/tree/v5.1.0 Changelog: https://github.com/tmcarmichael/nn-observability/blob/v5.1.0/CHANGELOG.md Croissant: https://github.com/tmcarmichael/nn-observability/blob/v5.1.0/croissant.json

2604.22099 2026-05-13 cs.LG

Assessing the impact of dimensionality reduction on clustering performance -- a systematic study

Ousmane Assani-Amate, Mohammadreza Bakhtyari, Émilie Roy, Vladimir Makarenkov

AI总结本研究系统评估了五种降维技术对四种聚类算法性能的影响，旨在探讨降维在高维数据聚类中的作用。通过调整降维后的维度比例，并使用调整兰德指数（ARI）进行性能比较，研究发现选择合适的降维方法和降维程度对于提升聚类效果至关重要，且需根据数据结构和聚类算法特性进行适配。

2604.22026 2026-05-13 cs.AI cs.CY cs.DL

Rethinking Publication: A Certification Framework for AI-Enabled Research

Yang Lu, Rabimba Karanjai, Lei Xu, Weidong Shi

AI总结本文提出了一种用于评估AI生成研究成果的双重认证框架，旨在应对当前学术出版体系对人类作者假设的局限性。该框架将知识有效性与人类贡献程度的评估分离开来，前者确保研究成果的科学性，后者明确人类在研究过程中的参与程度。研究还提出了专门的基准投稿渠道，以促进完全自动化研究成果的透明发表，并强调应基于知识价值而非作者身份来评价研究贡献。

Comments correct references

详情

英文摘要

AI research pipelines can now generate academic work that may satisfy existing peer review standards for quality, novelty, and methodological rigor. However, the publication system was built around the assumption that research is produced by human authors. It therefore lacks a clear way to evaluate work when the knowledge claim may be valid but the producer is partly or fully automated. This paper proposes a two-layer certification framework for AI-generated research. The first layer evaluates whether the knowledge claim is sound. The second layer evaluates the level of human contribution. This separation allows journals and conferences to assess pipeline-generated work more consistently without creating new institutions. The framework uses normative analysis, conceptual design, and dry-run validation against representative submission cases. It classifies human contribution into three categories: Category A, where the work is reachable by an automated pipeline; Category B, where human direction is required at identifiable stages; and Category C, where the work goes beyond current pipeline capability, especially at the problem-formulation stage. The paper also proposes dedicated benchmark slots for fully disclosed automated research. These slots would provide a transparent publication path and help reviewers calibrate judgments over time. The key argument is that publication has historically certified two things at once: that the knowledge is valid and that a human produced it. AI research pipelines separate these two claims. By decoupling knowledge certification from authorship attribution, the proposed framework responds to a structural change already underway. It can be implemented within existing editorial systems, works even when attribution is uncertain, and recognizes human frontier contribution based on epistemic value rather than human origin alone.

URL PDF HTML ☆

赞 0 踩 0

2604.21052 2026-05-13 cs.CV cs.AI

StyleVAR: Controllable Image Style Transfer via Visual Autoregressive Modeling

Liqi Jing, Dingming Zhang, Peinian Li, Lichen Zhu, Yang Xu, Hanyu Xing

AI总结 StyleVAR 是一种基于视觉自回归建模（VAR）框架的可控图像风格迁移方法，通过将图像分解为多尺度表示并编码为离散码，利用变压器模型在条件离散序列建模中实现风格与内容的可控融合。该方法引入了混合交叉注意力机制和尺度相关的融合系数，以在保持自回归连续性的同时，有效结合风格与内容信息。实验表明，StyleVAR 在多个基准测试中优于传统 AdaIN 方法，在感知相似度和结构保持方面表现突出，尤其在风景和建筑场景中效果显著。

详情

英文摘要

We build on the Visual Autoregressive Modeling (VAR) framework and formulate style transfer as conditional discrete sequence modeling in a learned latent space. Images are decomposed into multi-scale representations and tokenized into discrete codes by a VQ-VAE; a transformer then autoregressively models the distribution of target tokens conditioned on style and content tokens. To inject style and content information, we introduce a blended cross-attention mechanism in which the evolving target representation attends to its own history, while style and content features act as queries that decide which aspects of this history to emphasize. A scale-dependent blending coefficient controls the relative influence of style and content at each stage, encouraging the synthesized representation to align with both the content structure and the style texture without breaking the autoregressive continuity of VAR. We train StyleVAR in two stages from a pretrained VAR checkpoint: supervised fine-tuning on a large triplet dataset of content--style--target images, followed by reinforcement fine-tuning with Group Relative Policy Optimization (GRPO) against a DreamSim-based perceptual reward, with per-action normalization weighting to rebalance credit across VAR's multi-scale hierarchy. Across three benchmarks spanning in-, near-, and out-of-distribution regimes, StyleVAR consistently outperforms an AdaIN baseline on Style Loss, Content Loss, LPIPS, SSIM, DreamSim, and CLIP similarity, and the GRPO stage yields further gains over the SFT checkpoint, most notably on the reward-aligned perceptual metrics. Qualitatively, the method transfers texture while maintaining semantic structure, especially for landscapes and architectural scenes, while a generalization gap on internet images and difficulty with human faces highlight the need for better content diversity and stronger structural priors.

URL PDF HTML ☆

赞 0 踩 0

2604.16684 2026-05-13 cs.LG stat.ML

DARLING: Detection Augmented Reinforcement Learning with Non-Stationary Guarantees

Argyrios Gerogiannis, Yu-Han Huang, Venugopal V. Veeravalli

AI总结本文研究了在非平稳有限时间回合马尔可夫决策过程（MDPs）中的无模型强化学习问题，且不预先知道非平稳性。针对分段平稳（PS）环境，即奖励和转移动态在未知时间点发生变化的情况，提出了一个名为DARLING的模块化方法，适用于表格和线性MDPs，无需提前知道变化时间点。DARLING在理论分析中改进了已知的最佳动态遗憾界，并在多种非平稳基准测试中表现出优于现有方法的性能。

Comments 50 pages, 8 figures

2604.15664 2026-05-13 cs.LG cs.AI

Stargazer: A Scalable Model-Fitting Benchmark Environment for AI Agents under Astrophysical Constraints

Xinge Liu, Terry Jingchen Zhang, Bernhard Schölkopf, Zhijing Jin, Kristen Menou

AI总结本文介绍了 Stargazer，一个用于评估人工智能代理在天体物理约束下进行动态模型拟合任务的可扩展基准环境。该环境基于径向速度时间序列数据，包含120个任务，涵盖从高信噪比单行星系统到复杂低信噪比多行星系统的多种场景，并包含20个真实档案案例。研究发现，尽管现有前沿代理在统计拟合上表现良好，但在物理参数恢复方面仍存在显著不足，且增加计算资源带来的提升有限。Stargazer 为训练和评估人工智能代理在实际科研相关模型拟合问题上的能力提供了重要平台。

2604.14717 2026-05-13 cs.AI cs.CR cs.CY cs.LG

Layered Mutability: Continuity and Governance in Persistent Self-Modifying Agents

Krti Tallam

AI总结本文提出“分层可变性”框架，用于分析持续自我修改语言模型代理在预训练、对齐、自我叙述、记忆和权重适应五个层面中的行为演化过程。研究指出，当内部变化迅速、耦合性强、不可逆且难以观测时，治理难度显著增加，导致行为影响层与人类可观察层之间出现系统性不匹配。通过引入漂移、治理负载和滞后等量化指标，并结合实验验证，论文揭示了这类代理的主要失效模式并非突变失准，而是由局部合理更新累积引起的“组合漂移”问题。

Comments 17 pages, 2 figures, 3 tables. self-modifying agents; AI governance; identity drift; persistent memory; runtime adaptation; model editing Primary: cs.AI Cross-list: cs.LG, cs.CY

2604.12928 2026-05-13 cs.CL eess.AS

MoshiRAG: Asynchronous Knowledge Retrieval for Full-Duplex Speech Language Models

Chung-Ming Chien, Manu Orsini, Eugene Kharitonov, Neil Zeghidour, Karen Livescu, Alexandre Défossez

AI总结本文提出了一种名为MoshiRAG的异步知识检索方法，用于提升全双工语音语言模型的事实准确性。该方法通过结合紧凑的全双工接口与选择性检索机制，使模型能够在保持实时交互性的同时，访问更强大的知识源。实验表明，MoshiRAG在事实性方面达到非全双工模型的水平，并且支持灵活的检索模块替换，表现出良好的跨领域推理能力。

Comments Accepted to ICML 2026

2604.12923 2026-05-13 cs.CV

Pi-HOC: Pairwise 3D Human-Object Contact Estimation

Sravan Chittupalli, Ayush Jain, Dong Huang

AI总结本文提出了一种名为Pi-HOC的单次推理、实例感知的框架，用于预测图像中所有人类-物体对的密集3D语义接触。该方法通过检测实例并为每对人-物生成专用的标记，结合InteractionFormer进行优化，再利用基于SAM的解码器在SMPL人体网格上预测密集接触点。实验表明，Pi-HOC在多个数据集上显著提升了接触估计的准确性和定位能力，并且推理效率提高了20倍，同时还能通过测试时优化算法提升3D图像到网格的重建效果，并支持基于语言查询的参考接触预测。

2604.11048 2026-05-13 cs.CL cs.AI

A Systematic Analysis of the Impact of Persona Steering on LLM Capabilities

Jiaqi Chen, Ming Wang, Tingna Xie, Shi Feng, Yongkang Liu

AI总结本文系统分析了在大型语言模型中引入特定人格特质对其认知能力的影响。研究采用基于神经元的人格特质诱导框架（NPTI），在六个认知基准任务中评估五大人格特质对模型性能的影响，发现人格诱导不仅改变了交互风格，还导致认知任务表现的稳定变化，并且这种影响因任务类型和人格特质不同而有所差异。研究还提出了一种轻量级的动态人格路由策略（DPR），能够在无需额外训练的情况下优于固定人格设置。

2604.06779 2026-05-13 cs.AI

VASR: Variance-Aware Systematic Resampling for Reward-Guided Diffusion

Shivanshu Shekhar, Sagnik Mukherjee, Jia Yi Zhang, Tong Zhang

AI总结该论文提出了一种名为VASR的方差感知系统重采样方法，用于解决奖励引导扩散模型中的系统采样（SMC）粒子系谱快速崩溃问题。通过将延续方差与残差方差分离，研究揭示了传统多项式重采样导致的高后代数量方差是崩溃的主要原因，并提出基于方差最优质量分配和系统重采样的改进方法。VASR及其变体VASR-Max在多个任务中表现出更优的样本质量和更高的计算效率，且无需训练、可并行处理。

2604.06485 2026-05-13 cs.LG cs.AI

Inference-Time Code Selection via Symbolic Equivalence Partitioning

David Cho, Yifan Wang, Fanping Sui, Ananth Grama

AI总结该论文研究了如何在推理阶段从大型语言模型生成的多个候选程序中有效选择正确解的问题。作者提出了一种基于符号等价划分（SEP）的方法，利用问题提供的公共示例作为有效性信号，并通过符号执行将候选程序划分为功能等价类，从而选择最可能正确的解。实验表明，该方法在多个基准上显著提升了代码选择的准确性，无需额外测试生成或学习验证器。

2604.04894 2026-05-13 cs.CL cs.AI cs.LG

Asymmetric Advantage Modulation Calibrates Entropy Dynamics in RLVR

Hengrui Gu, Xiaotian Han, Yujing Bian, Feiyi Wang, Kaixiong Zhou

AI总结在可验证奖励强化学习（RLVR）中，大型语言模型（LLMs）的推理能力虽有所提升，但常因探索受限而难以获得多样化解。本文提出一种新的熵动态调节方法——AsymGRPO，通过将优势估计器分解为正负通道，分别调控有益熵和噪声熵，从而更精细地引导模型学习。该方法在多个数学推理任务中表现出色，显著优于现有RLVR基线方法。

2604.03701 2026-05-13 cs.CV

VidNum-1.4K: A Comprehensive Benchmark for Video-based Numerical Reasoning

Shaoyang Cui, Lingbei Meng

AI总结 VidNum-1.4K 是一个用于评估视频中数值推理能力的综合性基准数据集，包含1,379个人工标注的视频问答对，覆盖多种复杂场景，旨在测试视觉语言模型对时间事件、物体持续性和组合逻辑的理解。该基准采用三级结构，从直接视觉感知逐步过渡到多步骤数值推理，要求模型进行算术运算、比较和逻辑推断。实验表明，当前最先进的模型在该任务上仍存在较大性能差距，凸显出视频数值推理任务的挑战性与现有模型的不足。

Comments 7 pages, 5 figures, under review at ACMMM 2026 Dataset Track

2603.28561 2026-05-13 cs.RO cs.AI

Fine-Tuning Large Language Models for Cooperative Tactical Deconfliction of Small Unmanned Aerial Systems

Iman Sharifi, Alex Zongo, Peng Wei

AI总结随着小型无人机系统在低空空域的广泛应用，如何在安全约束下实现可靠的战术避撞成为亟需解决的问题。本文研究了通过微调大语言模型（LLM）来实现多智能体协同避撞的方法，提出了一种基于BlueSky模拟器的仿真到语言数据生成流程，生成符合航空安全规则的避撞数据集，并采用低秩适配（LoRA）和基于偏好的微调策略对预训练模型进行优化。实验表明，该方法显著提升了避撞决策的准确性、一致性及避撞性能，有效减少了近距空中冲突的发生。

Comments 15 pages, 6 figures, to be published in CVPR 2026 Workshop Proceedings

2603.28488 2026-05-13 cs.CL cs.AI cs.MA

Courtroom-Style Multi-Agent Debate with Progressive RAG and Role-Switching for Controversial Claim Verification

Masnun Nuha Chowdhury, Nusrat Jahan Beg, Umme Hunny Khan, Syed Rifat Raiyan, Md Kamrul Hasan, Hasan Mahmud

AI总结该研究针对大语言模型在高风险声明验证中的不可靠问题，提出了一种基于法庭辩论风格的多智能体框架PROClaim，通过引入角色分工和渐进式检索增强生成（P-RAG）方法，提升证据检索与推理的深度与准确性。该方法通过结构化辩论流程、证据协商及多法官异构聚合，有效增强了系统校准能力与鲁棒性，在零样本测试中表现出优于传统多智能体辩论10个百分点的性能，验证了其在争议性声明验证中的有效性。

Comments Under review, 7 figures, 12 tables

2603.27358 2026-05-13 cs.CL

Not Worth Mentioning? A Pilot Study on Salient Proposition Annotation

Amir Zeldes, Katherine Conhaim, Lauren Levine

AI总结本文探讨了如何在自然文本中对命题的显著性进行分级标注的问题。研究借鉴了基于摘要的显著性度量方法，并将其应用于命题层面，定义了相应的标注任务。通过在一个多体裁小规模数据集上的实验，验证了该方法的可行性，并初步探讨了其与话语结构理论中核心话语单元之间的关系。

2603.24652 2026-05-13 cs.CL cs.LG

Demystifying When Pruning Works via Representation Hierarchies

Shwai He, Guoheng Sun, Haichao Zhang, Yun Fu, Ang Li

AI总结该研究探讨了网络剪枝在不同语言任务中的效果差异，发现剪枝对非生成任务（如检索和多选）效果较好，但在生成任务中常导致性能下降。通过分析语言模型的表示层次结构，研究将模型内部计算分解为嵌入、logit和概率三个空间，发现嵌入和logit空间对剪枝具有较强鲁棒性，但logit到概率的非线性变换会放大剪枝带来的偏差，进而影响生成质量。该分析揭示了剪枝效果任务差异的内在机制，并为实际应用提供了指导。

Comments ICML 2026. 24 pages, 21 figures, and 3 tables. Includes an appendix with supplementary experiments and derivations