Sparsity Curse: Understanding RLVR Model Parameter Space from Model Merging
稀疏性诅咒:从模型合并理解RLVR模型参数空间
发表机构 * Zhejiang University(浙江大学) ; Simon Fraser University(西蒙菲莎大学) ; The Chinese University of Hong Kong(香港中文大学) ; Zhejiang Key Lab of Accessible Perception and Intelligent Systems(浙江省可感知智能系统重点实验室)
专题命中 其他推理 :RLVR增强推理能力
AI总结 本文发现RLVR模型的稀疏更新在参数空间中分散更远,形成近正交捷径导致合并脆弱,并提出SAR-Merging方法解决该问题。
Comments Accepted by KDD 2026