2601.21577
2026-05-14
cs.LG
Collaborative Parameter Learning: Mitigating Forgetting via Parameter-Level Gradient Analysis
Mutian Yang, Zisen Zhan, Yutong Chen, Haolin Li, Kaiwen Wang, Kaili Zheng, Yuguang Wang, Qi Wang, Jiandong Gao, Ji Wu
发表机构
*
Department of Electronic Engineering, Tsinghua University, Beijing, China(清华大学电子工程系,北京,中国)
;
Institute of Medical Technology, Peking University Health Science Center, Peking University, Beijing, China(北京大学医学部医学技术研究所,北京大学,北京,中国)
;
College of Information Science and Engineering, Northeastern University, Shenyang, China(东北大学信息科学与工程学院,沈阳,中国)
;
College of AI, Tsinghua University, Beijing, China(清华大学人工智能学院,北京,中国)
;
Beijing National Research Center for Information Science and Technology, Beijing, China(北京信息科学与技术国家研究中心,北京,中国)
AI总结
在知识注入过程中,大语言模型容易出现灾难性遗忘问题,即学习新知识时会覆盖已有知识。本文通过参数级梯度分析,识别出两类参数:导致遗忘的冲突参数和缓解遗忘的协作参数,并提出协作参数学习(CPL)方法,仅更新协作参数以减轻遗忘。实验表明,CPL在保持较少遗忘的同时显著提升了模型的学习能力,并降低了显存和计算时间消耗。