Energy-Regularized Sequential Model Editing on Hyperspheres
发表机构 * Columbia University(哥伦比亚大学) ; University of California, Los Angeles(加州大学洛杉矶分校) ; Zhejiang University(浙江大学) ; University of Science and Technology of China(中国科学技术大学)
AI总结 大型语言模型需要持续更新以保持与现实世界知识的一致性,但顺序编辑常导致模型表示不稳定并引发灾难性遗忘。本文提出了一种基于超球面能量(HE)正则化的编辑方法SPHERE,通过维持神经元权重在超球面上的均匀分布,有效缓解了编辑过程中的性能退化问题。实验表明,SPHERE在多个主流模型上显著提升了编辑效果,同时较好地保留了模型原有性能。
Comments Accepted by ICLR 2026. The code is available at https://github.com/PlusLabNLP/SPHERE. Project page: https://www.qingyuanliu.net/sphere_projectpage/