Model Collapse Is Not a Bug but a Feature in Machine Unlearning for LLMs
模型崩溃不是错误,而是大语言模型机器遗忘中的一种特性
发表机构 * Dept. of Computer Science & Munich Data Science Institute, Technical University of Munich(计算机科学系及慕尼黑数据科学研究所,技术大学慕尼黑) ; Mila, Université de Montréal(蒙特利尔大学Mila)
专题命中 安全评测 :机器遗忘方法,移除私有信息,涉及安全
AI总结 提出部分模型崩溃(PMC)方法,通过故意触发模型在目标数据上的分布崩溃实现遗忘,无需在遗忘目标上优化,有效移除私有信息并保持模型效用。
Comments Accepted at ICLR 2026