2602.07940
2026-05-12
cs.AI
MePo: Meta Post-Refinement for Rehearsal-Free General Continual Learning
Guanglong Sun, Hongwei Yan, Liyuan Wang, Zhiqi Kang, Shuang Cui, Hang Su, Jun Zhu, Yi Zhong
发表机构
*
School of Life Sciences, IDG/McGovern Institute for Brain Research, Tsinghua University, Beijing, China(生命科学学院,IDG/麦克戈维脑研究 institute,清华大学,北京,中国)
;
Tsinghua-Peking Center for Life Sciences(清华-北京大学生命科学中心)
;
Dept. of Comp. Sci. and Tech., Institute for AI, Tsinghua-Bosch Joint ML Center, THBI Lab, BNRist Center, Tsinghua University, Beijing, China(计算机科学与技术系,人工智能研究所,清华-博世联合机器学习中心,THBI实验室,BNRist中心,清华大学,北京,中国)
;
Department of Psychological and Cognitive Sciences, Tsinghua University, Beijing, China(心理学与认知科学系,清华大学,北京,中国)
;
Univ. Grenoble Alpes, Inria, CNRS, Grenoble INP, LJK, Grenoble, France(格勒诺布尔阿尔卑斯大学,Inria,CNRS,格勒诺布尔INP,LJK,格勒诺布尔,法国)
;
Institute of Software Chinese Academy of Sciences, Beijing, China(软件研究所,中国科学院,北京,中国)
AI总结
为应对外部环境的不确定性变化,智能系统需要从复杂动态环境中持续学习并实时响应,这一能力被称为通用持续学习(GCL)。尽管利用预训练模型(PTMs)已显著提升了传统持续学习的性能,但在处理单一过程中多样化且时间混合的信息时仍存在局限。本文提出了一种名为MePo的元后优化方法,通过构建伪任务序列和双层元学习框架,增强PTMs在无回放场景下的持续学习能力,并通过初始化元协方差矩阵提升表征对齐的鲁棒性,实验证明该方法在多个GCL基准上取得了显著性能提升。