RegMix-D: Dynamic Data Mixing via Proxy Training Trajectories
RegMix-D: 通过代理训练轨迹实现动态数据混合
发表机构 * The University of Tokyo(东京大学) ; National Institute of Informatics(国立信息学研究所)
专题命中 预训练 :LLM预训练动态数据混合方法
AI总结 提出RegMix-D,通过代理训练轨迹预测多阶段最优混合比例,实现动态数据混合,在13个下游任务上优于RegMix和DoReMi,且代理计算预算仅为RegMix的25%。
Comments Work in progress