GIFT: Guided Importance-Aware Fine-Tuning for Diffusion Language Models
AI总结 本文提出了一种针对扩散语言模型的指导性重要性感知微调方法GIFT,旨在解决其在监督微调过程中因缺乏精确概率估计而导致的生成不稳定问题。该方法通过基于词元熵值分配不同重要性权重,引导模型更关注关键生成步骤,从而提升生成一致性和准确性。实验表明,GIFT在多个主流数据集和不同微调设置下均优于传统微调方法,在四个广泛使用的推理基准测试中表现出显著性能提升。
Comments preprint