2606.19744
2026-06-19
cs.CL
cs.AI
cs.HC
新提交
90%
Beyond Uniform Forgetting: A Study of Sequential Direct Preference Optimization Across Preference Settings
超越统一遗忘:不同偏好设置下顺序直接偏好优化的研究
Pranav Bhandari, Nicolas Fay, Amitava Datta, Usman Naseem, Mehwish Nasim
发表机构
*
Network Analysis and Social Influence Modelling (NASIM) Lab(网络分析与社会影响建模实验室)
;
School of Physics Maths and Computing, The University of Western Australia(西澳大学物理数学与计算学院)
;
School of Psychological Science, The University of Western Australia(西澳大学心理科学学院)
;
School of Computing, Macquarie University(麦考瑞大学计算机学院)
专题命中
偏好对齐
:核心研究偏好优化方法DPO的顺序应用与遗忘模式。
AI总结
研究顺序DPO在不同偏好设置下的影响,发现遗忘模式并非统一,而是取决于目标关系、信号强度和训练顺序,并提出未来对齐流程应考虑目标兼容性。