SaFeR-Steer: Evolving Multi-Turn MLLMs via Synthetic Bootstrapping and Feedback Dynamics
SaFeR-Steer:通过合成引导和反馈动力学进化多轮多模态大语言模型
发表机构 * Huazhong University of Science and Technology(华中科技大学) ; Beijing University of Posts and Telecommunications(北京邮电大学) ; West China Biomedical Big Data Center, Sichuan University(四川大学西部生物医学大数据中心) ; School of Public Policy and Administration, Chongqing University(重庆大学公共政策与管理学院) ; Nanyang Technological University(南洋理工大学)
AI总结 提出SaFeR-Steer框架,通过分阶段合成引导和导师参与的GRPO训练单学生模型,并引入轨迹一致总结奖励(TCSR)以解决多轮安全对齐中的长上下文安全衰减问题,显著提升多轮安全性和有用性。