The Road to Artificial SuperIntelligence: A Comprehensive Survey of Superalignment
通往人工超级智能之路:超级对齐的全面综述
发表机构 * Microsoft Research Asia(微软亚洲研究院) ; Sungkyunkwan University(顺天大学) ; Stanford University(斯坦福大学) ; Fudan University(复旦大学)
专题命中 安全评测 :综述超级对齐问题,分析可扩展监督范式
AI总结 本文综述了超级对齐问题,通过分析可扩展监督范式(夹层、自我增强和弱到强泛化)及其局限性,探讨了监督、控制和管理人工超级智能的挑战与路径。
Comments 24 pages