2605.10310
2026-05-15
cs.AI
cs.CY
cs.HC
q-bio.NC
Positive Alignment: Artificial Intelligence for Human Flourishing
Ruben Laukkonen, Seb Krier, Chloé Bakalar, Shamil Chandaria, Morten Kringelbach, Adam Elwood, Daniel Ford, Fernando Rosas, Maty Bohacek, Matija Franklin, Nenad Tomašev, Stephanie Chan, Verena Rieser, Roma Patel, Michael Levin, Arun Rao
发表机构
*
Department of Psychiatry, University of Oxford(牛津大学精神病学系)
;
Flourishing Intelligence Program, Centre for Eudaimonia and Human Flourishing, Linacre College, University of Oxford(牛津大学幸福智能计划、幸福与人类繁荣中心、林acre学院)
;
Google DeepMind(谷歌DeepMind)
;
LIFE
;
OpenAI
;
Anthropic
;
University of California, Los Angeles(加州大学洛杉矶分校)
;
Aily Labs(Aily实验室)
;
Stanford University(斯坦福大学)
;
Tufts University(塔夫茨大学)
;
Positive AI Labs(积极AI实验室)
;
Department of Informatics, University of Sussex(Sussex大学信息学系)
;
Department of Brain Sciences, Imperial College London(伦敦帝国理工学院脑科学系)
AI总结
本文提出“积极对齐”(Positive Alignment)的概念,旨在开发能够主动支持人类和生态繁荣的人工智能系统,同时保持安全与合作。与现有聚焦于安全与风险防范的对齐研究不同,积极对齐强调系统应具备多元、去中心化、情境敏感及用户主导的特性,并通过培养美德、促进人类福祉来解决当前对齐中的诸多问题。文章还提出了在大语言模型和智能体生命周期中的一系列技术方向与设计原则,以推动分歧包容与去中心化治理。