PatchWorld: Gradient-Free Optimization of Executable World Models
PatchWorld:可执行世界模型的免梯度优化
发表机构 * Hong Kong Baptist University(香港 Baptist 大学) ; Independent Researcher(独立研究员) ; HKUST(香港科技大学) ; Beijing Institute of Technology(北京理工大学) ; Southern University of Science and Technology(南方科技大学) ; Wayne State University(韦恩州立大学) ; University of Edinburgh(爱丁堡大学)
专题命中 规划决策 :可执行世界模型,用于智能体规划与预测
AI总结 提出 PatchWorld 框架,通过反例引导的代码修复将离线轨迹转化为可执行的 Python 世界模型,实现无需梯度优化的符号信念状态程序,在 AgentGym 环境中达到 76.4% 的宏观成功率。
Comments 40 pages