JEDI: Joint Embedding Diffusion World Model for Online Model-Based Reinforcement Learning
AI总结 本文提出了一种名为 JEDI 的端到端联合嵌入扩散世界模型,用于在线基于模型的强化学习。该模型结合了 JEPA 预测表征学习与扩散去噪目标,直接从扩散损失中学习潜在空间,避免了传统方法中预训练编码器的依赖。JEDI 在计算效率和性能上均优于现有方法,在 Atari100k 环境中表现出色,同时显著降低了显存占用和训练、采样时间。