Latent Spatial Memory for Video World Models
视频世界模型的潜在空间记忆
发表机构 * Zhejiang University(浙江大学) ; Microsoft Research(微软研究院) ; Adelaide University(阿德莱德大学) ; Monash University(莫纳什大学)
AI总结 提出潜在空间记忆框架Mirage,通过在扩散潜在空间中直接构建和查询3D缓存,避免像素空间重建,实现高效视频生成,速度提升10.57倍,内存减少55倍。