Focused Forcing: Content-Aware Per-Frame KV Selection for Efficient Autoregressive Video Diffusion
聚焦强制:面向内容的每帧KV选择用于高效的自回归视频扩散
发表机构 * SJTU(上海交通大学) ; SDU(山东大学) ; HUST(华中科技大学) ; UTokyo(东京大学) ; HKUST(香港科技大学) ; SCUT(上海大学) ; Shanghai AI Lab(上海人工智能实验室)
AI总结 本文提出了一种无需训练的KV选择方法,通过结合注意力分数和历史帧的多样性分数,保留最相关和有区别的历史帧,从而在不牺牲质量的情况下提高自回归视频扩散的效率。