AI 大模型

视频大模型

视频理解、视频生成、视频语言模型和时序视觉推理。

今日/当前日期收录 2 篇信号源：cs.CV, eess.IV, cs.MM

2602.15819 2026-06-19 cs.CV 版本更新专题 90

VideoSketcher: Sequential Sketch Generation Using Video Model Priors

VideoSketcher：利用视频模型先验的序列草图生成

Hui Ren, Yuval Alaluf, Omer Bar Tal, Alexander Schwing, Antonio Torralba, Yael Vinker

专题命中视频生成：利用视频扩散模型生成序列草图，结合LLM规划

AI总结提出VideoSketcher方法，结合LLM的语义规划与视频扩散模型的时序渲染，通过两阶段微调从少量样本学习笔画顺序与风格，生成高质量序列草图。

URL PDF HTML

2605.31158 2026-06-19 cs.CV cs.LG 版本更新专题 85

光交互：交互式视频世界模型的免训练推理加速

Jiacheng Lu, Haoyi Zhu, Sipei Yi, Enze Xie, Yu Li, Cheng Zhuo

专题命中视频生成：加速交互式视频世界模型推理。

AI总结针对交互式视频世界模型推理成本高的问题，提出免训练加速框架Light Interaction，通过自适应上下文管理、去噪缓存加速和3D块稀疏注意力实现最高2.59倍加速。

URL PDF HTML