Scribby: A Multi-Level LLM Framework for Semantic Video Analysis
Scribby: 一种用于语义视频分析的多级LLM框架
发表机构 * Department of Computer Science and Software Engineering, Milwaukee School of Engineering(密尔沃基工程学院计算机科学与软件工程系)
AI总结 提出一种基于LLM的视频摘要框架,通过微观索引(分析完整转录、句子及语义分组)平衡宏观理解与微观语义分析,并利用相关性热图实现语义分块和匹配的可视化。