Very Efficient Listwise Multimodal Reranking for Long Documents
AI总结 本文提出了一种高效的列表级多模态重排序模型ZipRerank,旨在解决长文档视觉中心检索和多模态检索增强生成中的计算瓶颈问题。该方法通过轻量的查询-图像早期交互机制缩短输入长度,并采用单次前向传播对所有候选进行评分,从而避免了自回归解码的高耗时过程。实验表明,ZipRerank在保持高性能的同时,显著降低了大语言模型的推理延迟,适用于对延迟敏感的实际应用场景。
Comments To appear in ICML 2026