Improving Visual Token Reduction via Rectifying Distortions for Efficient Multimodal LLM Inference
通过纠正失真改进视觉令牌减少以实现高效多模态大语言模型推理
发表机构 * KAIST(韩国科学技术院)
专题命中 图文多模态 :多模态大模型视觉令牌减少,提升推理效率
AI总结 提出RESTORE框架,通过校准位置和注意力失真来改进视觉令牌减少,在保持效率的同时提升多模态大语言模型性能。
Comments Accepted to ICML 2026