Verification Mirage: Mapping the Reliability Boundary of Self-Verification in Medical VQA
发表机构 * The University of British Columbia(不列颠哥伦比亚大学) ; Vector Institute(向量研究所) ; Redmin University of China(红矿大学)
AI总结 本文研究了医学视觉问答(VQA)中自验证机制的可靠性边界,指出当前常用的通过重新调用相同视觉语言模型(VLM)进行自验证的做法存在根本性不可靠的问题。作者提出了一种诊断框架,通过分解验证器的行为为判别能力和一致性偏差,揭示了验证器与生成器之间的能力耦合会导致“验证幻觉”现象,即在错误答案被错误接受的情况下,验证器错误率和一致性偏差同时升高的状态。实验表明,验证机制无法提供独立的安全保障,且在多轮交互中错误答案可能被错误验证所固化,凸显出自验证在实际临床应用中可能存在的严重风险。
Comments 31 pages, 12 figures