A Geometric Analysis of Small-sized Language Model Hallucinations
小尺寸语言模型幻觉的几何分析
发表机构 * Engineering (CEMSE) division, King Abdullah University of Science and Technology (KAUST)(卡塔尔科技大学工程学院(CEMSE)) ; Istituto di Informatica e Telematica (IIT), National Research Council of Italy (CNR)(意大利国家研究理事会信息与电信研究所(IIT)) ; Department of Information Engineering, University of Pisa(比萨大学信息工程系)
AI总结 本文从几何角度分析小尺寸语言模型幻觉问题,提出APORIA框架,通过句子嵌入空间研究重复提示下的响应,发现真实响应比幻觉响应更紧密聚类,并通过APORIA-LP方法实现高效分类,同时发布SOCRATES-300K数据集以支持进一步研究。
Comments 30 pages, 12 figures, 14 tables, accepted as regular paper at ICML'26