CTR-Sink: Attention Sink for Language Models in Click-Through Rate Prediction
CTR-Sink:用于点击率预测的语言模型中的注意力汇聚点
发表机构 * NLPR, Institute of Automation, Chinese Academy of Sciences(神经信息处理教育部重点实验室,自动化研究所,中国科学院) ; Ant Group(蚂蚁集团) ; The University of Hong Kong(香港大学) ; City University of Hong Kong(香港城市大学) ; Sun Yat-sen University(中山大学) ; Shenzhen MSU-BIT University(深圳MSU-BIT大学)
AI总结 针对用户行为序列与语言模型预训练文本之间的结构差异导致的语义碎片化问题,提出CTR-Sink框架,通过引入行为级注意力汇聚点并动态调节注意力聚合,提升点击率预测性能。