Fine-tuning vs. In-context Learning in Large Language Models: A Formal Language Learning Perspective
在大型语言模型中微调与上下文学习:从形式语言学习的角度
发表机构 * Max Planck Institute for Software Systems(马克斯·普朗克软件系统研究所) ; Boston University(波士顿大学)
AI总结 本文从形式语言学习的角度比较了大型语言模型中的微调与上下文学习,通过设计精确的语言边界、受控字符串采样和无数据污染的任务,发现微调在分布内泛化上优于上下文学习,而两者在分布外泛化上表现相当,且两者在不同熟练度水平上的归纳偏置也有所不同。
Comments Accepted at ACL 2026 (Main)