An Asymptotic Theory of Chain-of-Thought in In-Context Learning
上下文学习中思维链的渐近理论
发表机构 * Department of Physics, Graduate School of Science, The University of Tokyo(东京大学物理系研究生院) ; John A. Paulson School of Engineering and Applied Sciences, Harvard University(哈佛大学约翰·A·保罗森工程与应用科学学院) ; Kempner Institute for the Study of Natural and Artificial Intelligence, Harvard University(哈佛大学凯普勒人工智能研究 institute) ; Center for Brain Science, Harvard University(哈佛大学脑科学中心)
AI总结 通过高维随机矩阵理论,推导了线性回归中上下文学习思维链的泛化误差精确公式,揭示了推理深度、预训练数据量和上下文长度之间的相变现象。