AI 大模型
大模型推理能力
大模型数学、逻辑、规划、多步推理和测试时计算能力。
Manifold Bandits: Bayesian Curriculum Learning over the Latent Geometry of Large Language Models
流形赌博机:大语言模型潜在几何上的贝叶斯课程学习
专题命中 测试时计算 :贝叶斯课程学习框架用于LLM推理的强化学习。
AI总结 提出贝叶斯流形课程(BMC)框架,将问题采样建模为流形结构赌博机问题,通过层次任务树和贝叶斯学习引导采样,平衡学习信号、多样性和实用性。
Comments Webpage: https://darrienmckenzie.com/manifold-bandits/