What Makes Effective Supervision in Latent Chain-of-Thought: An Information-Theoretic Analysis
什么使得潜在思维链中的监督有效:一种信息论分析
发表机构 * Ningbo Institute of Digital Twin, Eastern Institute of Technology(宁波数字孪生研究院,东方理工大学) ; Department of Computing, The Hong Kong Polytechnic University(香港理工大学计算学系)
专题命中 复杂问题求解 :潜在思维链监督信息论分析
AI总结 本文从信息论角度分析潜在思维链中的监督失效问题,提出轨迹监督和空间监督两个维度,并引入统一潜在探针(ULP)量化信息保真度,揭示了信息-性能绑定关系。