DreamReasoner-8B: Block-Size Curriculum Learning for Diffusion Reasoning Models
DreamReasoner-8B:面向扩散推理模型的块大小课程学习
发表机构 * The University of Hong Kong(香港大学) ; Peking University(北京大学)
专题命中 数学推理 :块扩散语言模型用于长链推理
AI总结 提出块大小课程学习,通过从细粒度到粗粒度的渐进训练,解决块扩散语言模型在长链推理中性能差距问题,DreamReasoner-8B在数学和代码推理上达到与Qwen3-8B相当的水平。