CODEBLOCK: Learning to Supervise Code at the Right Granularity
CODEBLOCK: 学习在正确的粒度上监督代码
发表机构 * Hong Kong University of Science and Technology (Guangzhou)(香港科技大学(广州)) ; UC Santa Cruz(加州大学圣克鲁兹分校) ; Ant Group(蚂蚁集团) ; BAIA, ZJUT(浙江工业大学智能信息处理实验室) ; D5Data.ai
专题命中 代码生成 :提出CodeBlock框架,结构感知稀疏监督提升代码生成微调。
AI总结 提出CodeBlock框架,通过选择结构完整的代码块而非孤立token进行稀疏监督,在仅使用1.9%监督token的情况下,在六个代码生成基准上取得优于全token微调的效果。