2606.14948
2026-06-16
cs.SE
cs.AI
新提交
Beyond Correctness: Enhancing Architectural Reasoning in Code LLMs via Scalable Labeling with Agentic Judgment
超越正确性:通过可扩展的智能体判断标注增强代码大模型的架构推理能力
Kirill Vasilevski, Ximing Dong, Benjamin Rombaut, Ruochen Deng, Jiahuei Lin, Arthur Leung, Dayi Lin, Boyuan Chen, Shaowei Wang, Ahmed E. Hassan
发表机构
*
Centre for Software Excellence, Huawei Canada(华为加拿大软件卓越中心)
;
Department of Computer Science, University of Manitoba, Canada(曼尼托巴大学计算机科学系)
;
School of Computing, Queen’s University, Canada(皇后大学计算科学学院)
AI总结
针对代码大模型缺乏架构理解的问题,提出智能体判断流水线,利用强LLM作为专家架构评估的代理,通过两个判断器(ACJ和AQJ)实现可扩展标注,微调模型在SWE-bench上提升高达540%,并展现跨语言泛化能力。