Can Large Language Models Reason About Complex Execution Paths? An Empirical Study on Python
大型语言模型能否推理复杂执行路径?基于Python的实证研究
专题命中 代码评测 :实证研究LLM在Python执行路径推理中的能力。
AI总结 本文实证研究大型语言模型在Python执行路径推理中的可行性,构建测试用例生成和缺陷分类任务,发现LLM能提升路径覆盖率,但强推理模型不一定优于弱模型。
Comments Accepted by ACM Transactions on Software Engineering and Methodology (TOSEM)