![]()
这项由中山大学联合华为技术有限公司、重庆大学、浙江大学等九所知名高校和企业共同完成的研究发表于2025年1月,论文编号arXiv:2601.11655v1。研究团队深入调研了175篇相关论文和在线资源,首次系统性地梳理了基于大语言模型的软件问题解决领域的发展现状。
程序出了bug,程序员要像侦探一样翻遍成千上万行代码找问题,这个过程往往让人头疼不已。但如果有一个AI助手能像经验丰富的老程序员一样,自动理解问题描述,在庞大的代码库中精准定位bug,并且还能提出修复方案,这会是什么样的体验?
研究团队发现,近年来随着大语言模型技术的飞速发展,AI在软件开发领域的应用已经从简单的代码补全进化到了能够处理复杂软件问题的"程序员助手"。这些AI系统不再只是被动地根据提示生成代码片段,而是能够主动理解软件问题的描述,在包含数千个文件的大型项目中导航,找到问题根源,并生成相应的修复补丁。
这种转变的关键契机来自于SWE-bench基准测试的建立。SWE-bench就像是给AI系统设计的"程序员资格考试",它收集了真实的GitHub项目问题和对应的解决方案,要求AI系统像人类