![]()
这项由华为技术有限公司、南洋理工大学、香港大学和香港中文大学联合完成的突破性研究发表于2026年1月,论文编号为arXiv:2601.01426v1。研究团队通过一种名为SWE-Lego的创新训练方法,让相对较小的8B参数模型在软件代码自动修复任务上的表现超越了许多32B甚至70B的大型模型。这就像是让一位技艺精湛的专科医生在复杂手术中战胜了经验更丰富的全科医生一样令人惊讶。
想象一下,你的电脑程序出了bug,就像汽车引擎出现故障一样让人头疼。传统上,程序员需要像汽车修理工一样,花费大量时间阅读代码、测试各种可能性,然后手工修复问题。而AI代码修复就像是拥有了一个超级智能的自动诊断和修复系统,能够自动定位问题并提供解决方案。这种技术的价值不言而喻——它可以大大提升软件开发效率,减少人为错误,甚至在某些情况下比经验丰富的程序员更快更准确地解决问题。
然而,训练这样的AI系统面临着巨大挑战。现有的方法通常需要复杂的多阶段训练流程,就像培养一个医生需要经历医学院、实习、住院医师等多个阶段一样。这些方法不仅计算成本高昂,还容易在训练过程中出现各种问题。更关键的是,高质量的训练数据极其稀缺,就像寻找经验丰富的名医来指导