![]()
这项由西伯利亚神经网络公司、T技术公司和新西伯利亚国立大学联合开展的研究发表于2026年1月19日的arXiv预印本平台(编号:arXiv:2601.13097v1),为自动化软件测试领域带来了重大突破。有兴趣深入了解的读者可以通过该编号查询完整论文。
在现代软件开发中,单元测试就像是给程序做体检的医生。传统上,要判断一个测试是否有用,就像医生要给病人做全面检查一样,需要运行测试、编译代码、测量覆盖率等一系列繁琐步骤。这个过程既耗时又消耗大量计算资源,特别是在大型软件项目中,可能需要几小时甚至几天才能完成一次完整的评估。
研究团队开发了一个名为RM-RF的智能模型,这个模型就像一位经验丰富的医生,仅仅通过看病历和症状描述,就能准确判断病人的健康状况,而无需进行繁琐的检查。RM-RF能够仅通过阅读源代码和测试代码,就预测出三个关键指标:测试是否能正常运行、是否能增加代码覆盖率、以及是否能提高突变检测能力。这就像是一位神医,仅凭望闻问切就能诊断病情。
传统的代码生成和测试评估过程面临着巨大挑战。当开发者使用人工智能生成代码时,需要不断验证生成的代码质量。这个验证过