![]()
这项由香港理工大学数据科学与人工智能系以及应用数学系联合开展的研究发表于2026年1月,论文编号为arXiv:2601.13591v1。有兴趣深入了解的读者可以通过该编号查询完整论文。
在人工智能飞速发展的今天,我们经常听到AI可以写文章、画图片、甚至编程序。但你是否想过,AI能不能像专业的数据科学家那样,面对一堆复杂的数据,从零开始进行完整的分析,最终得出有价值的结论呢?这就像问一个机器人能否独自完成从采购食材到烹饪出一桌美味佳肴的全过程一样。
香港理工大学的研究团队就面临着这样一个挑战:如何准确评估AI在数据科学领域的真实能力。要知道,数据科学不同于简单的代码编写,它更像是一门需要综合运用多种技能的艺术。一个优秀的数据科学家需要具备敏锐的洞察力来理解数据背后的故事,扎实的编程能力来处理复杂的计算,以及清晰的表达能力来将发现传达给别人。
以往的评估方法就像只看厨师会不会切菜,而忽略了他们是否真的能做出一道完整的菜。大多数现有的测试要么只关注代码是否正确,要么只检查最终答案是否匹配,完全没有考虑到数据科学工作的复杂性和开放性。更重要的是,现实中的数据科学项目往