![]()
这项由蒙特利尔大学Mila实验室的Milad Aghajohari、Kamran Chitsaz、Amirhossein Kazemnejad等研究人员与微软研究院、麦吉尔大学、ServiceNow研究部门合作完成的研究,发表于2025年的arXiv预印本平台(论文编号:arXiv:2510.06557v1)。有兴趣深入了解的读者可以通过该编号查询完整论文,也可以访问研究团队公开的代码仓库和模型权重。
你有没有想过,当我们思考一个复杂问题时,大脑是怎么工作的?比如解一道数学题,我们不会把所有信息都塞在脑海里,而是会分步骤推理,把重要的中间结果记下来,然后基于这些关键信息继续思考。然而,目前最先进的AI模型在"思考"时却不是这样的——它们就像一个强迫症患者,必须把之前想过的每一个字都牢牢记住,这让它们在处理复杂问题时变得极其耗费计算资源。
研究团队发现了一个令人震惊的现象:让一个小巧的1.5B参数模型采用"分段思考"的方式,竟然能在数学竞赛题目上击败那些使用传统"长篇大论思考"方式的大型模型,而且计算成本只有后者的四分之一。这就好比一个聪明的学生用简洁的草稿纸就能解出难题,而另一个学生却需要写满厚厚的笔记本才能