爆点资讯

这项由香港中文大学的明瑞、吴昊原团队与华为诺亚方舟实验室、ChatEDA科技公司合作完成的研究，发表于2025年9月的arXiv预印本平台（论文编号：arXiv:2509.26313v1）。对于关心人工智能发展的普通读者来说，这项研究解决了一个听起来很技术但实际影响深远的问题：如何让AI更好地学习和泛化知识。

当我们教孩子学习时，有两种不同的方式。第一种是让孩子反复抄写标准答案，这就像传统的监督微调方法，孩子能够完美复制，但遇到新问题时往往不知所措。第二种是让孩子在实际练习中摸索，从错误中学习，这就像强化学习，虽然过程曲折，但孩子最终能举一反三。研究团队发现，第二种方法之所以更有效，关键在于孩子是在"真实练习"中学习，而不是只从固定的教材中死记硬背。

基于这个洞察，研究团队开发了一种名为"单词汇滚动"的新训练方法。这种方法巧妙地将两种学习方式的优点结合起来，既保持了第一种方法的高效性，又获得了第二种方法的泛化能力。核心创新在于将AI生成每个词汇的过程都视作一次完整的学习机会，而不是等到生成完整句子后再进行评估。

研究团队在数学推理、代码生成和通用推理等多个领域进行了广

香港中文大学突破AI训练难题：单个词汇也能让机器学得更聪明

皇马+赫伊森...

马筱梅晒定制...

女子手机突然...

美特使被指教...

《重影》：高...

杨振宁逝世享...

每体：腓骨骨折的邦马蒂将接受手术，或将伤缺5个月

疑张亮儿子塌房，留学致女同学怀孕？

中国移动咪咕发布“书香悦学计划”，以“423行动”重塑企业数智化学习新范式

注射后48小时有知觉，6人重新行走！巴西科学家破解脊髓损伤难题

上海老人落水获救 4名老人花4天完成＂不打扰＂的致谢

古巴外长批评美国内政外交双重失序

法兰克福左后卫布朗：我们依靠整体防守萨拉赫，而不是我单防

42岁暴瘦脱相崩溃大哭的蒋欣，给所有人提了个醒

BJ30旅行家高光版上市全系享超级置换3万补贴6.99万起

杨紫新剧邀林志玲演上海名媛，两人11年前亲吻

伊朗陆军司令：伊斯法罕省行动失败是敌方停火主因

与特朗普会晤前泽连斯基亮明“红线”

马卡：姆巴佩在皇马达成50球里程碑，本赛季点球命中率显著提升

跌落神坛！“逼疯”黄奕，“整了”周迅的他，因王家卫再次被牵连

为了万亿美元薪酬！马斯克取消FSD买断制，但不适合中国国情？

韩安冉自曝新男友为她花了十几万，两人交往仅一个多月

军用元素加持 Jeep牧马人Sarge Edition发布

男子吃饭像兔子去治疗蒙眼做手术听到医生一句话懵了

特朗普称让美国大型石油公司进入委内瑞拉

霍尔木兹海峡已再次关闭

特朗普：可能接管伊朗的哈梅内伊接班人在空袭中丧生

中海成都谋变？曝开发公司连亏2年，桐梓林28亩项目寻合作

周星驰罕见发声！盛赞吴宜泽夺冠

曝杨威与儿子失联！杨阳洋父母情绪崩溃