关闭广告

香港中文大学突破AI训练难题:单个词汇也能让机器学得更聪明

科技行者4537人阅读


这项由香港中文大学的明瑞、吴昊原团队与华为诺亚方舟实验室、ChatEDA科技公司合作完成的研究,发表于2025年9月的arXiv预印本平台(论文编号:arXiv:2509.26313v1)。对于关心人工智能发展的普通读者来说,这项研究解决了一个听起来很技术但实际影响深远的问题:如何让AI更好地学习和泛化知识。

当我们教孩子学习时,有两种不同的方式。第一种是让孩子反复抄写标准答案,这就像传统的监督微调方法,孩子能够完美复制,但遇到新问题时往往不知所措。第二种是让孩子在实际练习中摸索,从错误中学习,这就像强化学习,虽然过程曲折,但孩子最终能举一反三。研究团队发现,第二种方法之所以更有效,关键在于孩子是在"真实练习"中学习,而不是只从固定的教材中死记硬背。

基于这个洞察,研究团队开发了一种名为"单词汇滚动"的新训练方法。这种方法巧妙地将两种学习方式的优点结合起来,既保持了第一种方法的高效性,又获得了第二种方法的泛化能力。核心创新在于将AI生成每个词汇的过程都视作一次完整的学习机会,而不是等到生成完整句子后再进行评估。

研究团队在数学推理、代码生成和通用推理等多个领域进行了广

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

文晏回应争奖!直言不认识白百何否认沪圈投资,白百何再次内涵

萌神木木 浏览 4480

以军空袭加沙多地致至少28人死亡

环球网资讯 浏览 3334

特朗普:芝加哥市长和伊利诺伊州州长都该入狱

新华社 浏览 20433

华为WATCH GT5 Pro手表获鸿蒙6.0.0.20更新:支付宝碰一下升级

IT之家 浏览 4347

63岁的吴镇宇刷老年卡坐公交被质疑?

今古深日报 浏览 4357

半场-马竞0-0马洛卡 汉茨科造点阿尔瓦雷斯失点

直播吧 浏览 4264

王楚钦低调现身演唱会!全场观众疯狂尖叫

小椰的奶奶 浏览 5193

护肤新趋势!从“表面功夫”到“内调外养”的转变

时尚COSMO 浏览 2856

26岁男子从杭州徒步回重庆过年 途经湖北获邀吃杀猪饭

极目新闻 浏览 7443

陈伟霆何穗官宣结婚生子,夫妻俩抱娃露面幸福满溢,二人隐藏好深

扒虾侃娱 浏览 4537

"斩首警告"后高市早苗骑虎难下 日本网民却集体破防

北回归线 浏览 32841

前总裁起诉申通快递,要求分得前妻名下2028万股股权

YOUNG财经 浏览 3360

国家医保局:职工医保个人账户跨省共济今年全国覆盖

商业观察杂志社 浏览 2848

洪都拉斯3-0大胜海地,奎奥托建功,安东尼-洛萨诺破门

懂球帝 浏览 4644

普利希奇:恢复进展非常顺利,我迫不及待想要复出

懂球帝 浏览 4518

蓝色系下装看着清爽不闷,裤子、裙子都凉快,随便穿都不出错

静儿时尚达人 浏览 583

让AI给人类发工资 28岁小伙用AI创业拿下3000万元投资协议

封面新闻 浏览 1955

铜梁龙李镇全谈冲超:有这么多人支持我们,为什么不能冲超?

懂球帝 浏览 4331

国产北斗守护世界最高坝,这家地区总部位于松江的企业攻克极限监测难题

上观新闻 浏览 666

全智贤风波升级,雪花秘扇时期表现被审判,此前曾多次翻车

扒虾侃娱 浏览 5369

看了隆妮表演才知道,观众都冤枉杨幂了?

霁月文娱阁 浏览 4718
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1