关闭广告

香港中文大学突破AI训练难题:单个词汇也能让机器学得更聪明

科技行者2047人阅读


这项由香港中文大学的明瑞、吴昊原团队与华为诺亚方舟实验室、ChatEDA科技公司合作完成的研究,发表于2025年9月的arXiv预印本平台(论文编号:arXiv:2509.26313v1)。对于关心人工智能发展的普通读者来说,这项研究解决了一个听起来很技术但实际影响深远的问题:如何让AI更好地学习和泛化知识。

当我们教孩子学习时,有两种不同的方式。第一种是让孩子反复抄写标准答案,这就像传统的监督微调方法,孩子能够完美复制,但遇到新问题时往往不知所措。第二种是让孩子在实际练习中摸索,从错误中学习,这就像强化学习,虽然过程曲折,但孩子最终能举一反三。研究团队发现,第二种方法之所以更有效,关键在于孩子是在"真实练习"中学习,而不是只从固定的教材中死记硬背。

基于这个洞察,研究团队开发了一种名为"单词汇滚动"的新训练方法。这种方法巧妙地将两种学习方式的优点结合起来,既保持了第一种方法的高效性,又获得了第二种方法的泛化能力。核心创新在于将AI生成每个词汇的过程都视作一次完整的学习机会,而不是等到生成完整句子后再进行评估。

研究团队在数学推理、代码生成和通用推理等多个领域进行了广

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

星际之门计划捧红了这家公司,化废弃能源为AI算力,估值达百亿

DeepTech深科技 浏览 2127

立起来的高铁:“海上巨人”启航风电新征程

人民网 浏览 1799

中国对稀土相关技术实施出口管制

财联社 浏览 17609

媒体:郑丽文当选回复大陆贺电 表述难得一见意义重大

经济观察报 浏览 7242

L90 产品故事:放下理想主义执念,接受必要的 “庸俗”

晚点LatePost 浏览 1151

梅开二度,姆伯莫当选与布莱顿一役曼联队内最佳球员

懂球帝 浏览 2064

没有商业模式--DeepSeek最坚固的“护城河”

华尔街见闻官方 浏览 996

2019年资金荒隐现?全球货币市场流动性趋紧信号显现

华尔街见闻官方 浏览 2030

【二十届四中全会】文汇报 | 胡晓鹏:何为人工智能+产业的进阶图谱

上观新闻 浏览 757

太好看了!!!「镖人」把我看激动了!

吐槽电影院 浏览 265

郑智化发声道歉!坦言自己情绪上头用词不当

萌神木木 浏览 1980

收购“Manus”也治不好大厂的焦虑症

虎嗅APP 浏览 1095

我永远不会买黄金,更不会投资黄金!

浏览 24343

卡纳瓦罗:我会继续努力学习,看看以后是否有机会执教意大利

懂球帝 浏览 1448

在桃浦,解锁未来发展无限可能

上观新闻 浏览 1345

追梦:当勇士保持健康,我认为没有哪支球队是我们无法击败的

懂球帝 浏览 2352

5组超显气质的配色,可以从现在穿到过年!

Yuki女人故事 浏览 1150

吉利汽车集团10月销量307133辆 同比增长35%

网易汽车 浏览 1635

新型发电领域的“超级跑车”来了!发电效率提升的秘密藏在这里

上观新闻 浏览 1101

今年冬天最时髦保暖的4组搭配,照着穿美出新高度!

LinkFashion 浏览 937

可惜了,这世界第一美少年

独立鱼 浏览 2088
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1