关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者1529人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

离婚4年,42岁佟丽娅高调官宣喜讯

刘森森 浏览 1269

新季各队最令人期待球员中部篇 内姆哈德追逐MIP?

体坛周报 浏览 2208

抖音饿了么双双辟谣收购传闻 美团躺枪一度下跌超8%

财联社 浏览 13487

库里37分 克莱24分 卡梅隆-托马斯41分 勇士力克篮网止3连败

直播吧 浏览 13699

沙特承认申办世博会宣传片是中国拍的 韩国网友破大防

李砍柴 浏览 83188

科比三女儿比安卡超像父亲,8岁的她五官变化明显

素素娱乐 浏览 19457

甘肃男子亲历地震:当时零下15度 很多人熬不住回家了

红星新闻 浏览 75758

“穷了、生了”小S公公去世,大S刚露面,就被扒得一点体面都没了

娱乐白名单 浏览 13024

这条裙子又火了!穿得花一点才好看

LinkFashion 浏览 12276

排队两小时买奶皮子糖葫芦,值吗?

时尚COSMO 浏览 1159

最有野心的“厨子”,如何成为普京的“叛徒”

中国新闻周刊 浏览 16080

IPO纵览|两会IPO重点回顾:强调提高上市公司质量,夯实市场之基

IPO日报 浏览 11803

一文读懂索提诺比率(附索提诺比率选出的牛基--普通股票型)

一地基毛 浏览 1351

"地表最难乒乓球赛"上 全运会卫冕冠军王曼昱差点输了

澎湃新闻 浏览 33052

泡泡玛特股价连跌6天

YOUNG财经 浏览 1378

稀土是啥?为啥是中国王牌?

混知财经 浏览 1465

8年青春换来丈夫出轨,如今张嘉倪让前夫高攀不起

画画影视 浏览 675

葡萄牙宣布将于9月21日承认巴勒斯坦国

上观新闻 浏览 2229

登贝莱:踢什么位置教练说了算,我很喜欢中锋位置

懂球帝 浏览 2100

美媒:狄龙今日将与湖人、雄鹿、独行侠和火箭进行会面

直播吧 浏览 15903

59岁无儿无女,王晶为何说张卫健一点都不惨

林雁飞 浏览 312
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1