关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者1603人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

大型SUV“搅局者”:奇瑞风云T11叫板头部玩家

一品汽车 浏览 1393

罗体:萨里向洛蒂托要求在一月引进一名高水平中场球员

懂球帝 浏览 1074

iPhone Air 2已在路上:升级2nm芯片 补齐影像续航短板

快科技 浏览 1270

巴黎极端球迷在埃菲尔铁塔前非法燃放大量焰火,约40人被逮捕

懂球帝 浏览 706

内容“新物种”,全球“闪电战”|2025中国短剧出海报告

霞光社 浏览 2195

最新现场:山东舰完成年度最后一次海上训练

环球网资讯 浏览 788

零跑D19定档10月16日,旗舰SUV全球首秀

网易汽车 浏览 2442

巴基斯坦和阿富汗同意立即停火

央视新闻客户端 浏览 1582

张雨绮被抵制成功!辽视春晚已将她除名

萌神木木 浏览 250

陈伟霆何穗官宣当爸妈!圈内仅5位明星送祝福,女方为爱放弃事业

萌神木木 浏览 1436

秋天这么穿好美啊!这些小细节真的很加分

黎贝卡的异想世界 浏览 2792

一艘船多付620万美元 美方尝到中方反制滋味后改限令

梁讯 浏览 5345

因欧盟制裁 普京或将绕行5000公里会晤特朗普

环球网资讯 浏览 5187

众泰还魂?追觅新车实车照曝光:一比一复刻宾利添越

三言科技 浏览 1390

黄仁勋放大招,全栈 AI 加持的NVIDIA 要承包智驾未来?

汽车观察AUTO 浏览 349

MRAM,台积电重大突破

半导体行业观察 浏览 1632

以部长:已接回人质 必须重启战争打开加沙"地狱之门"

看看新闻Knews 浏览 1590

特朗普取消"特普会"对俄追加制裁 俄发出强烈威慑信号

上游新闻 浏览 5933

古二反击《繁花》!新录音曝光打脸秦雯,业内直言压榨新人是常态

萌神木木 浏览 2130

欧阳娜娜怎么不算“审美天才”少女

时尚COSMO 浏览 813

马杜罗在纽约首次“出庭” 多国发表联合声明

环球网资讯 浏览 582
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1