关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者4454人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美政府寻求查封数十艘与委内瑞拉有关联的油轮

国际在线 浏览 3342

20岁341天,奥多贝尔成为热刺队史欧冠第三年轻进球球员

懂球帝 浏览 4297

亏损超2亿?《用武之地》票房崩塌,我感慨:这块金字招牌算砸了

靠谱电影君 浏览 3551

新版《聊斋》杀青,六个单元主演全亮相,林允、宋祖儿倾力加盟

最爱酷影视 浏览 5190

外媒:卢浮宫失窃珠宝现身黑市 窃贼提议在暗网交易

环球网资讯 浏览 10212

百度智能云公布两款自研AI芯片,昆仑芯比外界想象得更有野心

钛媒体APP 浏览 4126

中山大学突破:AI实现精准图像语义搜索

科技行者 浏览 4331

女鞋巨头,集体“脱鞋”谋变

斑马消费 浏览 3360

磐霖资本迎来收获季:连投6轮的明星企业上市了

投中网 浏览 3409

王家卫录音曝光,内容信息很炸裂

林轻吟 浏览 4282

相伴25年,76岁张艺谋尽显沧桑,44岁陈婷仍年轻

星娱叨叨社 浏览 1126

孙俪、罗晋53集都市职场剧,阵容强大,值得一看

楠鱼 浏览 5120

塞内加尔队26人名单:34岁马内8年后再战世界杯 18岁拜仁天才入选

我爱英超 浏览 449

冬季如何穿的漂亮?看看这27套穿搭就有灵感了,优雅不臃肿

静儿时尚达人 浏览 3847

今年夏天别傻傻穿一身黑,试试黑色+彩色穿搭,活力大方

静儿时尚达人 浏览 544

德甲身价涨幅榜:奥利塞暴涨3000万第1,阿德耶米、于帕上榜

懂球帝 浏览 4427

38岁尹正再破天花板,这一次,他让整个娱乐圈“沉默”了

温柔娱公子 浏览 3811

万科开启了第二笔中票展期

国际金融报 浏览 3778

昔日“神车”众泰突然大规模招聘!内部人士:已收到不少简历

红星资本局 浏览 3278

古美关系高度紧张 古巴启动"战争状态"

扬子晚报 浏览 3279

高能量唱跳歌手李斯丹妮的「12小时」,居然是这样度过的?

时尚COSMO 浏览 3015
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1