关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者2335人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

上新|| 降温天不能错过的绝美毛衣,来了!

黎贝卡的异想世界 浏览 1182

美国43岁母亲在学校舞会拐走女儿14岁男友 还和他生子

潇湘晨报 浏览 7825

车企研发:小米车门锁在某些看不见的地方省去了成本

第一财经 浏览 6525

21岁韩乒一姐状态下滑?混双+女单皆不敌33岁老将 韩媒:极易崩盘

颜小白的篮球梦 浏览 2322

以军对加沙地带南部的哈马斯目标发动袭击

新华社 浏览 2267

3张照片背后,娱乐圈正在悄悄改变的一件事

传递满满正能量 浏览 1190

耶鲁大学AI团队突破:让机器人团队像人类团队一样相互指导学习

科技行者 浏览 911

上市后要“去创始人化”?林清轩孙来春:企业要进入“战略利润”时代

中国商报 浏览 1294

46岁周杰伦身患“不死癌症”已超20多年

阿晭评论哥 浏览 2277

出场时间创新低,记者:马刺有意交易索汉来换更强的轮换球员

懂球帝 浏览 1546

帧帧美若油画,库布里克大神杰作告别放映!

幕味儿 浏览 1144

冬季穿搭要避开臃肿感!配色不老气、穿衣不随意,越看越高级

静儿时尚达人 浏览 328

美防长:已做好战争准备 谁开第一枪就见不到明天太阳

军机Talk 浏览 7079

喻国明:正因为人常常不按“最优”计算行动,世界才充满魅力

上观新闻 浏览 1191

冬季穿衣千万别花枝招展,这些基础穿搭,越简单才越高级耐看

静儿时尚达人 浏览 1151

《我不是药神》原型陆勇时隔5年重返印度

红星新闻 浏览 6024

从美国到东南亚,TikTok电商重心转移

虎嗅APP 浏览 3097

大疆「摔跤」,影石「拱火」

豹变 浏览 2339

北京一副局长骑电动车送外卖,“原以为骑手最关心社保政策,没想到他们张口就是‘别罚我款’”

第一财经资讯 浏览 1488

激光雷达上车 比亚迪新款海豹06EV申报图曝光

网易汽车 浏览 1225

或命名为瑞虎3L 奇瑞瑞虎T13T谍照曝光

车质网 浏览 1441
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1