关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者165人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

网曝友商要特斯拉降低中国员工工资 从1.3w降到5341元

深蓝财经 浏览 18602

突发:华晨欲出售剩下25%股份,华晨宝马要“改姓”?

车快评 浏览 11706

派系纷争不断 加沙秩序恢复仍需时间

极目新闻 浏览 18

李开复,在成都投了一家“0卡糖”

投中网 浏览 366

特朗普呼吁美国促和:乌克兰或许得出让一些领土

看看新闻Knews 浏览 14731

国际油价攀高 国内成品油零售价将迎今年来最大涨幅

澎湃新闻 浏览 110055

笔神作文称学而思AI大模型盗窃其数据,学而思回应:未使用其任何数据

三言科技 浏览 15432

讲解员回忆杨振宁95岁来访两弹城:他说这个时代特别需要“两弹一星”精神

封面新闻 浏览 194

卫星图像显示以军坦克集结加沙城周围

环球网资讯 浏览 930

泰国止步16强!魔咒延续52年,被新帅激活,5个月后将战国足

奥拜尔 浏览 11964

冬季气质女人穿衣优雅的秘密,都藏在“大衣”里,这么搭太美

静儿时尚达人 浏览 12513

接近完工!韩国高调展示国产隐形战机进展

环球网 浏览 25813

今秋这件“瘦瘦衫”必穿!巨in巨洋气,上身瘦十斤!

Yuki女人故事 浏览 1146

场均2.70分,阿隆索登顶皇马主帅前10场西甲场均拿分榜

懂球帝 浏览 2

60+女人,秋天穿衣“上紧下宽”,不紧绷、不暴露优雅显年轻

静儿时尚达人 浏览 322

周琦赵继伟回应李凯尔归化:不能只靠一个人,专注做好自己

澎湃新闻 浏览 14726

伊能静,在给全互联网当妈

江湖人称艾掌门 浏览 11225

4岁女孩在未锁门的车里睡觉突然失联 刑侦介入

极目新闻 浏览 5801

预计2026年正式发布 全新现代i20渲染图曝光

车质网 浏览 150

莫斯科市长称击落两架飞往莫斯科的武装无人机

环球网资讯 浏览 13743

产品力全面提升 问界M7新老款车型对比

车质网 浏览 56
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1