关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者4155人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

百亿私募一站式出海!招商证券打造跨境服务生态

券商中国 浏览 3336

阿里发布生态级AI助手数字人形象——千问“小酒窝”

大象新闻 浏览 1274

官方:麦克托米奈当选2025意大利足球盛典年度最佳球员

懂球帝 浏览 3552

苹果被曝开发类ChatGPT应用!专为训练新Siri打造

智东西 浏览 4573

北京105-74大胜广东 球员评价:3人满分,7人及格,2人低迷

篮球资讯达人 浏览 3304

上年纪的女人穿衣别焦虑,试试这几个搭配套路,优雅还减龄

静儿时尚达人 浏览 3951

王勤伯:美感足球给AI足球上一课!巴黎拜仁谱传奇

体坛周报 浏览 1007

靠创新药结束连续8年亏损局面,百济神州烧百亿研发终迎转机

览富财经网 浏览 4691

专家:美方受到来自北京的迎面正击 特朗普真没招了

澎湃新闻 浏览 4183

推广|| 被低估的百元级国货!推荐你们趁好价试试

黎贝卡的异想世界 浏览 6092

上海男子出门频频裸露臀部太辣眼睛 女邻居崩溃了

看看新闻Knews 浏览 35355

特朗普或为中国制造三大机遇,中国如何利用?

浏览 26991

华为智慧屏新品MateTV Max今日预售,110英寸64999元

IT之家 浏览 3685

波士顿动力人形机器人亮相CES 拟2028年进厂造车

网易汽车 浏览 3190

《寒战1994》票房大爆,四位演员被赞,演技才是真正的颜值滤镜

娱乐圈笔娱君 浏览 818

小米汽车直播间遭网暴,仅剩一家门店直播,雷军抖音账号半个月掉粉30万

红星资本局 浏览 4163

奥迪A8L和雷克萨斯LS或无后续全尺寸轿车接班!

凡兮说 浏览 3933

《狙击蝴蝶》开播!看完4集,我想说:都市爱情剧就该这么拍!

娱乐圈笔娱君 浏览 3617

上海97-77大胜浙江,李弘权18分,吴前15分,兰道夫27+5

懂球帝 浏览 3464

A股董事被拘!涉嫌违法放贷,早年工行履历被关注

财通社 浏览 4283

23岁硕士徒步因高反去世 刚出现症状时没有听劝下撤

红星新闻 浏览 8816
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1