关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者888人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国航母前出行动相对固定,战术意图是什么?

浏览 10970

俄最新核潜艇下水 可搭载“末日鱼雷”

环球网资讯 浏览 713

应对欧盟关税压力?雷诺将与宁德时代、LG合作研发电池

观察者网 浏览 10659

美国专家:韩国不太愿意在中国问题上与美日结盟

上观新闻 浏览 19278

向太曝郭碧婷父亲患病或时日无多,儿媳长期留台,私房钱贴补娘家

不八卦会死星人 浏览 1043

一加 15 手机跑分曝光:骁龙 8 Elite Gen 5 芯片

IT之家 浏览 1693

俄无人机救下一名正遭乌军性侵女子 顾不上提裤子拔腿就逃

大象新闻 浏览 1016

金晨两种穿衣模式赚足回头率 身材太优越!

巧百搭 浏览 15293

曝美童军大规模性侵,数十年来受害者近10万人

趣看热点 浏览 26182

匈牙利外长:俄罗斯将按合同向匈牙利供应石油

界面新闻 浏览 14531

俄媒:武契奇自曝每天收到超200次死亡威胁

环球网资讯 浏览 16447

⌚⭐戴表绝杀队友!利拉德职业生涯首次斩获全明星MVP!

直播吧 浏览 12228

中国灵芝第一股寿仙谷,致敬保健产业30年

证券市场周刊 浏览 1657

郑爽张恒父母录音曝光,孩子打不掉就弃养!

趣看热点 浏览 26069

氢燃料电池已不被日本卡脖子了!

网易财经 浏览 15979

为什么宋朝这么弱却有320年的历史?

趣看热点 浏览 25661

想穿得又暖又美?快来看看这24套冬季造型

静儿时尚达人 浏览 13142

宫磊:国足做好防守不被偷袭,稳定心态把握机会完全能赢黎巴嫩

直播吧 浏览 12994

邮报:流浪者正考虑让麦克马斯特临时带队,等待穆斯卡特

懂球帝 浏览 998

“打飞的”半小时畅飞长三角,低空经济“飞入”进博会|聚焦2025进博会

华夏时报 浏览 661

95后爸爸在猪圈给娃搭床:猪圈脏 但孩子在身边才安心

极目新闻 浏览 101561
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1