关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者3363人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

或于2026年推出 比亚迪大汉谍照曝光

车质网 浏览 2604

长安汽车10月销量27.8万辆 同比增长11%

网易汽车 浏览 2860

图片报:皇萨塔、曼联、拜仁、药厂、多特等球队关注艾希霍恩

懂球帝 浏览 628

世体:拉菲尼亚将坐在替补席额外座位上,为球队提供支持

懂球帝 浏览 3228

被预制菜笼罩,商场餐饮大撤退?

餐饮老板内参 浏览 2834

BBA,势败如山倒

虎嗅APP 浏览 2226

马克·库班抨击OpenAI情色计划:这将会适得其反

鞭牛士 浏览 3386

懒懒陪王思聪低调过38岁生日,晒甜蜜日常

丁丁鲤史纪 浏览 2315

委内瑞拉强烈反对“美国封锁空域”

国际在线 浏览 2835

账面1000多亿,却隐藏20多年,整个互联网都找不到它长什么样

壹只灰鸽子 浏览 2228

发球都不会的球员混进ITF职业比赛!引国外网友和专家愤怒

网球之家 浏览 2397

荣耀林林:整个行业成本趋势非常恶劣,二手机不排除会涨价

IT之家 浏览 2512

曼联官方:召回小将惠特利,为北安普顿出场25次打进3球

懂球帝 浏览 2281

梁靖崑一脸沮丧令人心疼!10-6手握赛点被逆转 腰伤困扰他9个月

颜小白的篮球梦 浏览 2873

每体:奥尔莫将因伤错过加泰德比,预计在西超杯期间伤愈复出

懂球帝 浏览 2488

芦哲:降准降息利好哪些权益资产?

首席经济学家论坛 浏览 3332

看AI变身游戏达人:莫斯科研究院开发超快视觉智能测试平台KAGE

科技行者 浏览 2231

TA:弗兰-加西亚本预计将外租樱桃,对皇马放弃交易感到失望

懂球帝 浏览 2008

致敬,齐达内送给法国10000米冠军格雷西耶一件签名皇马球衣

懂球帝 浏览 3923

聂远不让女儿雨天上学,黄磊女儿满口错别字,怪不得星二代要进圈

萌神木木 浏览 2828

美论坛:为什么中国明知很容易被摧毁 仍在南海建基地

博览历史 浏览 6531
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1