关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者4278人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

俄称今年已控制205个居民点 乌称对俄港口及战机发动袭击

极目新闻 浏览 4777

八部门:加快脑机接口等新型终端的产业化、商业化进程

澎湃新闻 浏览 3297

《浪姐7》4大“赢家”,出道多年不及参加一档综艺,选择真重要

娱乐圈笔娱君 浏览 1375

年龄差19岁,这对姐弟恋又给内娱上了一课!

伊周潮流 浏览 3599

OPPO刘作虎:无法承诺全年不涨价

观察者网 浏览 1349

网友称在按摩时遭51岁技师摸下体猥亵 门店:他才来3天

大风新闻 浏览 98110

蔡一杰体内癌细胞仍在扩散,最新露面照显憔悴,身形也消瘦不少

素素娱乐 浏览 273

对话工程院院士王浩:我国独创的“河湖长制”值得向“全球南方”国家推广

封面新闻 浏览 4076

海哈金喜更新离婚后动态,状态不错

影视口碑榜 浏览 3425

短剧都没有她的故事精彩?62岁活成了多少人羡慕的样子

黎贝卡的异想世界 浏览 3076

瓜帅:利物浦和阿森纳都在争冠;英超风格的改变?我会接受

懂球帝 浏览 4200

寻找隐形冠军|意想不到的它

海外网 浏览 3018

华为的智驾神话,要被打破了吗?

电动势 浏览 3212

释永信老照片流出 21岁的他推师傅看病看起来老实本分

火山詩话 浏览 19778

宁德时代再出手!1月内从弃控到增资,深度绑定富临精工磷酸铁锂版图

时代周报 浏览 3006

春天就该这样穿!裙子选彩色、白色T恤作内搭,舒适优雅简约

静儿时尚达人 浏览 1294

莱因克尔:对阵勒沃库森时哈弗茨应首发,他能提供更多东西

懂球帝 浏览 2229

转战舞池,前意大利网球名将弗格尼尼斩获《与星共舞》冠军

懂球帝 浏览 4078

杭州20楼江景房业主破防:每晚耳边都是广场舞立体声

环球网资讯 浏览 58398

美国要“收回”阿富汗空军基地 阿政府断然拒绝

环球网资讯 浏览 5054

这一天:杨幂蚂蚁腰无敌了,赵丽颖生图抗打,陈坤咋长这样了

娱乐圈笔娱君 浏览 3071
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1