关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者3184人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

以色列再次延长对半岛电视台运营禁令

上观新闻 浏览 1940

三万俱乐部的疲态:“蔚小理” 的 2025

晚点LatePost 浏览 2455

双雄对决,最豪华精彩的英国戏剧现场上演!

幕味儿 浏览 2997

一年狂揽60亿融资!13大玩家厮杀无人配送,阿里京东美团都入局了

车东西 浏览 1889

华为主导+广汽控股,华望汽车或定名“启境”,首款车型明年发布

车市红点 浏览 3876

“私募一哥”A股清零,大恒科技再临十字路口

每日资本论 浏览 3397

瞭望 | 宇宙寻亲新路径

新华社 浏览 2674

香港科学院新增五名院士

财闻 浏览 2393

首播6集热度高达9100!好评如潮,观众直呼:“看完不敢上厕所”

娱乐圈笔娱君 浏览 3151

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者 浏览 2941

“末日鱼雷”目前“无法拦截” 俄一周内测试两种战略武器

环球网资讯 浏览 3047

若昂-内维斯卖便宜了?坎波斯:我们为他支付的价格很合理

懂球帝 浏览 2340

莫雷托:赫罗纳与国米接触,询问了阿斯拉尼的转会可能

懂球帝 浏览 2148

姚晨:自然予我

时尚COSMO 浏览 4918

日本经济长期疲软,日元购买力跌至53年来最低

环球网资讯 浏览 1507

苏永康被曝出轨!劣迹太多网友呼吁封杀?

萌神木木 浏览 2772

今年冬天最流行搭配:裤子+靴子,高级又时髦!

LinkFashion 浏览 2651

29.39万起 2.71秒破百 法拉利同款底盘 新款阿维塔12真的不是超跑吗?

网易汽车 浏览 373

机器人爆单之后

北京商报 浏览 2763

盛合晶微冲刺IPO 募资扩产引争议

北京商报 浏览 2908

推广中奖名单-更新至2025年12月19日推广

黎贝卡的异想世界 浏览 2157
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1