爆点资讯

由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队，最近在人工智能领域取得了一项重要突破。这项研究发表于2025年，论文编号为arXiv:2509.23371v1，提出了一种名为MetaAPO（Meta-Weighted Adaptive Preference Optimization）的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性，我们先来看一个生活中的例子。假设你正在教孩子学习做饭，你有两种教学资源：一套经典的家传菜谱（就像AI训练中的离线数据），还有让孩子实际动手练习的机会（就像在线生成的数据）。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习，而东南大学团队的新方法则像是配备了一位智慧的厨艺老师，这位老师能够根据孩子当前的水平，灵活决定什么时候该参考菜谱，什么时候该放手让孩子实践，从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战：如何让AI既能从人类已有的经验中学习，又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据，导致AI无法适应新情况；要么完全

东南大学突破：AI学会情境化拒绝能力

斯基拉：国米...

勇士124-...

钟楚曦合影风...

姚晨回应即将...

特朗普称赞高...

“嘎子”谢孟...

德科：C罗是我见过最谦逊的人，他和梅西是不同类型的天才

2025年ETF盘点：冠军花落通信ETF，年度黑马竟是它！十大关键事件影响深远

上海海港三场亚冠比赛仅拿1分，进1球丢6球

4年半亏了165亿，百亿基金经理被告上法庭

LG AI Research发布K-EXAONE：万亿参数模型挑战全球AI格局

偷鸡不成蚀把米！白百何疑开撕王传君，自己却先被骂了个底朝天

中国海警依法驱离菲律宾侵权船只边逃窜边喊糟糕

阿根廷3-0阿尔及利亚！梅西淡定，全队与其庆祝，现场球迷狂欢！

消息称三星Galaxy S26系列手机将首次提供2400万像素切换开关

叔叔宗泽后再发声：娃哈哈不是宗家的水军害了宗馥莉

特朗普：多名美高官将参与在委事务最终由我负责

切费林：我认为球员在赛季结束后，至少应该有一个月假期

李书福砍了一刀，尹同跃打出一枪！车市大战硝烟弥漫

东方财富实控人其实的妻子和父亲近期套现约93亿

仝卓表弟获救了！照片曝光头发已被剃光，从求助到救出不到24小时

美联储主席最热人选哈塞特：CPI报告好得令人震惊，美联储有很大空间可以降息

两会对话｜商汤徐立：建议推动AI工具的公共职业化培训，促进就业形态多元化发展

特朗普急于将爱泼斯坦案翻篇仍有250万页文件未公布

刘嘉玲在2.6亿豪宅办跨年宴，28岁侄子首露面

具俊晔搬入金宝山附近的新别墅，可以遥望大S的墓园

高盛：人工智能热潮并非泡沫，才刚刚起步

兴业消费金融：筑梦美好生活扎实推进高质量发展

移动、联通押注下一代“手机”

媒体：特朗普提出中美＂G2＂概念日本不安拼命找存在感