爆点资讯

由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队，最近在人工智能领域取得了一项重要突破。这项研究发表于2025年，论文编号为arXiv:2509.23371v1，提出了一种名为MetaAPO（Meta-Weighted Adaptive Preference Optimization）的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性，我们先来看一个生活中的例子。假设你正在教孩子学习做饭，你有两种教学资源：一套经典的家传菜谱（就像AI训练中的离线数据），还有让孩子实际动手练习的机会（就像在线生成的数据）。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习，而东南大学团队的新方法则像是配备了一位智慧的厨艺老师，这位老师能够根据孩子当前的水平，灵活决定什么时候该参考菜谱，什么时候该放手让孩子实践，从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战：如何让AI既能从人类已有的经验中学习，又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据，导致AI无法适应新情况；要么完全

东南大学突破：AI学会情境化拒绝能力

首拍飙至数千...

终于来了！山...

李湘要气炸了...

不敌王楚钦，...

工信部副部长...

珍珠专场||...

伊姐元旦热推：电视剧《人之初》；电视剧《轻年》......

TIGIT的转机还会出现吗？

媒体：高市早苗疯言台湾问题中方对她没什么好客气的

姚晨怒批倍速看剧：观众不该背锅

“一言不发”的唐嫣，给娱乐圈上了一课

支付宝旗下两家经营主体完成更名，支付宝APP名字不变

特朗普就伊朗问题表态伊朗：不会轻易相信美国

认真生活的18个锦囊妙计：

演了一辈子警察却穷得靠老朋友刘丹接济

苹果公司在印度反垄断案中可能面临高达380亿美元罚款

骑士135-119轻取步行者，米切尔43+9+6，西亚卡姆26分

将于年内上市别克至境SUV官方预告图曝光

这个意外走红的风格，冬天穿真的很加分！

抖音&LV-NUS开源多模态新模，以小博大刷新SOTA，8B推理比肩GPT4o

福建舰是否即将交接入列国防部回应

权力重构？泽连斯基亲信部队高层遭反腐

深圳松岗街道：以“开放性场景”创享技术可感、产品可触、产业互联“新模式”

曾经拯救过无数个学生狗的360doc，倒下了。。。

《寒战1994》票房大爆，四位演员被赞，演技才是真正的颜值滤镜

果壳直击CES：具身智能下班时刻

影后秦海璐，与二婚丈夫生下一子，如今过的怎样

前任自杀，现任小25岁，他算渣吗？

迟重瑞放弃继承陈丽华百亿遗产，他终于解脱了！

极石ADAMAS将于12月28日上市