爆点资讯

这项由清华大学联合小米公司、浙江大学、南洋理工大学和中科院自动化所共同开展的研究发表于2026年2月，论文编号为arXiv:2601.22491v1。研究团队开发了一种名为"甜蜜点学习"(Sweet Spot Learning, SSL)的全新AI训练方法，能够显著提升智能体在复杂任务中的学习效率和表现。

这个看似浪漫的名字其实来源于网球运动中的一个经典概念。当你用网球拍击球时，球拍上有一个特殊的区域叫做"甜蜜点"——在这个位置击球能产生最佳的力度和控制效果。研究团队受此启发，认为在AI训练过程中也存在类似的"甜蜜点"区域，如果能引导AI智能体向这些高质量解决方案区域学习，就能大幅提升训练效果。

传统的AI智能体训练就像是一个严厉的老师，只会给出"对"或"错"的简单评价。比如在训练一个AI助手完成手机操作任务时，不管这个助手是用3步还是8步完成任务，只要最终结果正确，都会得到相同的奖励分数。这种粗糙的评价方式就像是告诉学生"答案正确就行"，却不指导他们如何找到更优雅、更高效的解题方法。

研究团队发现，这种二元化的奖励机制存在三个关键问题。首先是优化方向不明确，

清华等联合开发＂甜蜜点学习＂算法：AI智能体训练效率提升2.5倍

贵州2岁女童...

销售渠道改为...

俄方表示结束...

未来四个月，...

王传君拿下东...

或搭载激光雷...

黄金、白银突然暴跌！发生了什么？

AI会取代考古学家吗？在这场沙龙中窥见人工智能对文保利用的影响

特朗普建议高市不要在台湾问题上挑衅通话细节披露

雷军跨年直播拆车，15台手机撬动300亿市值？

26岁男子从杭州徒步回重庆过年途经湖北获邀吃杀猪饭

轴距3066mm 全新奥迪A6L将于1月15日首发

警惕溢价QDII产品投资风险

19岁女孩留学9天遭遇电诈后自杀父亲:我女儿太善良了

多地突然取消！小地方，不配办马拉松了？

颜骏凌：和范德萨交换了联系方式，在儿时偶像面前踢球是圆梦

皇社球员阿兰布鲁：要把绝杀进球献给经历艰难时刻的委内瑞拉

美国11月密歇根大学消费者信心创逾三年新低，短期通胀预期上升

靠老婆出圈，成名后过河拆桥，这4位实在绝情！

AI时代存储“超级牛市”降临？透视A股存储核心产业链掘金逻辑

470场，格列兹曼追平科利亚尔并列马竞队史出场榜第5名

泽连斯基被疑＂诅咒特朗普＂：政客嘛早晚会死

希罗赛季首秀24+7热火险胜独行侠夺5连胜状元14中5华盛顿27+8

买黄金，要大变了！

中企在拉美花22个月建成的铜矿无法投产：总统换人了

或告别燃油时代丰田Supra将于明年停产

存储芯片涨价潮蔓延，半导体细分龙头业绩“水涨船高”

2026，如何留在“牌桌”上？

43岁张杰正式宣布退出！原因令人意外

2天挨4 针，韩国皮肤科，挤满“特种兵医美”的中国人