爆点资讯

当我们训练人工智能写代码或解数学题时，就像教小孩做作业一样，需要给它很多练习题。但问题来了：有些题目太简单，AI一下就会了；有些题目太难，AI怎么也学不会。更麻烦的是，按照传统方法，不管题目难易，我们都给每道题分配同样的练习时间和次数。这就像让学霸和学渣都花同样时间做同一套题——既浪费了学霸的时间，也帮不到学渣。

来自伊利诺伊大学香槟分校、微软研究院和阿姆斯特丹大学的研究团队，在2025年10月发表了一项名为"Reinforce-Ada: An Adaptive Sampling Framework for Reinforce-Style LLM Training"的研究。这项研究就像给AI学习装上了"智能调节器"，让它能够根据题目难度自动分配练习时间，既不浪费计算资源，又能确保每道题都学得扎实。

研究团队的核心发现是：当前主流的AI训练方法GRPO（组相对策略优化）存在一个严重问题——当AI对某道题的所有尝试都得到相同结果时（要么全对要么全错），系统就收不到有用的学习信号，就像老师看到学生交上来的作业要么全是满分要么全是零分，无法判断学生的真实水平。

为了解决这个问

AI让机器写代码变得更聪明：伊利诺伊大学团队破解训练瓶颈新方法

深度解读“碱...

日股大跌，政...

一边收监管“...

锂电行业“反...

等折叠屏iP...

许绍雄葬礼设...

福建舰更多细节公布一组动图全方位看清楚

考古中秋“顶流”的出道史

宁波网友投诉到理发店理发被诱导消费：1次花了6万元

今日起，数字人民币开始计息，这些变化影响你的钱包

伊朗军官：美以不再能随心所欲结束战争

美媒称中国又抓到美国痛点:一旦断供美国就得瘫痪

胡歌现身为电影宣传，现场人山人海全场欢呼，胡歌照顾后辈好暖心

“双引擎”再提速：中国资本市场改革释放创新红利

小个子秋季穿搭指南！7件单品穿出大长腿，显高10cm

5名共和党议员＂倒戈＂特朗普＂愤怒＂向其打电话威胁

上海老教授花600万借孙女名字买房结果要不回来了

德国Mindfactory平台数据：AMD处理器周销量是英特尔10倍多

换装丰田混动系统！马力提升至219匹！美版2026款CX-50售21万

苏州造车新势力Kosmera跑车亮相CES 2026

秋季的穿衣难度并不高，选择基础款、配色不沉闷，舒适又减龄

eSIM手机，来了！

中方在联合国点名日本呼吁警惕其涉核消极动向

游客境外租车加错油＂全额保险＂被判失效还被扣6000元

事关钓鱼岛、南海等问题国防部最新回应

32岁杨紫又“变脸”，皮肤紧致一脸高原红，重回“锦觅”颜值巅峰

赵震：中国青训最需要解决的是体系问题，应坚持搞校园足球

点一桌子菜只吃几口，39岁杨幂揭开内娱现状，没胃口更没活人感

不尊重中国领土完整！巴萨遭批：中国特供不发外网甩锅临时工

最「可爱」的全新酷路泽 FJ 上线，这真不是方程豹在日本失散的兄弟？