爆点资讯

当我们训练人工智能写代码或解数学题时，就像教小孩做作业一样，需要给它很多练习题。但问题来了：有些题目太简单，AI一下就会了；有些题目太难，AI怎么也学不会。更麻烦的是，按照传统方法，不管题目难易，我们都给每道题分配同样的练习时间和次数。这就像让学霸和学渣都花同样时间做同一套题——既浪费了学霸的时间，也帮不到学渣。

来自伊利诺伊大学香槟分校、微软研究院和阿姆斯特丹大学的研究团队，在2025年10月发表了一项名为"Reinforce-Ada: An Adaptive Sampling Framework for Reinforce-Style LLM Training"的研究。这项研究就像给AI学习装上了"智能调节器"，让它能够根据题目难度自动分配练习时间，既不浪费计算资源，又能确保每道题都学得扎实。

研究团队的核心发现是：当前主流的AI训练方法GRPO（组相对策略优化）存在一个严重问题——当AI对某道题的所有尝试都得到相同结果时（要么全对要么全错），系统就收不到有用的学习信号，就像老师看到学生交上来的作业要么全是满分要么全是零分，无法判断学生的真实水平。

为了解决这个问

AI让机器写代码变得更聪明：伊利诺伊大学团队破解训练瓶颈新方法

足总杯117...

一觉醒来霍尔...

“霸凌”周迅...

委反对派领导...

卫宁健康实控...

今年最狠悬疑...

河南田地积水玉米发霉农民：夏天求的雨下在了秋天

豆瓣逆天9.6，世间再无如此大师云集的神作！

奇瑞集团2月销售16.1万辆累计出口突破600万辆

新财年临近，美政府“停摆”风险加剧，白宫指示联邦机构准备裁员计划

英伟达向CoreWeave追加投资20亿美元，首推独立CPU芯片

女网红流落柬埔寨街头中使馆：已联系其家属准备接回

男子＂手搓＂小船带着儿子游太湖被困：船刚开出一公里

战斗感十足雷克萨斯LFR内饰谍照曝光

＂煤老虎＂敛财数千万元被批受贿＂来者不拒、大小通吃＂

巨星传奇想摆脱“周杰伦依赖”

2026年度流行色怎么搭最好看？看这篇就够了

新研究发现 AI 的最大破绽：不是不够聪明，而是不会“骂人”

格罗斯谈重返布莱顿：我有几个选项，但布莱顿一直是首选

曼城虐菜之战：18场18胜！哈兰德再冲英超100球首发曝光

广东渔民捕的＂神兽＂鉴定为韩江鼋曾在《西游记》出现

海魂衫搭配白色，更解暑！

伊姐周日热推：电视剧《大生意人》；电视剧《乌蒙深处》......

西芒杜铁矿石准备装船，榨取中国钢企利益的时代该结束了

官方：因看台有医疗紧急情况，富勒姆vs利物浦推迟15分钟开球

皮耶罗评尤文浪费机会太多：皇马就不会浪费这么多机会

体图：格纳布里愿意接受较低薪资，拜仁可能和他续约两年

联合国官员：加沙教育系统状况是灾难性的

成熟女性秋天衣服怎么穿？看看这些穿搭就有灵感，舒适又简约

巴特勒18+10勇士轻取鹈鹕3连胜，库里9+5穆迪单节7三分比肩传奇