关闭广告

AI让机器写代码变得更聪明:伊利诺伊大学团队破解训练瓶颈新方法

科技行者3831人阅读


当我们训练人工智能写代码或解数学题时,就像教小孩做作业一样,需要给它很多练习题。但问题来了:有些题目太简单,AI一下就会了;有些题目太难,AI怎么也学不会。更麻烦的是,按照传统方法,不管题目难易,我们都给每道题分配同样的练习时间和次数。这就像让学霸和学渣都花同样时间做同一套题——既浪费了学霸的时间,也帮不到学渣。

来自伊利诺伊大学香槟分校、微软研究院和阿姆斯特丹大学的研究团队,在2025年10月发表了一项名为"Reinforce-Ada: An Adaptive Sampling Framework for Reinforce-Style LLM Training"的研究。这项研究就像给AI学习装上了"智能调节器",让它能够根据题目难度自动分配练习时间,既不浪费计算资源,又能确保每道题都学得扎实。

研究团队的核心发现是:当前主流的AI训练方法GRPO(组相对策略优化)存在一个严重问题——当AI对某道题的所有尝试都得到相同结果时(要么全对要么全错),系统就收不到有用的学习信号,就像老师看到学生交上来的作业要么全是满分要么全是零分,无法判断学生的真实水平。

为了解决这个问

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

轰-6k在黄岩岛战备警巡示意图公布

央视新闻客户端 浏览 2874

女子手机突然预警陌生人在家偷东西 男子看见监控懵了

环球网资讯 浏览 7078

特朗普回绝伊朗新方案

界面新闻 浏览 749

中国留学生潜水后失踪妻子4天后报警 仅找到一根胫骨

新民晚报 浏览 23187

美军损失11架"死神"无人机 特朗普为卖它曾欲改其分类

红星新闻 浏览 29393

周深:新年巡演审批通过,创下三大历史记录

陈意小可爱 浏览 2837

恩里克:0-0通常让人觉得比赛沉闷,但今天完全不是这样

懂球帝 浏览 3452

谭松韵扛剧能力被质疑 赵丽颖成女主?

楚楚号 浏览 3179

以色列再次延长对半岛电视台运营禁令

上观新闻 浏览 2886

美官员称特朗普曾拒绝批准对台4亿美元军援 中方回应

北京日报客户端 浏览 4548

1月销量环比暴跌超20%!雷军:一季度本就是汽车销售淡季,且初代SU7已停售

商用车头条 浏览 2823

姚期智:我们建成了世界上最好的量子实验室之一

上观新闻 浏览 4645

巩俐和77岁“法拉利”老公甜蜜逛北京,依偎互拍

粵語经典歌單 浏览 3261

上新|| 我心中的“人生衬衫”,它终于来了

黎贝卡的异想世界 浏览 2153

哈啰“豪赌”Robotaxi,联手阿里和宁德能否比萝卜快跑“跑更快”?

汽扯扒谈 浏览 4715

文班亚昕就这?前三节仅1分末节刷到7分 生日夜仍被杜锋战略冰封

颜小白的篮球梦 浏览 3307

30 个月,一个周榜的诞生与消失

晚点LatePost 浏览 3932

中方敦促波黑各方缓解紧张局势

国际在线 浏览 3828

王菲没想到女儿窦靖童,会以头秃理由嫌弃亲爹

千言娱乐记 浏览 3923

9.4分剧王回归,封神到最后一秒

独立鱼 浏览 3371

【亚冠精英】阿苏埃头球路易斯建功 申花2比0首尔

体坛周报 浏览 4051
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1