关闭广告

AI让机器写代码变得更聪明:伊利诺伊大学团队破解训练瓶颈新方法

科技行者133人阅读


当我们训练人工智能写代码或解数学题时,就像教小孩做作业一样,需要给它很多练习题。但问题来了:有些题目太简单,AI一下就会了;有些题目太难,AI怎么也学不会。更麻烦的是,按照传统方法,不管题目难易,我们都给每道题分配同样的练习时间和次数。这就像让学霸和学渣都花同样时间做同一套题——既浪费了学霸的时间,也帮不到学渣。

来自伊利诺伊大学香槟分校、微软研究院和阿姆斯特丹大学的研究团队,在2025年10月发表了一项名为"Reinforce-Ada: An Adaptive Sampling Framework for Reinforce-Style LLM Training"的研究。这项研究就像给AI学习装上了"智能调节器",让它能够根据题目难度自动分配练习时间,既不浪费计算资源,又能确保每道题都学得扎实。

研究团队的核心发现是:当前主流的AI训练方法GRPO(组相对策略优化)存在一个严重问题——当AI对某道题的所有尝试都得到相同结果时(要么全对要么全错),系统就收不到有用的学习信号,就像老师看到学生交上来的作业要么全是满分要么全是零分,无法判断学生的真实水平。

为了解决这个问

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

小米推出“围观短剧”App:主打“无广告海量短剧免费看”

IT之家 浏览 524

政策利率带动LPR下行,存量房贷下调空间大

华夏时报 浏览 15778

以军装甲部队进入加沙地带南部城市拉法市中心

央视新闻客户端 浏览 10446

一人讲一个瞒着表友的手表知识!都太炸裂了!

万表世界 浏览 12857

中科大团队开发新型暖白光LED,最大发光效率接近理论水平

DeepTech深科技 浏览 11999

不惧油价上涨 成都车展这些混动车型值得关注

车市红点 浏览 19697

众星捧月到人走茶凉,杨颖的生日宴揭下姐妹假面

传媒一班 浏览 19277

净利润暴增503倍!310亿“零食大王”,冲刺港股IPO

侃见财经 浏览 523

零跑不是小米,胜似小米

路咖汽车 浏览 12406

印军在中印边境用上“地道战”究竟是怎么回事?

趣看热点 浏览 25542

摩根大通减持,持股比例低于5%!小鹏汽车一年多跌没3145亿

市界观察 浏览 18865

2024上半年评分最低的6部剧,如果你一部没看,那就成功避雷

不八卦会死星人 浏览 10447

特朗普或优先“做掉”欧洲?

浏览 22246

预售35万起 小鹏X9增程版终结MPV续航焦虑

网易汽车 浏览 44

敷尔佳:定价过高、盟友倒戈,重营销模式难掩发展困境|ESG案例

网易财经ESG 浏览 23

"30年老公厕"被改成咖啡店后又遭封 当地城管部门回应

封面新闻 浏览 9085

大结局!俞敏洪董宇辉被偶遇,“挺董派”等着喝酒

萌神木木 浏览 12495

怒放竞技场3V3街头足球赛玉溪站落幕,奥斯卡、约尼查助阵

懂球帝 浏览 9

小鹏 P7+ 汽车累计交付 8 万台

IT之家 浏览 538

王家卫繁花有黑幕!?

八卦疯叔 浏览 1071

黄仁勋,亲赴台积电“要产能”

华尔街见闻官方 浏览 10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1