关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者3339人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

英媒:特朗普下令制定"入侵"格陵兰岛计划 遭军方抵制

环球网资讯 浏览 3318

限制赎回风波后,当红PE Blue Owl为数据中心专项基金募资17亿美元

华尔街见闻官方 浏览 3838

300135前三季度由盈转亏!池州国资入主后大动作,沥青龙头跨界投资半导体

时代周报 浏览 4319

新鹏城确定新帅 44岁英国教头接替陈涛 曾率队胜曼联+进英联杯4强

我爱英超 浏览 298

王大陆逃兵役案新后续,贾静雯老公受牵连

查尔菲的笔记 浏览 3511

智驾双雄:大湾区杀出全球智驾新势力

21世纪经济报道 浏览 3258

评论丨网购衣服上的“密码锁”,是商业诚信的刺眼“疤痕”

红星新闻 浏览 4285

阿里正把自己装进赛博分身

虎嗅APP 浏览 3275

媒体:被昔日学生中国超越 欧洲落于人后的悲观正蔓延

澎湃新闻 浏览 6300

57岁寻亲志愿者离世:为数百人找到家 自己却未能回家

扬子晚报 浏览 22074

森保一:若球迷都穿巴西球衣来看球,那我们恐怕很难赢

懂球帝 浏览 4511

小鹏汽车2025年交付超42万台:大增126% 创历史新高

快科技 浏览 3418

8样回购N次宝藏零食!送礼/自己吃都合适!

Yuki女人故事 浏览 6342

刚刚,全球首个GB300巨兽救场!一年烧光70亿,OpenAI内斗GPU惨烈

新智元 浏览 4401

主打新潮科技 smart精灵#6内饰官图发布

车质网 浏览 1813

从短剧到漫剧,快手的内容大生意

定焦One 浏览 4123

欧豪骨子里的江湖气与角色浑然天成

呱田里的猹 浏览 4448

厂房沉降纠纷缠身,熊猫乳品两大募投项目延期

时代周报 浏览 3369

第一女富豪的大瓜,被拍出来了

独立鱼 浏览 4121

4500亿果链龙头狂赚115亿,潮汕富豪父女身家超800亿

21世纪经济报道 浏览 4298

伊姐周六热推:电视剧《亦舞之城》;电视剧《时差一万公里》......

伊周潮流 浏览 3769
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1