关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者2157人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

今日热点:匠妹因太漂亮没能出演长发公主;时代峰峻回应朱志鑫见面会……

伊周潮流 浏览 2810

31岁女护士提分手遭男友割喉 生前日记称像活在地狱中

中国新闻周刊 浏览 8654

解密福建舰电磁弹射背后的硬核支撑

上观新闻 浏览 2880

宗馥莉,抛弃娃哈哈?

豹变 浏览 3846

美国坠机航母将退役

极目新闻 浏览 3020

美国“难民”涌入,中国公知的天塌了!

浏览 25785

大湾区晚会太混乱!跑调抢拍忘词破音全占了,合唱几乎都翻车

萌神木木 浏览 3125

英特尔AI双赛走出的万名开发者,正在弥合AI人才缺口

科技行者 浏览 2089

谷歌AI实现类人判断解决系统偏见问题

科技行者 浏览 3055

短剧女神郭宇欣让多少白幼瘦女星脸红?

娱乐圈笔娱君 浏览 3175

断崖领先,罗塞尼尔执教白堡同期使用U21球员时间五大联赛第1

懂球帝 浏览 2165

4680电池的大饼,马斯克不想画了

远川科技评论 浏览 2113

每体:球打到巴萨球员手臂就会判点;轮到皇马就要“解读”

懂球帝 浏览 3101

美军扣船不到48小时 中美在安理会"大吵一架"

基斯默默 浏览 11999

十铨推出最新P35S外接SSD:按下按钮瞬间“自爆”!

快科技 浏览 3996

李璇:三镇开出国内球员顶薪与邓涵文续约,但没能续约成功

懂球帝 浏览 2650

精致詹詹,美媒晒出詹姆斯更衣室座位边摆满护肤品的照片

懂球帝 浏览 2799

丈夫因妻子"买肉价格低"疑其出轨 捅刺结婚30多年妻子

红星新闻 浏览 3414

被记者询问涉移民言论 德国总理回呛"问你们女儿去吧"

环球时报国际 浏览 10707

强生爽身粉致癌案新进展:被判赔单一原告近70亿元

红星新闻 浏览 4448

林心如曝与霍建华婚姻裂隙:孕期独守空房

一盅情怀 浏览 3188
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1