关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者3100人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

张纪中爆料不留情面,刘晓庆风流妖精形象受创

精彩背后 浏览 2888

利润激增200%,半导体巨头,护城河太深!

飞鲸投研 浏览 2848

刘淼上任第十年,泸州老窖“重回前三”的目标,还是没希望

无冕财经 浏览 4592

德国防长建议特朗普道歉 但暗示并不真抱希望

参考消息 浏览 7232

李亚鹏与娇妻离婚!女方近期动态充满伤感,晒落泪照直言心情复杂

萌神木木 浏览 4187

中央批准 开除姜德果、唐德智党籍

北京日报客户端-长安街知事 浏览 43275

转行当吉他手?科纳特被罗梅罗蹬到后,做出吉他里的扫弦动作

懂球帝 浏览 3366

温州85后接棒,百亿企业大“换血”

中国企业家杂志 浏览 3897

媒体:俄乌战场“飞出”的无人机 为何让欧洲如此忧惧

极目新闻 浏览 5974

第一阶段加沙停火协议正式生效

界面新闻 浏览 4328

10.58 万!零跑造了一台「红米 YU7」

极客公园 浏览 3918

媒体:美国解除对白制裁 系大国格局中精心策划的变动

上观新闻 浏览 16661

纯电汉兰达?丰田发布新款SUV预告,向新时代低头?

正在说车 浏览 2970

嘉定企业携新品亮相集成电路设计业展览会

上观新闻 浏览 2867

为什么她们穿粉色很好看?

Yuki女人故事 浏览 2905

涉中国电动汽车,美交通部长称“加拿大会后悔”,外国网友回怼:该后悔的是美国吧!

海外网 浏览 3010

定义豪华越野中国标准,2025纵横之夜暨G700预售发布会盛大开启

梅卿快车道 浏览 5020

苏州一企业愿无偿为嫣然医院提供场地 负责人:将详谈

潇湘晨报 浏览 7018

收购“Manus”也治不好大厂的焦虑症

虎嗅APP 浏览 3161

借小贝之力,三狮欲赴迈阿密集训

体坛周报 浏览 4062

零百加速1.8s 星空计划首款车型将亮相CES

车质网 浏览 3302
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1