关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者1018人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

时间的“相对论”:为什么我们总觉得时间越跑越快?『心灵加油站』(271)

我们的太空 浏览 1385

我国最“不靠谱”专家,公开在央视“忽悠”人

来科点谱 浏览 989

货拉拉跑腿骑手取走万元苹果手机后失联 手机店主发声

红星新闻 浏览 7247

咖啡万店新王诞生:挪瓦如何以“寄生模式”隐秘扩张?

虎嗅APP 浏览 1372

推动新场景大规模应用要打通哪些堵点?专访工信部赛迪研究院胡国栋丨聚焦国常会

封面新闻 浏览 1888

乌方公布视频:无人机命中俄方两架安-26运输机

环球网资讯 浏览 2382

两名国民党民代遭起诉 郑丽文:民进党想团灭在野党

海峡导报社 浏览 12864

三季报发布,中国人寿总保费规模创历史同期新高

证券市场周刊 浏览 2064

新研究让大模型学会主动追问,人机协作效果大幅提升

DeepTech深科技 浏览 1037

加拿大总理:加美经济关系已结束

北京日报客户端-长安街知事 浏览 8667

欧洲11国及欧盟领导人联合声明:承诺为乌提供安全保障

环球网资讯 浏览 18396

ChatGPT要有广告了?消息称ChatGPT安卓测试版现广告代码

环球网资讯 浏览 1538

NVIDIA研究团队打造"思考-表达"双模式AI

科技行者 浏览 954

马卡: 姆巴佩在皇马达成50球里程碑,本赛季点球命中率显著提升

直播吧 浏览 2893

苹果iPhone 17e首次支持eSIM!单SIM卡+eSIM/双eSIM

快科技 浏览 141

流行了100年的CP?大衣+阔腿裤,不过时的高级

LinkFashion 浏览 851

i60首月销量破万 广汽埃安全系月销量达40066辆

网易汽车 浏览 1165

特朗普:我不知道还能活多久 很多人都想置我于死地

扬子晚报 浏览 36442

板块轮动到谁了?沪指逼近4000点,机构正大幅买入这些主题ETF

每经牛眼 浏览 1996

午评:创业板指半日跌3% 稀土永磁板块逆势爆发

网易财经 浏览 2237

兰博基尼 CEO 温科尔曼称至少十年内不会放弃内燃机

IT之家 浏览 2152
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1