关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者3102人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

腾讯元宝派宣布支持接入OpenClaw

环球网资讯 浏览 2118

何时结束战事 美以不同调:一个急于退场一个还想硬刚

环球网资讯 浏览 2056

迪亚曼蒂:在广州有卖鳄鱼肉和鳄鱼皮的,简直不可思议

懂球帝 浏览 4684

牛弹琴:中国外交干了件大事 王毅的一句话内涵很丰富

现代快报 浏览 24647

周受资,晋升一位90后女将

华尔街见闻官方 浏览 3827

中企在非洲因环境问题引争议 遭800亿美元天价索赔

澎湃新闻 浏览 41490

笑星冯淬帆离世

萌神木木 浏览 3242

城区油耗2.98L/100km 长安逸动蓝鲸超擎官图发布

网易汽车 浏览 1542

李鬼变李逵?央视揭开温峥嵘骗局真相

烈史 浏览 3776

北汽新能源与小马智行达成全面深化战略合作

观察者网 浏览 3109

4岁娃吃席打翻盘子被要求道歉 父亲:"娃儿小"不是借口

封面新闻 浏览 18570

特朗普宣布:美伊协议取得重大进展,暂停“自由计划”!美方:搭载美军的商船遭袭!伊朗:与美国处于战争状态,霍尔木兹海峡已关闭

每日经济新闻 浏览 875

普通人冬天就该这么穿,衣服不昂贵、搭配不老气,简单又日常

静儿时尚达人 浏览 3474

马年“春晚”排成这样,我断言:观众看完,会站起来鼓掌

皮皮电影 浏览 3124

采用插混动力 奇瑞风云A7谍照曝光

车质网 浏览 2112

上年纪的姐妹们别慌!“反油腻”穿搭就这两招,时髦又显气质

静儿时尚达人 浏览 4091

主播让弗洛伦齐向拉齐奥打招呼,弗洛伦齐:永远不会

懂球帝 浏览 4152

观众对白百何的评价,明白了当年宋丹丹那番话

娱乐圈笔娱君 浏览 3096

港媒:高市所谓“对话”表态纯属玩文字游戏

参考消息 浏览 8673

首次庭审细节披露:马杜罗声音洪亮 称自己是战争囚犯

看看新闻Knews 浏览 6857

长这样的外套,大骨架女孩不要买!

Yuki女人故事 浏览 3994
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1