关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者3343人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

腾讯元宝接入微信支付

观察者网 浏览 4156

惠普暗影精灵11《英雄联盟》典藏版月底开售,海克斯金色线条装饰

IT之家 浏览 4327

23岁硕士徒步因高反去世 刚出现症状时没有听劝下撤

红星新闻 浏览 9057

杜加利奇解释离队:不是竞技因素和经济问题,原因在于一个人

懂球帝 浏览 3682

墨西哥总统:骚乱平息 瓜达拉哈拉机场遭占领消息不实

都市快报橙柿互动 浏览 39374

夏天的白裙,可以像赫本那样穿

Yuki女人故事 浏览 1117

从“白幼瘦”到“气血感”,审美标准终于“健康”了?

Yuki女人故事 浏览 3730

波兰官员称中方不愿迫使俄结束乌克兰危机 外交部回应

澎湃新闻 浏览 4985

2026年春晚分会场官宣 周深肖战刘宇宁令人期待

你我话娱乐 浏览 2795

经典重构,法拉利SC40向F40致敬

爱驾天下 浏览 4234

比亚迪元PLUS高功率版曝光 电机功率增至230千瓦

网易汽车 浏览 4544

白百何声明翻车!晒对接聊天记录漏洞百出,工作室评论区沦陷

萌神木木 浏览 4160

陈都灵、宋慧乔的短发美上热搜!春天想换发型一定不要错过这篇

LinkFashion 浏览 2399

突然拉升!加密货币超6万人爆仓,发生了什么?

每日经济新闻 浏览 3536

普通人冬天就该这么穿,衣服不昂贵、搭配不老气,简单又日常

静儿时尚达人 浏览 3704

看到郭宇欣跑龙套旧照,站杨紫身边一点不输,才知啥叫小红靠捧

温柔娱公子 浏览 3974

波兰外交部称有炮弹击中该国驻乌克兰大使馆

极目新闻 浏览 4923

多给2分钟来背锅?大帝25分钟20+6丢绝杀 马克西才该为失利担责

颜小白的篮球梦 浏览 4244

米切尔:我罚球少是因为不假摔;不敢多聊,我朋友都被罚款了

懂球帝 浏览 1098

长友佑都:目前的巴西并非最强形态,我认为日本队有机会取胜

懂球帝 浏览 4436

上汽零售赶超比亚迪

大象新闻 浏览 3348
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1