关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者3240人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

陈晓新剧黯然收官!口碑崩塌评论区沦陷,和前妻陈妍希对打输惨了

萌神木木 浏览 3573

长短剧都颓了,横屏中剧才是全村的希望?

仙女事件簿 浏览 1022

刘亦菲早年 告白遭考古,老己竟是全网粉丝?

山野卢员外 浏览 3583

IPO观察丨东鹏饮料再递表港交所,大单品收入占比近8成,上半年广告费超8.8亿元

红星资本局 浏览 4433

利民推出 PA140 SE 双塔风冷:158mm 高双风扇六热管,275W 解热

IT之家 浏览 4345

从百亿到两百亿:董宇辉2025年做对了什么?

字母榜 浏览 3305

普京公开重要情报:全国人民都该了解

环球时报新闻 浏览 3883

雷军,这次不对劲

创业家 浏览 4082

四维图新孟庆昕:全面AI转型,2027年或可盈亏平衡

网易汽车 浏览 4224

苹果iOS 26.2开发者预览版Beta发布:大批功能改!锁屏也能自定义液态玻璃

快科技 浏览 4001

AI设计出可杀灭细菌的功能性病毒,专家呼吁谨慎推进

IT之家 浏览 5136

币圈大佬的重生:特朗普特赦赵长鹏

节点财经 浏览 4179

18.51亿元!这家信托100%股权,第三次挂牌!

券商中国 浏览 3230

理发店主阻拦城管撕广告 冲突中被1名胖城管咬伤手指

大风新闻 浏览 6276

精致詹詹,美媒晒出詹姆斯更衣室座位边摆满护肤品的照片

懂球帝 浏览 3815

AI是繁荣还是泡沫?哈佛学者剖析OpenAI千亿交易背后的风险

硅星人 浏览 4319

赵露思这段戏火了,陈伟霆当初没说错

刘蕳爱下厨 浏览 4603

新一轮货币宽松到来

泽平宏观展望 浏览 3226

冬天就要和金靖一样穿得暖呼呼的

时尚COSMO 浏览 3355

许绍雄最新状况!戴氧气罩不能说话,大半港圈明星探视人缘极好

萌神木木 浏览 4210

成熟女性秋天衣服怎么穿?看看这些穿搭就有灵感,舒适又简约

静儿时尚达人 浏览 4403
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1