关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者3342人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

《营救汪星人》成毅正在透支自己的观众缘

娱乐圈笔娱君 浏览 3112

中方公布重要证据后 日本防卫大臣只得改口但依然狡辩

环球时报国际 浏览 8415

俄副外长警告:北约敌对行为可能导致核大国间直接冲突

环球网资讯 浏览 4204

2025公益热度排名:肖战压过王一博登顶公益榜

未曾青梅 浏览 3315

美经济学家:所谓对伊开战有利美国经济十分荒谬

国际在线 浏览 1712

欧豪:16岁送外卖,21岁遇到贵人谢霆锋

韩驰 浏览 3455

下周关注|进博会等多个重要活动将举办, 这些投资机会最靠谱

第一财经资讯 浏览 4283

美澳签85亿矿产大单 特朗普对澳大使说"我不喜欢你"

红星新闻 浏览 8872

上海交大吴家睿:复杂的科学时代需要复杂性思维|全国科普月

上观新闻 浏览 5128

低价"银行直供房"激增 有房产价格低于市价25%

第一财经资讯 浏览 8500

委反对派领导人把自己的诺贝尔和平奖赠予特朗普

财联社 浏览 3180

当“蔚小理”跌出头部:2026车企淘汰赛全面加速

首席商业评论 浏览 3423

她连上5次春晚,私下却和恩师同居怀孕被骗流产

律便利 浏览 4271

乌方公布视频:无人机命中俄方两架安-26运输机

环球网资讯 浏览 4225

每体:西甲启动2027-32赛季在西班牙的电视转播权拍卖

懂球帝 浏览 4190

杠上了!皇马与西甲争议盘点:点球未判、突遭药检、首轮延期被拒

直播吧 浏览 5043

新增双色特别涂装 全新宝马X7将2027年上市

车质网 浏览 3051

舒淇哽咽表白冯德伦:谢谢你娶一个不常在家的女人

Yuki女人故事 浏览 6378

突发!技术派掌权,吴泳铭调整阿里组织结构

互联网那些事 浏览 1779

男子精神分裂砍死同学的弟弟 第二次精神鉴定结果变了

红星新闻 浏览 8473

特斯拉第三季度财报亮点:交付创新高,能源业务强势领跑

不看车bukanche 浏览 4130
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1