关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者396人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

澳海滩枪击惊魂50分钟:枪手占据天桥向下扫射

澎湃新闻 浏览 6395

外观酷似G级 奔驰全新纯电SUV谍照曝光

车质网 浏览 874

数读“十四五”答卷︱世界第一、全球领先!一组数据看我国科技事业历史性成就

海外网 浏览 2378

DiDi联手香港科大首创自动旅行规划AI

科技行者 浏览 1325

专家:高市早苗收敛了一贯对华强硬的鹰派色彩

北京日报客户端 浏览 12189

美国的联邦制,很落后!

浏览 24085

上海海港三场亚冠比赛仅拿1分,进1球丢6球

懂球帝 浏览 1550

里程偏差98%时长偏差136% 女子坐网约车被扣费超10倍

新民晚报 浏览 7856

1-9月百万级豪车销量:奔驰3款入榜,奥迪出局,仰望U8苦苦支撑?

AGKC阿贵艺车 浏览 1405

媒体:泰军缴获柬军中国制造反坦克导弹 有人阴阳怪气

新民周刊 浏览 11420

高能量唱跳歌手李斯丹妮的「12小时」,居然是这样度过的?

时尚COSMO 浏览 720

苏格兰11月世预赛大名单:麦克托米奈、罗伯逊领衔

懂球帝 浏览 1391

普通人穿衣别太发愁,学会这些基础穿搭,舒适大方又省时间

静儿时尚达人 浏览 1597

视频:单日发射数百架 俄乌无人机互袭更趋激烈

环球网资讯 浏览 542

双节假日即将拉开序幕:酒店民宿预订率均超去年,第一批拼假游客已抵达酒店

澎湃新闻 浏览 2038

小米推出“围观短剧”App:主打“无广告海量短剧免费看”

IT之家 浏览 1650

A股董事被拘!涉嫌违法放贷,早年工行履历被关注

财通社 浏览 1684

轮圈选择丰富/金标开放选装 新一代SU7更多细节

网易汽车 浏览 480

纳米级OLED突破:科学家开发出全球最小发光像素,仅 300nm² 见方

IT之家 浏览 1512

媒体:美军武器靠拆零件续命 对美国或是一种致命伤

新民周刊 浏览 7143

“受够了女装就是男装XXS版”,不想再交粉红税的她们被「时尚户外风」哄好了

Vista氢商业 浏览 1697
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1