关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者3098人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国机会|ASML:半导体产业开放合作是主流

澎湃新闻 浏览 3948

爱马仕继承人,千亿家产被最好的朋友骗光

Yuki女人故事 浏览 3640

阿维塔王金海:豪华不止于技术 要让用户每天感到品牌在变好

网易汽车 浏览 3454

全面大撤离!李嘉诚英国“套现”2000亿

创业家 浏览 793

中国机会|ASML:半导体产业开放合作是主流,继续依法合规为中国客户提供坚实支持

澎湃新闻 浏览 4010

KAIST团队突破视频生成瓶颈:让AI学会"自我反思"修正动作错误

科技行者 浏览 2995

60+女人,秋天穿衣“上紧下宽”,不紧绷、不暴露,优雅年轻

静儿时尚达人 浏览 4175

马斯克:解散 xAI,把22万张GPU租给OpenAI死对头

创业家 浏览 812

朱丹新年晒全家福,儿女戴眼镜长相很一般

疯说时尚 浏览 3313

当你的代码测试出问题时,人工智能能像专业程序员一样修复吗?

科技行者 浏览 2742

在桃浦,解锁未来发展无限可能

上观新闻 浏览 3312

插混车纯电续航超过210km,增程车怎么办?

汽车公社 浏览 3125

约6000人被埋加沙废墟下 哈马斯:不会离开自己的土地

红星新闻 浏览 4257

今日热点:曾艳芬提醒丝芭传媒有聊天记录;边伯贤恶评者被罚款……

伊周潮流 浏览 3353

朱元璋变脸 研究学者:"鞋拔子脸"异像并非其真实面容

环球网资讯 浏览 20737

国常会重磅部署!

数据宝 浏览 3990

从头部驱动到生态共建,初瑞雪重构直播团队新范式

时代周报 浏览 3379

弗里克:相信阿隆索会有新工作;坎塞洛明天有可能上

懂球帝 浏览 3102

《水龙吟》《天地剑心》一弃一追

古木之草记 浏览 3936

这些都是普通人适合的穿搭!多穿卫衣和半身裙,舒适又耐看

静儿时尚达人 浏览 3812

国亮新材IPO:行业产能过剩、竞争对手强大,未来发展出路在哪里

览富财经网 浏览 3875
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1