爆点资讯

这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台，论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者，他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时，一个有趣的现象出现了：那些曾经被视为"金标准"的测试题目，如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试，但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下，上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场，专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台"，寓意着要像古希腊神话中扛起天空的巨人一样，承担起衡量AI真实科学推理能力的重任。

想象一下，如果把现有的AI测试比作小学数学题，那么ATLAS就像是博士入学考试。它不满足于简单的

上海AI实验室推出ATLAS：让AI在科学推理中＂败下阵来＂的超级考场

马克龙透露约...

中超第27轮...

赵少康称＂很...

全世界都被肯...

汽车之家官宣...

龙芯中科拟募...

一心为女儿铺路的李湘，竟被撕下体面？

保时捷失守中国市场

曼联官宣利马伤情，恐缺席两周战水晶宫存疑！曝红魔欲签热刺铁卫

标配激光雷达和四驱魏牌高山7上市售28.58万

伊朗一间谍组织被瓦解其主要成员曾多次前往以色列

对话黑芝麻高管：不烧钱造新芯，机器人平台发布前已经创收

美2027财年国防预算恐创纪录五角大楼查女兵＂有效性＂

球队新闻：凯文进入比赛名单

谢娜主持晚会还是差一口气！直播接不上话，看热闹忘记控场一直笑

2025蔚来日在杭州成功举办

卡罗拉锐放价格再下探！网友：这次真心动了

新华社:2026世界有7大悬念或将深刻影响国际政经格局

用AI演戏，Vidu 的三重进化，AI视频从碎片化叙事迈向复杂叙事新阶段

NVIDIA 向英特尔投资 50 亿美元共同开发 AI 基础设施和个人计算产品

铜梁融媒：U16国足已抵达重庆备战，全力冲刺U17亚洲杯预选赛

郝蕾说金敏喜是自己在亚洲的唯一对手

今年冬天一定要拥有的6件衣服，谁穿谁好看！

记者：兰斯门将伊文-贾万愿意加盟纽卡，前提是能成为二门

E句话| 姐有新恋情啦？

美联储112年来最富的主席，要改规矩了！

官方：不莱梅免签勒阿弗尔19岁前锋奎坦特

从对手到盟友，刘强东王兴联手要“联吴抗曹”？

长城汽车发布归元平台，穆峰称坚决不做增程式

更智能更豪华乐道L90加配置会贵多少？