关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西2511人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

媒体:特朗普提出中美"G2"概念 日本不安拼命找存在感

澎湃新闻 浏览 30393

百亿私募一站式出海!招商证券打造跨境服务生态

券商中国 浏览 2136

针对配置进行升级 新款小鹏G9官图发布

车质网 浏览 1910

汇源官方旗舰店及多个电商平台空无一物 客服回应

大风新闻 浏览 21667

俄美乌首次三方会谈在阿联酋举行

环球网资讯 浏览 1681

向华强说娱乐圈明星美女他看不上眼:极致宠溺背后的事业共生学

互联观察联盟 浏览 1751

专栏 | 做“主语”的体验

时尚COSMO 浏览 1814

委内瑞拉内政部长称美国袭击造成100人死亡

新京报 浏览 1547

星空相册|今年“个头”最大的“超级月亮”来啦

新华社 浏览 2630

小鹏汽车出海新动态:小鹏 MONA 正式发往中东非

IT之家 浏览 2676

王心凌吴克群暧昧19年爆热恋1年内飞4地约会

小霍霍 浏览 1544

拜仁欧冠战巴黎大名单:凯恩领衔,诺伊尔、卡尔在列

懂球帝 浏览 2792

双星名人创始人父子决裂 父亲称被儿子扣工资借钱维生

极目新闻 浏览 9225

REDMI K90 Pro Max 可与 iPhone / 小米 17 Pro Max 通用钢化膜

IT之家 浏览 2850

鲁尼:萨拉赫应该回撤参与协防;范戴克的进球应该算作有效

懂球帝 浏览 2621

宁愿净身出户,也要与闫妮离婚的邹伟现状如何?

律便利 浏览 2885

AI大模型"减肥"新突破:MWS AI团队让语言模型变小却更聪明

科技行者 浏览 2930

磐霖资本迎来收获季:连投6轮的明星企业上市了

投中网 浏览 1852

李亚鹏的女人缘为什么这么好?

仙女事件簿 浏览 2875

泽连斯基:美提议举行美俄乌国家安全顾问级别会议

国际在线 浏览 2152

拼多多没活成“别人家的孩子”

老斯基财经 浏览 2927
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1