关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西3819人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

众星送别袁惟仁,前妻陆元琪露面表示不再怨恨,Ella哭到说不出话

萌神木木 浏览 2355

印度砸7000亿卢比吸引日韩造船不料这两国胃口有点大

澎湃新闻 浏览 6230

马斯克摊牌,商业航天不赚钱!

米筐投资 浏览 146

梅德韦杰夫终结882天冠军荒,阿拉木图夺第21冠,一纪录让人惊讶

网球之家 浏览 4205

这年头长得好看也成错了?!

伊周潮流 浏览 2161

节后戒断太难,屏障修复实验室自有招

时尚COSMO 浏览 3573

中国9系新旗舰 长城魏牌V9X正式亮相

网易汽车 浏览 2392

六王表演赛:辛纳2-0横扫阿卡,带走600万美金和一把纯金球拍

懂球帝 浏览 4094

本赛季前5轮三支英超升班马共拿19分,比上赛季三队快一倍

直播吧 浏览 5018

台媒:解放军演习戳破“美日救台”迷梦

参考消息 浏览 17767

弗里克:相信阿隆索会有新工作;坎塞洛明天有可能上

懂球帝 浏览 3222

李在明告诉CNN:不能将中国拒之门外

环球网资讯 浏览 7278

周深香港跨年唱到凌晨!5万人嗨翻无投诉

贵州小娟 浏览 3279

迪丽热巴:从流量到实力,她还能走多远?

伊周潮流 浏览 3627

山西废止烟花爆竹禁令背后:5年前最严"禁炮令"出台

澎湃新闻 浏览 8706

天津联通与华为合作:5G-A宽上行样板点峰值速率突破1Gbps

IT之家 浏览 2912

齐沃:锋线四人组兼容且互补;我不会去抱怨海外赛

懂球帝 浏览 4159

美军营救飞行员出动155架飞机

新华国际头条 浏览 1607

哈马斯证实达成加沙停火协议 呼吁特朗普确保以执行

界面新闻 浏览 18832

蔚来全新ES8正式上市,起售价40.68万元

财经无忌 浏览 5054

刘强东又拿下理想,京东汽车靠谱吗?

正在说车 浏览 3487
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1