关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西2732人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

英媒:由于伊萨克受伤,利物浦预计不会在冬窗放走萨拉赫

懂球帝 浏览 2424

这次黄一鸣 没给王思聪留体面?

可乐谈情感 浏览 2124

一汽-大众迈腾臻选款上市 售价17.49万元起

车质网 浏览 2773

生涯之夜!邹阳35+7三分创新高 福建大胜送四川开局9战全败

醉卧浮生 浏览 2177

女星安吉丽娜·朱莉访乌 其随身保镖被乌军征兵处抓走服役

极目新闻 浏览 2953

民营航天新年首战告捷:星河动力谷神星一号海上成功发射四星入轨

澎湃新闻 浏览 2025

镜报:格拉利什对阵曼城需要回避,这让英超的公平性受到损害

懂球帝 浏览 3367

AI 接管手机这事儿,豆包能干成么?

钛媒体APP 浏览 2601

《一路繁花2》出圈理由

娱乐圈笔娱君 浏览 3122

销量、价格双双坍塌,二线豪华品牌,已经被国产新能源“挤垮”了

小李车评李建红 浏览 2540

搭载VLA大模型 魏牌全新蓝山智能进阶版年内上市

网易汽车 浏览 2541

刘越:申花最后的点球判罚的太牵强,阿利米踢球合理简练

懂球帝 浏览 2966

千万粉丝网红"猴哥说车"官宣离婚:缘分尽了 和平离婚

扬子晚报 浏览 18594

郑丽文"不谈统一"让人失望了 蔡正元的话一针见血

现代小青青慕慕 浏览 8067

曾获专班支持的“座上宾”,如今被追要1.4亿元投资款!光伏龙头50亿元项目推进不利,收地方政府“听证通知书”

每日经济新闻 浏览 2262

福斯特:曼联看起来很有信心,但争4与曼城相比差距依然明显

懂球帝 浏览 2948

被判赔偿220万元 海底捞"小便门"当事人登报道歉

上观新闻 浏览 12565

Word再见!华为和WPS联手攻克难题:一句话生成PPT、PDF/Excel大文件秒开

快科技 浏览 1875

特朗普扬言:美国已经变成了一个真正的联合国

参考消息 浏览 23899

北京78-93天津1喜3忧!太吃杰曼状态,陈盈骏低迷,许利民辣眼!

篮球资讯达人 浏览 1973

马特塔:对阵佛罗伦萨首次首发,品尝错失的意甲滋味

绿茵情报局 浏览 386
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1