关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西3629人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

阿门:我之前一直是詹姆斯、威少和沃尔球迷,后来我喜欢隆多

懂球帝 浏览 3466

解码东道主意大利的冲金版图 丰塔纳的最后一舞

体坛周报 浏览 2741

精读季报丨谢治宇的基金,为什么只适合“买”,不适合“抄”?

一地基毛 浏览 2805

邻居在家门口干了匪夷所思的事 杭州女子:提心吊胆

极目新闻 浏览 33863

毒枭留下的80头河马被捕杀前获救 亚洲富豪:我全要了

中国新闻周刊 浏览 95074

2025年利润在4%徘徊,车圈是从从容容还是连滚带爬‌?

禾颜阅车 浏览 3307

牛弹琴:委内瑞拉面临三场较量 美国将更加狂妄

北京日报客户端 浏览 6601

《恋人》要空降?会成下个《许我耀眼》吗?

楚楚号 浏览 3255

陆毅女儿漂亮到认不出!年仅16岁身高超一米七,长相神似陈都灵

温柔娱公子 浏览 4209

南海舰队发声:中国军人,只有战死没有吓死

极目新闻 浏览 2913

鲁媒:苏超决赛变成青训对决,别被所谓“草根”赛事蒙蔽双眼

懂球帝 浏览 4029

《许我耀眼》很爽,但要小心

时尚COSMO 浏览 4187

剑桥大学团队揭秘:如何让计算机像管家一样聪明地分配工作

科技行者 浏览 2669

解码科创成长层药企2025年成绩单

北京商报 浏览 810

谁是真汇源?

经济观察报 浏览 3020

清华字节跳动首创视频换脸新纪元:让照片主角完美融入视频场景

科技行者 浏览 2948

董明珠的言语经常惹争议,但是她做的事为何都做对了?

BT财经 浏览 2839

市场关键时点前夕,伦敦金属交易所交易一度中断两小时,铝锌等金属受影响

华尔街见闻官方 浏览 2018

对话深投控何建锋:当好耐心资本、长期资本、大胆资本|连线两会

中国企业家杂志 浏览 2190

保时捷的2025:利润触底+渠道震荡,百年积淀如何穿越周期?

买车君 浏览 3012

杭州一公园白鹤"大战"无人机 现场市民看得心惊肉跳

都市快报橙柿互动 浏览 32384
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1