关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西3751人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

罗体:萨里向洛蒂托要求在一月引进一名高水平中场球员

懂球帝 浏览 3701

62岁"石榴姐"在景区打工 曾饰演过不少"丑女"角色

红星新闻 浏览 8307

过去24小时共有5艘船只通过霍尔木兹海峡

国际在线 浏览 1074

第二十七届高交会将于下周举办,中国太空游项目将全球首发

南方都市报 浏览 3985

工信部:将会同有关部门加强养老服务机器人研发

IT之家 浏览 3777

今年秋天一定要拥有的10件单品,时髦又高级!

LinkFashion 浏览 3622

"30年老公厕"被改成咖啡店后又遭封 当地城管部门回应

封面新闻 浏览 12791

资产上亿女老板突然失联 知情人:疑似被骗去泰国

上观新闻 浏览 23453

美军猛烈轰炸后 特朗普暗示或发起"踩红线"打击

界面新闻 浏览 116611

中方点名以色列 呼吁实现加沙真正持久停火

新京报 浏览 191

申万宏源:牛市1.0高点看26年春季 关注储能、存储、创新药与国防军工

智通财经 浏览 3929

高市早苗内阁"明显右转" 日本或开启"保守暴走"时代

上观新闻 浏览 7462

初秋穿什么才最适合?准备好以下这些单品,日常穿衣不再发愁

静儿时尚达人 浏览 6457

森保一:若球迷都穿巴西球衣来看球,那我们恐怕很难赢

懂球帝 浏览 4337

《树影迷宫》给10位演员演技排个名

皮皮电影 浏览 3959

北向资金三季度持仓曝光:宁德市值第一,京东方A获增持股数最多

澎湃新闻 浏览 4206

杨紫连续七年为李现庆生,没有避嫌只有坦荡

娱乐寡姐 浏览 4288

本轮矿业大周期的演进逻辑,隐匿在“卖铲人”的资产负债表里

锦缎研究院 浏览 1330

吃相难看!史晓燕曝何晴离婚有隐情,力挺许亚军

収起了底线 浏览 3476

对标丰田4Runner 本田新款Passport最新消息曝光

乐选爱车 浏览 4286

崔东树:2025年全国汽车市场总体走势较强 新能源商用车景气度走高

智通财经 浏览 3491
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1