关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西3938人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

蓉城海港连败0进球!为中超争冠大轮换,媒体人:亚冠毫无吸引力

奥拜尔 浏览 4325

被美围绕的一周:上课、逛家、看展

黎贝卡的异想世界 浏览 4299

IPO观察丨东鹏饮料再递表港交所,大单品收入占比近8成,上半年广告费超8.8亿元

红星资本局 浏览 4519

除了卖汽水,这家外资巨头还在中国修飞机、开医院丨国是访问

国是直通车 浏览 4109

名爵MG4 X正式上市 售价9.98-11.68万元

车质网 浏览 508

加公有能!罗马5轮4胜仅失1球升第2

体坛周报 浏览 4861

杰伦-约翰逊登顶老鹰队史三双榜 “新鹰王”已悄然诞生

仰卧撑FTUer 浏览 3723

马杜罗在出庭期间在纸上做笔记 对旁听席说"新年快乐"

环球网资讯 浏览 6909

这场活动让李亚鹏被骂13年!成了离婚导火索

萌神木木 浏览 3218

E句话| 马尔福已经成了马年吉祥物?

仙女事件簿 浏览 3051

《一路繁花2》要封神?5位综艺强者登场,预告连刷4遍不过瘾

娱乐圈笔娱君 浏览 4394

2026款小米SU7即将上市!最高纯电续航902Km

小史谈车 浏览 2308

推广中奖名单-更新至2025年10月10日推广

黎贝卡的异想世界 浏览 4047

机票“锁座”变相收费 10家航司被约谈

北京商报 浏览 3921

新款小鹏G9申报图曝光 自研图灵芯片上车

网易汽车 浏览 4411

iPhone Air国行版要来了!联通eSIM预约通道正式开放

三言科技 浏览 3747

历时8小时,神舟二十一号乘组第一次出舱任务全回顾视频发布

IT之家 浏览 3803

不一定能掀桌男主,但一定是个好演员!

伊周潮流 浏览 3184

这些才是真正接地气的穿搭!裤子基础、外套保暖,简单又自然

静儿时尚达人 浏览 3382

福建舰入列消息刷屏 美媒对其达到的技术高度表示赞叹

环球网资讯 浏览 8978

71岁老太,专治穷病

她刊 浏览 1462
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1