关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西2325人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

马杨马君妍官宣怀二胎,马立奥要当哥哥了

扒虾侃娱 浏览 2728

花400元“过家家”,Jellycat火爆看不懂?情绪消费正带来行业新逻辑

红星资本局 浏览 2783

升东部第二!绿军轻取公牛获4连胜 西蒙斯27分普里查德21分

醉卧浮生 浏览 1793

荣耀MagicOS 10升级设备数突破1000万 力争春节前都能升

快科技 浏览 1992

引援自救!内蒙古矿业富豪入局,贾国龙朋友圈托举西贝

时代财经 浏览 601

投机永不眠!加密货币失宠 币圈玩家转战预测市场

智通财经 浏览 1479

寻找AI的杀手级应用:机器人、智能驾驶和智能可穿戴设备

21世纪经济报道 浏览 3248

大鹏工业:外购标准件采购占比超七成 自研的被评奖项目背后现客户

金证研 浏览 2744

金价暴跌 不少上海人跑外地买黄金:就像在抢大白菜

极目新闻 浏览 5767

王小卤的双11:在抖音电商,把凤爪“嗦”成国民零食

一点财经 浏览 2553

太二不做酸菜鱼了?告别酸菜鱼的太二想干啥?

江瀚视野 浏览 1664

郑丽文再称"大陆是我们的亲人" 民进党直接跳脚

扬子晚报 浏览 7696

外观设计风格独特 本田0 α原型车发布

车质网 浏览 2323

美拉德失宠了?今年冬天最流行的3个颜色,谁穿谁好看!

LinkFashion 浏览 2151

瑞典拉普兰:凛冽北境的万物平衡之道

时尚COSMO 浏览 1943

特斯拉第三季度财报亮点:交付创新高,能源业务强势领跑

不看车bukanche 浏览 2616

5部电影亏了8亿,古天乐不甘心,又带来三部生猛大片

娱乐圈笔娱君 浏览 1753

海AI实验室团队揭秘:LLM训练新招数让AI学习效率提升36%

科技行者 浏览 1506

朱亚文评价白宇,只字不提演技,却一针见血

白面书誏 浏览 1513

美军大兵压境 委内瑞拉发现一邻国与中情局勾结

上观新闻 浏览 2146

《大生意人》将至,陈晓出演一代商王,或可比肩《乔家大院》

最爱酷影视 浏览 2951
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1