关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者3327人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

哔哩哔哩董事长兼CEO陈睿:优质视频内容能给用户获得感

上游新闻 浏览 4055

让智驾能看懂真实世界 英伟达发布开源Alpamayo平台

网易汽车 浏览 3431

芦哲:降准降息利好哪些权益资产?

首席经济学家论坛 浏览 4318

古二3次发布录音,王家卫秦雯深陷争议

阿伧说事 浏览 3998

房企开年集体“变阵”:人事调整与架构重塑背后的生存新法则

拾盐士 浏览 3251

比亚迪元PLUS高功率版曝光 电机功率增至230千瓦

网易汽车 浏览 4529

山东海阳老人扎堆领结婚证现场挤满人 有村庄包车去办

极目新闻 浏览 10326

短剧版《小巷人家》,为什么难成下一部《父母爱情》?

仙女事件簿 浏览 3629

高管“换血”,股东内斗落幕!200亿淳厚基金迎国资入主

独角金融 浏览 3319

春季躁动,AI软件应用迎来“奇点时刻”

懂财帝 浏览 3249

秋季穿衣原来如此简单!记住这几组穿搭公式,得体简约又耐看

静儿时尚达人 浏览 4186

被自称前女友的网友实名举报涉毒 短剧"顶流":别搞我

极目新闻 浏览 7614

李斌、雷军“吹哨”,芯片危机又来了

汽车公社 浏览 3310

baby近照撞脸刘嘉玲,苹果肌下垂脸变僵,没了事业心近乎退圈

萌神木木 浏览 3883

谁说何老师老了?!

时尚COSMO 浏览 4177

短剧翻拍《新英雄本色》,刘萧旭主演?

最爱酷影视 浏览 4477

真我售后网点增至 815 家,GT8 Pro 将是同档“最香”旗舰机

IT之家 浏览 4298

号称追星不用背相机:OPPO官宣哈苏专业影像套装,含增距镜、手柄

IT之家 浏览 4473

重马"破三"选手终点附近倒地离世 业内人士:切勿透支

扬子晚报 浏览 12727

机器人“农民”来了!智能“秒杀”杂草,不用一滴农药

上观新闻 浏览 2833

打破29个月冠军荒!梅总终于赢了!

网球之家 浏览 4443
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1