关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者1573人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

深圳“果链女王”拟减持3600万股,公司市值超千亿,正冲刺A+H上市

红星资本局 浏览 1609

香港科大:用"随机策略"训练AI数学推理,效果竟然超越复杂算法

科技行者 浏览 2680

SK海力士因环保问题被罚26.4万

雷达财经 浏览 2809

西方媒体炒作“伊朗加速生产导弹”

环球网资讯 浏览 2424

中加领导人时隔8年首次会晤 外交部回应

外交部网站 浏览 8271

又有8个大V账号被封!雪球一日连发“两弹”,“游资战法”等遭重点打击

第一财经资讯 浏览 1665

李娜×新狮铂拓界:源于价值理念的同频共振

网易汽车 浏览 2291

连券商首席都被妈妈“科普”,商业航天太火了

财通社 浏览 1668

韩版Galaxy S26独享,三星Exynos 2600芯片被曝难以走向全球

IT之家 浏览 2188

环球:中国实施稀土出口管制 美方没必要过度反应

环球网资讯 浏览 6246

猛士汽车2025全年销量10228台 同比增长387%

网易汽车 浏览 1762

朱江明和费翔一起发零跑车皇!增程配80度大电池,“全身名牌”登场

车东西 浏览 2597

白敬亭带着无限流杀回来了,这剧真的很好看!

伊周潮流 浏览 3696

新增蓝牙数字钥匙 迈腾3000万辆甄选款17.49万起

网易汽车 浏览 2869

媒体:中美元首打电话"提及台湾" 极为重要、极不寻常

环球网资讯 浏览 14880

全球知名对冲基金投资人:中国业务超越预期

中国基金报 浏览 2376

今年秋冬,流行“九分”穿法,时髦又显高!

LinkFashion 浏览 2251

8个月前碰撞损伤仍未修复 美"杜鲁门"号航母新照披露惹争议

环球网资讯 浏览 2794

打破垄断,光模块巨头,利润大增300%!

飞鲸投研 浏览 1421

17个街道年投入逾亿元 资质错配、服务动力不足何解?

南方都市报 浏览 2062

福建舰是否即将交接入列 国防部回应

环球网 浏览 3313
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1