关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者3117人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

鸿铭股份创始人夫妇拟退出董事会,25岁哥大硕士儿子将加入

红星资本局 浏览 3223

时光相册| 一生逐梦蓝天,缅怀顾诵芬院士

新华社 浏览 249

连续被血洗!今年前十个月的涨幅,币圈一个月跌完了

华尔街见闻官方 浏览 4075

E句话| 李艺彤和丝芭居然和平解约了?

仙女事件簿 浏览 2865

半导体封测第一股,进击汽车电子!

飞鲸投研 浏览 3203

单眼皮、矮个子、微胖,停止焦虑!普通女孩的美丽指南请收好

Yuki女人故事 浏览 2858

爱马仕的暮色时分有多美?

时尚COSMO 浏览 2452

秋季的穿衣难度并不高,选择基础款、配色不沉闷,舒适又减龄

静儿时尚达人 浏览 4453

奚梦瑶何猷君婚礼曝光 深情热吻甜蜜

情感大头说说 浏览 275

谷歌Pixel 11系列手机Tensor G6芯片爆料:7核CPU

IT之家 浏览 1301

美印友谊的中流砥柱被FBI大张旗鼓拘捕 被控"串通中国"

澎湃新闻 浏览 9840

64岁男演员春节在景区打工暴瘦引担忧 曾自称不再拍戏

扬子晚报 浏览 39331

委内瑞拉谴责美军扣押委油轮:国际海盗行为

环球网资讯 浏览 3741

电动豪华的再进化 新款奔驰EQS新车图解

车质网 浏览 1174

奇才120-103尼克斯,巴格利18+11,亚布塞莱11分,克拉克森12分

懂球帝 浏览 4303

5名中国游客在巴厘岛车祸死亡 伤者:司机一点伤没有

扬子晚报 浏览 44257

中科大团队发布Agent-R1:让AI智能体像人类一样学习和成长的框架

科技行者 浏览 3223

学者:此次"正义使命"演习最大的亮点就是"开局即打"

环球网资讯 浏览 24929

足球:雷恩成为欧洲五大联赛第四大球员输送俱乐部

绿茵情报局 浏览 3312

媒体:向乌提供"战斧"或只是幌子 特朗普可能另有打算

枢密院十号 浏览 18485

弗里克:很不满意拉菲尼亚受伤;还没和特尔施特根聊过

懂球帝 浏览 3083
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1