关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者1576人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

支持家乡球队,网球球员吴易昺来黄龙体育场观战浙江vs山东

懂球帝 浏览 2723

日本前首相石破茂再批"日本拥核"言论

界面新闻 浏览 1920

李施嬅困局:被有毒关系猎杀的富家女

仙女事件簿 浏览 2175

从一秒起身的机器人到降本80%的数据,鹿明机器人破解具身机器人智能化困境

雷峰网 浏览 1773

美联储年内“三连降”,2026年利率走向何方?

中新经纬 浏览 2160

高通AI研究团队让图像生成快1.7倍

科技行者 浏览 1763

记者:NBA正考虑取消伦纳德与快船的合同使其成为自由球员

懂球帝 浏览 972

重庆女子乘"黄色法拉利"去内蒙古:计价器爆表了

大风新闻 浏览 18209

斗跑杨立昆后自己也要被废?汪滔赶忙“端菜上桌”

字母榜 浏览 756

"鸡排哥"在座谈会上发言 被指"讲出了6亿项目的气魄"

扬子晚报 浏览 39311

国米vs凯拉特首发预测:巴雷拉踢后腰,劳塔罗继续首发搭皮奥

懂球帝 浏览 2612

“工装混搭风”今年爆火!全世界的时髦女人都在穿

LinkFashion 浏览 1423

美军猛烈轰炸后 特朗普暗示或发起"踩红线"打击

界面新闻 浏览 94778

《小城大事》上星央八 热血筑梦正当时

小小李娱 浏览 1785

2025羽绒服8大流行趋势,温暖时髦过冬天!

LinkFashion 浏览 2167

达姆施塔特工业大学发布SCICOQA数据集

科技行者 浏览 1523

官方:张效瑞出任梅州客家总经理,莱蒂耶里担任主教练

懂球帝 浏览 1576

2025公益热度排名:肖战压过王一博登顶公益榜

未曾青梅 浏览 1731

贵州省能源局局长陈华接任茅台集团董事长

网易财经 浏览 2637

当女将军成为内娱偶像剧时尚单品,我们更怀念穆桂英

时尚COSMO 浏览 4633

新款小鹏G9申报图曝光 自研图灵芯片上车

网易汽车 浏览 2836
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1