关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者1565人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

内需复苏叠加“反内卷” 聚焦两大方向投资机遇

证券时报 浏览 1013

汪峰演唱会遭遇“掉链子”

一娱三分地 浏览 2527

60年首次4200万美国人"断粮" 特朗普:快打民主党电话

红星新闻 浏览 8570

小米YU7交付量突破4万台 推出高端定制服务

网易汽车 浏览 3393

特朗普威胁对欧洲8国加税:直到美"彻底购买格陵兰岛"

红星新闻 浏览 5812

国家医保局:职工医保个人账户跨省共济今年全国覆盖

商业观察杂志社 浏览 930

以军坦克开进加沙城 特朗普警告哈马斯“别动人质”

澎湃新闻 浏览 3588

易三方/云辇-A/2.0T 腾势N8L售29.98万元起

网易汽车 浏览 2236

43天内两度被约谈引关注,携程的奔跑与隐忧

天下财道社 浏览 2794

法国队史第3次闯入U20世界杯半决赛,此前一次夺冠一次第4

懂球帝 浏览 2871

苹果欲推首款低价Mac,定价远低于1000美元,挑战微软与Chromebook

华尔街见闻官方 浏览 2538

德云社岳云鹏五姐包大巴车,带亲友们看演唱会

情感大头说说 浏览 2870

吴越曾黎同框对比!一个自然老去一个脸僵浮肿,不是没皱纹就年轻

萌神木木 浏览 2465

走失女童被找到后父亲首度发声:感谢1.2万个恩人

极目新闻 浏览 8777

冬天的毛衣,越“大”越好看!

LinkFashion 浏览 1847

何猷亨大方公开恋情,与女友牵手跨年,脸贴脸高调撒糖好甜蜜

扒虾侃娱 浏览 1752

女人过了40岁穿衣别老气横秋,看看这些日系穿搭,得体又显瘦

静儿时尚达人 浏览 2526

志愿军"冷枪英雄":用206颗子弹杀敌203人 受金成日接见

极目新闻 浏览 7723

芒米Pocket Max掌机:模块化设计、大容量电池与强芯片的结合

IT之家 浏览 1678

荣梓衫工作室回应偏轨事件,暴力行径揭露阴暗面

二凯训猛犬 浏览 2800

世界田联公布最佳田赛运动员候选:杜普兰蒂斯在列

懂球帝 浏览 2785
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1