关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者3122人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

4名专家被饿晕拒绝评标 曾有女专家擅离评标室被处罚

澎湃新闻 浏览 9040

对话郝飞:智能座舱新物种 斑马为端芯片带来的新机遇

网易汽车 浏览 4499

“恨海情天仙品CP”郭晓婷王天辰将合体拍杂志

手工制作阿歼 浏览 2660

女人过了40岁穿衣别发愁,学会这些日常穿搭,高级又显气质

静儿时尚达人 浏览 2294

马杜罗在纽约首次“出庭” 多国发表联合声明

环球网资讯 浏览 3460

牛弹琴:美欧直接开干 全世界看得目瞪口呆

现代快报 浏览 7577

戴尔推入门游戏显示器SE2426HG、SE2726HG:FHD 240Hz Fast IPS

IT之家 浏览 3677

朱媛媛离世7个月后遗作定档,辛柏青状态令人担忧

林雁飞 浏览 3401

安踏投资加速,主品牌却有些掉队了

36氪财经 浏览 3227

绿帽哥:切尔西就罗德里戈与皇马展开接触,计划冬窗完成交易

懂球帝 浏览 4047

77岁大爷孤身赴柬埔寨见网友流浪数日:互联网喊我来的

潇湘晨报 浏览 10012

阿里主动加码外卖大战,谁能笑到最后?

陆玖商业评论 浏览 3315

双十一特惠5折,双厨狂喜:智本社X财新

智本社 浏览 4098

美媒扒哈登末节细节:快船追到只差15分 登哥穿训练服两眼空洞

Emily说个球 浏览 3841

特朗普称与北约达成格陵兰合作框架 吕特:没提丹麦

澎湃新闻 浏览 20658

德雷森:格雷茨卡本赛季不走;我们将择机与凯恩开启续约谈判

懂球帝 浏览 3341

26小伙辞职照顾瘫痪母亲3年 家中3个姐姐均已嫁人

封面新闻 浏览 9921

有望明年初亮相 小米YU9假想图曝光

车质网 浏览 3607

推广中奖名单-更新至2025年12月19日推广

黎贝卡的异想世界 浏览 3342

太强了!“宁王”净赚722亿元,分红361亿元,曾毓群能分到多少?

数字财经智库 浏览 2551

刘强东又要敲钟:京东工业冲刺港股,估值67亿美元

蓝鲸新闻 浏览 4721
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1