关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2593人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

在进博会上,重新认识海尔生物

财经无忌 浏览 2578

停办吧!《奔跑吧》首播差评一片,请一大堆明星没一个能拿得出手

娱乐圈笔娱君 浏览 2303

沃什问鼎美联储主席前路如何?

21金融圈 浏览 1466

最新!这家险资巨头,透露康养生态布局进展

券商中国 浏览 1931

强强联手!市北高新、临汾路街道与中科信息签署战略合作协议,共促人工智能与超高清视听创新发展

上观新闻 浏览 2075

刘越:申花最后的点球判罚的太牵强,阿利米踢球合理简练

懂球帝 浏览 2616

浩坤昇发资产观点:学会适应一个“正常上涨的市场” 潮落潮起终有信,再攀千点启新程

经理人杂志 浏览 2519

北约秘书长力挺特朗普:没有美国 欧洲能自保是做梦

红星新闻 浏览 5485

有品味的中年阿姨,穿衣搭配都有4个共同点,学会了优雅到老

静儿时尚达人 浏览 2557

香港中文大学突破AI训练难题:单个词汇也能让机器学得更聪明

科技行者 浏览 2678

终于来了!山东签约新大外弥补内线隐患,但陈培东感冒将缺席一场

篮球资讯达人 浏览 1699

谁是真汇源?

经济观察报 浏览 1710

德媒:面对美军进逼 委内瑞拉亮出俄制武器

参考消息 浏览 2643

美媒披露普京停火条件:基辅必须彻底放弃顿涅茨克

参考消息 浏览 2880

工银安盛一年赚了25亿,三款“鑫如意”产品退保却达28亿

独角金融 浏览 794

热议日本3-2巴西:几十年认准一条路;人家从容我们连滚带爬

懂球帝 浏览 2765

突发!特斯拉美国要求禁用中国产零部件;离谱!曝多益网络创始人有300个孩子,公司回应;苹果CEO库克被曝或于明年卸任丨雷峰早报

雷峰网 浏览 2473

黄宗泽恭喜陈伟霆当爸,没想到隐藏那么深,怼记者做人别太八卦

扒虾侃娱 浏览 2756

爆火的“表演饭”,开始被年轻人避雷

餐饮老板内参 浏览 2426

中国对日本政府发出第一道制裁令 暗示了高市早苗结局

时时有聊 浏览 18763

抢占本土聊天机器人市场,印度AI企业Sarvam推出Indus应用

IT之家 浏览 1021
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1