关闭广告

蚂蚁集团突破性研究:一个视觉"万能钥匙"让AI同时理解和创造图像

科技行者4083人阅读


这项由蚂蚁集团旗下Inclusion AI团队领导的重要研究发表于2025年10月,研究团队包括黄梓源、郑丹丹、邹程等众多研究员。论文题为《Ming-UniVision: Joint Image Understanding and Generation with a Unified Continuous Tokenizer》,感兴趣的读者可以通过arXiv:2510.06590查询完整论文,相关代码和模型已在GitHub、HuggingFace等平台开源。

AI看懂图片和创造图片,原本是两个完全不同的任务,就像一个人既要当翻译官又要当画家。以往的AI系统通常需要分别训练两套完全不同的"大脑"来处理这两种任务。现在,蚂蚁集团的研究团队找到了一种方法,让AI用同一套"视觉语言"既能理解图片内容,又能根据文字描述创造全新的图像。

这个突破性发现的关键在于他们开发

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

出场时间创新低,记者:马刺有意交易索汉来换更强的轮换球员

懂球帝 浏览 3555

普京:俄罗斯将在战场解放故土 欧洲"猪猡"将下台

参考消息 浏览 3624

伊朗媒体:伊朗南部一港口多艘船只起火

界面新闻 浏览 1071

一车三动力:五菱星光730电/油/插混动力配置公布,10月15日预售

IT之家 浏览 4532

巴媒质问:忘恩负义的阿富汗是否正成为印度代理人

澎湃新闻 浏览 8791

官方:巴黎前锋杜埃右大腿肌肉拉伤,将伤缺数周

懂球帝 浏览 4200

转行当吉他手?科纳特被罗梅罗蹬到后,做出吉他里的扫弦动作

懂球帝 浏览 3573

美国大模型战局生变:Anthropic 甩出最强模型,OpenAI 陷内部分歧

创业家 浏览 1789

全球知名对冲基金投资人:中国业务超越预期

中国基金报 浏览 3957

一年高速迭代、超2000万安装!鸿蒙版微信用实力回应质疑

雷科技 浏览 4407

媒体:放弃全球霸权 背叛美国的美国已不再自信

南风窗 浏览 8595

“50%汽车芯片由格力产品替代”?广汽回应

第一财经资讯 浏览 3206

郑爽在美国越混越差!打官司诉讼费都掏不起,前夫张恒比她还沦落

萌神木木 浏览 3115

77岁大爷孤身赴柬埔寨见网友流浪数日:互联网喊我来的

潇湘晨报 浏览 10007

具俊晔亲手揭幕,大S雕像真容曝光,S妈拥抱雕像哭泣

素素娱乐 浏览 3169

中方接连被美国暗中"做局" 两个国家几乎同时对华出手

头条爆料007 浏览 7867

ELLE风尚盛典秒变菜市场,有人摔倒、有人调侃内涵,状况百出

Yuki女人故事 浏览 3414

微软团队突破性研究:AI网页助手终于学会在新网站"随机应变"了

科技行者 浏览 3129

初三男生杀害女同学前检索会担什么责 出庭时变胖变白

红星新闻 浏览 8183

AI智库“智汇”珠海,助力大湾区学术与产业的“双向奔赴”

南方都市报 浏览 4339

立起来的高铁:“海上巨人”启航风电新征程

人民网 浏览 4058
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1