关闭广告

浙大团队突破:AI实现多人脸精准生成

科技行者4347人阅读


这项由浙江大学计算机科学与技术学院吴涛、江逸博等研究人员领导的团队,联合浙江大学软件技术学院和华为技术有限公司,于2025年9月发表的研究成果,解决了AI绘画领域一个令人头疼的技术难题。该研究成果以论文形式发表,论文编号为arXiv:2509.21953v1,为多主体图像生成技术带来了突破性进展。

当前的AI绘画技术已经能够根据用户提供的照片,生成单个人物的精美图像。但是,当我们要求AI在同一张图片中绘制多个不同的人物时,问题就出现了。就像一个初学画画的孩子,AI经常会把不同人的特征混在一起,比如把张三的眼睛画到了李四脸上,或者让王五戴上了赵六的帽子。这种现象被研究人员称为"属性泄漏",就好比调色板上的颜料不小心混合了,原本清晰分明的色彩变得模糊不清。

更令人困扰的是,即使AI勉强画出了多个人物,生成的图像往往无法满足人们的审美期待,缺乏真实感和艺术美感。这就像一位厨师虽然知道所有的食材,但却不知道如何搭配才能做出令人满意的佳肴。

面对这些挑战,浙江大学的研究团队开发了一套名为"MultiCrafter"的全新框架。这个框架就像一位经验丰富的导演,能够精确指挥每个"演

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

何小鹏的“回旋镖”与超级增程的“阳谋”

1号车盟 浏览 3631

雅达利复刻“前竞争对手”Mattel Intellivision Sprint 游戏机

IT之家 浏览 4272

有人被拖欠工资!毫末智行北京总部人去楼空,员工抱着显示器离开;曝ASML为美国监控中国客户!官方否认;雷军斥资超1亿港元增持小米

雷峰网 浏览 3826

华为主导+广汽控股,华望汽车或定名“启境”,首款车型明年发布

车市红点 浏览 5007

颜骏凌:和范德萨交换了联系方式,在儿时偶像面前踢球是圆梦

懂球帝 浏览 4178

小鹏汽车2025年全年交付量达429,445台 同比增长126%

网易汽车 浏览 3523

标配激光雷达和四驱 魏牌高山7上市售28.58万

网易汽车 浏览 4419

被大空头狙击的明星AI股Palantir,华尔街怎么看

第一财经资讯 浏览 4189

前央视主持人水均益直播 额头顶"中国人"纸条否认移民

极目新闻 浏览 9690

耗资3.5亿,中国版107分钟一刀不剪,好莱坞这部R级大片杀来了

靠谱电影君 浏览 4003

首款轻商量产钠电池 宁德时代发布天行Ⅱ轻商系列动力电池

网易汽车 浏览 3300

S=更入门?大众速腾S工信部信息曝光

网易汽车 浏览 3378

媒体人:国安从来没说过要解散,也从未想过要自我了断

懂球帝 浏览 4103

方永飞怼雷军,“行业不敢说的话全被他讲透了”

车轱辘话V 浏览 3551

林允儿回应新剧争议,语带挑衅惹众怒,曝与韩方合作将全面收紧

扒虾侃娱 浏览 5504

高管减持、股东跑路、产品爆炸:上市公司的“中年危机”

诗与星空 浏览 4382

详解“和平意志-2026”演习各国参演舰艇阵容

环球网资讯 浏览 3312

做企业,是一场反人性的修炼

创业家 浏览 4201

美媒:特朗普声称美将"统治"委 其真实意图逐渐明朗

环球时报国际 浏览 8951

LV高管空降泡泡玛特,年薪300万港元

YOUNG财经 浏览 3615

纯电续航超400km ID.ERA 9X将于4月正式上市

车质网 浏览 3107
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1