关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者1510人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

万宁突然关闭内地线上线下全部门店,连锁巨头这是怎么了?

江瀚视野 浏览 2011

深圳1900亿央企换将,去年人均薪酬超51万

华美财经 浏览 2170

博尔达拉斯:巧妇难为无米之炊,我不该承受这赛季所遭受的一切

懂球帝 浏览 1662

叶总逼走李匆匆,才知肖格格攀上吴总的真相

阿腩讲娱乐 浏览 1770

利空突袭!暴跌50%!

券商中国 浏览 1835

知名折扣店好特卖被指大量闭店 曾4年开960家

每日经济新闻 浏览 23560

介绍一个如果你用了,你就看不到这篇文章的产品

时尚COSMO 浏览 2003

邱泽妈妈没想到 这个女人竟把她儿子狠狠“拿捏”

黄小仙的搞笑视频 浏览 2138

外媒:中法元首会谈议题十分广泛 似乎找到更多共识

环球网资讯 浏览 35315

穆西亚拉庆祝梦幻回归

绿茵情报局 浏览 1726

秋天怎么穿出时尚感?避开老气的着装方式,美得自然又大方

静儿时尚达人 浏览 2445

郑智化发声道歉!坦言自己情绪上头用词不当

萌神木木 浏览 2605

在生活的沟壑里,为自己镶嵌星光

LinkFashion 浏览 2702

捷途纵横G700限时售30.49万起 轮端扭矩过万

网易汽车 浏览 2705

AI算力需求疯狂,微软“新云”交易额超600亿美元

华尔街见闻官方 浏览 2551

上海交大突破:单一AI模型实现全视觉创作任务

科技行者 浏览 1730

王家卫评论区沦陷!跟秦雯调情还曾让女配音员舔手,滤镜碎了一地

萌神木木 浏览 2648

演员孙涛告别春晚:18次登春晚,把舞台给年轻人

素素娱乐 浏览 1499

马拉加71-61击败NBA发展联盟联队!卫冕国际篮联洲际杯冠军!

直播吧 浏览 3076

何以“破卷”?光伏经历至暗时刻!

飞鲸投研 浏览 1999

vivo S50系列手机侧边外观图公布,全系航空铝金属中框

IT之家 浏览 2332
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1