关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者1524人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

任重正式宣布与孙骁骁结婚!

广西阿妹香香 浏览 2628

全国第二个提前还债的省份,出现在西部

时代周报 浏览 3531

多个品牌双11集体上调金价 每克已破1300元

潇湘晨报 浏览 31027

欧盟限制中国企业参与5G建设,商务部回应:坚决反对

时代周报 浏览 1596

巴总理称"将7架印战机炸成残骸" 印方激烈反驳

澎湃新闻 浏览 4296

被记者询问涉移民言论 德国总理回呛"问你们女儿去吧"

环球时报国际 浏览 10259

主销售价45万起,极氪8X路试谍照曝光

网易汽车 浏览 2261

《喜人2》中的演员,个个都让人笑抽筋,最后一个更是离谱至极

娱乐圈笔娱君 浏览 2799

支持家乡球队,网球球员吴易昺来黄龙体育场观战浙江vs山东

懂球帝 浏览 2723

林允儿新剧遭官媒批评!本人社媒喊话我喜欢,来中国捞金还挑衅

萌神木木 浏览 3032

首艘美国船被罚之际 特朗普调2艘航母部署中国周边

现代小青青慕慕 浏览 6350

特朗普否认美军将领“反对与伊朗开战”

上观新闻 浏览 985

在这场战争中特朗普的致命弱点是什么?

智本社 浏览 907

周末重磅!特朗普关税突发,中美经贸磋商进展,下周三大事件

看财经show 浏览 2675

北汽集团10月整车销量160133辆 同比增长11%

网易汽车 浏览 2621

《寻秦记》成为香港影史首日最高开画票房冠军

皮皮电影 浏览 1774

普通人秋天应该怎么穿衣?颜色选对、衣服穿对,简单又大方

静儿时尚达人 浏览 2479

钟欣潼前夫被曝婚变,第三任妻子删光合照

树娃 浏览 2563

何超莲评论区沦陷!跟窦骁结婚后态度变化大,遭讨伐骗婚功利心重

萌神木木 浏览 2778

央行连续增持黄金,10月我国外汇储备规模稳中有升

中国商报 浏览 2602

花400元“过家家”,Jellycat火爆看不懂?情绪消费正带来行业新逻辑

红星资本局 浏览 2791
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1