关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者1517人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

致敬,齐达内送给法国10000米冠军格雷西耶一件签名皇马球衣

懂球帝 浏览 3345

吴京《镖人》官宣,谢霆锋李连杰甘愿作配,票房能否破50亿?

娱乐圈笔娱君 浏览 2512

英伟达H100刚上天,谷歌Project Suncatcher也要将TPU送上天

机器之心Pro 浏览 2552

今年最狠悬疑剧,好人为何集体沉沦?

仙女事件簿 浏览 2767

两名英格兰球员在西班牙国家德比中交手,为123年来首次

懂球帝 浏览 2729

演习第2天 东部战区组织实弹射击

央视新闻 浏览 1868

男子50多万买66台苹果手机放平台出租 如今钱机都没了

潇湘晨报 浏览 7308

京东汽车来了!埃安UT super上市,4.99万起,你会考虑吗?

大李说车 浏览 2476

郑钦文排名跌至世界第24!年终确定跌出前20 不影响澳网种子席位

风过乡 浏览 2750

福特总部70年来首次搬家

MOTO 浏览 3478

护士上门采样、公立医院检测京东到家快检推出新服务缓解流感季就医难题

上观新闻 浏览 2301

苏州大学突破:AI评判官能评估人工智能的记忆管理能力吗?

科技行者 浏览 1552

奖金1.5万元,破赛事新纪录,张水华拿下2026年第一个冠军

数字财经智库 浏览 1837

好久没对一双鞋这么心动了!

黎贝卡的异想世界 浏览 3276

中国被指与伊朗接近达成超音速导弹采购协议 外交部回应

澎湃新闻 浏览 894

28岁华裔天才成百亿富豪 却献计特朗普封锁中国AI技术

策略述 浏览 5361

难怪连央媒都发文悼念,许绍雄竟“藏”得这么深

凡知 浏览 2244

全球第二、国内第一!最强文本的文心5.0 Preview一手实测来了

机器之心Pro 浏览 2518

新年强势开局!AI需求叠加供给趋紧,存储芯片迎来集体反弹

华尔街见闻官方 浏览 1796

“Mag 7”过时了?华尔街想要AI!

华尔街见闻官方 浏览 3271

东体:地区超重塑观众的心理认同,足协应让草根和职业贯通

懂球帝 浏览 2773
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1