关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者21人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国对稀土相关技术实施出口管制

财联社 浏览 16774

央行:继续精准有力实施稳健的货币政策

中国人民银行网站 浏览 16978

E句话|福原爱,再婚怀孕

仙女事件簿 浏览 679

特朗普称"阻挠达成和平协议的人是泽连斯基" 克宫回应

环球网资讯 浏览 297

波兰警方突袭总统府拘捕前部长及其副手 杜达表态

环球网资讯 浏览 13213

谁又能想到,人民大会堂的镜头,却成了明星真实颜值的“照妖镜”

娱乐圈笔娱君 浏览 13264

淝水之战为何会发生?淝水之战的交战双方是谁?

趣看热点 浏览 26837

亚马逊历史新高!道指标普月线六连阳,中概股探底回升

第一财经资讯 浏览 1241

三星最贵手机:Galaxy Z TriFold三折叠手机跑分首曝

IT之家 浏览 954

43岁叶璇疑官宣结婚!穿婚纱牵手男士 文案似表白

盖饭娱乐官方号 浏览 15835

Meta实验室革命性并行推理技术:让AI模型思考速度提升50%

科技行者 浏览 491

面板价格跳水后反弹,电视厂商掀起新一轮涨价,线上线下都不放过

时代财经 浏览 16038

2025款岚图FREE+新车商品性评价

车质网 浏览 1493

董忠云:保持战略定力,增强必胜信心,A股有望恢复震荡上行趋势

首席经济学家论坛 浏览 1375

日企将用高空气球把乘客送至25公里高空开启太空游 票价12万元

网易科技报道 浏览 20054

美国安局利用境外品牌手机 网攻中国国家授时中心

央视新闻 浏览 5102

看来看去还是这些穿搭舒适!深浅互补、多穿阔腿裤,简约自然

静儿时尚达人 浏览 1558

《狙击蝴蝶》开播!看完4集,我想说:都市爱情剧就该这么拍!

娱乐圈笔娱君 浏览 940

月最佳球员:哈登加盟篮网后首获奖 布克生涯首次

网易体育 浏览 26938

媒体:郑丽文当选回复大陆贺电 表述难得一见意义重大

经济观察报 浏览 6634

儿车梦!杰克逊:一直都想加盟切尔西,偶像是德罗巴和登巴巴

直播吧 浏览 16043
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1