关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者867人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

记者问美防长戴"俄国旗颜色领带" 五角大楼:你妈买的

环球网资讯 浏览 6880

沈伯洋被指到处寻求"保护" 邱毅:"台独"分子们都慌了

环球网资讯 浏览 7482

唉!又一地产巨头,宣布退市

说财猫 浏览 2098

美媒称沙特强烈游说特朗普对伊朗动手 沙特坚决否认

环球时报国际 浏览 21434

热议中超:恶心国安放水,西海岸和英博值得尊重

懂球帝 浏览 2045

长期的“台积电第一大客户”,苹果如今也不得不“抢产能”了

华尔街见闻官方 浏览 1026

恩里克:踢出极高的水平是我们一贯的目标;要避免球员受伤

懂球帝 浏览 2050

外媒发布本田全新一代2027款思域预想图,比以往更高级!

老爷车 浏览 2746

特朗普在专机上提到与高市早苗通话:她是安倍的好朋友

红星新闻 浏览 7566

余承东展示鸿蒙智行门锁安全设计:安全是最大的豪华

三言科技 浏览 2215

韩国知名潮牌宣布将关闭中国全部门店 陆续打折清仓

潇湘晨报 浏览 7716

纯电续航215km 极狐阿尔法T5增程版官图发布

车质网 浏览 1936

于文文贵州演唱会晕倒,曝被救护车拉走

扒虾侃娱 浏览 795

比亚迪成为全球首家达成1400万辆里程碑的新能源车企

财闻 浏览 2203

最近很火的发型,原来这么简单!

黎贝卡的异想世界 浏览 1922

美澳关键矿产协议被解读为旨在"对抗中国" 外交部回应

澎湃新闻 浏览 6374

合约纠纷还没了,鞠婧祎的新剧又悬了?

八卦三缺一 浏览 1046

澳国防部称监测到中国舰队活动 外交部回应

财联社 浏览 1587

国星宇航“星算”计划 02 组星座发布

IT之家 浏览 2236

高市早苗4天上3次新闻联播:玩火者必自焚

看看新闻Knews 浏览 44349

柬泰签署停火联合声明 中方回应

北京日报 浏览 1211
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1