关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者203人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国留学生潜水后失踪妻子4天后报警 仅找到一根胫骨

新民晚报 浏览 20069

希尔德:追梦可能是篮球史上的最强防守者,他在防守端功力深厚

懂球帝 浏览 1692

最大纯电续航达335km 智己LS8官图发布

车质网 浏览 368

伊朗情报部长:伊成功渗透以色列核研究设施

每日经济新闻 浏览 2168

存在银行保管箱百万物品不翼而飞 银行:保管箱锁完好

上游新闻 浏览 18401

今年第三次!53万的理想MEGA烧了,奶爸:不敢想象

说财猫 浏览 1488

事关黄金交易!工、农、中、建、交、邮储,六大行密集公告

上观新闻 浏览 91

这些才是真正接地气的穿搭!裤子基础、外套保暖,简单又自然

静儿时尚达人 浏览 574

2026年首月A股新开492万户,高于2025所有月份,如何看这个数据?

财联社 浏览 53

丹麦后悔在格陵兰岛部署F-35战机:美国或断供零部件

红星新闻 浏览 19306

59-61超低分!齐麟0分丢绝杀三分新疆惜败浙江 程帅澎19分

醉卧浮生 浏览 54

佘诗曼《新闻女王2》首波口碑出炉了!现场观众的评价一针见血

娱乐圈笔娱君 浏览 1309

福特总部70年来首次搬家

MOTO 浏览 2375

俄总统助理:普京和特朗普会晤意愿依旧存在

每日经济新闻 浏览 1491

燃油/插混/纯电都有 五菱星光730将于10月15日预售

网易汽车 浏览 1726

马雷斯卡告别切尔西:我在离开时把切尔西留在应有的位置上

懂球帝 浏览 545

中年女人的开挂指南,避开花衣服和紧身衣,把优雅感焊在身上

静儿时尚达人 浏览 1246

5人违规穿越鳌太线3人遇难:为规避罚款手机调飞行模式

极目新闻 浏览 5319

E句话| 恭喜,他们生三娃了!

仙女事件簿 浏览 1485

黄慧颐自曝锤保剑锋内情!举报账号投资被撤,一条活路都没给她留

萌神木木 浏览 392

内塔尼亚胡:加沙地带停火将很快进入下一阶段

环球网资讯 浏览 991
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1