关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者2882人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

一群人闯进女子刚买的新房砸了两面墙 物业称出于好心

杭州交通918 浏览 54831

惨!周星驰电影5天票房仅86万,时代抛弃你时,连句再见都不会说

娱乐圈笔娱君 浏览 3549

广汽传祺1月交付新车 终端销量逆势双增长

网易汽车 浏览 2916

护士上门采样、公立医院检测京东到家快检推出新服务缓解流感季就医难题

上观新闻 浏览 3654

60岁无儿无女形象大变的张卫健,经历了什么

草莓解说体育 浏览 3991

两位民营企业家登上人民大会堂主席台

一见财经 浏览 2255

1200亿元深耕中原!中国人寿助力河南区域经济高质量发展

证券市场周刊 浏览 3978

女子孕检低风险却生下唐氏儿 险企拒赔:只赔"标准型"

鲁中晨报 浏览 9685

泽连斯基接受采访期间马林斯基宫两度停电 俄官员回应

环球网资讯 浏览 3838

佘诗曼《正义女神》首播,看完4集后,我要说:港剧就应该这样拍

娱乐圈笔娱君 浏览 2209

“大衣+毛衣”今年冬天又火了,这样穿时髦又高级!

LinkFashion 浏览 2897

中国人民大学的研究突破:让AI思考过程更快更省的神奇方法

科技行者 浏览 2825

一笑随歌李沁陈哲远短短37秒吻戏床戏都上尺度了

陈意小可爱 浏览 3581

美被指向以色列通报对伊朗行动准备进展

每日经济新闻 浏览 2978

朝鲜进行远程战略巡航导弹发射训练

国际在线 浏览 3183

船员在公海杀同事6个月后跳海潜逃 中国海警跨境捉拿

扬子晚报 浏览 7366

新势力做了这么久豪车 为什么只有尊界卖爆了?

差评XPIN 浏览 3317

足总杯117年最大冷门!卫冕冠军首战出局,被业余球队淘汰

奥拜尔 浏览 3152

全国巡回上坟的大学生,追星追到阴间了

她刊 浏览 1530

16倍大牛股天普股份遭证监会立案,公司市值已从不足17亿增至292亿元

红星资本局 浏览 3080

吉利品牌登陆英国市场,目标 2030 年实现 10 万台汽车销量

IT之家 浏览 4043
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1