关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位12971人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

"兔子警官"入围最美浙警 曾因执勤视频在网络上走红

环球网资讯 浏览 11688

欧文:篮球是团队运动 今天我们的所有球员团结一致

直播吧 浏览 13149

汪涵老婆自曝独自住院,素颜憔悴没人陪

大龄女一晓彤 浏览 1565

华为Momenta争夺保时捷,全球大厂智驾再度“投华”

汽车公社 浏览 237

火箭惨败雷霆!3首发全铁+2替补狂铁,切特压制申京,乌度卡遭批

篮球资讯达人 浏览 184

网传张曼玉加盟《浪姐2026》,工作人员发声回应:不知道此事

扒虾侃娱 浏览 338

俄总统普京宣布暂停履行《新削减战略武器条约》

环球网资讯 浏览 19852

北约举行一年一度“坚定正午”核演习

极目新闻 浏览 1521

全运男篮决赛对阵:广东vs浙江争冠 周琦率四川vs辽宁争季军

醉卧浮生 浏览 1244

2024年为啥电商平台都在砸“新品”?

钛媒体APP 浏览 11883

AI正在成为“孤独止痛药”,这是社交能力的一场不可逆退化

虎嗅APP 浏览 329

腾讯元宝接入微信支付

观察者网 浏览 1230

运满满冷运完成B轮数亿元融资 平台冷藏车注册量超27万

网易科技报道 浏览 16797

全智贤给了韩娱4年,归来还是0人能打?

时尚COSMO 浏览 2496

普京签署法律修订兵役法:征兵工作将全年不间断进行

界面新闻 浏览 5849

真爱大牌 || 这些被抢空的好物又回来了,这次破价100+

黎贝卡的异想世界 浏览 832

徐艺洋三亚美照惊艳

悦君兮君不知 浏览 1004

已生龙凤胎?何超莲近照曝光 身材纤瘦力破谣言

扒虾侃娱 浏览 16698

威创股份高买低卖“利润主力” 屏幕拼接同质化之下如何突围

创作者_1374543933241 浏览 15205

30个项目脱颖而出!大赛让AI与实体经济深度“握手”

上游新闻 浏览 1332

AI“孙燕姿”横空出世 歌手饭碗不保?但版权问题或成隐患

财联社 浏览 18970
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1