关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位11651人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

2024年第一颗大雷爆了?富人收割机,终于割不动了

象视汽车 浏览 11907

搭载固态电池 电动日产GT-R或将2023年发布

乐选爱车 浏览 12059

机长与乘务长互殴事件最新进展,涉事两人被终身停飞

趣看热点 浏览 689663

英国政府要求领事探视"英国公民黎智英" 外交部表态

澎湃新闻 浏览 73882

《17号音乐仓库》治好了我的假期综合症

八卦三缺一 浏览 11658

金融监管应该关注秩序规则,而不是明天指数涨到多少

观察者网 浏览 11972

官方:德容和贝尔温因伤退出此次荷兰国家队,马伦和维尔曼入替

直播吧 浏览 18773

你是谁?库里持续低迷13中4仅得15分6助

直播吧 浏览 12078

明星最新穿搭欣赏 你最pick谁

明星时尚穿搭解析 浏览 18748

摩尔多瓦新总理:我们的目标是让俄军永远离开

观察者网 浏览 18379

加拿大所有省份均发现变异新冠病例,中国驻加拿大使馆发文提醒

趣看热点 浏览 292472

曼联今夏恐无法清洗马夏尔!其复出日期曝光,或发奋争取加薪续约

罗米的曼联博客 浏览 15676

11月豪华品牌 :旧王朝坚如磐石 新秩序仍需时间发酵 |汽势焦点

汽势传媒 浏览 12185

外媒科学网站30日摘要:机器人读盲文比人快一倍

网易科技报道 浏览 11886

李靓蕾庆37岁生日 许玮甯出席侯佩岑因工作没现身

素素娱乐 浏览 18873

达芙妮们,都想成为南极电商

斑马消费 浏览 13751

卢卡申科透露:莫斯科曾提出从基辅手中"租借"克里米亚

环球网资讯 浏览 90227

周星驰周杰伦合作?经纪人:相关事宜正在沟通中

网易娱乐 浏览 18674

雅阁降5万,凯美瑞降3万,日系车为了销量真“拼”了?

车域无疆 浏览 9987

2月汽车投诉榜:宝马X3、极氪001、铃木维特拉位列前三

红星资本局 浏览 18853

宋祖儿背31万奢侈包逛街遭遇路人直指“偷税”,淡定自若成焦点

文艺圈娱乐号 浏览 10196
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1