关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位12202人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

为什么有的女人老了也很美?

小陈聊搭配 浏览 16669

被问"联合利剑-2024A"后是否会有"B" 国台办回应

财联社 浏览 10484

长安启源全新 Q05 车型 11 月 21 日上市,纯电续航 506km

IT之家 浏览 393

Jennie自曝单飞成立新公司原因!吐苦水称很怕生

文艺圈娱乐号 浏览 12763

走失女童被找到后父亲首度发声:感谢1.2万个恩人

极目新闻 浏览 6748

法国又乱了:一晚上667人被捕 华人社区俨然如战场

上观新闻 浏览 90392

《狂飙》高启盛做客网红直播间,强盛集团狂刷礼物

大傻说娱 浏览 19191

俄军出动2500兵力在远东地区开展实弹射击演练

环球网 浏览 25763

约会黑人小伙遭质疑 比尔·盖茨20岁女儿公开回应

译言 浏览 18818

全运男篮决赛对阵:广东vs浙江争冠 周琦率四川vs辽宁争季军

醉卧浮生 浏览 401

友人追忆杨振宁:他其实还有一个遗憾

大象新闻 浏览 720

缺席训练!曝25岁主力门将遭申花“三停”,上轮中超赛后通宵泡吧

我爱英超 浏览 579

牛弹琴:中国人过春节时 世界发生了10件大事

上观新闻 浏览 80958

被问若赖清德当选战争风险多大 侯友宜:比任何人都高

海峡导报社 浏览 73765

温州推出外卖后厨“AI 智能评价处置”系统

IT之家 浏览 1342

工商银行原纪委书记刘立宪严重违纪违法被开除党籍

中央纪委国家监委网站 浏览 12646

国内十大城市哪些新能源车卖得最好?问界M7夺多个冠军

智车情报局 浏览 12043

章莹颖遇难6年 父亲:女儿男友非常善良 至今未婚

大象新闻 浏览 89771

《中国刑警》阵容曝光,李现白敬亭搭档朱亚文

趣看热点 浏览 26786

风衣不要只会配裤子 试试搭配这5款裙装吧

形象设计师飞飞 浏览 19419

贝克汉姆一家出游,12岁小七发育过猛穿吊带短裙

好丹 浏览 14184
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1