关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位12384人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

精准长传助张镇麟平筐扣篮 赵继伟手插双眼庆祝

网易体育 浏览 26558

2026年量产 特斯拉Cybercab将于进博会首发

车质网 浏览 740

广东晋级四强4利好!胡明轩杜润旺难得暴走,王睿泽+内线状态极佳

篮球资讯达人 浏览 620

真正会搭配的女人,夏季都懂得“穿简不穿繁”,时尚洋气不过时

Yuki时尚酱 浏览 11258

李鸿其王紫璇官宣结婚

扒虾侃娱 浏览 683

2023年又亏损200多亿,蔚来能否靠阿尔卑斯自救?

郑谊 浏览 12109

滴滴代驾在全国240城落地“伴夜食堂”

网易科技报道 浏览 12950

上年纪的女人买“裤子”,不妨按照这3个原则试试,显瘦时髦

静儿时尚达人 浏览 1008

曼联今夏恐无法清洗马夏尔!其复出日期曝光,或发奋争取加薪续约

罗米的曼联博客 浏览 16446

vivo S50外观揭晓!全新告白配色:田曦薇同款

快科技 浏览 172

深度复盘:大疆是如何成为影像领域新巨头的?

极客公园 浏览 592

多国提出援助意向 日本宣称目前只接受美国救灾援助

极目新闻 浏览 73903

搭载固态电池 电动日产GT-R或将2023年发布

乐选爱车 浏览 12873

2022年北京冬奥会和冬残奥会 志愿者报名人数超百万

中国新闻网 浏览 25818

小S复出获奖细节:纹了大S名字还带了骨灰

萌神木木 浏览 964

英伟达财报电话会:对市场前景乐观、优先解决产能问题

电厂 浏览 14095

村民拒绝自家土地流转提出质疑 副镇长:有多远滚多远

燕赵都市报纵览新闻 浏览 89848

E句话 | 为什么没回去当教练?郭晶晶的回答很坦诚

仙女事件簿 浏览 10806

在参加G1比赛过后的训练时,“浓眉”戴维斯一直都非常生气

趣看热点 浏览 25569

晒意大利女总理"色情照"的网站发关闭声明:很快再见

中国新闻周刊 浏览 5472

湖南要求严控债务风险:有多大财力办多大事

澎湃新闻 浏览 16327
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1