关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位11351人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

同事称张恩华因饮酒过量去世是谣言,法医诊断是心脏骤停猝死

趣看热点 浏览 24131

徐杰1分钟三分自抢自投!达到朱总要求,超越胡卫东,太准了!

篮球资讯达人 浏览 13341

日媒曝福原爱或面临国际通缉!与新男友现身新加坡

十点街球体育 浏览 13525

成立不久的中央领导小组 再有两名重要成员亮相

政知新媒体 浏览 87613

媒体:在巴赫穆特守与撤的问题上 美乌早就出现了分歧

国防时报看点 浏览 96016

美最高法院驳回苹果诉Epic Games案 后者需求也遭驳回

手机中国 浏览 11508

4400亿!中证A500指数基金一周年:总规模增近50%,近80家基金公司下场

券商中国 浏览 256

加装中控大屏 瑞风M3 2022款成都车展发布

网易汽车 浏览 19751

什么牛仔包 还要大牌抢着出

《买手客buyerkey》 浏览 15544

中邮人寿再收监管罚单:涉及提供虚假投诉数据报告

面包财经 浏览 12003

特朗普上台后,美国的“狗腿子”要小心了!

浏览 21524

媒体:朝鲜半岛新年响炮 局势很危险

直新闻 浏览 72620

3个月内唐山8名厅官被查后 河北省委启动矿业专项巡视

界面新闻 浏览 62938

刘梓晨近况曝光!依旧炫富疑有新恋情,拍照扭成蛇精,被骂很做作

文艺圈娱乐号 浏览 11966

2023长城汽车车多势重,围绕“智能新能源”赛道发力

天天汽车 浏览 11675

卢靖姗素颜不穿内衣大胆出镜!北京豪宅内景曝光

盖饭娱乐官方号 浏览 17764

媒体:美国领衔13国要对胡塞武装动手 中国没加入

北京日报 浏览 11713

别总嫌弃经典牛仔裤 低调的时髦才出圈

男士穿衣搭配杂志 浏览 13655

小扎官宣Code Llama重量级更新,新增70B版本,但还有能力限制

机器之心Pro 浏览 11562

《纽约时报》更新服务条款,禁止将新闻报道用于AI开发

澎湃新闻 浏览 13216

媒体:美军犯致命错误 误把敌机当成自家的致重大伤亡

环球时报新闻 浏览 76414
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1