关闭广告

微信AI团队,悄悄干了件大事,算力消耗暴降44%!

智东西19人阅读


智东西
作者 陈骏达
编辑 李水青

智东西11月5日报道,近日,腾讯微信AI团队发布的一篇论文在海外AI圈引发广泛关注。论文提出了一种名为“连续自回归语言模型(CALM)”的新颖架构。与传统Transformer相比,CALM直接将训练大模型所用的计算量减少了44%,推理时的计算量也减少了34%

CALM的核心逻辑是,将连续的K个token压缩成一个语义向量,并在生成时直接预测“下一个向量”而非“下一个token”。假设K=4,那么原本需要逐步生成4次的内容,现在只需1步即可完成,使其能在一次生成中输出更多信息,大幅提升效率。

这项研究的相关讨论在社交媒体平台X的阅读量累计已经超过100万次,在评论区引起热议。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

泰国榴梿出口,中国几乎“包圆”

环球时报国际 浏览 12167

SpaceX称识别并切断缅甸电诈园区周边逾2500台“星链”设备

澎湃新闻 浏览 332

央行新提法!“社融规模可持续较快增长”如何理解?

21金融圈 浏览 12261

微软、动视暴雪要求美国法官加速处理 FTC 案件

IT之家 浏览 15458

机长与乘务长互殴事件最新进展,涉事两人被终身停飞

趣看热点 浏览 690078

别问了,今年朋友圈都在打网球

时尚COSMO 浏览 138

中俄联合空中巡航期间 俄军机曾在中国机场起降

环球网资讯 浏览 16063

你穿什么衣服就是什么命!第3种千万要避免

顾一宸 浏览 14625

29岁女白领荒野求生半月瘦成"闪电":睡觉时放一把刀

都市快报橙柿互动 浏览 11581

今年流行的配饰,“大一点”才好看

LinkFashion 浏览 11067

美国提议土耳其向乌提供S-400 土方拒绝:侵犯土主权

枢密院十号 浏览 111560

以色列和哈马斯不会有新年休战

CCTV国际时讯 浏览 12184

夏天不建议大家穿的4种颜色,显肤色暗沉还油腻,看看你有没有?

潮人志Fashion 浏览 10888

联通三季报:宽移用户净增规模创新高,首次披露云收入数字

南方都市报 浏览 313

中东壕客下单:先订600台!飞行汽车海外最大订单来了

南方都市报 浏览 500

4小时票房3165万,看完《沙丘2》我想说:好莱坞大片终于赢回一局

肥罗大电影 浏览 11520

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻 浏览 339

马赛官方:球队签下伯尔尼年轻人后卫球员乌利塞斯-加西亚

懂球帝 浏览 12154

钱志敏突然当庭认罪震动旁听席 刑期或减免三分之一

封面新闻 浏览 11129

李平康:国安在谈一名东欧外教,其人在北京&还是以前的渠道

懂球帝 浏览 156

中国拿出比稀土更致命的王牌美国"破防" 万斯:要冷静

时时有聊 浏览 4480
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1