关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro3354人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

有消息称“美军战机系被友军误击”

南方都市报 浏览 2561

为打造本地生活超级入口 高德再推新招提升平台活跃度

贝壳财经 浏览 3422

从嬉皮士到硅谷教父,他写了一本关于“维修”的书

DeepTech深科技 浏览 1520

余承东到访又一车企,签约!

电动知家 浏览 3404

外国女教师性侵16岁男学生数月上百次 详情炸裂

胡侃社会百态 浏览 39639

董明珠的言语经常惹争议,但是她做的事为何都做对了?

BT财经 浏览 3145

中国最牛医美巨头,跌懵了

财经锐眼 浏览 4013

50+女性秋日别瞎打扮,这3招让你告别油腻感,优雅好气质

静儿时尚达人 浏览 4142

韩国最大军工企业爆炸 已造成5人死亡

红星新闻 浏览 284

乌克兰称"首次"用无人潜航器击伤俄潜艇 俄罗斯回应

极目新闻 浏览 19852

南部战区:正告菲方停止在南海挑起事端

北京日报客户端 浏览 5175

法国:欧委会派员参加所谓"和平委员会"会议未获授权

界面新闻 浏览 2705

沃什被提名次日 特朗普:不降息就把他告到裤子都不剩

极目新闻 浏览 9600

瓜帅:维拉一直是最难对付的对手;多库的1对1能力让他很特别

懂球帝 浏览 4264

湖南省属最大国企再次增持长沙银行

湘财Plus 浏览 1280

陈浩民夫妇滞留阿联酋 妻子:人生第二次收到轰炸警报

极目新闻 浏览 38274

旅行焕新价8.39万起 BJ30旅行家正式上市 新增7座布局

网易汽车 浏览 4922

媒体:中国不惧美方施压 "偏逆着来"购买更多俄石油

澎湃新闻 浏览 12311

养乐多卖不动了?

斑马消费 浏览 4370

英特尔与谷歌围绕至强CPU与定制IPU深化双方多年合作

IT之家 浏览 1692

金银"大跳水" 深圳水贝有档口单日卖出200万元金条

红星新闻 浏览 7786
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1