关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro442人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

理想汽车线上全员会,员工表示“听不懂”

财视传播 浏览 254

吉利银河星耀6全球上市 限时置换价6.88万起

网易汽车 浏览 1405

尹锡悦被控同军方合谋试图“诱使朝鲜发动进攻”

扬子晚报 浏览 6281

三星首发2nm移动芯片:为拔头筹,不惜“开倒车”

雷科技 浏览 762

霍英东体育基金会晚宴,多位奥运冠军现身,霍家更知郭晶晶的份量

不八卦会死星人 浏览 857

阿莫林的耻辱之最

体坛周报 浏览 500

独栋别墅被拆除业主原地偷建 城管局:他"打游击"施工

扬子晚报 浏览 10644

面对全新应用场景还有推理能力 英伟达发布全新物理AI模型

网易汽车 浏览 541

消息称6.3英寸小屏机或为OPPO Find X9s,将搭载双2亿镜头

IT之家 浏览 693

E句话| 儿子发文替闫学晶道歉,说像给灵魂动手术?

仙女事件簿 浏览 411

公司倒查半年考勤辞退迟到32次员工 员工起诉法院判了

上观新闻 浏览 31676

乌克兰袭击莫斯科一座热电站 距克宫仅百余公里

上观新闻 浏览 1185

色彩凝聚笔尖,描绘双唇明眸之美

时尚COSMO 浏览 1441

宗馥莉,抛弃娃哈哈?

豹变 浏览 2328

月销破7万台!汽车圈外行朱江明,成新势力大赢家

象视汽车 浏览 1284

普京签署法律修订兵役法:征兵工作将全年不间断进行

界面新闻 浏览 5965

13日凌晨!成都一小米SU7发生交通事故后起火

网易汽车 浏览 1546

全球1~8月电池装机量,韩系继续败退

汽车公社 浏览 1615

林允儿新剧遭官媒批评!本人社媒喊话我喜欢,来中国捞金还挑衅

萌神木木 浏览 2080

韩星在内娱吃相越来越难看?

萌神木木 浏览 1233

突然加速!避险资金拥抱消费ETF,什么信号?

券商中国 浏览 1597
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1