关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro2192人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美媒:报告称,东南亚成美国电子垃圾倾倒场

环球网资讯 浏览 3148

詹俊:阿莫林换人值得肯定,冬窗应该留下齐尔克泽

懂球帝 浏览 2176

2025年10月我国新能源汽车销量占比超50% 历史首次!

智车情报局 浏览 3044

男导演曝丑闻 蒋欣的含金量还在上升

刘森森 浏览 3005

E句话| 王星与女友合体,复盘在缅甸遭遇?

仙女事件簿 浏览 1821

9系大六座旗舰SUV又添一员,智己LS9预售33.69万起

网易汽车 浏览 3024

“1元买壳”10个月后,北大医药新老板徐晰人突遭刑拘!

野马财经 浏览 3150

拼多多新质供给一周年:新质商品SKU数增长超五成,产业加速新质转型

财闻 浏览 3828

腾势汽车12月销售18139辆 全年累计157134辆

网易汽车 浏览 2237

以色列允许部分学校复课 继续扩大黎南部地面行动

国际在线 浏览 1132

熊园:“十五五”GDP目标——怎么定、定多少?

首席经济学家论坛 浏览 3225

弗莱彻首战曼联将用四后卫,B费请缨出战!新帝星已撤回转会申请

罗米的曼联博客 浏览 2232

印巴空战震撼全球:PL-15导弹为何一击必杀

浏览 7090

从 "商务" 变 "潮酷" 全新一汽奥迪A6L首秀亮相

网易汽车 浏览 2147

阿拉维斯vs西班牙人:德尼斯-苏亚雷斯、阿莱尼亚首发,鲁文-桑切斯、基克-加西亚出战

懂球帝 浏览 3001

搭载双电机 极狐阿尔法S6四驱版或年内上市

车质网 浏览 2854

硬核风格 奥迪Q6 e-tron越野版假想图曝光

车质网 浏览 2665

中国色特别策划 | 故宫建筑与阙羽重光

时尚COSMO 浏览 2399

女警带儿子逛街遇行凶 徒手夺刀面部受伤差点伤到动脉

大象新闻 浏览 6774

专访刘莘教授:AI时代更应该阅读经典,警惕“智力外包”|“书”适圈

封面新闻 浏览 110

林俊贤景区打工,如今成了这样

动物奇奇怪怪 浏览 3262
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1