关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro3119人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

赵丽颖都救不了!央视新剧《逍遥》播出被吐槽

烈史 浏览 2606

网恋1个月怀孕 45岁女子被61岁男友拉黑:他出轨别人

极目新闻 浏览 9905

女单黯淡女双坚挺,金花2025交7冠答卷

网球之家 浏览 3949

太阳报:曼联17岁中场思韦茨随一线队训练,被比作佩德里

懂球帝 浏览 4318

全球牛肉“通胀”,中国市场价格为何“独稳”

北京商报 浏览 3913

严屹宽老婆41岁生日,婆婆送杜若溪万元大红包

爱八卦的晓请 浏览 2909

鲁尼:阿森纳还没有赢得冠军,现在的这些庆祝有些过了

懂球帝 浏览 853

花费498万买进"百强县"榜单被通报 辽宁海城官方回应

中国新闻周刊 浏览 6850

已减重10公斤的泫雅澳门演出晕倒后公开致歉

封面新闻 浏览 3905

IPO带病闯关遭通报批评未满一年 英虎机械重启资本路欲挂牌新三板

叩叩财讯 浏览 4243

有望明年初亮相 小米YU9假想图曝光

车质网 浏览 3441

伊利契奇:有人出钱让我讲述经历;加斯佩里尼让我突破极限

懂球帝 浏览 4200

日本计划部署导弹可攻击中国 当地民众:万分危急

环球网资讯 浏览 16337

CBA疯狂一夜:广东遭上海双杀,前总冠军23连败,最新积分榜如下

侃球熊弟 浏览 2887

将生产两款纯电SUV 丰田最新消息曝光

乐选爱车 浏览 4812

雷军,这次不对劲

创业家 浏览 3965

起底Plaud不融资却卖100万台的秘密

虎嗅APP 浏览 3805

大迫敬介:巴西的球员个人能力出色,高位逼抢可能会效果不佳

懂球帝 浏览 4215

抗日名将孙立人次子已正式向大陆申请 将父亲迁葬故里

环球时报新闻 浏览 16027

沙特被指已下单50架超30亿美金的ch7无人机 官方回应

澎湃新闻 浏览 8567

从文淇被堵看无赖滋事的成本有多低

八卦三缺一 浏览 2509
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1