关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro32人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

新冠肺炎可能成为长期流行的传染病,未来依旧面临更大的挑战

趣看热点 浏览 26645

飞机事故连连 波音再遇重创

北京商报 浏览 11833

多邻国大裁员,翻译也要被AI取代了?

刺猬公社 浏览 13545

激怒特朗普 BBC身陷数十年来"最严重危机"

鲁中晨报 浏览 32698

换装全新设计语言 北京EU8申报图曝光

车质网 浏览 1510

胡塞武装:以军空袭萨那致9死174伤 包括大量妇女儿童

极目新闻 浏览 1979

现代新SUV曝光!动力系统升级将下半年首发

网上车市 浏览 12868

国米本赛季11粒进球中4粒来自角球,身高超1.88米的球员有10位

直播吧 浏览 2137

委内瑞拉:逮捕一批"掌握美情报机构直接信息"的雇佣兵

红星新闻 浏览 10626

奥迪暗示Q9大型豪华SUV即将推出 主要市场将是美国和中国

老爷车 浏览 13310

三星One UI 8.5前瞻:基于安卓16,引入情景感知AI

IT之家 浏览 932

神预测,热乎乎的最新诺奖得主电影神作来了

幕味儿 浏览 1471

特朗普还嘴硬:莫迪保证过不买俄罗斯石油了

澎湃新闻 浏览 6497

10条适合小长假的仙女裙 一键遮盖拜拜肉和大象腿

巧百搭 浏览 20229

明年继续“国补”但政策优化;小米副董事长拟套现不超20亿美元

21世纪经济报道 浏览 476

2023年夏天鞋履趋势是“BIRKENSTOCK效应”?

潮人 浏览 16190

古巴外长批评美国内政外交双重失序

国际在线 浏览 83

嫦娥五号带上天的水稻种子发芽了!我国水稻培育的又一个新里程碑

趣看热点 浏览 26512

银行存款利率下调 年轻人跨城存钱:50万能多赚6000元

上观新闻 浏览 117260

以军空袭黎巴嫩南部轰炸真主党重型机械 画面披露

环球网资讯 浏览 1519

苏亚雷斯:保级信心主要来自我的球员,包括逆境中展现的决心

懂球帝 浏览 1448
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1