关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro1063人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

蔚来乐道发布换电站电池翻倍计划

电动知家 浏览 1457

从小鹏的“物理AI”,看中国智能化的下一步

观察者网 浏览 1856

麻省理工学院教授文小刚追忆杨振宁:他是近代物理的伟人

澎湃新闻 浏览 2250

50+女性穿衣没头绪?教你3个显瘦还时髦的思路,照搬就好看

静儿时尚达人 浏览 971

瞄准2028年重要选举 郑丽文最新表态

新京报政事儿 浏览 7004

赛英电子治理“黑洞”:IPO前人事动荡,保荐机构入股,独董适格性存疑|读懂IPO

时代周报 浏览 1073

50岁女子当入殓师:有家属为抢房产要掀棺抬老人遗体

新京报 浏览 5188

新卡罗拉锐放/腾势N8L/星耀6 三天10款新车密集上市

网易汽车 浏览 2112

男子下车救人被网友误会成是"肇事逃逸" 警方出面澄清

封面新闻 浏览 22583

东部战区:军演是对"台独"和外部干涉势力的严重警告

央视新闻客户端 浏览 23016

媒体人:国安从来没说过要解散,也从未想过要自我了断

懂球帝 浏览 1964

综合续航超1500km 加方盒子车身 智己LS9即将上市!

车品 浏览 1843

齐溪高龄追生儿子 再婚王传君生俩女儿

萌神木木 浏览 2295

特朗普:战事不是挡箭牌 乌克兰该选举了

澎湃新闻 浏览 1035

360万克六选错队?三分23中5太铁 33岁亚一控失球权已完全迷失

颜小白的篮球梦 浏览 2246

vivo黄韬亲自爆料新机X300:下周一发布,是X200 Pro mini的迭代

IT之家 浏览 2205

中国第三艘航空母舰福建舰入列

新华社客户端 浏览 1851

国防部:中国不参与任何形式的军备竞赛

环球网资讯 浏览 2591

女鞋巨头,集体“脱鞋”谋变

斑马消费 浏览 1099

大连“智”造金属螺钉骨植入材料将上市

半岛晨报 浏览 2856

美国国务院要求美国公民立即离开伊朗

新华社 浏览 943
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1