关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro2043人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

下一代GPU,竞争激烈

半导体行业观察 浏览 3752

泰国王太后诗丽吉逝世享年93岁,后宫恐加混乱

译言 浏览 3030

官方:巴黎前锋杜埃右大腿肌肉拉伤,将伤缺数周

懂球帝 浏览 2912

澳海滩枪击惊魂50分钟:枪手占据天桥向下扫射

澎湃新闻 浏览 7898

男子爬衡山丢80.88克金牌 失主:做好找不回的打算了

极目新闻 浏览 6358

比利亚雷亚尔vs阿拉维斯:阿约塞-佩雷斯、帕雷霍首发,阿莱尼亚、洪尼-奥托出战

懂球帝 浏览 2040

31省份去年人口出生率数据公布:哪些省份生娃多?

第一财经资讯 浏览 3089

人类史上最大抄家案?华人受害,美国却狂揽1070亿

大猫财经Pro 浏览 2766

这6款发色居然这么火?50张图可以直接给tony

Yuki女人故事 浏览 1205

信达生物与武田制药达成全球战略合作,交易额最高可达114亿美元,股价收跌近2%

红星资本局 浏览 3004

经典之上再造经典 BJ40探险家上市 13.49万元起

网易汽车 浏览 1951

阿特金森帅位岌岌可危!上季当选年度最佳教练 曾获骑士老板力挺

罗说NBA 浏览 2326

王鸥才是真清醒!住200平复式豪宅独自养娃

心静物娱 浏览 2315

刘嘉玲怒怼肉娱小鲜肉?

港剧叔 浏览 2870

阿尔巴:对我帮助最关键的是埃梅里;我心中梅西就是历史最佳

懂球帝 浏览 2964

父子在悉尼海滩枪击致16死 中国学生亲历:很怕打中我

上观新闻 浏览 8131

财政部:1-8月国有企业利润同比下降2.7%

财政部 浏览 3504

联合国启动下任秘书长遴选 三大热门人选亮相

红星新闻 浏览 29922

小鹏汇天“陆地航母”于迪拜完成公开飞行演示

网易汽车 浏览 3082

连Win10都要停服了,那么多电脑该咋办?

江瀚视野 浏览 3183

与特朗普会晤前 泽连斯基亮明“红线”

上观新闻 浏览 2250
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1