关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro3122人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

蜜雪冰城开到公交站乘车享折扣 执法局的人却上门了

每日经济新闻 浏览 34089

记者:成都是最国企的俱乐部,现在应关心周定洋和莱切特续约

懂球帝 浏览 3465

徐静蕾美国超市现身,黄立行白发相伴

墨语家 浏览 3083

东方通4年虚增3.14亿利润,两家审计机构为何失守?

翠鸟资本 浏览 4860

迪士尼将对OpenAI进行10亿美元股权投资

第一财经资讯 浏览 2893

高市在日本青年群体中获极高支持率 专家解读

北京日报 浏览 19365

贵州茅台的盈利会下降吗?

锦缎研究院 浏览 3152

与孙继海翻脸!董路:我的对手们甘愿被当枪使,自降身价智商全无

念洲 浏览 3405

于和伟逆袭的路上,藏着这样的一个女子

农村娱乐光哥 浏览 4125

牛弹琴:伊朗和美以停火又悬了 有三点实在太诡异

现代快报 浏览 1509

辱骂西蒙尼的球迷:我没说种族歧视的话,也没提马岛战争

懂球帝 浏览 4770

现场调查!拥有“黄金”招牌的金雅福爆雷后人去楼空,“买卖+委托”模式是否涉嫌非法吸存

华夏时报 浏览 3232

【中超】恩里克2球迪力穆拉提世界波 梅州1比4玉昆

体坛周报 浏览 4032

九旬李明启谈到容嬷嬷为自己发声

蜜桔娱乐 浏览 3924

大伯晨练在公园发现年轻女尸 29年后警方公布案件详情

环球网 浏览 12582

"九一八事变"纪念日当天 有些日媒还"警戒"上了

澎湃新闻 浏览 16622

果然,51岁钟汉良还是赢了

温柔娱公子 浏览 2724

多国领导人到访 朝鲜迎来外交潮

上观新闻 浏览 4085

舒默公开指责特朗普:总统无权独自将国家带向战争

看看新闻Knews 浏览 59831

五一消费爆发,新茶饮“爆单”!霸王茶姬5天狂揽1600万人次

国际金融报 浏览 827

美媒询问缅甸大选后中国会否同缅甸深化关系 中方回应

外交部网站 浏览 7574
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1