关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro3117人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特斯拉与迪士尼合作引争议:车机引入《创:战神》车模被指广告

IT之家 浏览 4156

为新能源再投10亿,苹果为何还不造车?

BT财经 浏览 4320

重庆一大学生发帖称老师"刻薄" 老师不接受道歉将起诉

封面新闻 浏览 9933

台陆军运输群车队两辆军用卡车相撞 画面披露

环球网资讯 浏览 3877

有些路,不必每一步都走得那么用力

她刊 浏览 737

你从托马斯·穆勒身上吸取教训了吗?

绿茵情报局 浏览 3057

1-9月百万级豪车销量:奔驰3款入榜,奥迪出局,仰望U8苦苦支撑?

AGKC阿贵艺车 浏览 3956

德国Mindfactory平台数据:AMD处理器周销量是英特尔10倍多

IT之家 浏览 3702

累瘫?三战全打满40分钟 从40+9到11+5失误 黑龙江女战神也顶不住

颜小白的篮球梦 浏览 4103

端网深度协同,中国移动5G-A超级上行刷新移动直播体验

环球网资讯 浏览 88

辽篮展温馨一幕!杨鸣继伟组织与澳门男篮合影,全员沟通太和睦了

篮球资讯达人 浏览 3994

爆破试验带你看巡飞弹飞龙-60A有多强

环球网资讯 浏览 4799

半夏投资创始人李蓓新“战场”:12888元卖课、“下凡”小红书!

独角金融 浏览 2967

于文文贵州演唱会晕倒,曝被救护车拉走

扒虾侃娱 浏览 2912

恰20:今天我们运气不错,我们要努力达到我们应得的位置

懂球帝 浏览 3847

北约秘书长吕特与泽连斯基通话 讨论对乌军援

极目新闻 浏览 4787

清华大学等联手打造智能分析系统,让卫星图像自动识别准确率飙升

科技行者 浏览 3163

暴涨!全线拉升!芯片传闻,突然刷屏

券商中国 浏览 3050

日本汽车业面临停产风险!

电动知家 浏览 4182

乌官员证实美乌代表将在迈阿密再次会晤

北青网-北京青年报 浏览 3555

鲁比奥称对巴拿马涉港口裁决感到振奋 外交部回应

北京日报 浏览 94889
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1