关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro3337人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

关键邦选举印人党"罕见胜利" 莫迪重掌政治主动

环球网资讯 浏览 15898

男子吃饭像兔子去治疗 蒙眼做手术听到医生一句话懵了

1818黄金眼 浏览 33032

大众中国市场2025年交付269.38万辆,同比减少8%

IT之家 浏览 3241

336万年薪请来的CEO,上任两个月就“失联”,高鑫零售的转型阵痛期

红星资本局 浏览 3067

AI眼镜厂商,正在集体拒交“智商税”

钛媒体APP 浏览 3763

别管怎么质疑《寻秦记》,只要古天乐、林峯在,再烂我都会买单

最爱酷影视 浏览 3683

塞梅尼奥立竿见影,曼城10球隔山敲打阿森纳

体坛周报 浏览 3356

戴向宇曾单方面通知家人要和陈紫函离婚

乡野小珥 浏览 4959

特斯拉Model3/ModelY Standard正式发布

网易汽车 浏览 4363

女网红流落柬埔寨街头 中使馆:已联系其家属准备接回

封面新闻 浏览 10646

向太和向佐回应“向家破产”传闻

韩小娱 浏览 4921

11月十大必看短剧

仙女事件簿 浏览 3701

「寻芯记」上市后首个大动作!摩尔线程公布全功能GPU架构路线图,国产芯片发起生态冲刺

华夏时报 浏览 3545

7万级方盒子,后独悬+Flyme Auto,吉利牛仔不讲武德

盖世汽车 浏览 266

美军空袭尼日利亚 至少有4枚"战斧"疑未能引爆

环球网资讯 浏览 3273

曼城vs埃克塞特城:塞门约首秀,哈兰德、罗德里、阿克首发

懂球帝 浏览 2684

王玉雯激动发合照,评论区林一破防

鲁中晨报 浏览 4197

李亚鹏宣布离婚!跟海哈金喜结婚不到5年,网友质疑是为了躲债

萌神木木 浏览 3528

AI智库“智汇”珠海,助力大湾区学术与产业的“双向奔赴”

南方都市报 浏览 4339

西媒:巴萨系俱乐部在仓库存了30万件球衣,共花费400万欧元

懂球帝 浏览 3144

宋慧乔怎么不会老啊?

时尚COSMO 浏览 3093
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1