关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro3344人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

副院长传出不雅视频后赴外地坐诊引争议 当地医院删文

红星新闻 浏览 14574

“东风Jeep”要来了?Jeep全球高层到访武汉

网易汽车 浏览 3664

陈道明被王家卫说他是阴阳同体的极品

包饺子ai剪辑 浏览 4150

蔚来官宣再融资11.6亿美元!

电动知家 浏览 5070

蔡少芬结婚18周年,与张晋过二人世界

侦探娱乐 浏览 3345

媒体:哈梅内伊大意了 他在最关键的时刻相信了美国

经济观察报 浏览 42840

外媒:中法元首会谈议题十分广泛 似乎找到更多共识

环球网资讯 浏览 36963

田栩宁恋情风波再升级!疑似若若回应恋情,喊话外界少打听别惹她

萌神木木 浏览 4295

从头部驱动到生态共建,初瑞雪重构直播团队新范式

时代周报 浏览 3613

伊朗媒体:伊朗南部一港口多艘船只起火

界面新闻 浏览 1075

MiniMax冲刺科创板,“大模型双雄”有望会师A股

国际金融报 浏览 287

粤浦科技韩毓祥:AI对传统资产有三方面价值

观察者网 浏览 304

球员是否因阿森纳输球更有动力?瓜帅:我建议他们专注于自己

懂球帝 浏览 3180

李湘账号被封;蔡依林鸟巢开唱:张水华直播道歉

娱乐圈那档子事儿 浏览 3296

凯塞多:之前没意识到自己的进球能力,现在会尝试并靠近禁区

懂球帝 浏览 3106

杉杉股份易主:任元林接盘,“民营船王”入主锂电材料巨头

征探财经 浏览 4531

继《沉默的荣耀》后又一黑马谍战作品

娱乐圈笔娱君 浏览 4009

美高官:委官员已私下保证 将满足美提出的条件和要求

中国经营报 浏览 8663

一家4口爬山妻子坠亡 警方排除他杀可能:属于高空坠亡

极目新闻 浏览 42543

奇瑞瑞虎9家族全面上市 抢鲜价12.79万起

网易汽车 浏览 4980

张雨绮被抵制成功!辽视春晚已将她除名

萌神木木 浏览 3180
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1