关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro1707人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

公司倒查半年考勤辞退迟到32次员工 员工起诉法院判了

上观新闻 浏览 32903

打破场景界限,波司登与Kim Jones的合作让冬天更体面

时尚COSMO 浏览 2175

杨旭文不再隐瞒!公开回应与陈若琳的关系?

喜欢历史的阿繁 浏览 1707

12岁男孩烫伤后死亡:死前还在干活 父母均智力残疾

新京报 浏览 7414

43岁阿Sa承认与男友同居,已带男友见过家长

扒虾侃娱 浏览 941

男子快递从甘肃寄到成都:直飞660公里却绕了2800公里

每日经济新闻 浏览 33825

刚刚,马云现身阿里千问工区

网易智能 浏览 1441

董路:我给宋凯提了1建议但没被采纳 邵佳一力劝安东尼奥放弃传控

风过乡 浏览 1630

今日最难得,我们十一周年啦!

黎贝卡的异想世界 浏览 2736

这才是会打扮的中年女人!穿搭不花不绿,简单时髦,值得借鉴

静儿时尚达人 浏览 1983

长泽雅美官宣结婚,日本女星都偏爱“丑男”

FUFASHION 浏览 1621

三种动力配置 星光560将于1月15日上市

网易汽车 浏览 1665

男子取170万元现金 在银行门口遭抢劫致重伤左眼失明

扬子晚报 浏览 16547

《重影》:高叶的这场被侵犯戏,被扇耳光,让人看了扎心的痛

娱乐圈笔娱君 浏览 2729

莱巴金娜送蛋逆转夺冠进总决赛形势大好,安德列娃已失去主动权

网球之家 浏览 2768

静默复古风,低调显贵的穿搭密码!得物2025秋冬趋势发布!

LinkFashion 浏览 4393

一夜翻盘,炫富网红蓝战非复活了

TVB的四小花 浏览 2873

新机发售之际,荣耀手机影像专家言论争议不断、引翻车质疑

观察者网 浏览 2829

以色列继续袭击约旦河西岸 哈马斯谴责

每日经济新闻 浏览 2484

月薪涨150被骂抠门?宁德时代宣布涨薪,回应来了;小米汽车将开放「现车选购」,预计年底前可提;字节联手中兴打造首款豆包助手手机

雷峰网 浏览 2206

Win10用户纷纷转向Linux!Zorin OS称72%新下载来自Windows

快科技 浏览 2770
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1