关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro1706人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

媒体:关于台湾问题 2028年有3个关键时间节点

经济观察报 浏览 7527

中方敦促波黑各方缓解紧张局势

国际在线 浏览 2556

科技巨头疯狂投资AI基建,芯片厂商吞了云服务企业的利润?

澎湃新闻 浏览 2829

冬天别总只穿“羽绒服”,试试这些日常穿搭,简单舒适显身材

静儿时尚达人 浏览 2124

C罗再谈曼联:架构出错阿莫林无法创奇迹,为此难过希望尽快复兴

罗米的曼联博客 浏览 2573

于和伟点评余皑磊的表现,只字不提演技二字,却真知灼见

娱乐圈笔娱君 浏览 2763

图多尔:虽输给皇马但球队有战斗精神,将努力去赢得每一场比赛

懂球帝 浏览 2691

中国海警:菲方侵闯中国领海 故意冲撞中国海警船

央视新闻客户端 浏览 3515

懒懒陪王思聪低调过38岁生日,晒甜蜜日常

丁丁鲤史纪 浏览 1732

美国禁令反噬!中国断供培育钻石,半导体巨头:完了,要停产!

木禾投研 浏览 2815

购置税新规下的购车选择题,插混车抄底还是等新车?

百姓评车 浏览 2900

高市早苗再有新动作日本准备拥有核武 中俄要早做准备

头条爆料007 浏览 44257

特朗普提议俄乌"在当前战线停火" 克宫表态

环球网 浏览 2696

谁将是下一个劈开海外万亿市场的中国黑马?

虎嗅APP 浏览 2891

SpaceX将于10月14日最后一次发射"星舰V2"

IT之家 浏览 2837

今日热点:李庚希空降粉丝群抵制代拍;荷兰弟复工拍摄《蜘蛛侠4》……

伊周潮流 浏览 2532

为什么最好全款买蔚来ES8,也不要贷款分期买?套路实在太多了

大志聊车 浏览 1817

收购两公司 探路者加码芯片业务

北京商报 浏览 2151

“最帅升旗手”张自轩结婚了

说点事 浏览 1758

盈利大考冲刺关头,千亿小鹏被指“虚假宣传”

雷达财经 浏览 1766

中国队手下败将逆袭进联合杯四强,袁悦45分钟速败引发网友热议

网球之家 浏览 1722
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1