关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2926人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

停不下来,肯扬-马丁继续怼追梦:没有库里和克莱你只是队内第12人

懂球帝 浏览 2254

华为“二代”:孟晚舟与姚安娜,截然不同的路

清欢娱乐八卦 浏览 2073

曼晚:无论卡里克成绩如何,恩里克、纳格尔斯曼顺位在他前面

懂球帝 浏览 788

邮报:流浪者正考虑让麦克马斯特临时带队,等待穆斯卡特

懂球帝 浏览 2796

蔚来ET9百万纪念限量版上市 售价81.8万元

车质网 浏览 1347

字节跳动:因组织调整离职的员工 过渡补贴最高7.2万元

澎湃新闻 浏览 2913

蓝宝石高管首度回应显卡16Pin烧毁:就算解决、名声也臭了

快科技 浏览 2108

缅北白家案4名罪犯被执行死刑 一审宣判后白所成病亡

大象新闻 浏览 8719

特朗普弄混格陵兰岛与冰岛 再提北约秘书长叫他"爸爸"

鲁中晨报 浏览 19098

百色"锅底"村庄积水不退 村民:明年不想再种地 白费劲

澎湃新闻 浏览 5703

年底交付 兰博基尼Temerario即将国内上市

车质网 浏览 1462

搭载鸿蒙座舱 新款天籁将于广州车展上市

车质网 浏览 2432

“大空头”11亿空单瞄准英伟达和Palantir,AI泡沫真的来了吗?

郭施亮 浏览 2565

高盛暂停为与芝商所事故相关的数据中心公司发售债券

华尔街见闻官方 浏览 2147

新卡罗拉锐放/腾势N8L/星耀6 三天10款新车密集上市

网易汽车 浏览 2804

北向资金三季度持仓曝光:宁德市值第一,京东方A获增持股数最多

澎湃新闻 浏览 2834

福建赖氏宗亲:姓赖的都是中国人 姓赖者根源都在中国

环球网资讯 浏览 6952

带队英超客胜曼城和利物浦,阿莫林是近五个赛季唯一一人

懂球帝 浏览 2954

许传智被查:在中纪委工作超30年 曾任宁夏纪委书记

界面新闻 浏览 7652

男子在悬崖边请人拍照滑倒坠下 遗体在水潭底部被找到

封面新闻 浏览 8363

农妇收玉米时遇山体坍塌失联4天 周边马路出现大坑

红星新闻 浏览 13769
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1