关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻4548人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

临危受命18个月,横琴人寿董事长或“功成身退”!

独角金融 浏览 3075

刘强东“10年1元年薪”之约到期,律师解构高净值人群如何妥善处理财产

红星资本局 浏览 4933

意媒:尤文有意引进拜仁小将利契纳,但尚未与拜仁接触

懂球帝 浏览 4453

云南外援奥斯卡连续七场联赛参与进球,刷新个人中超最长纪录

懂球帝 浏览 4269

中国军舰大片震撼上新:雷达一开 周围都是透明的

环球网资讯 浏览 34564

冲着陈晓去看《大生意人》,却被满脸狰狞的两位东北跨界演员惊艳

娱乐圈笔娱君 浏览 3087

比取消特普会更严厉的制裁来了 特朗普称不想浪费时间

文汇报 浏览 7464

邮轮爆发可人传人致命病毒:30人下船 多国开始追踪

中国新闻周刊 浏览 90909

SEMA改装展亮相 凯美瑞GT-S概念车官图发布

车质网 浏览 4285

特斯拉Model Y低调升级?标配16寸2K大屏+0息政策

大李说车 浏览 3498

AI大战打到太空!前脚H100入轨,TPU后脚上天,中国玩家笑而不语

量子位 浏览 4032

继续引援脚步,记者:北京首钢目前正在接触前NBA球员麦基

懂球帝 浏览 3428

Aluminium OS曝光:谷歌安卓、ChromeOS统一桌面平台计划加速落实

IT之家 浏览 3889

专家:特朗普对中国无牌可打了 没想到蠢到打起波音牌

澎湃新闻 浏览 4344

加沙停火一个月:民众苦难如常 美以又有新动作

国际在线 浏览 4112

新款红旗HS5曝光,内外设计大改,或推插混车型,半年内上市!

车讯简报 浏览 3233

埃安N60上市10.68万起 标配激光雷达/零重力座椅

网易汽车 浏览 1313

“羽绒服+半身裙”,混搭风太好看了!保暖又气质!

Yuki女人故事 浏览 3308

男子精神分裂砍死同学的弟弟 第二次精神鉴定结果变了

红星新闻 浏览 8453

牛弹琴:高市早苗有点悬了 女首相之路出现重大波折

现代快报 浏览 4377

多省份公布金融数据:居民储蓄高增,浙江人均存款超17万元

第一财经资讯 浏览 3288
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1