关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2934人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

忘切号了?桑乔社媒发文鼓励自己后,又用自己账号留言

懂球帝 浏览 3004

陈伟霆新剧《爱情慢慢》开机陷番位争议

梦在深巷qw 浏览 607

稳步迭代,全面超越:vivo S50 Pro mini 评测:小直屏旗舰的进化标杆

快科技 浏览 1899

2天票房3亿,看完《疯狂动物城2》,我想说:好莱坞大片赌对了

娱乐圈笔娱君 浏览 2293

2025年央八收视前十:《沉默的荣耀》第四,孙俪新剧遥遥领先

娱乐圈笔娱君 浏览 1746

科氪 | 荣耀MagicOS 10重构智能体验:AI成伙伴,全品牌互联破冰

36氪 浏览 2802

抖音&LV-NUS开源多模态新模,以小博大刷新SOTA,8B推理比肩GPT4o

量子位 浏览 2891

林丹西班牙庆生画面:9 岁儿子举动看哭网友

东方不败然多多 浏览 2132

但斌人气蝉联第1,邓晓峰热度上升!10月私募人气榜出炉!

私募排排网 浏览 2613

《逐玉》注水风波升级!315评论区沦陷

萌神木木 浏览 759

日政坛震荡首相或换人 石破茂一句话判高市早苗"死刑"

北回归线 浏览 13087

索尼耳夹式LinkBuds Clip耳机曝光:4种颜色、续航37小时

IT之家 浏览 1616

卡拉格:如果枪手本赛季夺冠,拉亚一定是最关键的因素之一

懂球帝 浏览 590

白宫又爆丑闻:为特朗普老婆拍片烧7500万

你得漂亮 浏览 1513

伊姐周日热推:电视剧《看得见风景的窗》;电视剧《春日狂热》......

伊周潮流 浏览 1654

美媒称马杜罗请求普京提供导弹等援助 佩斯科夫回应

环球时报国际 浏览 8410

告别关税围城,中欧和解为国产电车赢得战略缓冲

车市洞察 浏览 1692

全国第二个提前还债的省份,出现在西部

时代周报 浏览 3533

秦雯袭警风波升级!新剧开播前四天紧急撤档,上星困难唐嫣被牵连

萌神木木 浏览 2705

特朗普下令立即重启美国核试验 以应对其他国家核威胁

中安在线 浏览 7111

长安汽车10月销量27.8万辆 同比增长11%

网易汽车 浏览 2330
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1