关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻4553人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

最高363km纯电续航 魏牌V9X远山详解

网易汽车 浏览 2714

强脑科技:预计未来3-5年多款脑机接口产品获得医疗器械注册证

澎湃新闻 浏览 3034

【亚冠精英】阿苏埃头球路易斯建功 申花2比0首尔

体坛周报 浏览 4321

林心如自曝爱花钱,感慨霍建华太节省,网友:不懂二人咋在一起

萌神木木 浏览 4127

婚变传闻仅5天,窦骁大学同学为其发声

做一个合格的吃瓜群众 浏览 4185

泽连斯基:乌美就领土问题讨论6.5小时

每日经济新闻 浏览 3833

弹无虚发,凯恩德甲18次罚点全中

体坛周报 浏览 3970

年末避险情绪抬升 公募选股遵循涨价硬逻辑

证券时报 浏览 4088

注射后48小时有知觉,6人重新行走!巴西科学家破解脊髓损伤难题

DeepTech深科技 浏览 2993

阿卡进四强上轮电子设备没收却再惹争议,生产商:这又不是类固醇

网球之家 浏览 3104

宗馥莉辞职内幕曝光,大女主的复仇之路,如何伤了娃哈哈?

北向财经 浏览 4288

北航团队突破:让AI学会像人一样思考,不必每次都说出来

科技行者 浏览 3030

刘嘉玲好敢说!问柯淳不谈恋爱生理没需求么?柯淳回答堪称教科书

娱乐圈笔娱君 浏览 4069

广汽启动自主品牌BU改革 昊铂埃安渠道统筹运营

网易汽车 浏览 3562

千万粉丝网红"猴哥说车"官宣离婚:缘分尽了 和平离婚

扬子晚报 浏览 20117

以2.5吨白银建造的湖南“永兴银楼”被拍卖,其中1.75吨纯银折算1204.7万元,每克仅6.88元“白菜价”,委托方回应

极目新闻 浏览 3155

沙特,一部活色生香的《一千零一夜》

时尚COSMO 浏览 4317

普通人秋天应该怎么穿衣?颜色选对、衣服穿对,简单又大方

静儿时尚达人 浏览 4008

“中国巴菲特”晒出苹果持仓,而巴菲特早已减持

财视传播 浏览 3390

豆瓣逆天9.6,世间再无如此大师云集的神作!

幕味儿 浏览 3540

从轿车变成MPV? 雷克萨斯LS概念车正式发布

网易汽车 浏览 4202
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1