关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2920人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

这个赛季,NBA的玄学将被终结

虎嗅APP 浏览 2747

杨振宁获诺奖速度纪录至今未破 提出理论到获奖仅1年

澎湃新闻 浏览 6424

洋河股份董事长顾宇首次交出季度成绩单:日均亏掉400万

财经众议院 浏览 2663

一夜之间,矛盾又升级了!

米筐投资 浏览 2768

林永健批顶流进组带编剧乱改戏,网友总结合作演员,成毅被质疑

萌神木木 浏览 2913

嘉定企业携新品亮相集成电路设计业展览会

上观新闻 浏览 1710

雪落航天城!航天员呵护航天娃,航天人守护航天城

我们的太空 浏览 1626

美拉德过时了?今年冬天最火的4个颜色竟然是它们

LinkFashion 浏览 1644

被采取刑事强制措施后,善水科技董事长宣布“婚变”、辞职,前妻成实控人

红星资本局 浏览 2577

全球铜市神经紧绷:摩科瑞被曝大举提货 LME库存近被掏空

财联社 浏览 2120

最高法明确:醉驾启用辅助驾驶仍需担刑责

网易汽车 浏览 764

宁德时代第三季营收1042亿:同比增12.9% 净利185亿斥资800亿理财

雷递 浏览 2438

钟楚曦合影风波升级!站C位评论区沦陷,杨幂刘亦菲差点没挤进去

萌神木木 浏览 2735

时尚守艺人 | 这不是幻觉,麒麟真的眨了眼

时尚COSMO 浏览 2744

秦雯编剧电视剧被央视撤档 此前王家卫秦雯录音惹争议

鲁中晨报 浏览 15623

王小卤的双11:在抖音电商,把凤爪“嗦”成国民零食

一点财经 浏览 2548

这些老电影里的穿搭技巧,绝了!

Yuki女人故事 浏览 2410

不愧牛市!证券公司赚疯了,有人利润翻5倍

说财猫 浏览 2062

37岁高叶演“恶女”,连面相都变了?

娱乐圈笔娱君 浏览 2642

媒体:美军武器靠拆零件续命 对美国或是一种致命伤

新民周刊 浏览 8291

台北一醉酒女被男子拖墙边性侵超10分钟 现场无人制止

都市快报橙柿互动 浏览 6689
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1