关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2351人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

刘亦菲早年 告白遭考古,老己竟是全网粉丝?

山野卢员外 浏览 1559

球报总监:穆帅执教切尔西和皇马时不这样,带曼联之后就变了

懂球帝 浏览 987

美媒炒作中国大豆采购进度 遭到美国贸易代表直接反驳

澎湃新闻 浏览 18410

员工超长时间如厕被开除 单次最长4小时辩称护理痔疮

环球网资讯 浏览 5593

媒体:高市内阁就"雷达照射"贼喊捉贼 遭批国家的耻辱

新民晚报 浏览 18560

87岁画家范曾有四段婚姻 亲生后代一女一子

红星新闻 浏览 19032

伊姐元旦热推:电视剧《剥茧》;电视剧《玉茗茶骨》......

伊周潮流 浏览 1034

协议中加入"毒丸"条款 美国与印尼的贸易协议面临破裂

第一财经资讯 浏览 18338

火遍全网的这件外套太好穿,我总结了几个实用搭配公式

黎贝卡的异想世界 浏览 2025

仅2.2万,王晶贺岁档新片票房崩塌,我感慨:观众不再为情怀买单

靠谱电影君 浏览 1139

杨天真打不开自己特斯拉从后备箱爬进去 客服回应

极目新闻 浏览 11349

汕头火灾致12人遇难 幸存家属讲述逃生细节

红星新闻 浏览 18710

德约六王赛退赛向观众道歉遭网友怒喷来捞钱,球迷用成绩狠狠打脸

网球之家 浏览 2292

马斯克3小时高能量访谈,信息量大到爆炸

深蓝财经 浏览 1143

埃迪-豪联赛对前东家伯恩茅斯7场不胜,并列英超最长纪录

懂球帝 浏览 3048

迪亚斯生涯前6场德甲直接参与9球,追平哈兰德&仅次于凯恩

懂球帝 浏览 2391

好久没对一双鞋这么心动了!

黎贝卡的异想世界 浏览 2858

演完《与凤行》演《逍遥》,她减肥50斤

失宠的小野猪 浏览 1267

今年春天最流行的6件风衣!

LinkFashion 浏览 266

上市近30年终落幕,天茂集团主动退市

虎投邦 浏览 2376

搭VLA大模型 全新蓝山智能进阶版将上市

网易汽车 浏览 1441
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1