关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻1553人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

亲历香会学者:德研究员想为难中国防长 被直接怼回去

环球网资讯 浏览 90820

跨军种联合 直击空军航空兵直升机海上着舰训练

环球网资讯 浏览 1250

采用增程动力 极石ADAMAS将于12月17日上市

车质网 浏览 937

得益于松下 特斯拉最快今年就能推出更便宜的汽车

智车情报局 浏览 13334

米莱逆袭!阿根廷中期选举大胜,激进改革能走多远?

国际金融报 浏览 1393

微笑刺客:你碰一下乔丹他就哭着说自己被打了 联盟为他改变规则

直播吧 浏览 19554

我和我太奶竟然用的是一个Tony

时尚COSMO 浏览 14224

蓝色+灰色、红色+棕色,这4组配色怎么搭都好看!

LinkFashion 浏览 323

美日通电话后欧洲集体变脸 日本对华提出一个新要求

博览历史 浏览 29448

土耳其决定开始启动批准芬兰加入北约相关程序

新京报 浏览 19709

皮耶罗评尤文浪费机会太多:皇马就不会浪费这么多机会

懂球帝 浏览 1435

一个阮经天,打脸了多少内娱“影帝”,还有号称投资几亿的烂片

最爱酷影视 浏览 12976

近11战1胜10负!哈登缺阵快船惨败雷霆 近两战合计净负39分

Emily说个球 浏览 731

马拉戈:意大利惨败瑞士像开玩笑 斯帕莱蒂感觉被场上球员背叛了

直播吧 浏览 11679

陈伟霆何穗官宣结婚生子,夫妻俩抱娃露面幸福满溢,二人隐藏好深

扒虾侃娱 浏览 1578

市场博弈美联储降息

北京商报 浏览 837

掘金工作人员妥善保管着约基奇的FMVP奖杯 为夺冠游行做好了准备

直播吧 浏览 16413

昼夜不息!看陆航直升机空中突击

环球网资讯 浏览 19698

17岁少女含冤入狱13年获172万国赔 法院:我们道歉

社会奇闻君 浏览 91811

刘强东朋友圈疑曝光,自嘲在老婆面前失去没自信

柠檬有娱乐 浏览 1285

姚振华与宝能的造车梦:千亿资本开路 能否后来居上?

新京报 浏览 27006
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1