关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2353人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

83岁的何享健再度冲击IPO,美的系第十子即将诞生?

BT财经 浏览 3008

X把伊朗国旗改成狮子太阳旗 哈梅内伊把"国旗"删了

澎湃新闻 浏览 11754

借鉴丰田GR与日产Nismo,本田也要搞专属运动车系HRC

CLauto酷乐汽车 浏览 1126

奥特曼零食之父,要去IPO了

投资家 浏览 2090

古二反击《繁花》!新录音曝光打脸秦雯,业内直言压榨新人是常态

萌神木木 浏览 2576

“短大衣”今年冬天又火了,这4件怎么搭都好看!

LinkFashion 浏览 1044

美军在加勒比地区袭击船只致6人死亡 包括两名特多公民

环球网资讯 浏览 2339

陈浩民夫妇滞留阿联酋 妻子:人生第二次收到轰炸警报

极目新闻 浏览 35881

针对其父可能被“身边人”出卖的传言 马杜罗之子回应

上观新闻 浏览 1245

啃下数百万骑手社保的“硬骨头”,美团花了五年

雪豹财经社 浏览 2062

比亚迪元PLUS迎来史诗级升级,续航或超650km!

刘哥谈体育 浏览 1992

特瓦斯:大多数联赛都在苦苦挣扎,我好奇为何人们这么想阻止海外赛

懂球帝 浏览 2178

世体:尽管知道需合理分配体能,但莱万不会放弃争夺中锋位置

懂球帝 浏览 1250

上任即取大胜,新疆主帅格兰:这不是我的功劳,是球员打得好

懂球帝 浏览 1123

美媒披露:美空军8天内向中东地区调派至少42架重型运输机

环球网 浏览 987

熊园:9月财政有喜有忧,今年预算能完成吗?

首席经济学家论坛 浏览 2326

两种容量、最高纯电续航超320公里,极氪8X电池信息揭晓

IT之家 浏览 1195

B股,最后的金矿?

36氪财经 浏览 1069

新能源大三排SUV的猎杀时刻开始了

汽车公社 浏览 1365

巴黎客战布雷斯特:阿什拉夫、KK7首发, 登贝莱替补

懂球帝 浏览 1883

上海集成电路产业版图再落一子,长电科技今天在沪投产

上观新闻 浏览 74
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1