关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻4332人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美股芯片股全线大跌,希捷科技盘后猛涨17%,闪迪大涨4%,国际油价涨超3%,霍尔木兹海峡传来新消息

21世纪经济报道 浏览 961

信邦制药涉嫌单位行贿被移送起诉,前董事长涉嫌行贿法院已立案受理,公司回应

红星资本局 浏览 3468

特朗普避谈伊朗怎样算违反停火 坚称"他们想达成协议"

极目新闻 浏览 12606

年度最嚣张女配:只给自己磨皮,却被观众偏爱

Yuki女人故事 浏览 2914

"最快女护士"张水华获得"复出"后首个全马冠军

纵览新闻 浏览 8857

营销悍将赵长江加盟智界,放言智界V9三年内无对手!

车市红点 浏览 3167

东风奕派2026款纳米01、2026款eπ008五座版上市

网易汽车 浏览 4236

智能设备迭代更新 酒泉将精准“跟拍”神舟回家影像

环球网资讯 浏览 121

蒂亚戈-席尔瓦:回到欧洲能让我离家人更近,我很想念孩子们

懂球帝 浏览 3316

科创板主题基金规模突破三千亿元 “上新”的指数如何参与创新和成长?

金证研 浏览 3947

软银清仓英伟达,孙正义套现415亿

YOUNG财经 浏览 3861

雷军直播拆车,榜一大哥狂送“半辆SU7”

麦浪的玩车之家 浏览 3226

女人不管年纪多大,衣柜里都要准备几件衬衫,百搭耐穿又简约

静儿时尚达人 浏览 804

10天9涨停!又一超级大妖股彻底爆了

财经锐眼 浏览 4075

终结5连败!鲍威尔24分热火力克篮网 热巴8+17小波特28分

醉卧浮生 浏览 3278

一天两失利!国家队和民营航天双双遇挫!股民最担心的事来了

深蓝财经 浏览 3041

以军称对黎巴嫩真主党目标发动新一轮空袭

上观新闻 浏览 4892

武汉理工毕业生称因当保安遭学校约谈 本人否认蹭流量

封面新闻 浏览 7396

特朗普政府8日召集美石油巨头 "推销"委石油投资计划

澎湃新闻 浏览 9159

林永健批顶流进组带编剧乱改戏,网友总结合作演员,成毅被质疑

萌神木木 浏览 4280

"老虎"高以忱被开除党籍:大搞政商勾连 大肆收钱敛财

界面新闻 浏览 12599
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1