关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻84人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

房产遇灾能获赔百万?“家财险”值得买吗?

环球网资讯 浏览 13957

成熟企业做新品牌往往很难成功,为什么?

创业家 浏览 83

恭喜,又一个好演员被内娱毁了

独立鱼 浏览 11774

白玉兰奖争议不断!《繁花》三女主报名破坏规则,网友质疑玩特权

萌神木木 浏览 10193

3家“通达系”A股快递公司9月单价均同比上涨,快递反内卷见成效

红星资本局 浏览 183

夏末怎么穿?学会色彩搭配和穿衣技巧是关键

Yuki时尚酱 浏览 14155

2025秋冬一定要拥有的5只包包,怎么搭都好看

LinkFashion 浏览 883

国家新闻出版署发布2023年进口网络游戏审批信息:共27款游戏获批

Tech星球 浏览 18463

赵建:货币苏醒

首席经济学家论坛 浏览 83

定位大型旗舰SUV 零跑D19预告图发布

车质网 浏览 294

成龙疑似腰伤复发,走路都显得非常吃力

趣看热点 浏览 25436

新季各队最令人期待球员中部篇 内姆哈德追逐MIP?

体坛周报 浏览 820

美国向乌提供情报以瞄准俄境内目标?五角大楼回应

环球网资讯 浏览 18493

普京批准俄罗斯与古巴军事合作协议

上观新闻 浏览 236

富士康与英伟达合作,推动800伏直流电源架构落地AI数据中心

财闻 浏览 294

身高2米3女网红去世:衣服只能穿男装 买不到合适的鞋

鲁中晨报 浏览 76386

要摊牌邮报:桑乔将与滕哈赫直接对话,有人认为滕帅优待安东尼

直播吧 浏览 13493

军报披露 中央军委副主席何卫东再有新身份

政知新媒体 浏览 19344

针对伊朗有关目标?以色列再对叙利亚发动导弹袭击

环球军事时报 浏览 25729

两种动力可选 AITO问界M9将于12月26日上市

车质网 浏览 12502

没有一顿火锅解决不了的事,除了爆痘......

时尚COSMO 浏览 12433
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1