关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻874人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

大众在欧洲开启ID.7电动轿车预售:6.2万美元起,国产版下月开售

IT之家 浏览 13861

女人不管多大都可以这样穿衣搭配,不花哨、不臃肿,优雅舒适

静儿时尚达人 浏览 326

拟剥离银座商管 福瑞达继续瘦身

北京商报 浏览 972

亚马逊史上最惨裁员规模又扩大了:媒体和游戏直播部门新年解雇数百人

华尔街见闻官方 浏览 12386

媒体:丢大人了 特朗普在航母上演讲巨幅海报后有问题

枢密院十号 浏览 3718

普京签署法律修订兵役法:征兵工作将全年不间断进行

界面新闻 浏览 5212

月球样品管理办法首次对外发布,月球土壤样品将有4种基础用途

趣看热点 浏览 25570

春运诈骗,年轻人被坑得水深火热

她刊 浏览 12787

国产半导体设备突围,需要的不止光刻机

晚点LatePost 浏览 14229

这个吴邪,还真不是谁演都能火的。

伊周潮流 浏览 937

降幅缩窄,绿城亮眼!上半年TOP10房企销售涨跌榜

闺蜜财经 浏览 10588

11人涉菅义伟长子不当宴请被处分菅义伟长子“政商勾结”案最新消息

趣看热点 浏览 133793

谁吃掉了那块蛋糕?2023时尚圈黑马盘点

VogueMe 浏览 13787

上海9旬老太举报保姆虐待 儿媳:保姆逼写自愿给钱字据

极目新闻 浏览 92791

北约秘书长吕特与泽连斯基通话 讨论对乌军援

极目新闻 浏览 1410

763球!C罗登顶历史正赛射手王宝座

趣看热点 浏览 25322

媒体:拜登和耶伦近期轮番对中国经济动向发表偏颇言论

直新闻 浏览 93274

媒体:中方已经明确不出席“乌克兰和平峰会” 并给出理由

新民周刊 浏览 67720

成功冲乙,厦门壹零贰陆主帅:厦门是一座有足球底蕴的城市

懂球帝 浏览 988

反击美国"变脸"普京即将公布神秘新武器 专家分析

环球网资讯 浏览 962

告别奥博穆时代,保时捷加速落子研发"中国棋"

网易汽车 浏览 539
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1