关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻3346人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

北京正探索AI赋能教育,不同学段精细化考虑!市教委详解

北京商报 浏览 1907

社评|立足新起点 奋力开新局

中国企业家杂志 浏览 2224

大衣别这么穿,显黑又显胖!

Yuki女人故事 浏览 2887

29岁国乒老将临危受命?淘汰黄友政状态回暖 锁世界杯后冲世乒赛

颜小白的篮球梦 浏览 1217

A股进入“两会”时间,16大热门投资赛道出炉

览富财经网 浏览 1365

揭秘!印巴冲突突然停火背后五大关键因素

浏览 6800

记者:原梅州客家主帅里斯蒂奇将接任李霄鹏,执教青岛海牛

懂球帝 浏览 2490

美媒披露普京停火条件:基辅必须彻底放弃顿涅茨克

参考消息 浏览 3287

关键时刻委少将为美军"敞开大门" 美压制委军手段披露

澎湃新闻 浏览 6216

美军突袭抓获马杜罗 三个细节值得关注

上观新闻 浏览 2204

摩尔线程:股票价格可能存在短期上涨过快出现的下跌风险

网易财经 浏览 2464

吊打内娱的阴湿女王,回来了

独立鱼 浏览 3099

撕开铁幕裂缝:国产手术机器人的千亿逆袭

钛媒体APP 浏览 3274

50岁,我妈在恋综抢男人

她刊 浏览 347

特朗普扬言要撒"关税红利":反对关税的人都是傻瓜

财联社 浏览 8368

马杜罗怒斥美“南方之矛”行动:国际法终将被维护

国际在线 浏览 2743

女孩被篮球砸头后确诊癔症自残失禁 母亲:我也不理解

上游新闻 浏览 9028

牌桌被掀,中国模型换了一种赢法

36氪 浏览 2069

2026年最火单品,竟然是一只20年前的机车包?

LinkFashion 浏览 2164

千人冒雪送“棋圣”,韩国“围棋皇帝”曹薰铉专程道别:盼未来与聂老天堂对弈

国是直通车 浏览 1982

李在明表态:韩国站美国一边 但要妥善处理对华关系

澎湃新闻 浏览 14758
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1