关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻4718人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

直击海上训练场!多舰协同补给现场震撼来袭

环球网资讯 浏览 640

娃哈哈精密机械公司启动解散清算,员工称已收到终止劳动合同通知

红星资本局 浏览 2794

英媒:热刺希望能在冬窗签下马尔穆什,维拉也对他感兴趣

懂球帝 浏览 3457

5人违规穿越鳌太线3人遇难:为规避罚款手机调飞行模式

极目新闻 浏览 8348

数百大主播压阵,遥望科技为何走不出巨亏黑洞?

斑马消费 浏览 1417

外媒聚焦中国“最强航母”:看得清清楚楚 很冲击了

观察者网 浏览 8502

以军打死数十名哈马斯指挥官 特朗普:应该的

每日经济新闻 浏览 4344

安东尼奥:难以置信的比赛,球员们真是不可思议

懂球帝 浏览 3395

颜骏凌:武磊赛前对球队做了动员,我们争冠经验丰富没有包袱

懂球帝 浏览 4296

44岁阿娇自曝手抖出肝不太好,已戒酒一年多

小咪侃娱圈 浏览 4396

世体:坎塞洛、巴尔德和赫拉德-马丁各有特点,首发难以确定

懂球帝 浏览 2815

新兴市场套利狂潮未止!华尔街看好2026年高收益货币前景

智通财经 浏览 3788

李昀锐和孟子义恋情爆热搜,新剧直接无人在意了

陈意小可爱 浏览 4588

辽宁88-61山东迎3喜1忧!原帅付豪成支柱,对阵广东内线引担忧!

篮球资讯达人 浏览 4229

TII发布Falcon-H1R:7B小模型推理能力超越32B大模型

科技行者 浏览 3458

媒体:执政半年 李在明抓住了一个关键窗口期

澎湃新闻 浏览 9587

有消息称“美军战机系被友军误击”

南方都市报 浏览 2679

OpenAI发力机器人与AI设备,被爆寻找美国供应商

华尔街见闻官方 浏览 3376

奇瑞“掀桌子”了!首款固态电池车星途ES8,零下30℃续航1000Km

车矩阵更懂车 浏览 3698

泽连斯基:愿与特朗普和普京会面 但不去莫斯科

极目新闻 浏览 5171

泽连斯基:会谈富有成效 但美乌在领土问题上立场不同

国际在线 浏览 19042
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1