关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻4468人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

GEO炒出了个大乌龙,301171,20CM跌停!

看财经show 浏览 3035

10万观众打出9.3分,成本仅3000万,票房破3亿?贺岁档黑马来了

靠谱电影君 浏览 2989

助力AI全民创作 万兴科技(300624.SZ)旗下万兴天幕创作广场推出“视频教程共创激励计划”

智通财经 浏览 4795

澳网公布创纪录奖金池,史上最大奖金提升引发热议

网球之家 浏览 3386

锦州银行落幕引发渠道整合,超1600只基金上演“代销大迁徙”

券商中国 浏览 4009

陈赫40岁生日合影惹争议?

萌神木木 浏览 3176

摩登出街潮品 实拍奇瑞QQ冰淇淋女王版

网易汽车 浏览 3238

限量 100 台 电动 MINI JCW 蒙特卡洛 60 周年版上市

网易汽车 浏览 4174

乌克兰空军:一架苏-27战机在该国东部坠毁 飞行员死亡

环球网资讯 浏览 3507

激烈攻防暴露美军中东反导漏洞

环球网资讯 浏览 2162

全系智混 全新奥迪Q5L上市售30.98万起

网易汽车 浏览 3101

双向奔赴!澳优乳业再度携手江南大学 为营养健康行业发展注入创新动能

中国商报 浏览 4307

特朗普不解"为什么伊朗还不投降" 伊朗外长回应

CCTV4 浏览 2392

罗晋父亲离世后唐嫣首发声

娱乐圈圈圆 浏览 3742

从“白幼瘦”到“气血感”,审美标准终于“健康”了?

Yuki女人故事 浏览 3642

马切吉亚尼:迈尼昂扑点的秘诀是米兰的门将教练菲利皮

懂球帝 浏览 4055

万科A:第三季度净利润亏损160.69亿元

网易财经 浏览 3366

有人被拖欠工资!毫末智行北京总部人去楼空,员工抱着显示器离开;曝ASML为美国监控中国客户!官方否认;雷军斥资超1亿港元增持小米

雷峰网 浏览 3749

你们猜谁会迷失在电动浪潮中?

汽车公社 浏览 4227

全红婵夺金 新搭档身份不简单 赛后发文信息量大

白面书誏 浏览 3948

伊姐周六热推:电视剧《亦舞之城》;电视剧《时差一万公里》......

伊周潮流 浏览 3666
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1