关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻3492人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

德国一公司研发无贵金属电极技术让绿氢生产又快又便宜,明年试产

IT之家 浏览 2203

今年冬天最经典的4双鞋,年年穿都好看!

LinkFashion 浏览 2923

"90后"王兴兴:小学时想当科学家 同学一句话启发了我

中国新闻周刊 浏览 8488

限时换新价11.98万 第三代蓝电E5 PLUS正式上市

网易汽车 浏览 2709

法拉利撞上护栏后迅速起火 知名游戏大佬被困车内身亡

每日经济新闻 浏览 30482

咖啡万店新王诞生:挪瓦如何以“寄生模式”隐秘扩张?

虎嗅APP 浏览 2570

蔡国强被指富士山放烟花遭拒 媒体发问:国内为何通过

上游新闻 浏览 25487

不敌王楚钦,松岛辉空:满脑子只有不甘心,混双应该能复仇

懂球帝 浏览 2568

是颜值派更是实力派,李斯丹妮的高能生活不设限

时尚COSMO 浏览 1885

特朗普或为中国制造三大机遇,中国如何利用?

浏览 25949

绝色美人赛道,太适合何晴了!

温柔娱公子 浏览 2078

可磁吸绝配iPhone!长江存储致态灵潮流版移动SSD 2TB图赏

快科技 浏览 2537

“精准”归来:戴尔正式宣布推出"Pro Precision"工作站产品线

IT之家 浏览 1273

媒体:高市早苗想见中国领导人 也未必是特别难的事

新民周刊 浏览 15159

最高363km纯电续航 魏牌V9X远山详解

网易汽车 浏览 1602

加沙地带民防部门:以军袭击一车辆 同一家庭9人死亡

央视新闻客户端 浏览 3371

PPE平台打造 宾利全新纯电SUV测试谍照曝光

车质网 浏览 2871

官方:瑞典裁判尼贝里将执法欧冠热刺vs多特

懂球帝 浏览 2155

“北溪”爆炸案一嫌疑人被引渡至德国受审

极目新闻 浏览 2730

谁是AI之王?聊聊备受争议的AI评测与崛起的LMArena

硅谷101 浏览 3048

蔚来ES9压轴登场,“9系”五强争霸:谁是中国豪华新能源的终极答案?|汽车观察

封面新闻 浏览 569
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1