关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻4717人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

巴解组织高级官员:哈马斯回应“20点计划”是负责任做法

环球网资讯 浏览 4468

2025最狠理财,惊呆百万散户!

米筐投资 浏览 3446

男子下车救人被网友误会成是"肇事逃逸" 警方出面澄清

封面新闻 浏览 24899

外国女教师性侵16岁男学生数月上百次 详情炸裂

胡侃社会百态 浏览 39760

冬天想穿得轻盈保暖,看看这些大衣穿搭,大方舒适又有高级感

静儿时尚达人 浏览 3844

美国再退66个"群" 外交部回应

界面新闻 浏览 13838

刘晓庆回应年龄追问:关你们什么事

期望带来失望 浏览 3164

韩硕辞职后首战!新疆42分狂胜送四川18连败 齐麟复出11分

醉卧浮生 浏览 3464

理财代销加速下沉 热销背后警惕收益率“美化”

北京商报 浏览 4044

圣米伦夺苏格兰联赛杯,进球队员赛后采访不慎爆粗后道歉

懂球帝 浏览 3820

丹麦羽毛球公开赛今日打响,石宇奇迎来世锦赛后首次亮相

懂球帝 浏览 4656

央视主持杨澜:嫁百亿身家老公,57岁却直播卖课

冷紫葉 浏览 4375

【中超】埃杜加西亚梅开二度 9人深圳客场2比1三镇

体坛周报 浏览 4386

国羽包揽韩国公开赛混双冠亚军

体坛周报 浏览 5041

连爆2大行业瓜!大花回应只字不提影帝

大龄女一晓彤 浏览 4069

数据不会说谎!《向往8》收视0.3

手工制作阿歼 浏览 3772

64岁男演员春节在景区打工暴瘦引担忧 曾自称不再拍戏

扬子晚报 浏览 39515

刘宇宁一天迎来两个喜讯,秦海璐没说谎

贵州小娟 浏览 3598

科隆vs汉堡:卡明斯基、侯赛因巴希奇首发,法比奥-维埃拉、洛孔加出战

懂球帝 浏览 4238

妻子家中枉死丈夫被疑雇凶杀人 27年后真凶浮出水面

环球网资讯 浏览 9837

枪手又被黑?塔帅称VAR的解释不对

体坛周报 浏览 3394
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1