关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻1652人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

三年半烧掉35亿!一帮金融人,带“火箭”冲科创板

财通社 浏览 519

一个长城战略下,哈弗重塑命名体系

帮宁工作室 浏览 1491

患癌母亲"碰瓷"货车司机 儿子怒斥母亲后赔司机3000元

北青深一度 浏览 6565

凌晨3点皇马出战!赢球=8连杀+反超巴萨登顶 姆巴佩冲60球

叶青足球世界 浏览 1611

乌戈:今天是场起伏很大的比赛;过去几场打出了我们想要的风格

懂球帝 浏览 45

缅甸政府军突袭KK园区 查获30套星链设备

红星新闻 浏览 6808

鹿晗关晓彤恋爱期间毫不避讳?

娱晓晓 浏览 807

马英九祝贺郑丽文当选:坚守"九二共识" 促进两岸关系

参考消息 浏览 5933

3年半亏损289亿,华侨城A换帅,人均薪酬15.5万元

华美财经 浏览 2424

华为的智驾神话,要被打破了吗?

电动势 浏览 407

江一燕官宣离婚后首发声

扒虾侃娱 浏览 1471

断崖领先,罗塞尼尔执教白堡同期使用U21球员时间五大联赛第1

懂球帝 浏览 502

吉林长春中东新天地购物公园:丰富多元体验 焕新商业地标

中国商报 浏览 744

刘强东又拿下理想,京东汽车靠谱吗?

正在说车 浏览 757

缔造仙女梦的人,去了天堂继续缝制星光✨

黎贝卡的异想世界 浏览 373

负债数亿,足力健卖食品要开20000家店

中国企业家杂志 浏览 1326

马卡: 姆巴佩在皇马达成50球里程碑,本赛季点球命中率显著提升

直播吧 浏览 2375

推广|| 小预算也能戴出好质感,这个宝藏国货真的很值

黎贝卡的异想世界 浏览 1678

小川航基:没赢下巴拉圭心有不甘;对阵巴西的机会肯定会更少

懂球帝 浏览 1618

乌克兰决定与尼加拉瓜断交

参考消息 浏览 1313

30岁后越来越美的女人,只穿滋养自己的衣服

LinkFashion 浏览 2565
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1