关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻3349人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

这波操作太狠了!剪辑连夜删除邓莎路行镜头

娱乐圈笔娱君 浏览 2968

CBA战报:广厦84-65福建取CBA3连胜,胡金秋22+8+2

懂球帝 浏览 2376

8699元学习机成“大板砖”!维修要2499元,家长:交了智商税

北京商报 浏览 3194

波兰外长访乌 泽连斯基称愿与波兰分享实战经验

看看新闻Knews 浏览 3874

林丹西班牙庆生画面:9 岁儿子举动看哭网友

东方不败然多多 浏览 2441

「AI新世代」印奇掌舵阶跃星辰背后:一部中国AI的“实干派”进化史

华夏时报 浏览 1939

梅努的哥哥现身老特拉福德,衣服上写着“给科比-梅努自由”

懂球帝 浏览 2332

迪亚曼蒂:在广州有卖鳄鱼肉和鳄鱼皮的,简直不可思议

懂球帝 浏览 3746

哈马斯同意“20点计划”提议:释放所有以色列人质

央视新闻客户端 浏览 3306

小米SU7无法开门驾驶员死亡 雷军未发声累计掉粉29万

新闻坊 浏览 6930

利润暴跌99%,保时捷赚不到钱了?

汽车公社 浏览 2509

《疯狂动物城2》之后,更炸的大片来了

独立鱼 浏览 2223

特朗普敲打美最高法院:再做出否决 中国就赚爽了

观察者网 浏览 37210

加沙停火协议生效后的48小时:人质将释放、民众返乡

澎湃新闻 浏览 3303

马罗塔:国米不考虑中途换帅

体坛周报 浏览 3692

普京批准俄罗斯与古巴军事合作协议

上观新闻 浏览 3203

美推进“金穹”系统的天基拦截器研制 但钱和技术都存在问题

澎湃新闻 浏览 3216

A股年内近160股易主

北京商报 浏览 2626

新卡罗拉锐放/腾势N8L/星耀6 三天10款新车密集上市

网易汽车 浏览 3189

卷上天的新能源厂商,销量却被燃油车背刺了

虎嗅APP 浏览 3220

颠覆认知!用这8把“尺子”重新丈量中国餐饮未来!

餐饮老板内参 浏览 3857
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1