关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻3542人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

第五届意大利繁花电影节圆满落幕!

幕味儿 浏览 3211

徐洁儿浪姐的“三字诀”,稳、飒、燃

醉卧浮生 浏览 630

第六代RAV4荣放双擎精英版上市限时焕新价15.18万元

网易汽车 浏览 1614

2026年新年首个工作日 中纪委连打4“虎”

南方都市报 浏览 9605

特朗普:取消与普京在布达佩斯的会面

央视新闻客户端 浏览 2754

vivo S50外观揭晓!全新告白配色:田曦薇同款

快科技 浏览 2739

美媒:美两架军机坠入南海或与燃油无关

北京晚报 浏览 3056

港股智谱与MiniMax大涨能给A股带来什么变化?| 0223

虎嗅APP 浏览 1703

《太平年》演员演技排名,朱亚文第6,梅婷第3,第1众望所归

娱乐圈笔娱君 浏览 2168

美联储年内“三连降”,2026年利率走向何方?

中新经纬 浏览 2743

纯电续航达550km 吉利银河A7 EV官图发布

车质网 浏览 624

警方通报荣梓杉李禹熹纠纷

韩小娱 浏览 3049

杜兰特至少降薪4000万美元?高管建议火箭最多2年8000万与他续约

罗说NBA 浏览 2839

临危受命18个月,横琴人寿董事长或“功成身退”!

独角金融 浏览 2056

媒体:中方反制日自卫队前高官 令人想起"白团"终失败

新民周刊 浏览 17981

威少:梦想打橄榄球的我从未想过能有如今成就,希望我能激励到其他人

懂球帝 浏览 2466

名记:穆阿尼将继续留在热刺,尤文今夏将再次尝试引进他

懂球帝 浏览 2013

小个子秋季穿搭指南!7件单品穿出大长腿,显高10cm

Yuki女人故事 浏览 5257

中美俄都不想的事出现 欧尔班面临下台特朗普力保没用

博览历史 浏览 13450

建立互信和实现共赢,解读国有车企高层为何密集拜会任正非?

百姓评车 浏览 4086

佩斯科夫:"海燕"巡航导弹试验不应影响俄美互动

国际在线 浏览 3204
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1