关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2221人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

2米高台直坠!41岁张靓颖摔出尖叫

东方不败然多多 浏览 2191

储朝晖:应对“入学潮”,推动教育提质增效

环球网资讯 浏览 1483

理想汽车下摆臂异响补偿方案发布月余,多位车主投诉称遭区别对待

澎湃新闻 浏览 2992

超级转型,大洛佩斯生涯前8年仅进3记三分,后9年命中1072记三分

懂球帝 浏览 2206

SpaceX:识别并切断缅甸电诈园区周边逾 2500 台“星链”设备

IT之家 浏览 2030

以色列宣布:将扣押的数百名活动人士驱逐出境

环球时报国际 浏览 2236

重庆女孩不会杀猪上千网友驱车帮忙 有人白送9头活猪

极目新闻 浏览 10913

1.86亿,压垮王健林的最后一根稻草?

功夫财经 浏览 2382

山西宣布废除烟花爆竹"禁放令" 网友:年味回来了

每日经济新闻 浏览 12509

全新Q05/A06/Q07带动 长安启源11月销量46909辆增长31%

网易汽车 浏览 1582

《骄阳似我》热度24000,这才是现偶剧该有的样子

娱乐圈笔娱君 浏览 1325

霍汶希开工派利是好热闹!谢霆锋成最大财神

无心小姐姐 浏览 282

斯基拉:那不勒斯预计近期与梅努经纪人进行新的直接会谈

懂球帝 浏览 1375

乐摩科技八成设备“躺”在影院

北京商报 浏览 1670

泰国王太后诗丽吉逝世享年93岁,后宫恐加混乱

译言 浏览 2104

胡润榜财富增长较快的雷军李书福,每分钟净赚37万和15万?

BT财经 浏览 1943

喜报!识局助力一家机器人企业落户西南某地!

识局 浏览 1956

NVIDIA牢牢把握独显市场92%份额!Intel终于突破1%

快科技 浏览 1575

《小城大事》主演爆雷!校园霸凌致女生精神分裂

萌神木木 浏览 1038

俄一夜间击落249架乌克兰无人机

北青网-北京青年报 浏览 1591

德约回应针对他受伤的新闻:媒体总爱断章取义

网球之家 浏览 1032
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1