关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻4330人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美伊陷入互相封锁僵局

环球网资讯 浏览 927

全职主妇吞大量安眠药 丈夫:她觉得她是美女嫁我可惜

扬子晚报 浏览 7167

全球知名对冲基金投资人:中国业务超越预期

中国基金报 浏览 3715

蓝宝科技呼吁 GPU 制造商放宽限制,赋予板卡设计更大自主权

环球网资讯 浏览 3394

豪华5座中大型SUV!续航2327km,瞄准理想L6

隔壁说车老王 浏览 3876

伊朗选出新领袖 战事还要打多久

红星新闻 浏览 2229

哈梅内伊遇袭身亡 被指已指定暂代最高领袖责任人选

新民周刊 浏览 40393

小米 17 Pro Max 手机获澎湃 OS 3.0.24.0 版本升级

IT之家 浏览 4084

2025浦江创新论坛主论坛举行,汇聚全球智慧力量,构建开放合作科技共同体

澎湃新闻 浏览 4784

他入行30年不温不火,回村务农却火了

艳儿说电影 浏览 3977

连续两场地区联赛弃赛后,葡老牌球队博阿维斯塔面临解散风险

懂球帝 浏览 4071

继星巴克之后,汉堡王中国也被卖了!中国资管巨头3.5亿美元接手

深蓝财经 浏览 3783

侮辱性极强!美国炸死哈梅内伊的秘密武器,居然是伊朗自己发明的

壹只灰鸽子 浏览 2413

联合国官员:加沙惨状如末日电影

上观新闻 浏览 3229

AI让机器写代码变得更聪明:伊利诺伊大学团队破解训练瓶颈新方法

科技行者 浏览 3888

日本新首相高市早苗上台,日美同盟是共振还是错位

环球网资讯 浏览 4102

有多想不开才去巴西投资?

虎嗅APP 浏览 3221

阿里达摩院推出电商智能体全面测试基准

科技行者 浏览 3114

斯基拉:尤文派出球探考察萨索洛中场伊斯梅尔-科内

懂球帝 浏览 2161

持续烧钱的大模型,阻挡不了AI行业的热情

蓝鲸新闻 浏览 3310

普通人穿衣不需要太复杂!颜色恰当、搭配和谐,高级又耐看

静儿时尚达人 浏览 2376
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1