关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻4329人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

红魔授权服务中心・售后网点最新进展公布,覆盖全国62城

IT之家 浏览 3567

“强制接管”, 西方这是明抢了?

观察者网 浏览 4177

美官员:已收到伊朗通过巴基斯坦转交的谈判新方案

界面新闻 浏览 978

1.86亿,压垮王健林的最后一根稻草?

功夫财经 浏览 4019

内娱太上皇,破产了?

独立鱼 浏览 858

春节档对决张艺谋吴京,成龙能不能救港片?

娱乐圈笔娱君 浏览 2891

江一燕官宣离婚后首发声

扒虾侃娱 浏览 3973

中国商业联合会:人工智能加速拓展服务消费新场景

新华社 浏览 3092

杨鸣:广东三外援轮番冲击让我们顾此失彼;今晚年轻人的表现值得表扬

懂球帝 浏览 3149

大巴黎公布24/25赛季财报:营收达8.37亿欧元,创历史新高

懂球帝 浏览 4027

“中国机构是迪拜金融中心发展的关键力量”

国际金融报 浏览 4168

1200亿元深耕中原!中国人寿助力河南区域经济高质量发展

证券市场周刊 浏览 3973

续命式改款,新款英菲尼迪QX50难解市场困局

爱驾天下 浏览 4073

曼联连续5场英超不败,为阿莫林治下最长不败纪录

懂球帝 浏览 3962

农商行员工骗贷1600万 名下已无任何可供执行的财产

新京报 浏览 16607

蒋欣节目中直言自己没人追,理想型竟然是他!

青史楼兰 浏览 3803

入职要姓“鼠”?三只松鼠工作人员回应

第一财经资讯 浏览 3664

独居女子离世民政局任遗产管理人:女子遗产或有300万

每日经济新闻 浏览 24624

52岁颜丙燕官宣恋情!小20岁男友被拍

青梅侃史啊 浏览 4296

双星名人创始人父子决裂 父亲称被儿子扣工资借钱维生

极目新闻 浏览 10392

苹果发布iPhone 17e

澎湃新闻 浏览 2314
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1