关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻1551人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

官媒揭开70岁潘虹的真实现状,董卿说的一点没错

手工制作阿歼 浏览 1134

全世界最美的8条裙子 没有女人能拒绝

LinkFashion 浏览 15921

东风计划2026年将欧洲销量提升至8万辆

盖世汽车 浏览 2092

甘肃一村民家门口种玉米被全部拔掉 涉事干部上门道歉

上游新闻 浏览 91863

拜仁官方:后卫斯塔尼希奇今日回归合练

懂球帝 浏览 1461

今年秋冬最时髦的穿法:外套+连帽卫衣,减龄又松弛!

LinkFashion 浏览 1176

中超第27轮传球成功率榜:国安89.6%居首,时隔5轮再次登顶

懂球帝 浏览 1370

美防长抨击美军士兵肥胖后 一张照片火了

环球网资讯 浏览 5842

芒特曼联体检加盟时间确定!巴西铁腰恐离队,穆帅有意引进却没钱

罗米的曼联博客 浏览 15870

奇瑞再次否认与追觅合作:双方并未进行合作签约

IT之家 浏览 536

乌军要从巴赫穆特撤退?乌官方:将继续防御

环球网资讯 浏览 19692

德甲身价涨幅榜:奥利塞暴涨3000万第1,阿德耶米、于帕上榜

懂球帝 浏览 1550

赫罗纳已摸清RCDE球场的底细

绿茵情报局 浏览 262

i60首月销量破万 广汽埃安全系月销量达40066辆

网易汽车 浏览 514

中装建设违规被罚:保荐人东兴证券、万联证券是否勤勉尽责?

面包财经 浏览 13673

媒体:一级政府拒不执行法院判决 是非常恶劣的示范

南方都市报 浏览 3796

美国新冠死亡逼近50万,纽约时报头版布满了黑点

趣看热点 浏览 117760

丫邦组合与凤凰组合会师决赛

体坛周报 浏览 2073

李铁案传递反腐新信号 教授:其或被判10年以上或无期

长安街知事 浏览 75279

才播6集热度破8900,悬疑剧有天花板了

娱乐圈笔娱君 浏览 1264

复旦发布「新闻推荐生态系统模拟器」SimuLine:单机支持万名读者、千名创作者、100+轮次推荐

新智元 浏览 17011
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1