关闭广告

抖音&LV-NUS开源多模态新模,以小博大刷新SOTA,8B推理比肩GPT4o

量子位4203人阅读

SAIL-VL2团队 投稿
量子位 | 公众号 QbitAI

2B模型在多个基准位列4B参数以下开源第一。

抖音SAIL团队与LV-NUS Lab联合推出的多模态大模型SAIL-VL2

SAIL-VL2以2B、8B等中小参数规模,在106个数据集实现性能突破,尤其在MMMU、MathVista等复杂推理基准超越同规模模型,甚至比肩更大参数的闭源模型。



方法上,SAIL-VL2通过数据、训练、架构三大维度的创新,为社区提供“小模型也能有强能力”新范式。

SAIL-VL2既具备细粒度视觉感知能力,又能在复杂推理任务中媲美更大规模模型。同时,团队通过开源模型与推理代码,提供可扩展的多模态基础模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

比小说更魔幻!前华人首富,为何被特朗普特赦

说财猫 浏览 4114

百亿龙头股董事长获刑,已上诉!IPO关键期行贿官员,过程曝光

深蓝财经 浏览 3813

以无人机黎巴嫩南部炸死真主党要员 爆炸瞬间腾起浓烟

新京报 浏览 3854

世体:马竞主场对阵巴萨门票早已售罄,并有望刷新上座纪录

懂球帝 浏览 1553

北京现代纯电SUV EO羿欧开启预售 13–15万元

网易汽车 浏览 3863

媒体:放弃全球霸权 背叛美国的美国已不再自信

南风窗 浏览 8366

华为“二代”:孟晚舟与姚安娜,截然不同的路

清欢娱乐八卦 浏览 3477

国米vs凯拉特首发预测:巴雷拉踢后腰,劳塔罗继续首发搭皮奥

懂球帝 浏览 3954

亚马逊AWS将部署英伟达Groq LPU与超百万块GPU

IT之家 浏览 2124

“打飞的”半小时畅飞长三角,低空经济“飞入”进博会|聚焦2025进博会

华夏时报 浏览 3768

维权女车主“赢”特斯拉

电动知家 浏览 4872

看了《沉默的荣耀》就明白:于和伟的班,娱乐圈没有人接得了

娱乐圈笔娱君 浏览 4110

正在热播的五部电视剧,《剥茧》排在第三

农城浪子 浏览 3096

4999元起!荣耀三箭齐发:Air旗舰要从小屏卷向超轻薄赛道?

雷科技 浏览 3035

E句话| 蔡天凤案有判决结果了?

仙女事件簿 浏览 4060

鸿蒙座舱 华为智驾 三腔空悬 岚图泰山18号将上市

沙雕小琳琳 浏览 3913

MINI与Paul Smith合作推出设计师款 东京车展首秀

网易汽车 浏览 3966

俄石油贸易商要求印度简化流程:直接付人民币

澎湃新闻 浏览 5588

专家:美军突袭委内瑞拉战术有新变化 有4个突出特点

北京日报客户端-长安街知事 浏览 10387

卡里克三天激活曼联新帝星,提醒其仍需成长!拉爵或省钱少买中场

罗米的曼联博客 浏览 3115

斯诺克威尔士赛:江俊爆冷逆转塞尔比,吴宜泽4-0完胜晋级

懂球帝 浏览 2565
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1