关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者1925人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美方公开核航弹测试画面

北京青年报 浏览 1285

小川航基:没赢下巴拉圭心有不甘;对阵巴西的机会肯定会更少

懂球帝 浏览 2139

西贝的新考题:如何券后留客

北京商报 浏览 1557

周定洋自宣离队!媒体人热议:已经在深圳,非得不做英雄太可惜

奥拜尔 浏览 1056

翁帆:杨先生离开时一定很欣慰 他交出了份满意的答卷

光明日报 浏览 5670

秋天穿衣真的一点都不难!从这些穿搭中收获灵感,舒适又耐看

静儿时尚达人 浏览 1776

张元英又作大死?香港相关言论炸锅了

小徐讲八卦 浏览 1239

新华鲜报|向着8万海里!中国第42次南极考察队起航

新华社 浏览 2001

文班亚马:我真的不在乎个人荣誉,若拿到DPOY说明我帮到球队了

懂球帝 浏览 1967

状态比10年前更好,她到底做对了什么?

黎贝卡的异想世界 浏览 819

女友BELLA+封面 | Jimmy&Ohm:人生拼图

伊周潮流 浏览 1151

凑齐“56789”!问界独占鸿蒙智行7成销量,“5界”如何共扛百万辆目标?

时代周报 浏览 819

浙江男子全款买车合同签完提不了车 4S店:经理进去了

FM93浙江交通之声 浏览 6042

十五运会开幕式收视出炉!最高破3.9%,刘德华上场涨出小高峰

萌神木木 浏览 1596

托蒂:还没和斯帕莱蒂谈过去的事情,经过这么多年该放下了

懂球帝 浏览 1963

泡泡玛特股价连跌6天

YOUNG财经 浏览 2041

一款车就给吓成那样?某全球车企掌门人:比亚迪,是个巨大的威胁

小李车评李建红 浏览 2032

港媒:香港武打明星梁小龙离世,享年77岁

界面新闻 浏览 969

混动系统为内燃机续命 沃尔沃最新消息曝光

乐选爱车 浏览 1876

西芒杜铁矿石准备装船,榨取中国钢企利益的时代该结束了

北向财经 浏览 1870

宗馥莉辞职内幕曝光,大女主的复仇之路,如何伤了娃哈哈?

北向财经 浏览 2104
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1