关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者3905人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

记者:尽管与热刺和切尔西传出绯闻,但托尼1月不会返回英超

懂球帝 浏览 4184

实用|| 百元外套穿出万元既视感,这个思路太妙了!

黎贝卡的异想世界 浏览 3385

05后星二代“四大顶流”,为什么是她们?

仙女事件簿 浏览 4295

杜锋:希望大家能保持整场的强度,为年轻球员登场争取机会

懂球帝 浏览 2890

共享电单车下沉战升级!松果出行递表港股,业务覆盖全国422个市县|港E声

时代周报 浏览 3192

于文文贵州演唱会晕倒,曝被救护车拉走

扒虾侃娱 浏览 2914

重回“ABB”,一汽奥迪逆势突破背后的“价值竞争”

桑之未 浏览 2993

《一路繁花2》首波口碑,一针见血!

崽下愚乐圈 浏览 4055

周润发爆猛料:梁家辉以前是我“小弟”

今古深日报 浏览 891

造人形机器人的公司自己先泼冷水:行业存在过度炒作现象

IT之家 浏览 3306

笑星冯淬帆离世

萌神木木 浏览 3241

今晚发布,OPPO Find X9 系列手机提供 eSIM 版本

IT之家 浏览 4178

特朗普:将取消一些制裁 以平抑国际油价

环球网资讯 浏览 2258

调研 | 从陪伴“小巨人”企业A+H股上市,看宁波银行服务硬科技范式转变

券商中国 浏览 866

号称“租手机赚钱”,知名平台突然爆雷!有员工抵押房产上班两月,套牢130多万元,投资者:我66台iPhone没了

每日经济新闻 浏览 3788

辽篮展温馨一幕!杨鸣继伟组织与澳门男篮合影,全员沟通太和睦了

篮球资讯达人 浏览 3995

中兴驭风10 Air云电脑开售,售价2998元

IT之家 浏览 2793

恩佐:对凯塞多只有钦佩之情,能在切尔西和他并肩作战很开心

懂球帝 浏览 3900

短剧副导演拍摄结束两天后在家猝死 两女儿刚放学回家

中国青年报 浏览 33450

TA:告别全白球衣,阿森纳将在足总杯第3轮穿回传统红白球衣

懂球帝 浏览 3176

海南“半价豪车”真相:代购违规,15年强制报废还得补缴巨款

国际金融报 浏览 3310
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1