关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2942人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

黄金、白银突然暴跌!发生了什么?

中国品牌 浏览 2476

美对委军事打击造成至少40人死亡

界面新闻 浏览 2128

特朗普暗示谈判如有进展 或改变打击伊朗决定

上观新闻 浏览 346

加拿大总理:加美经济关系已结束

北京日报客户端-长安街知事 浏览 9613

Stellantis,“分”或许比“合”好

禾颜阅车 浏览 2978

NVIDIA牢牢把握独显市场92%份额!Intel终于突破1%

快科技 浏览 2579

德央行行长妄言:若报复中国是最后一招 那就干票大的

澎湃新闻 浏览 8755

入秋第一条裤子就买它!时髦显瘦,巨好看!

Yuki女人故事 浏览 3808

伊姐周日热推:电视剧《依依向北风》;电视剧《水龙吟》......

伊周潮流 浏览 2680

从负债几百万,到霸榜粮油,抖音直播间隐藏着农业产业带的崛起

锦缎研究院 浏览 3727

李禹熹公开和荣梓杉聊天记录!​开房都不舍花钱,还拿私密照威胁

萌神木木 浏览 3203

vivo严打“黑公关”:索赔近千万!

互联网那些事 浏览 3191

保时捷的2025:利润触底+渠道震荡,百年积淀如何穿越周期?

买车君 浏览 2057

看来看去还是这些穿搭最高级,不老套、不死板,舒适又显气质

静儿时尚达人 浏览 1151

邵佳一:退役画面还在脑海;做教练最适合我,离不开这个地方

懂球帝 浏览 2098

白银飙涨创历史纪录!已无可用的流动性!

国际金融报 浏览 3198

王晶大谈力捧谢霆锋原因,狄波拉是恩人,谢贤更是讲义气

温柔娱公子 浏览 3074

土媒:加拉塔萨雷想租借+买断库普梅纳斯,买断费仅2500万欧

懂球帝 浏览 2124

五角大楼启动10亿美元新计划 采购数十万架单向攻击无人机

环球网资讯 浏览 2496

高市为当首相对维新会大幅让步 接受其数个"绝对条件"

极目新闻 浏览 8192

孙燕姿被曝要与曲婉婷合作,二人过往互动被扒,关系亲密是好朋友

萌神木木 浏览 2344
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1