关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者3903人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

国内首个开放式机器人租赁平台在沪发布,已触达50个重点城市

澎湃新闻 浏览 3312

男子给小35岁情人转1340万 妻子:第三者生活极度奢侈

极目新闻 浏览 16968

自从养成这个小习惯,生活一下子好起来了

黎贝卡的异想世界 浏览 1212

特朗普被指非常重视"和平峰会" 以色列哈马斯或不参加

环球网资讯 浏览 8053

高市早苗再有新动作日本准备拥有核武 中俄要早做准备

头条爆料007 浏览 45576

俄总统新闻秘书:北约在与俄罗斯作战

新京报 浏览 4795

资深天使投资人肖庆平在西藏车祸离世 朋友圈内容披露

都市快报橙柿互动 浏览 4224

一个手机壳卖200,这家深圳公司靠什么掏空老外钱包?

花朵财经 浏览 2978

明年上半年上市 奇瑞风云实车A9 EV亮相

车质网 浏览 3691

胡塞武装:以军空袭萨那致9死174伤 包括大量妇女儿童

极目新闻 浏览 4704

香港三天两夜,满载而归(附攻略)

黎贝卡的异想世界 浏览 2101

包括氢动力版本 宝马全新一代X5最新消息曝光

乐选爱车 浏览 4667

隐退4年后,张一鸣久违现身!互联网大佬正集体杀回

深蓝财经 浏览 4205

内装豪华感提升 小鹏X9增程版内饰发布

网易汽车 浏览 4082

中方回应美100%关税威胁:动辄以高额关税进行威胁,不是与中方相处的正确之道

环球网资讯 浏览 4240

多品牌疑"删除"张雨绮代言内容 此前其被实名举报代孕

现代快报 浏览 6529

迅雷再次起诉前CEO陈磊 知情人:追索金额达2亿元

红星新闻 浏览 14504

汪小菲接俩娃回北京过春节!玥儿和奶奶逛公园

地理三体说 浏览 2992

吴佩慈发大S照片悼念:我失去的岂止是一个好朋友

素素娱乐 浏览 2865

关键时刻又崩!许利民发布会罕见发怒,却甩锅球员态度与球员能力

篮球资讯达人 浏览 3160

U23亚洲杯8强出炉 1/4决赛对阵:国足第2出线战上届亚军 避开日韩

我爱英超 浏览 3138
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1