关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者3276人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

图片报:塔踩到了斯塔尼希奇此前受伤的右脚,使其退出训练

懂球帝 浏览 2195

郑丽文当选提三大原则 称绝不让台湾成为"麻烦制造者"

海峡导报社 浏览 6866

足球报:J联赛改为跨年赛制,将对降雪地区俱乐部补贴50亿

懂球帝 浏览 3502

E句话|说错话,张凌赫ins发文道歉了

仙女事件簿 浏览 1573

马斯克:比尔盖茨最好尽快平掉特斯拉空头头寸

鞭牛士 浏览 2942

大连海鲜成双十一最热销特产之一 海参大虾扇贝备受追捧

半岛晨报 浏览 3303

急诊救命、省钱增效,AI如何改变诊疗?|全民健康大讲堂

澎湃新闻 浏览 2747

亚马逊大裁员,揭示了AI时代残酷的现实

首席商业评论 浏览 3253

帮助中国人撤离的伊朗民众:我们走不了的

南方都市报 浏览 1714

年报收官 现金分红成估值重估重要变量

北京商报 浏览 10

小米智能门锁 4 Pro 双摄版发布,预售价 2464.15 元

IT之家 浏览 3577

9.79万起 2026款比亚迪海狮05压迫感有多强?

网易汽车 浏览 495

连爆2大行业瓜!大花回应只字不提影帝

大龄女一晓彤 浏览 3116

缺席训练!曝25岁主力门将遭申花“三停”,上轮中超赛后通宵泡吧

我爱英超 浏览 3476

4个显高显瘦搭配,“小个子”的冬天就这样穿!

LinkFashion 浏览 2489

中国籍女网红在柬埔寨街头流浪面容憔悴 母亲最新发声

扬子晚报 浏览 9954

2026年4款全新MPV曝光:零跑将推“半价MEGA”,吉利华为有新品

蜗牛车志V 浏览 2461

14岁休学少女进拓展营后死亡 曾哭喊"妈妈我不想死"

新京报 浏览 37639

缅甸突袭KK园区后引发"招聘潮" 有人被7万美元"转卖"

红星新闻 浏览 15976

小米澎湃OS 3上线2026年元旦限定水印,三种版式自由选择

IT之家 浏览 2360

世体:霍安-加西亚恢复顺利,不排除入选本周末联赛大名单

懂球帝 浏览 3304
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1