关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者1560人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

丰田辟谣与比亚迪技术合作,网友的评论,能让丰田章男能背过气去

小李车评李建红 浏览 912

韩媒预热安洗莹VS陈雨菲:4强唯1战绩优于女帝之人 第9冠最大阻碍

颜小白的篮球梦 浏览 1686

山东加时105-99福建取4连胜,陶汉林19+10,邹阳空砍28+8

懂球帝 浏览 730

S妈现身大S雕像揭幕仪式,S家人穿黑衣现身,纪念碑刻着“S”字样

素素娱乐 浏览 397

西方媒体炒作“伊朗加速生产导弹”

环球网资讯 浏览 1422

网红基金,历史性暴跌

中国新闻周刊 浏览 364

鸿蒙版微信一周年:从“能用”到“好用” 超2000万下载量背后的进化史

快科技 浏览 1791

60岁的刘嘉玲、章小蕙太美了!港女的魅力从不是少女感

LinkFashion 浏览 353

女子新房装玫红色入户门贴大花壁纸 称总花费近100万

极目新闻 浏览 6210

惨不忍睹,四川全场46分创CBA常规赛单场历史最低分

懂球帝 浏览 968

媒体:日本或让美F-35战机带核炸弹部署 以"威慑中国"

枢密院十号 浏览 41873

沙特官员向德黑兰承诺:不会向美军开放领空

红星新闻 浏览 6193

配全新双联屏 红旗HS6 PHEV将11月15日预售

车质网 浏览 1555

傍上 “新中式”,现制酸奶能迎来 “二次爆发” 吗?

餐饮老板内参 浏览 1574

业绩承压借款激增 林平发展“带伤”闯关IPO

北京商报 浏览 1150

美国“难民”涌入,中国公知的天塌了!

浏览 23886

德国总理首次访华时间被指敲定 高级经济代表团将跟随

澎湃新闻 浏览 5006

男子身穿"醋瓶子"跑马拉松成全场"显眼包" 本人回应

极目新闻 浏览 23609

国米客战那不勒斯:劳塔罗搭档博尼,德布劳内、巴雷拉出战

懂球帝 浏览 1676

泽连斯基:乌克兰计划2027年加入欧盟

财联社 浏览 4349

女子旅游途中接到物业电话:你家发大水 把楼都淹了

鲁中晨报 浏览 1895
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1