关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者1366人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

携手华为,“黑马”深蓝的下一程

网易汽车 浏览 11286

前10月规模以上高技术制造业利润同比增长8.0%

北京商报 浏览 1042

谢锋:中美做对手还是伙伴 是管总、管根本的问题

环球网资讯 浏览 13302

销量五年连跌,转型未起色,为何日系车最“困难”的是本田?

汽扯扒谈 浏览 412

五角大楼被指欲购书供美军飞行员学习 名单现中国兵书

环球网资讯 浏览 68922

大疆最大对手,要IPO

投资家 浏览 523

中装建设违规被罚:保荐人东兴证券、万联证券是否勤勉尽责?

面包财经 浏览 13713

曝特朗普要攻击拜登,卸任后将首次公开露面并讲话

趣看热点 浏览 221146

"秒回师"火了:收到消息几秒回复 有人兼职月入过万

上观新闻 浏览 6115

2025款比亚迪海狮05 EV完全评价报告

车质网 浏览 1463

图赫尔:赫内斯真说我在引援上会得到一切?那对他可会是很贵的

直播吧 浏览 14290

13.18亿大单!国网信通公告:子公司重大经营合同中标

红星资本局 浏览 1292

女子不喜欢名字"丽春"多次申请改名被拒 县公安局回应

环球网资讯 浏览 14541

外媒称中国经济增长放缓或对全球经济构成风险 中方回应

外交部网站 浏览 86448

【原声】阿韦洛亚,最后一个穆里尼奥主义者

体坛周报 浏览 143

欧盟考虑强制中企转让技术 彭博社:可能引发强烈反弹

环球网资讯 浏览 5590

一封AI邮件,竟让Go语言之父爆起粗口

机器之心Pro 浏览 655

马龙:要击败76人你得在恩比德下场休息时赢分 我们今天没做到

直播吧 浏览 13062

3月11日外媒科学网站摘要:室温超导欺诈丑闻曝光

网易科技报道 浏览 11781

2025年“演技最好女演员”排名,第1实至名归海

皮皮电影 浏览 810

又1归化国脚有望重返中超:在巴西坐冷板凳,考虑回中国

叶青足球世界 浏览 16132
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1