关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者1402人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

扎哈罗娃:俄罗斯保留对日本采取强硬回应的权利

环球网资讯 浏览 1045

台娱渣男“脱口秀”大赏:全身最硬的只剩嘴?

仙女事件簿 浏览 1245

年销280万辆,出口134万辆后,奇瑞的下一站在哪

智电汽车. 浏览 276

前三季度私募产品“超涨”十强!复胜、远信、歌汝等夺冠!

私募排排网 浏览 1651

蔚来火速回应指控

华尔街见闻官方 浏览 1642

塞内西:只想为阿根廷效力,不想去唱毫无认同感的意大利国歌

懂球帝 浏览 199

综合续航里程超1600km smart精灵#5 EHD预售18.99万起

网易汽车 浏览 2193

特朗普弄混格陵兰岛与冰岛 再提北约秘书长叫他"爸爸"

鲁中晨报 浏览 17835

美媒:美军增派战机至位于波多黎各的前罗斯福路海军基地

环球网资讯 浏览 964

响应“人工智能+”国家行动,方舟健客(06086)“杏捷大模型”通过国家备案,为AI+慢病管理注入新动能

智通财经 浏览 1387

以色列部长回应"虐待环保少女":很自豪

CCTV国际时讯 浏览 1266

刘涛女儿近照曝光,这才是“顶级富养”的典范!

动物奇奇怪怪 浏览 1682

美军机沿伊朗边界飞行 伊朗寻求外交支持

新华社 浏览 458

18岁少年鳌太线失联超10天 搜救队再次进山展开搜救

红星新闻 浏览 6928

美军机在南海坠毁 特朗普:可能燃料不好

参考消息 浏览 1141

郭碧婷爸爸“打脸”向太:郭碧婷一人承担俩孩子开销

青途历史 浏览 1571

美媒刊文:不要虚张声势了 放弃"战胜中国"的想法吧

环球时报国际 浏览 11444

台学者:高市会让北京确信"台独"与日本右翼势力结盟

环球网资讯 浏览 44283

泽连斯基被疑"诅咒特朗普":政客嘛 早晚会死

澎湃新闻 浏览 11821

送别聂卫平队伍长度超200米 韩国围棋名宿前来吊唁

极目新闻 浏览 4514

美国对伊朗考虑"军事选项" 中方回应

澎湃新闻 浏览 454
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1