关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者3744人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

春天穿对了颜色真的很加分!试试这些彩色穿搭,养眼减龄显活力

静儿时尚达人 浏览 619

重磅!日产总部大楼被中国企业拿下!

电动知家 浏览 3735

著名音乐人何厚华英年早逝:终生未婚

历来纵横 浏览 4480

当AI奖励模型开始"偷懒":字节跳动如何让它们跟上AI助手的步伐

科技行者 浏览 2782

科学家研发可遥控癌痛克星,比阿片类药物更安全

DeepTech深科技 浏览 2873

国企6382.5万买沥青变"水和空气" 沥青是否存在过成谜

上游新闻 浏览 9057

24架F-35A隐身战机集结西太平洋

极目新闻 浏览 4174

统帅懒人空调今日上市,Ai人感调节,一键全托管

财视传播 浏览 4018

欧洲称正考虑反制美国方案 被指手握"10万亿美元武器"

财联社 浏览 2931

权志龙风波升级!装不懂中文还无视中粉遭暴力对待,挚友被扒辱华

萌神木木 浏览 3243

苹果被曝开发类ChatGPT应用!专为训练新Siri打造

智东西 浏览 4448

金·卡戴珊抵达英国,与F1车手汉密尔顿秘密约会

土澳的故事 浏览 2714

38岁后单赛季为意甲升班马攻入至少4球,瓦尔迪是历史第二人

懂球帝 浏览 3412

一级演员李春来表演时突然倒地,后抢救无效去世

可乐谈情感 浏览 3801

美媒:美军紧急出动F-16战机飞越叙中部城市上空"展示武力"

环球网资讯 浏览 3410

四川阿坝红旗桥垮塌:系山体变形加剧滑塌造成

新京报 浏览 32297

鸿蒙智行的上限,该重新评估了

汽车公社 浏览 3293

李金羽:冲超没那么容易,希望球员们勇敢地面对各种情况

懂球帝 浏览 4624

演员任敏生理期南极跳海,回船喝酒

失宠的小野猪 浏览 3247

基米希:十年前拜仁有很多个人主义,如今队友更愿为团队奉献

懂球帝 浏览 3833

FLX1s Linux 手机发布:预装基于 Debian 的 FuriOS,550 美元

IT之家 浏览 4693
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1