关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者3900人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

苏超,明年有新变化!省政府再做部署!

国是直通车 浏览 3917

64岁关之琳现身南京眼镜店,与老板娘喝下午茶

涵豆说娱 浏览 4309

营收净利双增、高股息估值,伊利股份进入「戴维斯双击」时刻

节点财经 浏览 767

美国或"最快本周"再次对俄罗斯动手 已和27国讨论计划

澎湃新闻 浏览 13890

美媒:马杜罗政权过渡或不会像特朗普希望的那样顺利

澎湃新闻 浏览 10292

优必选联手云智汇科技 加速人形机器人全球布局

财闻 浏览 4822

孙怡董子健,离婚散场的恋爱脑总裁与明星娇妻

火姐娱乐trend 浏览 2953

足力健卖水饺,吃干榨净老年人?

斑马消费 浏览 4723

男子给女友买的金镯子被放在门口丢了 顺丰只赔200元

潇湘晨报 浏览 8718

登顶Hugging Face GAIA全球榜首!中兴超级智能体终结「AI黑盒」时代

新智元 浏览 4141

山东99-75战胜宁波 球员评价:3人优秀,5人及格,2人低迷

篮球资讯达人 浏览 2958

状态比10年前更好,她到底做对了什么?

黎贝卡的异想世界 浏览 2939

美被指向以色列通报对伊朗行动准备进展

每日经济新闻 浏览 2970

曝奔驰考虑与长城汽车共享南非工厂

盖世汽车 浏览 2238

俄主动向美通报:核动力巡航导弹上天 射程"几乎无限"

上观新闻 浏览 9500

法尔克:曼城有意科隆前锋赛义德-马拉,巴黎和国米也在关注

懂球帝 浏览 4038

霍英东体育基金会晚宴,多位奥运冠军现身,霍家更知郭晶晶的份量

不八卦会死星人 浏览 3427

专栏 | 做“主语”的体验

时尚COSMO 浏览 3068

上年纪的女人买“裤子”,不妨按照这3个原则试试,显瘦时髦

静儿时尚达人 浏览 4262

被坑惨了的年轻人,已经放弃找旅游搭子了

她刊 浏览 715

坚持10年做这件小事,我收获了太多

黎贝卡的异想世界 浏览 4006
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1