关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2890人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

英超:维拉3比1富勒姆取联赛首胜

体坛周报 浏览 4576

拜登为何卸任前如此“恶毒”?

浏览 27198

诺奖得主:特朗普自摆乌龙 系中国明朝以来最严重自残

澎湃新闻 浏览 9045

公募基金业绩比较基准迎规范,证监会、中基协公开征求意见

华夏时报 浏览 3951

末节11分!连续7场上双!胡明轩拾巅峰锁胜局,内外线杀伤力拉满

篮球资讯达人 浏览 2977

“玻璃大王”曹德旺提前退休,儿子曹晖接班后福耀帝国走向何方?

尺度商业 浏览 4192

赵本山的一双儿女,为所有人提了醒

蕾爸退休日记 浏览 3790

美军绑架马杜罗"原班人马"全部飞抵欧洲 新目标已浮现

依偎在角落 浏览 8943

迪拜多地发生爆炸起火 当地停工停课

极目新闻 浏览 2308

首搭纯电quattro 奥迪E5 Sportback售23.59万起

网易汽车 浏览 4961

马克·库班抨击OpenAI情色计划:这将会适得其反

鞭牛士 浏览 4129

边打字边出片,交互式生成长视频!英伟达联合MIT开源新SOTA

新智元 浏览 4198

美股三大股指高开 纳指盘初涨0.87%

证券时报 浏览 3631

瑞信前副总裁挪用客户资金,判囚13年,24名高净值人士获赔8690万

财通社 浏览 3072

Qwen登顶AI赚钱大赛只是开始?“弃GPT投Qwen”已在硅谷蔓延开来

硅星人 浏览 3917

吉利全球全域安全中心发布 领克900完成碰撞测试

太平洋汽车 浏览 2861

特朗普为美军袭击委内瑞拉附近海域“贩毒船”辩护

环球网资讯 浏览 4128

3年剑指10万店,小咖咖啡将拿出6亿资金赋能门店增长

斑马消费 浏览 91

eSIM手机,来了!

中国基金报 浏览 4236

齐沃:阿森纳和拜仁是目前欧洲最强,但这不意味着我们输定了

懂球帝 浏览 3020

北约秘书长吕特:理解特朗普对许多北约盟友感到失望

参考消息 浏览 59612
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1