关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者175人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

杭州银行年薪252万副行长获提拔,行长空缺大半年后终于敲定

湘财Plus 浏览 510

大众中国市场2025年交付269.38万辆,同比减少8%

IT之家 浏览 463

和李晨分手6年后嫁普通人,她整个人都变样了

青史楼兰 浏览 1369

博主:王子铭今天自行加练,周金辉、李明等高层现身训练基地

懂球帝 浏览 1447

什么信号?有银行直接5.5折卖房

大猫财经Pro 浏览 1158

特朗普:加沙"和平委员会"已成立

新京报 浏览 404

配激光雷达 新款比亚迪海豹06 EV申报图曝光

车质网 浏览 452

G7对中国提出三个“不许” 媒体质问:凭什么

上游新闻 浏览 15977

迈瑞医疗市值跌了三千亿,第三次上市,74岁李西廷越来越忙

懂财帝 浏览 1663

翁青雅被官媒点名,言辞直戳其肺管子

娱乐圈笔娱君 浏览 1330

DiDi联手香港科大首创自动旅行规划AI

科技行者 浏览 1325

“烟管裤”今年冬天爆火,怎么搭都时髦!

LinkFashion 浏览 833

三年半亏掉62亿,244亿大模型巨头剑指港股

雷达财经 浏览 747

新款坦克400 4种动力+激光雷达 纯电续航200公里

念寒车评 浏览 1405

范德芬:我知道我加速后别人很难追上,那一刻只想着必须进球

懂球帝 浏览 1316

东南大学团队首次揭示:视觉欺骗如何让AI"看走眼"

科技行者 浏览 383

中国留学生潜水后失踪妻子4天后报警 仅找到一根胫骨

新民晚报 浏览 20069

高圆圆首谈当妈感受:感情都在妈妈身上用完了

雅儿姐爱追剧 浏览 329

博斯:19轮联赛打进72球,这足以说明拜仁的实力有多强

懂球帝 浏览 211

非足联官方:强烈谴责决赛期间不当行为,目前正审查相关画面

懂球帝 浏览 372

三幅字画涉刑被拍卖 其中徐悲鸿"奔马图"起拍价4762万

极目新闻 浏览 7328
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1