关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者3262人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

许绍雄患癌仍敬业!今年参演9部作品努力宣传剧集

萌神木木 浏览 4369

亏了1800万,分红1.3个亿!网红牙膏,凭啥上市?

蓝鲸新闻 浏览 1781

穆塞蒂全八强难耐德约,辛纳速胜同胞会师球王

网球之家 浏览 3371

《offer7》求职修罗场,满级人类怎么打逆风局?

仙女事件簿 浏览 5253

阿里研究:视频制作迎来"遥控器"时代,想让画面怎么动就怎么动

科技行者 浏览 3546

重磅!日产总部大楼被中国企业拿下!

电动知家 浏览 4238

记者:尤文、巴萨旧将卡塞雷斯将与乌拉圭球队尤文图德签约

懂球帝 浏览 3302

陕西夫妇在赞比亚遇害被发现 所雇当地员工有重大嫌疑

极目新闻 浏览 32742

卡里克三天激活曼联新帝星,提醒其仍需成长!拉爵或省钱少买中场

罗米的曼联博客 浏览 3510

刘润:企业盈利的5种模型

创业家 浏览 4413

油车首搭华为鸿蒙座舱!日产中国庆生40年,甩出三款新车,补全插混拼图

车东西 浏览 4508

5万美元筛选「超级婴儿」, 智商提升15点?马斯克被曝是客户!

新智元 浏览 4462

婚变传闻仅5天,窦骁大学同学为其发声

做一个合格的吃瓜群众 浏览 4345

推广|| 35+变化好大?不愧是2025年花得最值的一笔钱

黎贝卡的异想世界 浏览 4360

插混加持 新款捷途旅行者C-DM本月17日上市

车质网 浏览 4344

四季度机构调研显著加快!人工智能景气延续

券商中国 浏览 3802

上海网友在日料店里吃出蛆虫 蛆虫还在炸鸡上蠕动

极目新闻 浏览 22882

张雨绮风波持续发酵,曝多个商务被取消

扒虾侃娱 浏览 3399

和马蓉离婚9年后,自己的一双儿女开始为他争光了

TVB的四小花 浏览 5313

"巴铁"越打越猛阿富汗塔利班致电北京 中方斩钉截铁

健身狂人 浏览 110728

23岁女孩骨癌截肢父母失联:第一次手术签字 手都在抖

上观新闻 浏览 14379
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1