关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者901人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

输球后被球迷辱骂,标准列日前锋:大街上也这么跟我说话试试

懂球帝 浏览 1463

高市早苗当选日本首相 曾叫嚣“台湾有事日本必入”

极目新闻 浏览 7126

摩恩电气深V之意

富凯财经 浏览 1852

美联储主席最热人选哈塞特:CPI报告好得令人震惊,美联储有很大空间可以降息

华尔街见闻官方 浏览 1609

诺奖得主:特朗普自摆乌龙 系中国明朝以来最严重自残

澎湃新闻 浏览 7104

垃圾至少有10层楼高 天坑溶洞垃圾堆成山臭气熏天

每日经济新闻 浏览 33886

收购“Manus”也治不好大厂的焦虑症

虎嗅APP 浏览 1097

将于二季度上市 蔚来ES9实车曝光还有双色车身

网易汽车 浏览 1044

阿隆索:我们在安菲尔德跑动太少?不能凭一场比赛下结论

懂球帝 浏览 1950

大厂们掀起春节大战:狂撒10亿红包,只为争夺AI时代「新船票」?

雷科技 浏览 907

北京大学联合多所知名高校突破机器人视角转换技术

科技行者 浏览 1912

《四喜》的妈圈生存指南:没有全福,只有幸存

仙女事件簿 浏览 1841

4.0T V8发动机 阿斯顿·马丁DB12 S官图发布

车质网 浏览 2290

于东来周鸿祎秦英林王宁张红超,2025河南企业家影响了中国?

BT财经 浏览 1397

真爱大牌破价|| 回购多年,这次竟然破天荒200+

黎贝卡的异想世界 浏览 2097

独家|我们与淘宝闪购管理层聊了聊增长的持续性问题

虎嗅APP 浏览 2103

2026年国家补贴来了,只需三步,收好这份省钱指南!

贝壳财经 浏览 1208

聂远不让女儿雨天上学,黄磊女儿满口错别字,怪不得星二代要进圈

萌神木木 浏览 1595

两人涉嫌切割小区23部电梯钢绳被拘 原物管称被迫退场

红星新闻 浏览 5329

推广|| 用了好几年才推荐,这件单品真的值得投资

黎贝卡的异想世界 浏览 2095

被扫地出门的贵公子,真是活该

Yuki女人故事 浏览 1715
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1