关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者1210人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

拉姆塞:我的合同被美洲狮终止了,这令我感到意外且失望

懂球帝 浏览 1592

美媒:"林肯"号航母打击群一两天内即可对伊朗动武

国际在线 浏览 1136

奥迪A8L和雷克萨斯LS或无后续全尺寸轿车接班!

凡兮说 浏览 2206

波兰官员称中方不愿迫使俄结束乌克兰危机 外交部回应

澎湃新闻 浏览 3066

爱泼斯坦死亡疑云再添关键爆料人 其身份被证实为狱警

扬子晚报 浏览 3416

员工超长时间如厕被开除 单次最长4小时辩称护理痔疮

环球网资讯 浏览 5736

比朔夫:最喜欢的球员是维蒂尼亚和基米希;梅罗选谁?梅西

懂球帝 浏览 1344

阿里千问开源四款Qwen3.5小尺寸模型

IT之家 浏览 470

借款人伪造公章贷款 煤企"缺席"审理被判背负上亿债务

澎湃新闻 浏览 28658

特朗普寻求加快大型电力项目,以满足AI需求

华尔街见闻官方 浏览 3062

寒风中南京数十名民工扒在桥栏上吃午饭 附近摊主发声

扬子晚报 浏览 7054

马杜罗在纽约法院首次出庭,对贩毒等指控表示"不认罪"

华尔街见闻官方 浏览 1456

晋级澳网四强!辛纳:期待与德约在半决赛对决,他是我的榜样

懂球帝 浏览 1207

《用武之地》票房崩塌:这块金字招牌算砸了

靠谱电影君 浏览 1459

全红婵是否退役悬念揭晓,央视新闻给出权威答复

蒋小成爱钓鱼 浏览 2545

工信部第405批申报图曝光:比亚迪、华为系全面出击

网易汽车 浏览 131

支持老东家,阿什利-扬晒自己现场观战曼联客战阿森纳照片

懂球帝 浏览 1200

福建赖氏宗亲:姓赖的都是中国人 姓赖者根源都在中国

环球网资讯 浏览 6611

洋河股份变脸!取消70亿保底分红,2025年利润暴雷

杠杆游戏 浏览 1151

五旬老人上综艺,有时候比年轻人更有看点。

伊周潮流 浏览 2433

AI终端战事升级:大厂跨界厮杀,阿里、字节、理想同场竞速

时代财经 浏览 1738
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1