关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者56人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美国务卿:希望泰柬下周停火

新华社 浏览 753

2部电影票房不到5亿,62岁刘德华展现港圈的无奈

不八卦会死星人 浏览 13222

郑州抗癌共享厨房合伙人:当时的捐款就不应该接收

海报新闻 浏览 122263

还得是她!杀疯了,也杀爽了!

吐槽电影院 浏览 456

网曝王心凌出场费超三百万!百亿帅气总裁变迷弟

盖饭娱乐官方号 浏览 19723

中国重点40城,九年间消失了多少企业?

财经十一人官方 浏览 20089

21载热血传承!2025肯德基三人篮球赛燃动青春赛场

中国商报 浏览 782

集成双4K摄像头与AI,雷蛇Project Motoko概念耳机亮相CES 2026

IT之家 浏览 490

那些年王室贵族新娘穿过的Elie Saab婚纱

欧洲王室八卦 浏览 17718

2026年央视春晚彩排开始!沈腾马丽回归,但呼声最高的是他们

娱乐圈笔娱君 浏览 493

李昀锐孟子义被曝恋情,却双双否认

霁月文娱阁 浏览 1529

被问中国元首是否就瓦格纳事件与普京通话 外交部回应

外交部网站 浏览 89603

前华为“天才少年”创业公司大火!短短数月已完成3轮融资

证券时报 浏览 14802

深埋江门地下,捕捉“幽灵粒子”的巨型实验装置预计明年运行

南方都市报 浏览 11860

利拉德留队?美媒建议1.5亿留格兰特1亿签换追梦 球迷:令人生厌

颜小白的篮球梦 浏览 16180

经典落幕:苹果正式将初代iPhone SE列为过时产品

环球网资讯 浏览 945

恒大汽车:纽顿集团战投及利益相关方仍在就交易条款进行磋商

澎湃新闻 浏览 13582

它是Chanel必买的一款包,最强出行搭子

《买手客buyerkey》 浏览 17206

5月开车撞利物浦球迷的司机承认故意撞人,预计12月15日宣判

懂球帝 浏览 1022

柬埔寨提高获取公民身份投资门槛:至少需100万美元

红星新闻 浏览 17713

特朗普:已开始从委石油资源中赚钱

环球时报国际 浏览 419
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1