关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者1137人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

秦煌如今过成这样只能算他活该?

一针见娱 浏览 2399

立案!光环下的清越科技,藏着多少“秘密”?

财经下午茶 浏览 2222

沃什被提名次日 特朗普:不降息就把他告到裤子都不剩

极目新闻 浏览 7546

孙红雷和妻子王骏迪逛街,比老婆矮显娇小

八怪娱 浏览 1353

《玉茗茶骨》张慧雯啊,是最可惜的谋女郎

温柔娱公子 浏览 1262

森保一:若球迷都穿巴西球衣来看球,那我们恐怕很难赢

懂球帝 浏览 2435

吉拉西多特生涯欧冠主场10场12球2助攻,每55分钟造一球

懂球帝 浏览 1067

罗马诺:拉齐奥正与贾府深入谈肯尼思-泰勒,球员也渴望加盟

懂球帝 浏览 1269

30亿元“炸弹”入场!千问烧钱搅动AI春节红包大战

华夏时报 浏览 1008

《许我耀眼》很爽,但要小心

时尚COSMO 浏览 2492

比亚迪锂电、钠电池量产 电动车或有4大变化

电动车的那些事儿 浏览 1520

委内瑞拉谴责美军扣押委油轮:国际海盗行为

环球网资讯 浏览 1662

百色"锅底"村庄积水不退 村民:明年不想再种地 白费劲

澎湃新闻 浏览 5262

王家卫录音曝光,内容信息很炸裂

林轻吟 浏览 2193

皮耶罗儿子被意丁俱乐部解约,俱乐部主席:我们不看他的姓氏

懂球帝 浏览 1614

智元精灵G2新一代工业级交互式具身作业机器人发布

IT之家 浏览 2423

算法工程师想在女友面前秀技术“养龙虾”,结果文件夹被全删 周鸿祎称“龙虾”更像个实习生

红星新闻 浏览 189

空客天津第二条总装线投产,称产能提高需联合各方构建更具韧性的供应链

澎湃新闻 浏览 2339

赵继伟伤后动态!工作室确定拉伤,待医生进一步检查!

篮球资讯达人 浏览 2083

德约六王赛退赛向观众道歉遭网友怒喷来捞钱,球迷用成绩狠狠打脸

网球之家 浏览 2368

岚图汽车卢放:必须啃下豪华轿车市场这块“硬骨头”

经济观察报 浏览 1706
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1