关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者1人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

秦刚外长抵达新德里 一场重大的多边外交拉开帷幕

环球网资讯 浏览 19659

海南离岛小车堵到转"∞"圈:多名新能源车主弃车保返

潇湘晨报 浏览 80898

抱着哭!具俊晔大S隔23年重逢画面曝光

娱絮 浏览 15056

悬了!仅剩80天!“西北酒王”进入倒计时

壹只灰鸽子 浏览 1526

德甲球员票选最令人失望主帅:别利察、科瓦奇、图赫尔前三

懂球帝 浏览 11335

杀疯了!续航630km,还配华为乾崑高速领航

隔壁说车老王 浏览 721

谷歌IMO金牌级Gemini 3深夜上线!华人大神挂帅,OpenAI无力反击

新智元 浏览 795

被67岁的她惊艳了!白发不染衣品优雅,老了也时髦

LinkFashion 浏览 13953

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者 浏览 1301

香港浸会大学推出AlphaApollo:AI实现协同推理突破

科技行者 浏览 1285

来沪打工女孩被跳楼者砸瘫住进ICU 已筹满20万治疗费

新民晚报 浏览 91019

马祖拉:不能被东欧打崩心态 东决对手长2分投到60%该放还得放

直播吧 浏览 11370

泽连斯基暗示中国破坏和平峰会 外交部回应

环球网 浏览 68021

太难了!2023年中型轿车销量榜出炉,国产车前10仅一席排第9

阿贵看车 浏览 13330

梅西带飞?迈阿密的卡伦德&克雷马斯基首次被选入美国初选名单

直播吧 浏览 14785

给《树影迷宫》演技最好的7位演员排座次:刘琳第3,第1无法超越

娱乐圈笔娱君 浏览 1199

再创历史新高!2025年粮食产量达14298亿斤

央视财经 浏览 163

银行开始又一轮调降存款利率,负利率来了!

Wind万得 浏览 14824

广州6分险胜同曦,来看看赛后郭士强和西热力江说了什么?

篮球资讯达人 浏览 20173

英媒:欧洲企业已因俄乌冲突损失超千亿欧元

国际在线 浏览 15388

能抵御核弹袭击的水坝断裂 专家:或是内部爆破

上游新闻 浏览 16918
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1