关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者1959人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

突发!特斯拉美国要求禁用中国产零部件;离谱!曝多益网络创始人有300个孩子,公司回应;苹果CEO库克被曝或于明年卸任丨雷峰早报

雷峰网 浏览 2860

奶茶、刮刮乐、GPS:整顿坟场的 00后,开始给太奶上难度

她刊 浏览 361

“乔治·华盛顿”号航母进入南海 “尼米兹”号航母同日离开

环球网资讯 浏览 2691

奔驰/宝马/奥迪销量集体下滑,谁也逃不过以价换量

郑谊 浏览 2018

全锦赛:江苏女篮40分狂胜山东晋级决赛 马文20分罗欣棫14+7

醉卧浮生 浏览 3226

微软豪掷79亿美元投资阿联酋AI企业G42,加速中东AI设施建设

IT之家 浏览 3042

马斯切拉诺:我对穆勒的记忆并不美好;希望运气在我们这边

懂球帝 浏览 2478

“领跑 ”西南低温鲜奶市场!新希望乳业冲刺港股,毛利率三年连增至29.2%|港E声

时代周报 浏览 423

E句话| 李亚鹏公开收入,算高吗?

仙女事件簿 浏览 2034

刘淼上任第十年,泸州老窖“重回前三”的目标,还是没希望

无冕财经 浏览 3629

或将于2027年发布 全新宝马X7假想图曝光

车质网 浏览 2448

遭拒绝后,派拉蒙仍坚持以30美元/股收购华纳兄弟

财闻 浏览 2103

伊萨克遭范德芬剪刀脚,伤病分析师:前者很大可能伤缺8-10周

懂球帝 浏览 2370

媒体:泽连斯基离间 声称俄罗斯正向中方放弃部分主权

澎湃新闻 浏览 19662

数字孪生+AI智能体技术突破,新思科技重塑芯片设计

第一财经资讯 浏览 4007

“空中货拉拉”首飞背后:无人运输机争食1.5万亿元低空经济“蛋糕”

上游新闻 浏览 2144

巩俐的前夫是圈外高级打工人,75岁在新加坡养老

白面书誏 浏览 3106

迈向智能化 广汽丰田雷凌L新老款车型对比

车质网 浏览 1950

纳帅:尊重马扎加入阿尔及利亚,但选择国家队应出于自豪感

懂球帝 浏览 2914

吴建豪妈妈晒与言承旭周渝民阿信合照

准备好了吗 浏览 1968

如果可以,希望鲁豫老师再工作30年!

时尚COSMO 浏览 2206
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1