关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2230人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

加码中国“确定性”

国际金融报 浏览 3620

特斯拉撞树后打不开车门 5人被困燃烧的车内身亡

每日经济新闻 浏览 3286

CES 2026|禾赛“牵手”英伟达 共同推动L4级车队规模化部署

财闻 浏览 1847

1.2亿辆车被召回,超半数源于监管调查,车企自查缺陷就这么难?

DearAuto 浏览 3257

11月新车:奇瑞长城神仙打架,朗逸也来凑热闹

汽车网评 浏览 3282

全时区・强流动性|ACCM 助力投资人把握贵金属时代红利

商业观察杂志社 浏览 753

女人“会穿衣”才更美,看看这些穿搭就知道,穿对了真显气质

静儿时尚达人 浏览 1633

西贝的新考题:如何券后留客

北京商报 浏览 2861

强化AI编程能力迎战谷歌!OpenAI发布GPT-5.2-Codex,软件工程和网安一把抓

华尔街见闻官方 浏览 2754

46岁港星回应 因钟嘉欣失落视后辞任TVB高层一职

TVB剧评社 浏览 2252

满油满电能跑一个月!何小鹏-20℃冬测:小鹏G7超级增程续航1108.3公里

快科技 浏览 2501

国米vs凯拉特首发预测:巴雷拉踢后腰,劳塔罗继续首发搭皮奥

懂球帝 浏览 3273

搭载华为乾崑舱内激光 全新深蓝S07限时15.99万元起

网易汽车 浏览 389

腾讯元宝接入微信支付

观察者网 浏览 3246

这家基因编辑初创正在挑战FDA的监管边界

DeepTech深科技 浏览 2372

特朗普发布一张个人黑白照片 并自诩为“关税之王”

环球时报国际 浏览 6534

剑桥大学定义图形世界:神经网络让纹理压缩像画家调色一样自然

科技行者 浏览 2112

舒淇最爱穿的裙子搭配,真的很适合春天!

黎贝卡的异想世界 浏览 1603

宁德时代再出手!1月内从弃控到增资,深度绑定富临精工磷酸铁锂版图

时代周报 浏览 2141

哈格里夫斯:希望拉什福德能回曼联,俱乐部完全可以用得上他

懂球帝 浏览 2421

深圳105-95山西取CBA3连胜,贺希宁23分,迪亚洛空砍31分

懂球帝 浏览 2290
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1