关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2302人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

女人过了40岁真该看看这些穿搭,不老气、不单薄,简单又耐看

静儿时尚达人 浏览 2317

大S离去一周年:爱她的人仍在经历一场漫长的告别

仙女事件簿 浏览 2200

至高6000元购车红包 长安启源推限时购车福利

网易汽车 浏览 1745

赵丽颖新剧翻车!热搜宣传是朱媛媛遗作,网友怒斥剧方吃人血馒头

萌神木木 浏览 2498

不只具身智能和AI,2026年的热门风口有哪些?

BT财经 浏览 1778

英伟达GTC大会利好兑现?CPO板块大跌

财闻 浏览 1390

E句话| 梁小龙去世,成龙周星驰发文悼念

仙女事件簿 浏览 2394

女生醉驾撞死3人最小死者未满3岁 至今未接触死者家属

极目新闻 浏览 21738

刘亦菲慷慨捐款150万助力香港,助力灾后重建与心理支持

茶韵浮生 浏览 2899

老人用爽身粉后患癌离世 家属获赔近70亿元

每日经济新闻 浏览 20223

年内首家省级农商行挂牌不到20天,快马加鞭启动第二批机构合并

湘财Plus 浏览 801

春晚主持人阵容曝光,5位都是老面孔

领略非凡 浏览 2234

芦哲:美国CPI势弱,联储10月降息几无悬念

首席经济学家论坛 浏览 3427

外媒:法国称“已准备好”向乌克兰派兵

参考消息 浏览 3379

更换平面化设计 马自达全新品牌LOGO发布

车质网 浏览 3249

质疑公牛集团广告语存误导被索赔420万 涉事公司反诉

澎湃新闻 浏览 20508

松岛辉空颁奖毫无喜色!世排升第8生涯新高 日球迷高呼比张本可靠

颜小白的篮球梦 浏览 3242

融资1111亿元,估值近8750亿元,全球最贵自动驾驶独角兽诞生

红星资本局 浏览 2196

欢迎回来!曾凡博时隔246天重返CBA赛场,高效拿到18分

懂球帝 浏览 2080

选来选去还是这些穿搭最适合秋天,不老气、不死板,舒适大方

静儿时尚达人 浏览 3231

看起来很好亲的唇,能养出来?

时尚COSMO 浏览 2525
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1