关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者3357人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国留学生到杨振宁在美办公室献花:晚安教授

极目新闻 浏览 8048

宗馥莉,没有娃哈哈

斑马消费 浏览 4643

本-福斯特谈C罗:他的确是弗格森的宠儿,因为他实在太出色了

懂球帝 浏览 4659

特朗普:一支舰队正在向伊朗方向航行

界面新闻 浏览 3376

欧洲企业CEO:中国抗生素卖得比口香糖还便宜 我好气

澎湃新闻 浏览 66638

苹果iPad Air M4新增支持802.11be无线局域网技术/蓝牙6.0

IT之家 浏览 2861

“打飞的”半小时畅飞长三角,低空经济“飞入”进博会|聚焦2025进博会

华夏时报 浏览 4267

陈匡怡怒斥台媒毁人名节,自曝写了遗书

萌神木木 浏览 3079

菲戈和伊尔迪兹获2025地中海卓越奖,颁奖典礼于10月20日进行

懂球帝 浏览 4610

星河动力谷神星一号“一箭四星”海射成功

财闻 浏览 3552

因“阴阳合同”伦纳德可能恢复自由身 湖人勇士尼克斯他去哪儿?

仰卧撑FTUer 浏览 2975

天津联通与华为合作:5G-A宽上行样板点峰值速率突破1Gbps

IT之家 浏览 3275

"失联风波"过后 画家范曾首度公开露面:近期喜得独子

澎湃新闻 浏览 20464

古巴外交部谴责美国蓄意制造借口对委内瑞拉动武

上观新闻 浏览 4710

吴启华:后悔演反派,来内地定居还交社保

失宠的小野猪 浏览 3566

A股上市行第二位80后行长来了!44岁王亮任职资格获批,出任苏农银行行长

时代周报 浏览 2029

奥迪E5 Sportback获2026 CCOY年度车大奖

网易汽车 浏览 3532

官方:瑞典裁判尼贝里将执法欧冠热刺vs多特

懂球帝 浏览 3482

丰田新款Land Cruiser FJ最新消息曝光

乐选爱车 浏览 3714

以色列和哈马斯代表团将于5日在埃及举行间接会晤

国际在线 浏览 4676

微软CEO纳德拉:能源成本将决定哪些国家能在人工智能竞赛中胜出

IT之家 浏览 3475
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1