关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2893人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

上市公司购买6000万私募产品“爆雷”

诗与星空 浏览 3095

“锂王”炒股,赚了111万,赔掉2000亿

大猫财经Pro 浏览 2517

最大纯电续航达335km 智己LS8官图发布

车质网 浏览 3122

知名女星私生活的谣言有多离谱?

动物奇奇怪怪 浏览 4063

科技大佬话AI未来:手机消失、工作消失、全民富有?

帮宁工作室 浏览 3146

TA:热刺想要加拉格尔已近三年,如今才终于签下他

懂球帝 浏览 3007

媒体:美伊对峙 2026年的第一场战争呼之欲出

经济观察报 浏览 23198

72岁唐僧迟重瑞卖房,580亿财产成了笑话?

胡一舸南游y 浏览 3902

贵州茅台多款产品出厂价降价,最高下调1990元,销售端也有降价

红星资本局 浏览 3134

欧足联临时禁赛普雷斯蒂安尼依据:捂嘴、维尼修斯&姆巴佩证词等

懂球帝 浏览 2468

加码中国“确定性”

国际金融报 浏览 4285

全球最大、国内首制万吨级纯电动智能海船“宁远电鲲”号开启海试

IT之家 浏览 2850

《逐玉》注水风波升级!315评论区沦陷

萌神木木 浏览 2254

2号种子险爆冷!张本智和打满5局逆转日本悍将,8强战约战勒布伦

乒谈 浏览 3990

辛纳重返世界第一无悬念?网友点出阿利西姆难阻意大利人夺冠原因

网球之家 浏览 3942

东方甄选线下店开业:不卖菜卖简餐,全标品

商业观察家 浏览 893

上海一业主去美国探亲接到一通越洋电话:你家被淹了

看看新闻Knews 浏览 14655

宗馥莉,抛弃娃哈哈?

豹变 浏览 4661

满配华为全家桶 岚图追光L将上市

网易汽车 浏览 3567

光峰科技“认领”闪极AI显示眼镜S1:采用蜻蜓G1 mini光机

IT之家 浏览 3238

下半场7中0背锅?威少8+10+7吞三连败 美记:本有机会染指最佳PG

颜小白的篮球梦 浏览 3359
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1