关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者2115人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美军猛烈轰炸后 特朗普暗示或发起"踩红线"打击

界面新闻 浏览 115444

胜辽宁发布会!潘江赞对手,亲承张宁将缺席三周,迪亚洛总结不足

篮球资讯达人 浏览 2071

可可成本大增 亿滋国际承压

北京商报 浏览 2921

连打工人出差都住不起亚朵了?日益昂贵的亚朵该咋看?

江瀚视野 浏览 3961

德云社郭德纲发文喜提4个新身份,含金量都不低

素衣读史 浏览 2943

咖啡万店新王诞生:挪瓦如何以“寄生模式”隐秘扩张?

虎嗅APP 浏览 2427

导演们,该有危机意识了!野生创作正在崛起

时尚COSMO 浏览 1961

将提升极端场景识别度 小米汽车召回超11万台SU7标准版

网易汽车 浏览 4041

姆巴佩已完成职业生涯400球,为最年轻达成此成就球员

懂球帝 浏览 2505

于和伟逆袭的路上,藏着这样的一个女子

农村娱乐光哥 浏览 3154

领克10/领克10+全球首秀 1秒补能2公里/3.2秒破百

网易汽车 浏览 398

擦碰中国海警艇 揭秘菲律宾“拍照打卡”式炒作套路

环球网资讯 浏览 6978

国信策略:抢占科技发展制高点

网易财经 浏览 3136

突然加速!避险资金拥抱消费ETF,什么信号?

券商中国 浏览 3251

追寻阳光的Isabel Marant女郎,再次独自启程

时尚COSMO 浏览 3344

10位院士与会 2025中国自动化大会成功举行

网易科技报道 浏览 3280

存储芯片涨价潮蔓延,半导体细分龙头业绩“水涨船高”

览富财经网 浏览 1861

十年前的百度,聚拢了硅谷最杰出的天才,每个都比姚顺雨耀眼……

字母榜 浏览 1907

美再发安全警告 敦促美公民立即离开伊朗

国际在线 浏览 2077

春晚阵容曝光!十年来最强的演出阵容

阿纂看事 浏览 1865

意甲12月最佳候选:霍伊伦、劳塔罗、普利希奇、弗拉希奇在列

懂球帝 浏览 2004
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1