关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者3182人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

拉总:诺坎普改叫梅西球场?不合适

体坛周报 浏览 3472

鲁豫想穿成她,章小蕙也爱她,152cm的她为什么能成为风格偶像?

黎贝卡的异想世界 浏览 2185

官方:张效瑞出任梅州客家总经理,莱蒂耶里担任主教练

懂球帝 浏览 3015

神预测,热乎乎的最新诺奖得主电影神作来了

幕味儿 浏览 4221

朝鲜晚上举行盛大阅兵式 现场画面披露

央视新闻客户端 浏览 3220

霸王茶姬创始人维权案将于3月开庭,公司回应:为反击此前涉婚姻、创业的诸多谣言

红星资本局 浏览 3123

鲁比奥称美伊协议措辞磋商或“还需几天时间”

界面新闻 浏览 188

产检时一切正常小孩出生后却畸形 母亲时隔一年多投诉

潇湘晨报 浏览 9078

预售20.99万起 新款领克10将于5月29日上市

车质网 浏览 191

连赢王曼昱+陈熠 42岁华裔掀翻世界第2+结束5连败 球迷:想念莎莎

风过乡 浏览 3187

富勒姆出价3500万英镑求购鲍勃

体坛周报 浏览 3062

AI代写论文公司曾申请精英人才商标

大象新闻 浏览 3640

衣服其实没有必要买很贵,准备这三件基础款,百搭实用又不挑人

静儿时尚达人 浏览 830

距离仅10到15米 飞行员驾驶歼-16倒飞驱离外军战机

环球网资讯 浏览 4163

"女首相梦"悬了的高市公开支持赖清德 日本亲华派翻脸

梁讯 浏览 7960

腾讯回应元宝崩了

第一财经资讯 浏览 2845

艾科维曾通过外部客户转贷逾千万元 两家“0人”供应商合计撑起超五千万元采购额

金证研 浏览 4234

欧洲8国集体反击特朗普 英国首相:将与美国政府交涉

极目新闻 浏览 7270

斯洛特:尽管我们取得四连胜,但球队的表现并不完美

懂球帝 浏览 3365

搭激光雷达/纯电续航506km 长安启源全新Q05开启盲订

网易汽车 浏览 4307

新增车道级导航与全向记录仪 腾势N9迎重磅OTA升级

网易汽车 浏览 4074
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1