关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者3137人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

氢能汽车的十字路口:巨头的撤退与坚守

车质网 浏览 3780

莱因克尔:对阵勒沃库森时哈弗茨应首发,他能提供更多东西

懂球帝 浏览 2119

万斯一句话让印度裔美国人炸锅 遭铺天盖地批评后回应

鲁中晨报 浏览 9210

50+女人这么穿,简单款一样搭出“有钱人”的感觉,时髦利落

静儿时尚达人 浏览 6206

高市政府迟迟不道歉还发出战争威胁 中方8个字宣告结局

时时有聊 浏览 9382

我国最“不靠谱”专家,公开在央视“忽悠”人

来科点谱 浏览 3059

牛弹琴:两中资外卖企业在巴西打官司 别再让全球看笑话

大象新闻 浏览 7445

乘联分会崔东树:2025年汽车以旧换新规模预计超1800亿元

IT之家 浏览 3566

衣服完全没有必要越买越多!准备好这3款单品,百搭又舒适

静儿时尚达人 浏览 3067

Beats苹果iPhone 17e专用保护壳发售,399元

IT之家 浏览 2343

伊姐周日热推:电视剧《狙击蝴蝶》;电视剧《天书黎明》......

伊周潮流 浏览 2928

搭猎鹰500辅助驾驶 全新奇瑞QQ3将于4月上市

车质网 浏览 2965

冯德莱恩称欧洲愿继续与乌美合作 强调安全保障重要性

国际在线 浏览 3192

知情人士:特朗普政府拒绝与伊朗启动停火谈判

国际在线 浏览 2056

普京官邸遭91架乌无人机袭击 特朗普:我很生气

每日经济新闻 浏览 3205

任正非最新讲话:没有网络的算力是信息孤岛

澎湃新闻 浏览 3458

韩华航空航天公司与挪威签署9.22亿美元火箭发射器供应合同

财闻 浏览 2886

将于5月15日发布 理想L9 Livis内饰细节公开

车质网 浏览 820

执法过严?拓王之战首节裁判合计吹罚21次犯规并出现31次罚球

懂球帝 浏览 4213

两女生称花90多元入住成都民宿 在空调管道发现摄像头

极目新闻 浏览 106562

林俊杰女友报警反击谣言,获男友极力维护,果然是奔着结婚去的

萌神木木 浏览 3151
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1