关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者3人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

江苏最新平均工资出炉!最挣钱的行业是→

环球网资讯 浏览 16703

大S工作室发律师声明 起诉张兰汪小菲侮辱诽谤

网易娱乐 浏览 15491

美国财政部部长耶伦将于7月6日至9日访华

财联社 浏览 93638

指挥官紧急送肉 台军慌忙平息“马祖缺肉风波”

环球网资讯 浏览 19287

以军在加沙地带发现迄今最大规模哈马斯地下隧道

环球网资讯 浏览 13754

中汽协:我国2023年汽车销量突破3000万辆,出口491万,再创新高

Nice好车 浏览 12917

英国政府或禁前官员入职中企

环球网 浏览 15546

这一次,54岁的杨钰莹早已经上了另一条大道

青史楼兰 浏览 1061

《庆余年2》大结局:叶流云一剑斩半楼,范闲恢复内力!

电和影 浏览 11839

格拉斯纳:期待与埃泽的碰面,但在比赛中我们只会全力争胜

懂球帝 浏览 1257

一个时代审美的终结:美人何晴,温柔亦有筋骨

仙女事件簿 浏览 600

布鲁斯-布朗:斯科蒂-巴恩斯是一位愿意在场上拼命的球员

直播吧 浏览 12927

腾讯元宝接入微信支付

观察者网 浏览 1083

第五季了,谁还在说艾米丽不时髦啊?

时尚COSMO 浏览 778

北汽新能源与小马智行达成全面深化战略合作

观察者网 浏览 8

特步公主与七匹狼公子婚礼细节披露:每桌最高9999元

每日经济新闻 浏览 68523

介绍一个如果你用了,你就看不到这篇文章的产品

时尚COSMO 浏览 483

13.99万元起 深度解读深蓝L06三大黑科技

第五冲程 浏览 1130

17年,巴菲特投资比亚迪累计套利至少80亿港元

第一财经资讯 浏览 2058

央行连续增持黄金,10月我国外汇储备规模稳中有升

中国商报 浏览 1130

宋志平:加强五种能力建设,全面提高上市公司质量

中国企业家杂志 浏览 19854
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1