关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者974人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

NBA战报:凯尔特人115-101公牛取NBA4连胜,安芬尼-西蒙斯27+3+3

懂球帝 浏览 1008

斯诺克英格兰公开赛决赛第一阶段:周跃龙2-6落后于马克-艾伦

直播吧 浏览 2830

飞天茅台4年下跌近50%,白酒寒冬结束的信号是什么?

郭施亮 浏览 1822

肖战官宣微博之夜!红西装造型要复刻?

孤城落日 浏览 736

詹姆斯坐骨神经痛进展:湖人计划让他11月中旬复出 将耐心康复

醉卧浮生 浏览 2084

谁将是下一个劈开海外万亿市场的中国黑马?

虎嗅APP 浏览 2183

欧盟限制中国企业参与5G建设,商务部回应:坚决反对

时代周报 浏览 840

海南华铁“失算”疑云:36.9亿元“三无”合约终止,阿里云前高管参与,“牛散”结伴进退

证券时报e公司 浏览 2134

贷款炒金的"黄金赌徒"后悔了:有人3天亏掉2个月工资

第一财经资讯 浏览 7211

女人老了别瞎穿,记住“衣不紧身,裙不上膝”,才是真的优雅

静儿时尚达人 浏览 1719

中方在联合国点名美国:4个严重违反 予以严重谴责

央视新闻 浏览 4479

马德里康普顿斯大学VERSE:AI实现文档视觉信息深度理解

科技行者 浏览 927

芯片初创公司,如何融资?

半导体行业观察 浏览 2120

媒体:高市早苗当选首相 对华采取挑衅措施的可能提升

界面新闻 浏览 6809

以“和美”之韵演绎时代新声 五粮液亮相第二十三届中国国际酒业博览会

中国商报 浏览 2086

4岁娃吃席打翻盘子被要求道歉 父亲:"娃儿小"不是借口

封面新闻 浏览 16494

珍珠专场|| 无论20+还是60+,一定都会对它心动!

黎贝卡的异想世界 浏览 3674

日本自卫队高强度"尾随"中国海军 真实水平被试出来了

空天力量 浏览 12336

今秋这件“瘦瘦衫”必穿!巨in巨洋气,上身瘦十斤!

Yuki女人故事 浏览 2966

别羡慕自由职业者了

虎嗅APP 浏览 1944

8699元学习机成“大板砖”!维修要2499元,家长:交了智商税

北京商报 浏览 2115
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1