关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者2023人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

和马蓉离婚9年后,自己的一双儿女开始为他争光了

TVB的四小花 浏览 3879

最高预增超32倍 283只医药股“剧透”业绩

北京商报 浏览 1766

贵金属风口催生7连板!白银有色涨势凌厉,基本面却“拖后腿”

览富财经网 浏览 1890

市民举报3600平违建存续8年 官方:违建人患病不能强拆

扬子晚报 浏览 19266

一家4口爬山妻子坠亡 警方排除他杀可能:属于高空坠亡

极目新闻 浏览 41119

44岁前TVB花旦有望跟前未婚夫复合

探长影视解说 浏览 2257

韩鹏:很高兴能战胜争冠球队,全体球员的发挥都非常出色

懂球帝 浏览 2985

珍珠专场|| 无论20+还是60+,一定都会对它心动!

黎贝卡的异想世界 浏览 4979

马杜罗在美首次出庭表示不认罪:我仍是委内瑞拉总统

每日经济新闻 浏览 5488

TA:利物浦的状态有所回暖;热刺展现了足够的斗志和韧性

懂球帝 浏览 2344

比速腾L略小 入门级的全新速腾S将发布

网易汽车 浏览 2035

限时换新价11.98万 第三代蓝电E5 PLUS正式上市

网易汽车 浏览 2455

蔡康永发文缅怀大S,说大S应该被好好疼爱的

素素娱乐 浏览 1726

哈梅内伊:绝不屈服

极目新闻 浏览 2195

视频:美公布在委内瑞拉附近扣押油轮行动画面

央视新闻客户端 浏览 1686

高通遭反垄断调查,国产平替芯片机会来了?

禾颜阅车 浏览 3194

AI再次降维打击人类 仅用1小时破译500年未解的"天书"

上观新闻 浏览 7162

又有8个大V账号被封!雪球一日连发“两弹”,“游资战法”等遭重点打击

第一财经资讯 浏览 1958

匿名“欢乐马”屠榜,国产视频模型批量崛起

第一财经资讯 浏览 234

深蓝汽车邓承浩否认“没钱了所以融资”:现金流非常好

IT之家 浏览 1990

复古拉力风 firefly萤火虫project glow改装车亮相

网易汽车 浏览 2504
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1