关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者1066人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

官方:因看台有医疗紧急情况,富勒姆vs利物浦推迟15分钟开球

懂球帝 浏览 1175

4500亿果链龙头狂赚115亿,潮汕富豪父女身家超800亿

21世纪经济报道 浏览 2056

三年半烧掉35亿!一帮金融人,带“火箭”冲科创板

财通社 浏览 1109

一加 15 /Ace 6 适配《金铲铲之战》原生 165 超高帧模式

IT之家 浏览 2048

赖清德只字不提台湾光复 还在公然纪念"古宁头战役"

海峡导报社 浏览 7561

史上最强财报背后,苹果仍差临门一脚

虎嗅APP 浏览 1953

“得黄金ETF者得天下”!这类ETF单周狂揽410亿元,两家公募成大赢家丨ETF规模周报

每经牛眼 浏览 2087

媒体:安世中国第3次硬核回击荷兰 已获国家强势撑腰

看看新闻Knews 浏览 7131

星际之门计划捧红了这家公司,化废弃能源为AI算力,估值达百亿

DeepTech深科技 浏览 2127

民事诉讼牵出5年纠纷!迅雷再诉前CEO陈磊损害公司利益,知情人:追索金额达2亿元

红星资本局 浏览 1000

郎酒9月发布的会员尊享酒,为何成懂酒人的优选?

金角财经 浏览 2148

灵鹊150无人机成功首飞

新华社 浏览 1083

人工智能如何赋能传统工艺?成都大学这场学术活动深入求解

封面新闻 浏览 2024

推广|| 双11来了!好口碑国货返场,买1送20

黎贝卡的异想世界 浏览 2291

90分钟战报:埃弗顿1-1桑德兰,詹姆斯-加纳点射绝平

懂球帝 浏览 879

出行场景升级/还支持餐厅排队 方程豹钛7推送第二次OTA

网易汽车 浏览 1030

郭磊:如何认识最新的出口数据和出口形势

首席经济学家论坛 浏览 2208

巴西发起最致命反毒行动:致121人死亡 头号头目逃脱

红星新闻 浏览 8391

邵佳一:退役画面还在脑海;做教练最适合我,离不开这个地方

懂球帝 浏览 1093

以色列又对加沙开火 内塔尼亚胡被指曾想请示特朗普

澎湃新闻 浏览 1905

超微电脑Q1财季营收大幅下滑15%,毛利率暴跌至9%,盘后股价重挫10%

华尔街见闻官方 浏览 1885
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1