关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者3194人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

11.99至15.99万元 长安启源A06开启预售

网易汽车 浏览 4725

自动驾驶真的来了 两款车型分别在北京/重庆获准上路

网易汽车 浏览 3559

菜鸟与蜜雪集团达成合作,为蜜雪打造AI供应链产品

财闻 浏览 3516

大哥承诺每月给1万养家费 小弟把事扛了入狱发现被耍

方圆 浏览 9275

熊园:9月财政有喜有忧,今年预算能完成吗?

首席经济学家论坛 浏览 4196

蔡依林《PLEASURE》巡回演唱会首站启幕

环球网资讯 浏览 3233

里尔老板:乔纳森不是典型9号球员,预料到他会遇到一些困难

懂球帝 浏览 3957

荣耀Magic8 Pro Air支持eSIM,搭配实体SIM卡可实现四卡双待

IT之家 浏览 3107

特朗普称俄为"纸老虎" 普京回应

央视新闻客户端 浏览 3157

这家中国民企,破解了“迪拜之眼”难题,还拿下30多项“世界第一”!

国是直通车 浏览 3991

余嘉豪:扣完篮肾上腺素就上来了,但得马上冷静继续投入比赛

懂球帝 浏览 3875

中国人自己的敞篷跑车来了!腾势Z敞篷版曝光

优视汽车 浏览 3419

“电池车”全面压过“发动机”一头?油车时代的辉煌,被彻底终结

少数派报告Report 浏览 3613

苏亚雷斯:有信心率领亚泰保级

体坛周报 浏览 4162

纳斯达克称申请将工作日交易时长延长至23小时

财联社 浏览 3404

"女首相梦"悬了的高市公开支持赖清德 日本亲华派翻脸

梁讯 浏览 7972

吴速玲曝儿子Joe是恋爱脑

韩小娱 浏览 3168

秋天穿衣真的很简单,看看这些造型就有灵感,舒适简约又自然

静儿时尚达人 浏览 3979

WTT重庆冠军赛:莫雷加德3-0横扫丹麦猛将,即将迎战国乒温瑞博

乒谈 浏览 2258

乔治亚大学团队让大型语言模型学会"精打细算"的思考方式

科技行者 浏览 3954

牛弹琴:2025年最勇敢的一个动作 背后是全世界的震惊

北京日报客户端 浏览 9484
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1