关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者981人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

惠普暗影精灵11《英雄联盟》典藏版月底开售,海克斯金色线条装饰

IT之家 浏览 2000

纪录片《重返狼群》一夜间翻红 "狼王"格林目前无下落

新民周刊 浏览 18175

德佬:我本来不想让KK的团队得逞,但最终不得不把他卖掉

懂球帝 浏览 2855

柬泰签署停火联合声明 中方回应

北京日报 浏览 1141

2026年新年首个工作日 中纪委连打4“虎”

南方都市报 浏览 8292

加斯佩里尼:意甲争冠?我知道有一些实力更强的球队

懂球帝 浏览 1290

隆基Hi-MO X10“三防”组件荣获权威检测证书

人民网 浏览 2745

新人中东度蜜月突遇战争爆发 新娘在领空关闭前幸运离境

极目新闻 浏览 11

一年狂揽60亿融资!13大玩家厮杀无人配送,阿里京东美团都入局了

车东西 浏览 736

这个十一假期,打败酒店行业的是帐篷?

BT财经 浏览 2190

洛里昂vs布雷斯特:姆沃戈、马肯戈首发,迪纳-埃宾贝、阿若克出战

懂球帝 浏览 2070

宗馥莉的两大心腹疑似离职,“宏胜系”权力大洗牌

财通社 浏览 2063

刘嘉玲问刘晓庆:现在接戏的角色是否有限?

红星新闻 浏览 2144

懂穿搭的女人,把“卫衣”收进衣柜,这3件单品才是时髦密码

静儿时尚达人 浏览 2063

梁靖崑2-3张本智和!决胜局被逆转太保守!男团0-1落后日本!

篮球资讯达人 浏览 2170

女儿严重高反 男子订回程票出错立即取消重订被扣两千

上观新闻 浏览 10552

2025年央八收视前十:《沉默的荣耀》第四,孙俪新剧遥遥领先

娱乐圈笔娱君 浏览 1018

终结三连败!商竣程取得大满贯第七胜

网球之家 浏览 933

美称空袭叙利亚西北部 打死一名与“基地”组织关联头目

新华社 浏览 904

中年女人,冬天这么穿羽绒服、大衣,优雅都藏在这3个细节里

静儿时尚达人 浏览 1299

特朗普对全世界一视同仁,中美关系未必会更糟

浏览 24522
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1