关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者468人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

马克龙警告美国:侵犯格陵兰岛将引发"前所未有后果"

环球网资讯 浏览 11823

2026款奔驰GLC AMG 43 4MATIC上市 售58.9万

车质网 浏览 1418

向太曝张艺谋巩俐分手内幕,女方逼婚不成移情,老谋子彻夜痛哭

不八卦会死星人 浏览 1498

又嫁错人?贾静雯老公过往争议被扒,催生四胎还和老婆闺蜜搞暧昧

萌神木木 浏览 1620

车导的瓜没吃完 孟桐的瓜又来了 那英如何反击?

动物奇奇怪怪 浏览 2266

第五届意大利繁花电影节圆满落幕!

幕味儿 浏览 1494

学者:欧洲想实现核心发展目标 除了中国没有其他选择

澎湃新闻 浏览 5198

格陵兰岛居民愤怒:商店里的枪支都快卖光了

环球网资讯 浏览 4756

Meta一边挥刀赶走老白兔,一边改绩效发甜枣

字母榜 浏览 430

即将结束非洲之旅,网红Speed受邀观战非洲杯决赛并获赠球衣

懂球帝 浏览 407

17岁小伙疑陷东南亚骗局 家人收其戴手铐跪地照片

大风新闻 浏览 15368

邮报:曼联计划升级老特拉福德排水系统,以修复顶棚漏水问题

懂球帝 浏览 776

上海业主十一出游后推开家门懵了 精装房成"化粪池"

环球网资讯 浏览 1612

韩红父亲居然是他?这身份太惊人了

君笙的拂兮 浏览 1352

一集封神,收视率暴涨,这剧赢麻了

独立鱼 浏览 1272

RMC:皇马球员获赠宝马车使用,姆巴佩因无驾照仅象征性领车

懂球帝 浏览 1680

视频:美公布在委内瑞拉附近扣押油轮行动画面

央视新闻客户端 浏览 634

二手车商称雷军在吹牛:现在有的车型降10万都没人要

都市现场 浏览 6072

老年痴呆父亲掏出所有钱哽咽求女儿:能带我找妈妈吗

潇湘晨报 浏览 10995

安踏强势反腐背后 毛利率下滑 营销、采购是重灾区

21世纪经济报道 浏览 2276

国内首个开放式机器人租赁平台在沪发布,已触达50个重点城市

澎湃新闻 浏览 782
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1