关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者3268人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

StereoAdapter:北大首提自监督,适配水下双目深度估计

新智元 浏览 4271

特朗普威胁:是时候在伊朗寻找新的领导层了

新京报政事儿 浏览 7307

再斩第一!OceanBase蝉联IDC榜单,国产数据库实力领跑

雷科技 浏览 3353

《浪姐7》4大“赢家”,出道多年不及参加一档综艺,选择真重要

娱乐圈笔娱君 浏览 1376

单日6只大规模基金成立!主动权益基金四大指标,超去年全年

券商中国 浏览 304

近距离感受国之重器:第一视角看亚洲首个电磁弹射微重力实验装置

IT之家 浏览 4332

成熟企业做新品牌往往很难成功,为什么?

创业家 浏览 4186

具身智能开启汽车产业万亿新赛道

车质网 浏览 4116

官方:利物浦从德比郡召回23岁后卫欧文-贝克

懂球帝 浏览 3362

郑恺晒与陈赫等10人合影,被扒P掉7处烟盒打火机,遭吐槽一群老登

萌神木木 浏览 3668

2-4遭海牛逆转,国安追平队史中超主场单场丢球纪录

懂球帝 浏览 4192

媒体:民进党为突破僵局推动"绿白合" 柯文哲不能犯浑

海峡导报社 浏览 8960

父子在悉尼海滩枪击致16死 中国学生亲历:很怕打中我

上观新闻 浏览 9344

女鞋巨头,集体“脱鞋”谋变

斑马消费 浏览 3193

俄罗斯终于发现 福建舰服役后做中国的朋友很有面子

现代小青青慕慕 浏览 8572

韩庚晒卢靖姗官宣生子!一家四口同框照好幸福

一只番茄鱼 浏览 4179

陈奕迅回应患焦虑症:仍在服药看医生,但已好转大半

大象新闻 浏览 4223

老鹰124-112魔术豪取10连胜,沃克41分,杰伦约翰逊三双,班凯罗13中3

懂球帝 浏览 2228

町田外援埃里克:期待2026年世界杯能成为属于内马尔的舞台

懂球帝 浏览 307

熊园:9月财政有喜有忧,今年预算能完成吗?

首席经济学家论坛 浏览 4277

66岁安帅径直离场!发布会暴怒:首负日本无法接受,点名狠批1人

我爱英超 浏览 4315
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1