关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者2114人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

股份行AIC扩容至三家

北京商报 浏览 2778

媒体:自家老牌车企落后中美 欧盟恐对中国车厂下手

澎湃新闻 浏览 10193

女子取240万现金"给外甥当彩礼" 外甥:根本没有对象

环球网资讯 浏览 12599

吸职工血、吞救命钱,42岁的她如今沦为过街老鼠

芳芳历史烩 浏览 1977

爱泼斯坦案最新文件公布 有记录显示来电人为特朗普

每日经济新闻 浏览 13286

亨通光电财运亨通

富凯财经 浏览 2422

蔚来乐道发布换电站电池翻倍计划

电动知家 浏览 2483

6.4万的特斯拉FSD将成为历史!

新车评网 浏览 2051

2026年第一票房惨案诞生了

靠谱电影君 浏览 2191

委内瑞拉谴责美军扣押委油轮:国际海盗行为

环球网资讯 浏览 2491

德约六王赛退赛向观众道歉遭网友怒喷来捞钱,球迷用成绩狠狠打脸

网球之家 浏览 3180

唉!又一地产巨头,宣布退市

说财猫 浏览 3123

混动加持 保时捷911 Turbo Touring谍照曝光

车质网 浏览 3227

视界大会短剧演员好尴尬!走红毯扎堆不给镜头,后台跟明星分开坐

萌神木木 浏览 2918

殷桃|每个表情都让人欲罢不能

农城浪子 浏览 2148

荣梓衫工作室回应偏轨事件,暴力行径揭露阴暗面

二凯训猛犬 浏览 3219

女生显老又土气的5款发型,真的别留了!

Yuki女人故事 浏览 3230

特朗普:以色列须立即停止轰炸加沙

央视新闻客户端 浏览 3215

湖人126-114勇士,库詹东缺阵,里夫斯21分伤退,波杰23+5+8

懂球帝 浏览 3172

以数字化锻造发展引擎!财信证券书写“五篇大文章”

券商中国 浏览 3252

2026“乐购新春”盛宴开启,这三只浙股或迎最强“红包”行情

览富财经网 浏览 1876
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1