关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者2117人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

腾讯元宝宣布“任务”功能上线:一句话安排时间,到点就提醒

IT之家 浏览 2319

西贝深圳一门店被指未获同意提前“逃场”,回应:撤店属实,双方已达成方案

红星资本局 浏览 1925

10000亿中芯国际,一剑封喉!

飞鲸投研 浏览 2707

视界大会红毯尴尬瞬间!踩裙子、抢位置,太多人手忙脚乱出状况

萌神木木 浏览 2930

舒默公开指责特朗普:总统无权独自将国家带向战争

看看新闻Knews 浏览 56855

民事诉讼牵出5年纠纷!迅雷再诉前CEO陈磊损害公司利益,知情人:追索金额达2亿元

红星资本局 浏览 2047

美媒:中国近半年没买过美国一粒大豆 豆农心急如焚

CCTV4 浏览 17109

鑫元基金,出了个年度“亏损王”

深蓝财经 浏览 2123

被处罚的ST云动较年内高点腰斩,符合条件股民可登记索赔

证券市场周刊 浏览 3001

凌晨!全线大涨!美联储宣布:降息!鲍威尔重磅发声!

券商中国 浏览 2484

3岁童喝珍珠奶茶蹦床时不幸窒息身亡 家长发声欲追责

大风新闻 浏览 9035

撑起500亿票房,国产片几大关键词:高质量动画大片、多维度抗战作品、话题性艺术佳作

环球网资讯 浏览 2408

无方向盘设计 曝特斯拉Cybercab路试谍照

车质网 浏览 2344

胡塞武装称若加沙停火破裂将恢复袭击以色列

极目新闻 浏览 2939

于根伟激励全队:付出最大的努力,把最后4轮比赛“咬”下来

懂球帝 浏览 3285

乌代表团赴美谈判 俄乌互相袭击

新华社 浏览 2518

卡什:阿卡辛纳这样“双马竞争”对网坛来说不是健康的事

网球之家 浏览 2157

货拉拉等平台被调查

第一财经资讯 浏览 2447

外国女教师性侵16岁男学生数月上百次 详情炸裂

胡侃社会百态 浏览 38582

欧盟行业代表:中方出手反制欧盟 法国这一次受伤最重

澎湃新闻 浏览 30511

俄方表示结束乌克兰危机“欧洲方案”不具建设性

环球网资讯 浏览 2702
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1