关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者3136人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

基金经理任期内亏损近40%,还让人“抄作业”

财通社 浏览 4005

新年第一顶帽子,就要不基础

时尚COSMO 浏览 2520

真爱大牌 || 这些被抢空的好物又回来了,这次破价100+

黎贝卡的异想世界 浏览 3533

马斯克SpaceX太空能源计划浮出水面,中国光伏产业或成关键一环

DeepTech深科技 浏览 2857

今年春节档头号种子,是它

电影最TOP 浏览 2818

商品期货今天涨疯了,地缘升温影响还能多久?

财联社 浏览 2380

王家卫凉凉!开会支持《繁花》副导演精日言论,网友让他滚出中国

萌神木木 浏览 4008

全国首个!华为、联通把5G-A上行速率飚到1Gbps

快科技 浏览 2933

“锂王”炒股,赚了111万,赔掉2000亿

大猫财经Pro 浏览 2515

员工超长时间如厕被开除 单次最长4小时辩称护理痔疮

环球网资讯 浏览 7502

加斯佩里尼:意甲争冠?我知道有一些实力更强的球队

懂球帝 浏览 3389

富士展示“无镜头相机”:光学器件与AI算法重构图像

IT之家 浏览 3970

5组超显气质的配色,可以从现在穿到过年!

Yuki女人故事 浏览 3148

遵义市市长黄伟任上被查:16岁考上大学 几天前在参会

红星新闻 浏览 6314

泰国总理:解散国会下议院不会影响泰柬边境局势

环球网资讯 浏览 3397

占比突增到62.2%,年末新能源车突然爆发,燃油车要“熄火”了?

小李车评李建红 浏览 3485

小米SU7高速碰撞后起火 事发前速度或超200km/h

网易汽车 浏览 4172

涉水加强 福特烈马亚马逊限量版上市 售价39.98万

网易汽车 浏览 132

郑爽近照曝光星味全无,家中装修豪华惊现儿童玩具,日子并不可怜

不八卦会死星人 浏览 3151

鹈鹕创队史纪录大胜独行侠 状元PK锡安27分弗拉格21+7+8

醉卧浮生 浏览 2155

国米球员身价变更:图拉姆下跌1500万欧,博尼上涨1200万欧

懂球帝 浏览 3385
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1