爆点资讯

这项由牛津大学视觉几何组(VGG)团队开展的研究发表于2025年1月，论文编号为arXiv:2601.09499v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

想象一下，当你在看一段视频时，你的大脑能够同时理解画面中物体的三维形状、它们的运动轨迹，以及摄像机的移动。现在，牛津大学的研究人员成功让计算机也具备了这种"立体视觉"能力。他们开发的V-DPM系统能够从一段普通视频中同时重建出场景的3D结构、物体的运动轨迹，甚至摄像机的参数——这就像给机器装上了一双能够"看透"视频背后三维世界的眼睛。

这项技术的突破性在于，它是首个能够在单次处理中完成所有这些任务的系统。以往的方法要么只能处理静态场景，要么需要多个步骤才能分别处理形状和运动。而V-DPM就像一位全能的"视频分析师"，能够一眼看出视频中的所有三维信息。更令人惊叹的是，研究团队巧妙地利用了在静态场景上训练的现有模型VGGT，通过相对少量的动态数据微调，就让它学会了处理复杂的动态场景——这就像让一位擅长画静物的画家，通过少量练习就学会了画动态人像。

这项研究解决了计算机视觉领域一个长期存在的挑战：如何让机器同

牛津VGG团队突破：单一网络实现视频动态3D重建

夏天衣服不要...

每天久坐8h...

陪爱妻方媛奔...

清华联合字节...

酷态科首款户...

东风集团股份...

俄总统助理：普京和特朗普会晤意愿依旧存在

AI会取代考古学家吗？在这场沙龙中窥见人工智能对文保利用的影响

一年蛰伏，亮剑CES：吉利智驾业务深度整合后，交出怎样一份全球化答卷？

普京签署法律修订兵役法：征兵工作将全年不间断进行

我们给有毒染料找了个“替身”，而且它真的能吃…

多人手机信号深夜同时消失出海7次未带回1条鱼被抓捕

美推进“金穹”系统的天基拦截器研制但钱和技术都存在问题

波兰外交部称有炮弹击中该国驻乌克兰大使馆

科创板主题基金规模突破三千亿元 “上新”的指数如何参与创新和成长?

老鹰124-112魔术豪取10连胜，沃克41分，杰伦约翰逊三双，班凯罗13中3

上台后第一次特朗普用7个字形容中国对华态度变了

电影《寻秦记》番位惹争议，白百何排第三成女主，原版女主变女二

江汽集团董事长项兴初拜访任正非送出尊界S800车模

4名游客遭马蜂袭击送医抢救：满头被蜇头发都剃光了

多位老人痴迷买保健品：有人甚至吞安眠药逼女儿妥协

又一国产车企官宣：正式全面停产、停售燃油车！

蔡一杰体内癌细胞仍在扩散，最新露面照显憔悴，身形也消瘦不少

曲刚：要付出最大努力来打好比赛，罗德里格伤势已没问题

冬季穿搭越简单越好看！衣服不多买、搭配彩色围巾，真的耐看

荣耀林林：整个行业成本趋势非常恶劣，二手机不排除会涨价

日供低至23元！车市开年遇冷，车企打响“金融战”

字节跳动:因组织调整离职的员工过渡补贴最高7.2万元

李亚鹏带货卖超千万？网友说他是不会蹭热度的人

谁逆袭谁掉队？43家券商业绩全景复盘