爆点资讯

这项由牛津大学视觉几何组(VGG)团队开展的研究发表于2025年1月，论文编号为arXiv:2601.09499v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

想象一下，当你在看一段视频时，你的大脑能够同时理解画面中物体的三维形状、它们的运动轨迹，以及摄像机的移动。现在，牛津大学的研究人员成功让计算机也具备了这种"立体视觉"能力。他们开发的V-DPM系统能够从一段普通视频中同时重建出场景的3D结构、物体的运动轨迹，甚至摄像机的参数——这就像给机器装上了一双能够"看透"视频背后三维世界的眼睛。

这项技术的突破性在于，它是首个能够在单次处理中完成所有这些任务的系统。以往的方法要么只能处理静态场景，要么需要多个步骤才能分别处理形状和运动。而V-DPM就像一位全能的"视频分析师"，能够一眼看出视频中的所有三维信息。更令人惊叹的是，研究团队巧妙地利用了在静态场景上训练的现有模型VGGT，通过相对少量的动态数据微调，就让它学会了处理复杂的动态场景——这就像让一位擅长画静物的画家，通过少量练习就学会了画动态人像。

这项研究解决了计算机视觉领域一个长期存在的挑战：如何让机器同

牛津VGG团队突破：单一网络实现视频动态3D重建

印度人崩了！...

新能源购置税...

肖战官宣微博...

“满200减...

李梓萌骗人真...

香港男子在宏...

全智贤风波升级，雪花秘扇时期表现被审判，此前曾多次翻车

退休警察举报11年前交通事故：当年鉴定疑未勘验实车

没有人不爱这个穿平底鞋都发光的女人

傅利叶：未来1-2年将脑机接口引入机器人康复训练，提升治疗效率

京东首款汽车定了！埃安UT迎泼天流量，能否逆天改命？

演员孙涛告别春晚：18次登春晚，把舞台给年轻人

14岁休学少女进拓展营后死亡曾哭喊＂妈妈我不想死＂

400余场特色促消费活动来袭，2026重庆618电商嘉年华启幕

海尔集团与阿里巴巴达成全面AI合作

还是王慧文有眼光，Kimi又融了35亿

曝杨威与儿子失联！杨阳洋父母情绪崩溃

靠老婆出圈，成名后过河拆桥，这4位实在绝情！

某券商首席炒黄金期货大赚14亿？本人报警了

莱因克尔：对阵勒沃库森时哈弗茨应首发，他能提供更多东西

38岁尹正再破天花板，这一次，他让整个娱乐圈“沉默”了

限时先享价25.98万吉利银河M9黑金智曜版正式上市

伊朗＂蚊子舰队＂披露：被美方视为霍尔木兹海峡的主要威胁

在罗塞尼尔执教的13场比赛中，切尔西因定位球丢了7球

200多斤小伙落水漂浮7小时钱塘江大潮来临之际获救

单反绝唱：优雅技艺在职业网坛的黄昏

媒体：美伊谈妥备忘录草案中有一个数字格外引人注意

【观察】不抱怨、情商高、擅激励，齐沃堪称“宝藏”主帅

超越纯视觉模型！不改VLM标准架构，实现像素级深度预测

特斯拉“连续5年保费”曝光：保险只要1900？比油车还便宜！