爆点资讯

这项由牛津大学视觉几何组(VGG)团队开展的研究发表于2025年1月，论文编号为arXiv:2601.09499v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

想象一下，当你在看一段视频时，你的大脑能够同时理解画面中物体的三维形状、它们的运动轨迹，以及摄像机的移动。现在，牛津大学的研究人员成功让计算机也具备了这种"立体视觉"能力。他们开发的V-DPM系统能够从一段普通视频中同时重建出场景的3D结构、物体的运动轨迹，甚至摄像机的参数——这就像给机器装上了一双能够"看透"视频背后三维世界的眼睛。

这项技术的突破性在于，它是首个能够在单次处理中完成所有这些任务的系统。以往的方法要么只能处理静态场景，要么需要多个步骤才能分别处理形状和运动。而V-DPM就像一位全能的"视频分析师"，能够一眼看出视频中的所有三维信息。更令人惊叹的是，研究团队巧妙地利用了在静态场景上训练的现有模型VGGT，通过相对少量的动态数据微调，就让它学会了处理复杂的动态场景——这就像让一位擅长画静物的画家，通过少量练习就学会了画动态人像。

这项研究解决了计算机视觉领域一个长期存在的挑战：如何让机器同

牛津VGG团队突破：单一网络实现视频动态3D重建

杨振宁在京逝...

泰柬新一轮边...

世体：皇马今...

向太曝古天乐...

《小城大事》...

上海机场48...

萧敬腾在岳父追思会上拥抱妻子，含泪致辞

一天两失利！国家队和民营航天双双遇挫！股民最担心的事来了

60岁无儿无女形象大变的张卫健，经历了什么

今年秋冬流行“漏斗领外套”，时髦又高级！

特朗普下令立即重启美国核试验以应对其他国家核威胁

下周，A股还能不能修复？分析来了

阿维塔赴港冲刺IPO：“国家队”新能源稀缺标的，115亿押注华为背后

市场监管总局发文禁止亏本卖车！比亚迪北汽响应

伊敏百台无人矿卡常态化安全稳定运行超180天，单日产量创新高

关于李湘为什么总披着外套?

OPPO Find X9 系列实拍：定位“旅拍神器”，口袋里的哈苏相机

AI时代，寻找超级创业者！徐汇区发布政策扶持一个人赛过一群人的“大牛”

资源品价值重估，“新周期”启幕

HuggingChat Omni 集成式 AI 平台发布

江铃旗下羿驰 05S 纯电紧凑型 SUV 将于10月16日上市

在纽约，香奈儿给每个人写了封情书

黄慧颐晒结婚证回击保剑锋，业内下场曝猛料，女方曾持刀捅伤男方

今年冬天流行的“露袜”穿法，时髦又减龄！

梅根·凯利怒怼谷爱凌争议，揭露政客背后的偏见

标配激光雷达、磁流变悬架深蓝L06预售13.99万元起

泽连斯基：任何形式的领土交换都“不可接受”

全运男足大冷？3大热门均无缘决赛！众国脚拉胯，徐根宝+韩鹏留憾

意大利比萨大学：让AI神经网络高效处理信息的新技术ParalESN

秦岚自曝身体出现情况，治疗结果不尽人意