这项突破性研究由莫斯科国立罗蒙诺索夫大学、俄罗斯高等经济学院以及亚美尼亚力学研究所的联合团队完成,第一作者是安东·科努申(Anton Konushin),通讯作者是达尼拉·鲁霍维奇(Danila Rukhovich)。这项名为"TUN3D: Towards Real-World Scene Understanding from Unposed Images"的研究发表于2025年9月的arXiv预印本平台,论文编号为arXiv:2509.21388v1。有兴趣深入了解的读者可以通过该编号查询完整论文。
房间里的每一件家具摆在哪里,墙壁是什么形状,天花板有多高——这些看似简单的信息,对于人类来说轻而易举,但让电脑理解却一直是个巨大挑战。就像教一个从未见过世界的人学会描述房间一样困难。传统的方法就像给这个"电脑学生"配备了昂贵的测距仪和精确的指南针,才能勉强完成这个任务。
但现在,莫斯科大学的研究团队想出了一个巧妙的办法:只需要用普通相机随便拍几张照片,就能让电脑准确地"看懂"整个房间。这就好比一个人蒙着眼睛摸索房间,仅凭几次触碰就能画出准确的房间地图。
这项研究的真正革