![]()
这项由上海AI实验室牵头,联合香港大学、浙江大学、清华大学等多家知名学府共同完成的重要研究,发表于2025年12月。研究团队提出了名为DualVLN的双系统视觉语言导航模型,这是该领域首个采用"快慢结合"架构的基础模型。有兴趣深入了解的读者可以通过论文编号arXiv:2512.08186v1查询完整论文。
机器人导航听起来很简单,就像我们日常走路一样自然。但实际上,让一个机器人理解"走到厨房拿杯水"这样的指令,并准确执行,比我们想象的要复杂得多。就好比让一个从未出过门的人,仅凭别人的口述描述就要找到一个陌生地方一样困难。
传统的机器人导航就像一个过分谨慎的新手司机,每走一步都要停下来仔细思考很久,动作既机械又缓慢。这种做法在实验室里也许还行,但在现实世界中就显得笨拙不堪。当有人突然从拐角走出来,或者路上临时出现障碍物时,这样的机器人往往来不及反应,要么撞上