在空间智能(Spatial Intelligence)飞速发展的今天,全景视角因其 360° 的环绕覆盖能力,成为了机器人导航、自动驾驶及虚拟现实的核心基石。然而,全景深度估计长期面临 “数据荒” 与 “模型泛化差” 的瓶颈。
空间智能(Spatial Intelligence)赋予了智能系统感知、解释物理世界并与之交互的能力,是通往通用人工智能(AGI)的重要基石。尽管当前的视觉语言模型(VLM)在一些宏观视觉任务上展现了潜力,但近期的研究表明,它们在处理三维空间关系、精确数值估计(如距离和尺寸)以及视角转换等任务时仍然面临巨大挑战。
点击蓝字关注我们2025年12月17日,金融时报发表题为《世界实验室的李飞飞:人工智能如果没有空间智能是不完整的》(Fei-Fei Li of World Labs: AI is incomplete without spatial ...
此前,李飞飞老师提出了空间智能 (Spatial Intelligence) 这一概念,作为回应,来自上交、斯坦福、智源、北大、牛津、东大的研究者提出了空间大模型 SpatialBot,并提出了训练数据 SpatialQA 和测试榜单 SpatialBench, 尝试让多模态大模型在通用场景和具身场景下理解 ...