SpatialRGPT: Grounded Spatial Reasoning in VLMs - a a8cheng Collection

a8cheng 's Collections

3D Aware Region Prompted Vision Language Model

NaVILA: Legged Robot Vision-Language-Action Model for Naviga

SpatialRGPT: Grounded Spatial Reasoning in VLMs

SpatialRGPT: Grounded Spatial Reasoning in VLMs

updated Oct 11, 2024