erenzhou
/

GeoGround

Image-Text-to-Text

Model card Files Files and versions

erenzhou commited on Apr 18, 2025

Commit

31ec995

·

verified ·

1 Parent(s): 838cc9b

Create README.md

Files changed (1) hide show

README.md +82 -0

README.md ADDED Viewed

	@@ -0,0 +1,82 @@

+---
+datasets:
+- erenzhou/refGeo
+language:
+- en
+base_model:
+- liuhaotian/llava-v1.5-7b
+pipeline_tag: image-text-to-text
+---
+## Inference
+1. Install LLaVA-1.5 from https://github.com/haotian-liu/LLaVA
+2-1. Inference Coarse Masks
+```
+MODEL_PATH=path/to/checkpoints/llava-v1.5-7b-task-lora-geoground
+OUTPUT=data/exp_0125
+ANSWER_PATH=$OUTPUT/llava-v1.5-7b-task-lora-geoground
+GPU_NUM=0
+echo "Processing RRSIS-D test"
+IMAGE_FOLDER=path/to/data/images/rrsisd/
+JSON_PATH=path/to/data/metadata/rrsisd_val.jsonl
+CUDA_VISIBLE_DEVICES=$GPU_NUM \
+python inference_hbb.py \
+    --model-path $MODEL_PATH \
+    --model-base $MODEL_PATH \
+    --question-file $JSON_PATH \
+    --image-folder $IMAGE_FOLDER \
+    --answers-file $ANSWER_PATH-rrsisd_val.jsonl \
+    --batch_size 1
+```
+2-2. Inference Horizontal Bounding Boxes (HBBs)
+```
+CUDA_VISIBLE_DEVICES=$GPU_NUM \
+python inference_seg.py \
+    --model-path $MODEL_PATH \
+    --model-base $MODEL_PATH \
+    --question-file $JSON_PATH \
+    --image-folder $IMAGE_FOLDER \
+    --answers-file $ANSWER_PATH-rrsisd_val.jsonl \
+    --batch_size 1
+```
+3-1. Generate Masks using Coarse Masks
+```
+python generate_mask.py \
+    --answers-file $ANSWER_PATH-rrsisd_val.jsonl \
+    --image-folder $IMAGE_FOLDER  \
+    --scale 16 \
+    --vis-dir $OUTPUT/vis_seg/
+```
+3-2. Generate Masks by SAM using HBBs
+```
+python generate_mask_sam_by_box.py \
+    --answers-file $ANSWER_PATH-rrsisd_val.jsonl \
+    --image-folder $IMAGE_FOLDER  \
+    --scale 16 \
+    --vis-dir $OUTPUT/vis_sam_box/
+```
+3-3. Generate Masks by SAM using HBBs and Coarse Masks
+```
+python generate_mask_sam_by_box+seg.py \
+    --answers-file $ANSWER_PATH-rrsisd_val.jsonl \
+    --image-folder $IMAGE_FOLDER  \
+    --scale 16 \
+    --vis-dir $OUTPUT/vis_sam_box+seg/
+```
+4. Compute Metric
+```
+python compute_mask_metric.py
+```