Spaces:

tingul4
/

text-image-seg

Running

text-image-seg / README.md

1. update README

72c908c about 1 month ago

2.4 kB

metadata

title: Text Image Seg
emoji: 📊
colorFrom: red
colorTo: green
sdk: gradio
sdk_version: 5.49.1
app_file: app.py
pinned: false

🎯 Text-Guided Image Segmentation Demo

基於 Grounding DINO 和 SAM (Segment Anything Model) 的文字引導圖片分割應用，使用 Gradio 構建互動式介面。

pip install -r requirements.txt

gradio app.py

或

python app.py

應用將在 http://localhost:7860 啟動。

檢測到的物件會按順序使用以下顏色作為mask：

Grounding DINO (IDEA-Research/grounding-dino-base)
- 用於零樣本物件檢測
- 根據文字描述定位物件
SAM (facebook/sam-vit-base)
- 用於精確分割
- 基於檢測框生成高質量遮罩

輸入圖片 + 文字提示
    ↓
Grounding DINO 檢測物件
    ↓
SAM 生成分割遮罩
    ↓
多物件遮罩疊加（不同顏色）
    ↓
輸出結果

text-image-seg/
├── app.py
├── requirements.txt
├── README.md
├── sample_images/
├── .gitattributes
└── .gitignore