Spaces:
Running
Running
| title: InvenSync V3 SigLIP-2 Embed API | |
| emoji: 🔍 | |
| colorFrom: blue | |
| colorTo: green | |
| sdk: docker | |
| pinned: false | |
| license: apache-2.0 | |
| short_description: SigLIP-2 fine-tuned embedding API for InvenSync V3 | |
| # InvenSync V3 — SigLIP-2 Embed API | |
| Self-hosted Hugging Face Space servant le modèle fine-tuné | |
| `invensync/siglip2-base-invensync-v1` via une API HTTP minimale. | |
| Contourne la limitation HF Inference Providers qui ne sert pas les SigLIP-2 custom | |
| en free tier. Latence sur Space CPU : ~1-2 s / image (acceptable pour démo + | |
| warming Cloudflare Worker). | |
| ## Endpoints | |
| | Verbe + path | Description | | |
| |---|---| | |
| | `GET /` | health check (modèle chargé, device, version) | | |
| | `POST /embed` | input `{image_base64}` → `{vector[768], dim, model}` | | |
| ## Format de l'image | |
| `image_base64` : chaîne base64 d'une image PNG/JPEG/WebP, avec ou sans préfixe | |
| `data:image/...;base64,`. Resize automatique en 384×384 BILINEAR avant inference. | |
| ## Test local (optionnel) | |
| ```bash | |
| docker build -t invensync-embed . | |
| docker run -p 7860:7860 invensync-embed | |
| # Puis : | |
| curl -X POST http://localhost:7860/embed \ | |
| -H 'Content-Type: application/json' \ | |
| -d "{\"image_base64\":\"$(base64 -w0 test.jpg)\"}" | |
| ``` | |
| ## Déploiement | |
| Push automatique sur HF Spaces — le commit déclenche un rebuild Docker (~10-15 min | |
| la première fois, ~2 min pour les rebuilds suivants). | |
| ## Sécurité | |
| - Pas d'auth — le Space est public, appelé uniquement par le Worker invensync-v3-edge. | |
| - Pas de logs de payload (images des utilisateurs) — uniquement count + latence. | |
| ## Hardware | |
| CPU basic (free tier). 16 GB RAM. SigLIP-2 base prend ~800 Mo, plenty. | |
| Cold start ~30-60 s — warmable via cron Cloudflare toutes les 10 min. | |