Spaces:

invensync
/

invensync-v3-embed

Running

App Files Files Community

invensync-v3-embed / README.md

invensync

Initial commit — SigLIP-2 embed API

2c45e8a verified 10 days ago

preview code

raw

history blame contribute delete

1.71 kB

	---
	title: InvenSync V3 SigLIP-2 Embed API
	emoji: 🔍
	colorFrom: blue
	colorTo: green
	sdk: docker
	pinned: false
	license: apache-2.0
	short_description: SigLIP-2 fine-tuned embedding API for InvenSync V3
	---

	# InvenSync V3 — SigLIP-2 Embed API

	Self-hosted Hugging Face Space servant le modèle fine-tuné
	`invensync/siglip2-base-invensync-v1` via une API HTTP minimale.

	Contourne la limitation HF Inference Providers qui ne sert pas les SigLIP-2 custom
	en free tier. Latence sur Space CPU : ~1-2 s / image (acceptable pour démo +
	warming Cloudflare Worker).

	## Endpoints

	\| Verbe + path \| Description \|
	\|---\|---\|
	\| `GET /` \| health check (modèle chargé, device, version) \|
	\| `POST /embed` \| input `{image_base64}` → `{vector[768], dim, model}` \|

	## Format de l'image

	`image_base64` : chaîne base64 d'une image PNG/JPEG/WebP, avec ou sans préfixe
	`data:image/...;base64,`. Resize automatique en 384×384 BILINEAR avant inference.

	## Test local (optionnel)

	```bash
	docker build -t invensync-embed .
	docker run -p 7860:7860 invensync-embed
	# Puis :
	curl -X POST http://localhost:7860/embed \
	-H 'Content-Type: application/json' \
	-d "{\"image_base64\":\"$(base64 -w0 test.jpg)\"}"
	```

	## Déploiement

	Push automatique sur HF Spaces — le commit déclenche un rebuild Docker (~10-15 min
	la première fois, ~2 min pour les rebuilds suivants).

	## Sécurité

	- Pas d'auth — le Space est public, appelé uniquement par le Worker invensync-v3-edge.
	- Pas de logs de payload (images des utilisateurs) — uniquement count + latence.

	## Hardware

	CPU basic (free tier). 16 GB RAM. SigLIP-2 base prend ~800 Mo, plenty.
	Cold start ~30-60 s — warmable via cron Cloudflare toutes les 10 min.