Spaces:

ashish-001
/

CLIP-API

Sleeping

App Files Files Community

ashish-001 commited on Nov 22, 2025

Commit

115f25c

verified ·

1 Parent(s): 8cd4e42

Upload 3 files

Browse files

Files changed (3) hide show

Dockerfile +16 -0
app.py +66 -0
requirements.txt +6 -0

Dockerfile ADDED Viewed

	@@ -0,0 +1,16 @@

+FROM python:3.10-slim
+WORKDIR /app
+COPY . /app
+RUN pip install --no-cache-dir  -r requirements.txt uvicorn
+ENV HF_HOME=/home/user/cache
+ENV TORCH_HOME=/home/user/cache
+RUN mkdir -p /home/user/cache && chmod -R 777 /home/user/cache
+COPY . .
+EXPOSE 7860
+CMD ["uvicorn","app:app","--host","0.0.0.0","--port","7860"]

app.py ADDED Viewed

	@@ -0,0 +1,66 @@

+from fastapi import FastAPI, File, UploadFile
+import torch
+from dotenv import load_dotenv
+import logging
+import os
+from PIL import Image
+from transformers import CLIPProcessor, CLIPModel
+load_dotenv()
+logging.basicConfig(level=logging.INFO)
+logger = logging.getLogger(__name__)
+app = FastAPI(title='CLIP API',
+              description='Returns CLIP embedding for text and image')
+HF_TOKEN = os.getenv('hf_token')
+logger.info("Loading CLIP processor and model")
+try:
+    processor = CLIPProcessor.from_pretrained(
+        "openai/clip-vit-large-patch14", use_auth_token=HF_TOKEN
+    )
+    clip_model = CLIPModel.from_pretrained(
+        "openai/clip-vit-large-patch14", use_auth_token=HF_TOKEN)
+    clip_model.eval()
+    logger.info("CLIP model loaded successfully")
+except Exception as e:
+    logger.error(f"Failed to load CLIP model : {e}")
+    raise
+def get_text_embedding(text: str):
+    try:
+        inputs = processor(text=[text], return_tensors="pt",
+                           padding=True, truncation=True)
+        with torch.no_grad():
+            text_embeddings = clip_model.get_text_features(**inputs)
+        logger.info("Text embedding generated")
+        return text_embeddings.squeeze(0).tolist()
+    except Exception as e:
+        logger.error(f"Error while generating embedding : {e}")
+        raise
+@app.get("/")
+async def root():
+    logger.info("Root endpoint accessed")
+    return {"message": "Welcome to the CLIP embedding API."}
+@app.get("/embedding")
+async def get_embedding_text(text: str):
+    logger.info(f"Embedding endpoint called with text")
+    embedding = get_text_embedding(text)
+    return {"embedding": embedding, "dimension": len(embedding)}
+@app.post("/clip/process")
+async def process_image(file: UploadFile = File(...)):
+    logger.info("Processing image")
+    image = Image.open(file.file).convert("RGB")
+    inputs = processor(images=image, return_tensors="pt")
+    with torch.no_grad():
+        embeddings = clip_model.get_image_features(**inputs)
+    return {"embedding": embeddings.tolist()}

requirements.txt ADDED Viewed

	@@ -0,0 +1,6 @@

+transformers==4.49.0
+fastapi==0.115.11
+pydantic==2.10.6
+torch==2.6.0
+pillow==11.1.0
+python-dotenv==1.0.1