Spaces:

toratal3
/

clip-encoder

Running

toratal3 commited on Feb 16

Commit

4f1b9ee

1 Parent(s): 7085dd4

Fix: convert RGBA to RGB for SigLIP processor

Files changed (1) hide show

app.py CHANGED Viewed

@@ -27,26 +27,15 @@ def encode(text: str) -> list:
     return feats[0].tolist()
 def encode_image(image) -> list:
-    print(f"encode_image called with type: {type(image)}")
     if image is None:
         raise gr.Error("No image provided")
-    # Gradio 5+/6+ may pass a filepath string or dict instead of PIL Image
-    if isinstance(image, str):
         image = Image.open(image).convert("RGB")
-    elif isinstance(image, dict):
-        # Gradio FileData dict: {"path": "/tmp/...", "url": "...", ...}
-        path = image.get("path") or image.get("url")
-        if path and path.startswith("data:"):
-            import base64, io
-            header, data = path.split(",", 1)
-            image = Image.open(io.BytesIO(base64.b64decode(data))).convert("RGB")
-        elif path:
-            image = Image.open(path).convert("RGB")
-        else:
-            raise gr.Error(f"Cannot parse image dict: {list(image.keys())}")
-    elif not isinstance(image, Image.Image):
         raise gr.Error(f"Unexpected image type: {type(image)}")
-    print(f"Image size: {image.size}, mode: {image.mode}")
     inputs = processor(images=[image], return_tensors="pt")
     with torch.no_grad():
         feats = model.get_image_features(pixel_values=inputs["pixel_values"])

     return feats[0].tolist()
 def encode_image(image) -> list:
     if image is None:
         raise gr.Error("No image provided")
+    # Gradio 6.x base64 shortcut returns RGBA — SigLIP needs RGB
+    if isinstance(image, Image.Image):
+        image = image.convert("RGB")
+    elif isinstance(image, str):
         image = Image.open(image).convert("RGB")
+    else:
         raise gr.Error(f"Unexpected image type: {type(image)}")
     inputs = processor(images=[image], return_tensors="pt")
     with torch.no_grad():
         feats = model.get_image_features(pixel_values=inputs["pixel_values"])