Spaces:

reab5555
/

AI-Image-Anomaly-Detection

Running

App Files Files Community

reab5555 commited on Jan 7

Commit

fcba7cb

verified ·

1 Parent(s): ec4100b

Update app.py

Browse files

Files changed (1) hide show

app.py +21 -7

app.py CHANGED Viewed

@@ -20,11 +20,22 @@ OPENAI_API_KEY = os.getenv('OPENAI_API_KEY')
 def encode_image_to_base64(image):
     buffered = io.BytesIO()
     image.save(buffered, format="PNG")
     return base64.b64encode(buffered.getvalue()).decode('utf-8')
 def analyze_image(image):
     client = OpenAI(api_key=OPENAI_API_KEY)
     base64_image = encode_image_to_base64(image)
@@ -206,17 +217,20 @@ def process_and_analyze(image):
     if OPENAI_API_KEY is None:
         return None, "OpenAI API key not found in environment variables."
-    # Convert numpy array to PIL Image
-    if isinstance(image, np.ndarray):
-        image = Image.fromarray(image)
     try:
-        # Analyze image with GPT-4
         gpt_response = analyze_image(image)
         response_data = json.loads(gpt_response)
         if response_data["label"].lower() == "surprising" and response_data["element"].lower() != "na":
-            # Process image with detection models
             result_buf = process_image_detection(image, response_data["element"], response_data["rating"])
             result_image = Image.open(result_buf)
             analysis_text = f"Label: {response_data['label']}\nElement: {response_data['element']}\nRating: {response_data['rating']}/5"

 def encode_image_to_base64(image):
+    # If image is a tuple (as sometimes provided by Gradio), take the first element
+    if isinstance(image, tuple):
+        image = image[0]
+    # If image is a numpy array, convert to PIL Image
+    if isinstance(image, np.ndarray):
+        image = Image.fromarray(image)
+    # Ensure image is in PIL Image format
+    if not isinstance(image, Image.Image):
+        raise ValueError("Input must be a PIL Image, numpy array, or tuple containing an image")
     buffered = io.BytesIO()
     image.save(buffered, format="PNG")
     return base64.b64encode(buffered.getvalue()).decode('utf-8')
 def analyze_image(image):
     client = OpenAI(api_key=OPENAI_API_KEY)
     base64_image = encode_image_to_base64(image)
     if OPENAI_API_KEY is None:
         return None, "OpenAI API key not found in environment variables."
     try:
+        # Handle different input types
+        if isinstance(image, tuple):
+            image = image[0]
+        if isinstance(image, np.ndarray):
+            image = Image.fromarray(image)
+        if not isinstance(image, Image.Image):
+            raise ValueError("Invalid image format")
+        # Analyze image
         gpt_response = analyze_image(image)
         response_data = json.loads(gpt_response)
         if response_data["label"].lower() == "surprising" and response_data["element"].lower() != "na":
             result_buf = process_image_detection(image, response_data["element"], response_data["rating"])
             result_image = Image.open(result_buf)
             analysis_text = f"Label: {response_data['label']}\nElement: {response_data['element']}\nRating: {response_data['rating']}/5"