Spaces:

raksama19
/

Alt_Text_Via_API

Sleeping

App Files Files Community

raksama19 commited on Jul 17, 2025

Commit

f63d98f

verified ·

1 Parent(s): 2b5d46f

Update app.py

Browse files

Files changed (1) hide show

app.py +2 -25

app.py CHANGED Viewed

@@ -8,7 +8,6 @@ import os
 import io
 from PIL import Image
 import google.generativeai as genai
-from google.generativeai import types
 def initialize_gemini():
@@ -39,11 +38,6 @@ def generate_image_description(image):
         if image.mode != 'RGB':
             image = image.convert('RGB')
-        # Convert PIL image to bytes
-        buffered = io.BytesIO()
-        image.save(buffered, format="JPEG")
-        image_bytes = buffered.getvalue()
         # Create prompt for detailed image description
         prompt = """You are an expert at describing images in detail. Analyze this image and provide a comprehensive description that includes:
@@ -58,13 +52,7 @@ Provide a clear, detailed description that would help someone who cannot see the
         # Generate description using Gemma 3n via Gemini API
         model = genai.GenerativeModel('gemma-3n-e4b-it')
-        response = model.generate_content([
-            types.Part.from_bytes(
-                data=image_bytes,
-                mime_type='image/jpeg',
-            ),
-            prompt
-        ])
         if hasattr(response, 'text') and response.text:
             return response.text.strip()
@@ -90,11 +78,6 @@ def create_alt_text(image):
         if image.mode != 'RGB':
             image = image.convert('RGB')
-        # Convert PIL image to bytes
-        buffered = io.BytesIO()
-        image.save(buffered, format="JPEG")
-        image_bytes = buffered.getvalue()
         # Create prompt for concise alt text
         prompt = """You are an accessibility expert creating alt text for images. Analyze this image and provide a clear, concise description suitable for screen readers.
@@ -107,13 +90,7 @@ Provide alt text in 1-2 sentences that is informative but concise. Start directl
         # Generate alt text using Gemma 3n via Gemini API
         model = genai.GenerativeModel('gemma-3n-e4b-it')
-        response = model.generate_content([
-            types.Part.from_bytes(
-                data=image_bytes,
-                mime_type='image/jpeg',
-            ),
-            prompt
-        ])
         if hasattr(response, 'text') and response.text:
             alt_text = response.text.strip()

 import io
 from PIL import Image
 import google.generativeai as genai
 def initialize_gemini():
         if image.mode != 'RGB':
             image = image.convert('RGB')
         # Create prompt for detailed image description
         prompt = """You are an expert at describing images in detail. Analyze this image and provide a comprehensive description that includes:
         # Generate description using Gemma 3n via Gemini API
         model = genai.GenerativeModel('gemma-3n-e4b-it')
+        response = model.generate_content([prompt, image])
         if hasattr(response, 'text') and response.text:
             return response.text.strip()
         if image.mode != 'RGB':
             image = image.convert('RGB')
         # Create prompt for concise alt text
         prompt = """You are an accessibility expert creating alt text for images. Analyze this image and provide a clear, concise description suitable for screen readers.
         # Generate alt text using Gemma 3n via Gemini API
         model = genai.GenerativeModel('gemma-3n-e4b-it')
+        response = model.generate_content([prompt, image])
         if hasattr(response, 'text') and response.text:
             alt_text = response.text.strip()