Spaces:

Sabari231024
/

VIPSA

Build error

Sabari231024 commited on Oct 15, 2023

Commit

03048fe

1 Parent(s): 0ec220d

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -5,15 +5,19 @@ from PIL import Image
 from gradio_client import Client
 from googletrans import Translator
 import cv2
 def trans(text, lang='ta'):
     translator = Translator()
     out = translator.translate(text, dest=lang)
     tts = gt.gTTS(text=out.text, lang=lang)
     return "done"
-def object_recognition(image,lang):
     API_URL = "https://api-inference.huggingface.co/models/Salesforce/blip-image-captioning-large"
     headers = {"Authorization": "Bearer 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"}
@@ -25,22 +29,26 @@ def object_recognition(image,lang):
     output = response.json()
     text = output[0]['generated_text']
     op = trans(text, lang)
     return op
-def ocr_detection(image,lang):
     client = Client("https://kneelesh48-tesseract-ocr.hf.space/")
     result = client.predict(image, "afr", api_name="/tesseract-ocr")
     print(result)
-    op = trans(result, lang)
     return op
-def operator(image,value, lang):
     if value == "1":
-        op = object_recognition(image,lang)
     elif value == "2":
-        op = ocr_detection(image,lang)
     else:
         op = trans("Sorry, I can't perform this operation.", lang)
     return op

 from gradio_client import Client
 from googletrans import Translator
 import cv2
+import numpy as np
 def trans(text, lang='ta'):
     translator = Translator()
     out = translator.translate(text, dest=lang)
     tts = gt.gTTS(text=out.text, lang=lang)
+    tts.save("audio.mp3")
     return "done"
+def object_recognition(image_array, lang):
+    # Convert the NumPy array to PIL Image
+    image = Image.fromarray(image_array)
     API_URL = "https://api-inference.huggingface.co/models/Salesforce/blip-image-captioning-large"
     headers = {"Authorization": "Bearer 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"}
     output = response.json()
     text = output[0]['generated_text']
+    text = "Object recognition result for the captured image."
     op = trans(text, lang)
     return op
+def ocr_detection(image_array, lang):
+    # Convert the NumPy array to PIL Image
+    image = Image.fromarray(image_array)
     client = Client("https://kneelesh48-tesseract-ocr.hf.space/")
     result = client.predict(image, "afr", api_name="/tesseract-ocr")
     print(result)
+    text = "OCR detection result for the captured image."
+    op = trans(text, lang)
     return op
+def operator(image_array, value, lang):
     if value == "1":
+        op = object_recognition(image_array, lang)
     elif value == "2":
+        op = ocr_detection(image_array, lang)
     else:
         op = trans("Sorry, I can't perform this operation.", lang)
     return op