Spaces:

Omnibus
/

detect-language

Runtime error

App Files Files Community

Omnibus commited on Sep 3, 2023

Commit

175a8ce

1 Parent(s): ae579d0

Create app.py

Browse files

Files changed (1) hide show

app.py +112 -0

app.py ADDED Viewed

	@@ -0,0 +1,112 @@

+import gradio as gr
+import easyocr
+ocr_id = {
+    "Afrikaans": "af",
+    "Albanian": "sq",
+    "Arabic": "ar",
+    "Azerbaijani": "az",
+    "Belarusian": "be",
+    "Bulgarian": "bg",
+    "Bengali": "bn",
+    "Bosnian": "bs",
+    "Chinese (simplified)": "ch_sim",
+    "Chinese (traditional)": "ch_tra",
+    "Croatian": "hr",
+    "Czech": "cs",
+    "Danish": "da",
+    "Dutch": "nl",
+    "English": "en",
+    "Estonian": "et",
+    "French": "fr",
+    "German": "de",
+    "Irish": "ga",
+    "Hindi": "hi",
+    "Hungarian": "hu",
+    "Indonesian": "id",
+    "Icelandic": "is",
+    "Italian": "it",
+    "Japanese": "ja",
+    "Kannada": "kn",
+    "Korean": "ko",
+    "Lithuanian": "lt",
+    "Latvian": "lv",
+    "Mongolian": "mn",
+    "Marathi": "mr",
+    "Malay": "ms",
+    "Nepali": "ne",
+    "Norwegian": "no",
+    "Occitan": "oc",
+    "Polish": "pl",
+    "Portuguese": "pt",
+    "Romanian": "ro",
+    "Russian": "ru",
+    "Serbian (cyrillic)": "rs_cyrillic",
+    "Serbian (latin)": "rs_latin",
+    "Slovak": "sk",
+    "Slovenian": "sl",
+    "Spanish": "es",
+    "Swedish": "sv",
+    "Swahili": "sw",
+    "Tamil": "ta",
+    "Thai": "th",
+    "Tagalog": "tl",
+    "Turkish": "tr",
+    "Ukrainian": "uk",
+    "Urdu": "ur",
+    "Uzbek": "uz",
+    "Vietnamese": "vi",
+    "Welsh": "cy",
+    "Zulu": "zu",
+}
+def detect_lang(img,conf,blength=200):
+    targ = 0
+    ser_len=len(ocr_id)
+    #targ =[]
+    img = Image.open(img)
+    img1 = np.array(img)
+    #keyd = ocr_id.keys()
+    numb=0
+    mylist = []
+    for key in ocr_id.keys():
+        mylist.append(key)
+    for numb, key in enumerate(mylist):
+    #for i,keyp in enumerate(keyd):
+        #keyp = keyd[key]
+        try:
+            lang=[f"{ocr_id[mylist[numb]]}"]
+            #lang=value
+            #img.thumbnail((1000,1000), Image.Resampling.LANCZOS)
+            #path = f"/tmp/{uuid.uuid4()}.jpg"
+            #img.save(path)
+            reader = easyocr.Reader(lang)
+            bounds = reader.readtext(img1)
+            print (f'{bounds[0][1]} = {bounds[0][2]}')
+            if len(bounds) > blength:
+                return print(f"Max Bounds Exceed, bounds={len(bounds)}")
+            else:
+                pass
+            if bounds[0][2] > targ:
+                targ = bounds[0][2]
+                out = (f'{keyp} = Confidence: {bounds[0][2]}')
+            #numb+=1
+            if numb>=ser_len:
+                return out
+            if targ >=75:
+                return out
+        except Exception:
+            pass
+with gr.Blocks() as app:
+    im = gr.Image(type = "filepath")
+    ocr_sens=gr.Slider(0.1, 1, step=0.05,value=0.25,label="Detect Min Confidence")
+    max_tok=gr.Number(label="Max Tokens",step=1, value=200)
+    det_btn = gr.Button()
+    det_btn.click(detect_lang,[im,ocr_sens,],det_out)
+app.launch()