detect-language-ocr

Runtime error

App Files Files Community

Omnibus commited on Sep 3, 2023

Commit

88aa1ab

1 Parent(s): bf0c0c7

Update app.py

Browse files

Files changed (1) hide show

app.py +60 -1

app.py CHANGED Viewed

@@ -2,9 +2,68 @@ import gradio as gr
 import easyocr
 import numpy as np
 from PIL import Image
 def detect_lang_ocr(img,lang):
     try:
         reader = easyocr.Reader(lang)
         bounds = reader.readtext(img)
         tot_b = len(bounds)
@@ -24,7 +83,7 @@ with gr.Blocks() as app:
     im = gr.Image(type = "filepath")
     ocr_sens=gr.Slider(0.1, 1, step=0.05,value=0.25,label="Detect Min Confidence")
-    lang = gr.Textbox(visible=False)
     max_tok=gr.Number(label="Max Tokens",step=1, value=200)
     det_btn = gr.Button()
     det_out = gr.Textbox()

 import easyocr
 import numpy as np
 from PIL import Image
+ocr_id = {
+    "Afrikaans": "af",
+    "Albanian": "sq",
+    "Arabic": "ar",
+    "Azerbaijani": "az",
+    "Belarusian": "be",
+    "Bulgarian": "bg",
+    "Bengali": "bn",
+    "Bosnian": "bs",
+    "Chinese (simplified)": "ch_sim",
+    "Chinese (traditional)": "ch_tra",
+    "Croatian": "hr",
+    "Czech": "cs",
+    "Danish": "da",
+    "Dutch": "nl",
+    "English": "en",
+    "Estonian": "et",
+    "French": "fr",
+    "German": "de",
+    "Irish": "ga",
+    "Hindi": "hi",
+    "Hungarian": "hu",
+    "Indonesian": "id",
+    "Icelandic": "is",
+    "Italian": "it",
+    "Japanese": "ja",
+    "Kannada": "kn",
+    "Korean": "ko",
+    "Lithuanian": "lt",
+    "Latvian": "lv",
+    "Mongolian": "mn",
+    "Marathi": "mr",
+    "Malay": "ms",
+    "Nepali": "ne",
+    "Norwegian": "no",
+    "Occitan": "oc",
+    "Polish": "pl",
+    "Portuguese": "pt",
+    "Romanian": "ro",
+    "Russian": "ru",
+    "Serbian (cyrillic)": "rs_cyrillic",
+    "Serbian (latin)": "rs_latin",
+    "Slovak": "sk",
+    "Slovenian": "sl",
+    "Spanish": "es",
+    "Swedish": "sv",
+    "Swahili": "sw",
+    "Tamil": "ta",
+    "Thai": "th",
+    "Tagalog": "tl",
+    "Turkish": "tr",
+    "Ukrainian": "uk",
+    "Urdu": "ur",
+    "Uzbek": "uz",
+    "Vietnamese": "vi",
+    "Welsh": "cy",
+    "Zulu": "zu",
+}
 def detect_lang_ocr(img,lang):
     try:
+        lang  = [f'{lang}']
         reader = easyocr.Reader(lang)
         bounds = reader.readtext(img)
         tot_b = len(bounds)
     im = gr.Image(type = "filepath")
     ocr_sens=gr.Slider(0.1, 1, step=0.05,value=0.25,label="Detect Min Confidence")
+    lang = gr.Textbox(visible=True)
     max_tok=gr.Number(label="Max Tokens",step=1, value=200)
     det_btn = gr.Button()
     det_out = gr.Textbox()