Spaces:

DebasishDhal99
/

all-in-one-translation

Running

DebasishDhal99 commited on Feb 2

Commit

7dbc3ec

1 Parent(s): 0fb7c05

Add target lang option for image

Files changed (2) hide show

app.py CHANGED Viewed

@@ -40,13 +40,17 @@ image_interface = gr.Interface(
     inputs=[
         gr.Image(label="Upload an Image", type="filepath"),
         gr.Dropdown(choices=sorted_languages,
-                    label="Select Language",
-                    # default='English'
-                   )
     ],
     outputs=[
         gr.Textbox(label="Image Text"),
-        gr.Textbox(label="Translated Text")
     ],
     title="Image Text Extractor and Translator",
     description=description_image,

     inputs=[
         gr.Image(label="Upload an Image", type="filepath"),
         gr.Dropdown(choices=sorted_languages,
+                    label="Select Image Text Language",
+                   ),
+        gr.Dropdown(
+            choices=language_list,
+            label="Select Target Language",
+            interactive=True
+        )
     ],
     outputs=[
         gr.Textbox(label="Image Text"),
+        gr.Textbox(label="Translated Text"),
     ],
     title="Image Text Extractor and Translator",
     description=description_image,

backend/image_to_tgt.py CHANGED Viewed

@@ -5,7 +5,11 @@
 from deep_translator import GoogleTranslator
 import pytesseract
-language_dict = {'English': 'eng', 'French': 'fra', 'Odia': 'ori', 'Hindi': 'hin',
                  'Bengali': 'ben', 'Telugu': 'tel', 'Hindi': 'hin', 'Malayalam': 'mal',
                  'Kannada': 'kan', 'Tamil': 'tam', 'Marathi': 'mar', 'Gujarati': 'guj',
                  'Punjabi': 'pan', 'Sinhalese': 'sin',
@@ -14,8 +18,9 @@ language_dict = {'English': 'eng', 'French': 'fra', 'Odia': 'ori', 'Hindi': 'hin
                  'Persian': 'fas', 'Chinese Simplified': 'chi_sim', 'Chinese Traditional': 'chi_tra',
                  }
-def src_image_to_eng_translator(input_image, lang = 'eng'):
-    image_text = pytesseract.image_to_string(input_image, lang = language_dict.get(lang, 'eng'))
-    translated = GoogleTranslator(source='auto', target='en').translate(image_text)
     return image_text, translated

 from deep_translator import GoogleTranslator
 import pytesseract
+available_languages = GoogleTranslator().get_supported_languages(as_dict=True)
+formatted_languages = {key.title(): value for key, value in available_languages.items()}
+formatted_codes = {value: key.title() for key, value in available_languages.items()}
+pytesseract_language_dict = {'English': 'eng', 'French': 'fra', 'Odia': 'ori', 'Hindi': 'hin',
                  'Bengali': 'ben', 'Telugu': 'tel', 'Hindi': 'hin', 'Malayalam': 'mal',
                  'Kannada': 'kan', 'Tamil': 'tam', 'Marathi': 'mar', 'Gujarati': 'guj',
                  'Punjabi': 'pan', 'Sinhalese': 'sin',
                  'Persian': 'fas', 'Chinese Simplified': 'chi_sim', 'Chinese Traditional': 'chi_tra',
                  }
+def src_image_to_eng_translator(input_image, image_lang = 'eng', target_lang = 'English'):
+    image_text = pytesseract.image_to_string(input_image, lang = pytesseract_language_dict.get(image_lang, 'eng'))
+    target_lang_code = formatted_languages.get(target_lang, 'en')
+    translated = GoogleTranslator(source='auto', target=target_lang_code).translate(image_text)
     return image_text, translated