Spaces:

Dionyssos
/

speech-analysis2

Running

App Files Files Community

Dionyssos commited on Sep 23

Commit

38c5196

1 Parent(s): 18fcbae

transcyril diphones fx

Browse files

Files changed (2) hide show

app.py +3 -3
textual.py +30 -14

app.py CHANGED Viewed

@@ -262,9 +262,9 @@ with gr.Blocks() as demo:
             value='Η γρηγορη καφετι αλεπου πειδαει πανω απο τον τεμπελη σκυλο.',
         )
         choice_dropdown = gr.Dropdown(
-            choices=VOICES + language_names,
             label="Vox :",
-            value=VOICES[0]
         )
         soundscape_input = gr.Textbox(
             lines=1,
@@ -272,7 +272,7 @@ with gr.Blocks() as demo:
             label="AudioGen Txt:"
         )
         kv_input = gr.Number(
-            label="Tokens",
             value=24,
         )
         generate_button = gr.Button("Generate Audio", variant="primary")

             value='Η γρηγορη καφετι αλεπου πειδαει πανω απο τον τεμπελη σκυλο.',
         )
         choice_dropdown = gr.Dropdown(
+            choices=language_names + VOICES,
             label="Vox :",
+            value=language_names[0], #VOICES[0]
         )
         soundscape_input = gr.Textbox(
             lines=1,
             label="AudioGen Txt:"
         )
         kv_input = gr.Number(
+            label="Tokens:",
             value=24,
         )
         generate_button = gr.Button("Generate Audio", variant="primary")

textual.py CHANGED Viewed

@@ -36,25 +36,41 @@ def only_greek_or_only_latin(text, lang='grc'):
     }
     cyrillic_to_latin_map = {
-        'а': 'a', 'б': 'b', 'в': 'v', 'г': 'g', 'д': 'd', 'е': 'e', 'ё': 'yo', 'ж': 'zh',
-        'з': 'z', 'и': 'i', 'й': 'y', 'к': 'k', 'л': 'l', 'м': 'm', 'н': 'n', 'о': 'o',
-        'п': 'p', 'р': 'r', 'с': 's', 'т': 't', 'у': 'u', 'ф': 'f', 'х': 'kh', 'ц': 'ts',
-        'ч': 'ch', 'ш': 'sh', 'щ': 'shch', 'ъ': '', 'ы': 'y', 'ь': '', 'э': 'e', 'ю': 'yu',
-        'я': 'ya',
     }
-    # Direct Cyrillic to Greek mapping based on phonetic similarity.
-    # These are approximations and may not be universally accepted transliterations.
     cyrillic_to_greek_map = {
-        'а': 'α', 'б': 'β', 'в': 'β', 'г': 'γ', 'д': 'δ', 'е': 'ε', 'ё': 'ιο', 'ж': 'ζ',
-        'з': 'ζ', 'и': 'ι', 'й': 'ι', 'κ': 'κ', 'λ': 'λ', 'м': 'μ', 'н': 'ν', 'о': 'ο',
-        'π': 'π', 'ρ': 'ρ', 'σ': 'σ', 'τ': 'τ', 'у': 'ου', 'ф': 'φ', 'х': 'χ', 'ц': 'τσ',
-        'ч': 'τσ', # or τζ depending on desired sound
-        'ш': 'σ', 'щ': 'σ', # approximations
-        'ъ': '', 'ы': 'ι', 'ь': '', 'э': 'ε', 'ю': 'ιου',
-        'я': 'ια',
     }
     # Convert the input text to lowercase, preserving accents for Latin characters.
     # casefold() is used for more robust caseless matching across Unicode characters.
     lowercased_text = text.lower()  #casefold()

     }
     cyrillic_to_latin_map = {
+        # 'а': 'a', 'б': 'b', 'в': 'v', 'г': 'g', 'д': 'd', 'е': 'e', 'ё': 'yo', 'ж': 'zh',
+        # 'з': 'z', 'и': 'i', 'й': 'y', 'к': 'k', 'л': 'l', 'м': 'm', 'н': 'n', 'о': 'o',
+        # 'п': 'p', 'р': 'r', 'с': 's', 'т': 't', 'у': 'u', 'ф': 'f', 'х': 'kh', 'ц': 'ts',
+        # 'ч': 'ch', 'ш': 'sh', 'щ': 'shch', 'ъ': '', 'ы': 'y', 'ь': '', 'э': 'e', 'ю': 'yu',
+        # 'я': 'ya',
+        # ----------------
+        'а': 'a', 'б': 'b', 'в': 'v', 'г': 'g', 'д': 'd', 'е': 'e', 'ж': 'zh',
+        'з': 'z', 'и': 'i', 'ј': 'j', 'к': 'k', 'л': 'l', 'м': 'm', 'н': 'n',
+        'о': 'o', 'п': 'p', 'р': 'r', 'с': 's', 'т': 't', 'у': 'u', 'ф': 'f',
+        'х': 'h', 'ц': 'c', 'ч': 'č', 'ш': 'š',
+        'ђ': 'đ', 'љ': 'lj', 'њ': 'nj', 'ћ': 'ć', 'џ': 'dž',
+        'ё': 'yo', 'й': 'y', 'щ': 'shch', 'ъ': '', 'ы': 'y', 'ь': '',
+        'э': 'e', 'ю': 'io', 'я': 'ia',
+        'ѓ': 'y', 'ѕ': 's', 'ќ': 'k',
     }
+    # Cyrillic to Greek on phonetic similarity.
     cyrillic_to_greek_map = {
+        # 'а': 'α', 'б': 'β', 'в': 'β', 'г': 'γ', 'д': 'δ', 'е': 'ε', 'ё': 'ιο', 'ж': 'ζ',
+        # 'з': 'ζ', 'и': 'ι', 'й': 'ι', 'κ': 'κ', 'λ': 'λ', 'м': 'μ', 'н': 'ν', 'о': 'ο',
+        # 'π': 'π', 'ρ': 'ρ', 'σ': 'σ', 'τ': 'τ', 'у': 'ου', 'ф': 'φ', 'х': 'χ', 'ц': 'τσ',
+        # 'ч': 'τσ', # or τζ depending on desired sound
+        # 'ш': 'σ', 'щ': 'σ', # approximations
+        # 'ъ': '', 'ы': 'ι', 'ь': '', 'э': 'ε', 'ю': 'ιου',
+        # 'я': 'ια',
+        # --------------------
+        'а': 'α', 'б': 'μπ', 'в': 'β', 'г': 'γ', 'д': 'ντ', 'е': 'ε',
+        'ё': 'γιο', 'ж': 'ζ', 'з': 'ζ', 'и': 'ι', 'й': 'γι', 'к': 'κ',
+        'л': 'λ', 'м': 'μ', 'н': 'ν', 'о': 'ο', 'п': 'π', 'р': 'ρ',
+        'с': 'σ', 'т': 'τ', 'у': 'ου', 'ф': 'φ', 'х': 'χ', 'ц': 'τσ',
+        'ч': 'τσ', 'ш': 'σ', 'щ': 'στς', 'ъ': '', 'ы': 'ι', 'ь': '',
+        'э': 'ε', 'ю': 'γιου', 'я': 'για'
     }
     # Convert the input text to lowercase, preserving accents for Latin characters.
     # casefold() is used for more robust caseless matching across Unicode characters.
     lowercased_text = text.lower()  #casefold()