Spaces:

cdactvm
/

demoASR

Sleeping

App Files Files Community

cdactvm commited on Aug 14, 2024

Commit

c577130

verified ·

1 Parent(s): ad0cb10

Update app.py

Browse files

Files changed (1) hide show

app.py +33 -3

app.py CHANGED Viewed

@@ -14,6 +14,7 @@ p1 = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-2.0-o
 odia_model2 = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-odia_v1")
 p2 = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-2.0-hindi_v1")
 punjaib_modle_30000=pipeline(task="automatic-speech-recognition", model="cdactvm/wav2vec-bert-punjabi-30000-model")
 #p3 = pipeline(task="automatic-speech-recognition", model="cdactvm/kannada_w2v-bert_model")
 #p4 = pipeline(task="automatic-speech-recognition", model="cdactvm/telugu_w2v-bert_model")
 #p5 = pipeline(task="automatic-speech-recognition", model="Sajjo/w2v-bert-2.0-bangala-gpu-CV16.0_v2")
@@ -286,6 +287,27 @@ def transcribe_punjabi_eng_model_30000(speech):
     return process_transcription(processed_sentence)
     return sentence
 ###########################################
 def transcribe_odiya(speech):
     text = p1(speech)["text"]
@@ -512,10 +534,14 @@ def sel_lng(lng, mic=None, file=None):
        return transcribe_odiya_model2(audio)
     elif lng == "Odia_trans_model2":
        return transcribe_odiya_eng_model2(audio)
-    elif lng == "punjabi":
        return transcribe_punjabi_30000(audio)
-    elif lng == "punjabi_trans":
        return transcribe_punjabi_eng_model_30000(audio)
@@ -549,7 +575,11 @@ demo=gr.Interface(
     inputs=[
         #gr.Dropdown(["Hindi","Hindi-trans","Odiya","Odiya-trans","Kannada","Kannada-trans","Telugu","Telugu-trans","Bangala","Bangala-trans"],value="Hindi",label="Select Language"),
-        gr.Dropdown(["Hindi","Hindi-trans","Odiya","Odiya-trans","Odia_model2","Odia_trans_model2","Assamese-LM","Assamese-Model2","punjabi","punjabi_trans"],value="Hindi",label="Select Language"),
         gr.Audio(sources=["microphone","upload"], type="filepath"),
         #gr.Audio(sources="upload", type="filepath"),
         #"state"

 odia_model2 = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-odia_v1")
 p2 = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-2.0-hindi_v1")
 punjaib_modle_30000=pipeline(task="automatic-speech-recognition", model="cdactvm/wav2vec-bert-punjabi-30000-model")
+punjaib_modle_75000=pipeline(task="automatic-speech-recognition", model="cdactvm/wav2vec-bert-punjabi-75000-model")
 #p3 = pipeline(task="automatic-speech-recognition", model="cdactvm/kannada_w2v-bert_model")
 #p4 = pipeline(task="automatic-speech-recognition", model="cdactvm/telugu_w2v-bert_model")
 #p5 = pipeline(task="automatic-speech-recognition", model="Sajjo/w2v-bert-2.0-bangala-gpu-CV16.0_v2")
     return process_transcription(processed_sentence)
     return sentence
+def transcribe_punjabi_75000(speech):
+    text = punjaib_modle_30000(speech)["text"]
+    text = text.replace("[PAD]","")
+    if text is None:
+        return "Error: ASR returned None"
+    return text
+def transcribe_punjabi_eng_model_75000(speech):
+    trn = Transliterator(source='pan', target='eng', build_lookup=True)
+    text = punjaib_modle_30000(speech)["text"]
+    text = text.replace("[PAD]","")
+    if text is None:
+        return "Error: ASR returned None"
+    sentence = trn.transform(text)
+    if sentence is None:
+        return "Error: Transliteration returned None"
+    replaced_words = replace_words(sentence)
+    processed_sentence = process_doubles(replaced_words)
+    return process_transcription(processed_sentence)
+    return sentence
 ###########################################
 def transcribe_odiya(speech):
     text = p1(speech)["text"]
        return transcribe_odiya_model2(audio)
     elif lng == "Odia_trans_model2":
        return transcribe_odiya_eng_model2(audio)
+    elif lng == "punjabi_30000":
        return transcribe_punjabi_30000(audio)
+    elif lng == "punjabi_trans_30000":
        return transcribe_punjabi_eng_model_30000(audio)
+    elif lng == "punjabi_75000":
+       return transcribe_punjabi_75000(audio)
+    elif lng == "punjabi_trans_75000":
+       return transcribe_punjabi_eng_model_75000(audio)
     inputs=[
         #gr.Dropdown(["Hindi","Hindi-trans","Odiya","Odiya-trans","Kannada","Kannada-trans","Telugu","Telugu-trans","Bangala","Bangala-trans"],value="Hindi",label="Select Language"),
+        gr.Dropdown([
+            # "Hindi","Hindi-trans",
+            # "Odiya","Odiya-trans","Odia_model2","Odia_trans_model2",
+            # "Assamese-LM","Assamese-Model2",
+            "punjabi_30000","punjabi_trans_30000","punjabi_75000","punjabi_trans_75000"],value="Hindi",label="Select Language"),
         gr.Audio(sources=["microphone","upload"], type="filepath"),
         #gr.Audio(sources="upload", type="filepath"),
         #"state"