Spaces:

cdactvm
/

demoASR

Sleeping

App Files Files Community

cdactvm commited on Aug 20, 2024

Commit

ad35cd7

verified ·

1 Parent(s): 4167320

Update app.py

Browse files

Files changed (1) hide show

app.py +31 -5

app.py CHANGED Viewed

@@ -13,6 +13,7 @@ import re
 #p1 = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-2.0-odia_v1")
 #odia_model2 = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-odia_v1")
 p2 = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-2.0-hindi_v1")
 punjaib_modle_155750=pipeline(task="automatic-speech-recognition", model="cdactvm/wav2vec-bert-punjabi-155750-model")
 punjaib_modle_75000=pipeline(task="automatic-speech-recognition", model="cdactvm/wav2vec-bert-punjabi-75000-model")
 #p3 = pipeline(task="automatic-speech-recognition", model="cdactvm/kannada_w2v-bert_model")
@@ -267,7 +268,7 @@ def process_transcription(input_sentence):
 ###########################################
 def transcribe_punjabi_30000(speech):
-    text = punjaib_modle_155750(speech)["text"]
     text = text.replace("[PAD]","")
     if text is None:
         return "Error: ASR returned None"
@@ -275,7 +276,7 @@ def transcribe_punjabi_30000(speech):
 def transcribe_punjabi_eng_model_30000(speech):
     trn = Transliterator(source='pan', target='eng', build_lookup=True)
-    text = punjaib_modle_155750(speech)["text"]
     text = text.replace("[PAD]","")
     if text is None:
         return "Error: ASR returned None"
@@ -288,7 +289,7 @@ def transcribe_punjabi_eng_model_30000(speech):
     return sentence
 def transcribe_punjabi_75000(speech):
-    text = punjaib_modle_30000(speech)["text"]
     text = text.replace("[PAD]","")
     if text is None:
         return "Error: ASR returned None"
@@ -296,7 +297,7 @@ def transcribe_punjabi_75000(speech):
 def transcribe_punjabi_eng_model_75000(speech):
     trn = Transliterator(source='pan', target='eng', build_lookup=True)
-    text = punjaib_modle_30000(speech)["text"]
     text = text.replace("[PAD]","")
     if text is None:
         return "Error: ASR returned None"
@@ -308,6 +309,27 @@ def transcribe_punjabi_eng_model_75000(speech):
     return process_transcription(processed_sentence)
     return sentence
 ###########################################
 def transcribe_odiya(speech):
     text = p1(speech)["text"]
@@ -542,6 +564,10 @@ def sel_lng(lng, mic=None, file=None):
        return transcribe_punjabi_75000(audio)
     elif lng == "Punjabi_Model2_Trans":
        return transcribe_punjabi_eng_model_75000(audio)
@@ -579,7 +605,7 @@ demo=gr.Interface(
             # "Hindi","Hindi-trans",
             # "Odiya","Odiya-trans","Odia_model2","Odia_trans_model2",
             # "Assamese-LM","Assamese-Model2",
-            "Punjabi_Model1","Punjabi_Model1_Trans","Punjabi_Model2","Punjabi_Model2_Trans"],value="Hindi",label="Select Language"),
         gr.Audio(sources=["microphone","upload"], type="filepath"),
         #gr.Audio(sources="upload", type="filepath"),
         #"state"

 #p1 = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-2.0-odia_v1")
 #odia_model2 = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-odia_v1")
 p2 = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-2.0-hindi_v1")
+punjaib_modle_30000=pipeline(task="automatic-speech-recognition", model="cdactvm/wav2vec-bert-punjabi-30000-model")
 punjaib_modle_155750=pipeline(task="automatic-speech-recognition", model="cdactvm/wav2vec-bert-punjabi-155750-model")
 punjaib_modle_75000=pipeline(task="automatic-speech-recognition", model="cdactvm/wav2vec-bert-punjabi-75000-model")
 #p3 = pipeline(task="automatic-speech-recognition", model="cdactvm/kannada_w2v-bert_model")
 ###########################################
 def transcribe_punjabi_30000(speech):
+    text = punjaib_modle_30000(speech)["text"]
     text = text.replace("[PAD]","")
     if text is None:
         return "Error: ASR returned None"
 def transcribe_punjabi_eng_model_30000(speech):
     trn = Transliterator(source='pan', target='eng', build_lookup=True)
+    text = punjaib_modle_30000(speech)["text"]
     text = text.replace("[PAD]","")
     if text is None:
         return "Error: ASR returned None"
     return sentence
 def transcribe_punjabi_75000(speech):
+    text = punjaib_modle_75000(speech)["text"]
     text = text.replace("[PAD]","")
     if text is None:
         return "Error: ASR returned None"
 def transcribe_punjabi_eng_model_75000(speech):
     trn = Transliterator(source='pan', target='eng', build_lookup=True)
+    text = punjaib_modle_75000(speech)["text"]
     text = text.replace("[PAD]","")
     if text is None:
         return "Error: ASR returned None"
     return process_transcription(processed_sentence)
     return sentence
+def transcribe_punjabi_155750(speech):
+    text = punjaib_modle_155750(speech)["text"]
+    text = text.replace("[PAD]","")
+    if text is None:
+        return "Error: ASR returned None"
+    return text
+def transcribe_punjabi_eng_model_155750(speech):
+    trn = Transliterator(source='pan', target='eng', build_lookup=True)
+    text = punjaib_modle_155750(speech)["text"]
+    text = text.replace("[PAD]","")
+    if text is None:
+        return "Error: ASR returned None"
+    sentence = trn.transform(text)
+    if sentence is None:
+        return "Error: Transliteration returned None"
+    replaced_words = replace_words(sentence)
+    processed_sentence = process_doubles(replaced_words)
+    return process_transcription(processed_sentence)
+    return sentence
 ###########################################
 def transcribe_odiya(speech):
     text = p1(speech)["text"]
        return transcribe_punjabi_75000(audio)
     elif lng == "Punjabi_Model2_Trans":
        return transcribe_punjabi_eng_model_75000(audio)
+    elif lng == "Punjabi_Model3":
+       return transcribe_punjabi_155750(audio)
+    elif lng == "Punjabi_Model3_Trans":
+       return transcribe_punjabi_eng_model_155750(audio)
             # "Hindi","Hindi-trans",
             # "Odiya","Odiya-trans","Odia_model2","Odia_trans_model2",
             # "Assamese-LM","Assamese-Model2",
+            "Punjabi_Model1","Punjabi_Model1_Trans","Punjabi_Model2","Punjabi_Model2_Trans","Punjabi_Model3","Punjabi_Model3_Trans"],value="Hindi",label="Select Language"),
         gr.Audio(sources=["microphone","upload"], type="filepath"),
         #gr.Audio(sources="upload", type="filepath"),
         #"state"