Spaces:

Banafo
/

Kroko-Streaming-ASR-Python

Runtime error

Banafo commited on Jan 31, 2025

Commit

dcdecd0

verified ·

1 Parent(s): 4713af7

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -26,6 +26,16 @@ recognizer_fr = OnlineRecognizer.from_transducer(
     debug=False
 )
 def transcribe_audio_online_streaming(file, language):
     """Generator for file transcription"""
     if file is None:
@@ -38,6 +48,8 @@ def transcribe_audio_online_streaming(file, language):
                 recognizer = recognizer_en
             case "French":
                 recognizer = recognizer_fr
         waveform, sample_rate = torchaudio.load(file.name)
         if sample_rate != 16000:
@@ -84,6 +96,8 @@ def transcribe_microphone_stream(audio_chunk, stream_state, language):
                 recognizer = recognizer_en
             case "French":
                 recognizer = recognizer_fr
         if audio_chunk is None:  # End of stream
             if stream_state is not None:
@@ -129,7 +143,7 @@ def transcribe_microphone_stream(audio_chunk, stream_state, language):
 def create_app():
     with gr.Blocks() as app:
         gr.Markdown("# Real-time Speech Recognition")
-        language_choice = gr.Radio(choices=["English", "French"], label="Select Language", value="English")
         with gr.Tabs():
             with gr.Tab("File Transcription"):

     debug=False
 )
+recognizer_de = OnlineRecognizer.from_transducer(
+    tokens="de_tokens.txt",
+    encoder="de_encoder.onnx",
+    decoder="de_decoder.onnx",
+    joiner="de_joiner.onnx",
+    num_threads=1,
+    decoding_method="modified_beam_search",
+    debug=False
+)
 def transcribe_audio_online_streaming(file, language):
     """Generator for file transcription"""
     if file is None:
                 recognizer = recognizer_en
             case "French":
                 recognizer = recognizer_fr
+            case "German":
+                recognizer = recognizer_de
         waveform, sample_rate = torchaudio.load(file.name)
         if sample_rate != 16000:
                 recognizer = recognizer_en
             case "French":
                 recognizer = recognizer_fr
+            case "German":
+                recognizer = recognizer_de
         if audio_chunk is None:  # End of stream
             if stream_state is not None:
 def create_app():
     with gr.Blocks() as app:
         gr.Markdown("# Real-time Speech Recognition")
+        language_choice = gr.Radio(choices=["English", "French", "German"], label="Select Language", value="English")
         with gr.Tabs():
             with gr.Tab("File Transcription"):