Spaces:

Mufintech
/

RealTime_Translation

Runtime error

MufinApps commited on Dec 6, 2023

Commit

d6b20a1

1 Parent(s): 1d13d55

increase accuracy

Files changed (2) hide show

__pycache__/transcription_service.cpython-311.pyc CHANGED Viewed

Binary files a/__pycache__/transcription_service.cpython-311.pyc and b/__pycache__/transcription_service.cpython-311.pyc differ

transcription_service.py CHANGED Viewed

@@ -1,10 +1,16 @@
 import os
 from google.cloud import speech
 from openai import OpenAI
 os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = 'msq-ai-78bdccb055f4.json'
 def transcribe_speech_local(wav_file,language):
     """
     Transcribes a local WAV file using Google's Speech-to-Text API.
     """
@@ -15,7 +21,8 @@ def transcribe_speech_local(wav_file,language):
     audio = speech.RecognitionAudio(content=content)
     config = speech.RecognitionConfig(
-        # encoding=speech.RecognitionConfig.AudioEncoding.LINEAR16,
       # Adjust this according to your file's sample rate
         language_code=language,
         enable_automatic_punctuation=True

 import os
 from google.cloud import speech
 from openai import OpenAI
+import subprocess
 os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = 'msq-ai-78bdccb055f4.json'
+convert_wav_to_flac = lambda wav_file: subprocess.run(['ffmpeg', '-i', wav_file, '-y', '-ar', '16000', '-ac', '1', wav_file.replace('.wav', '.flac')], stdout=subprocess.PIPE, stderr=subprocess.PIPE)
 def transcribe_speech_local(wav_file,language):
     """
     Transcribes a local WAV file using Google's Speech-to-Text API.
     """
     audio = speech.RecognitionAudio(content=content)
     config = speech.RecognitionConfig(
+        encoding=speech.RecognitionConfig.AudioEncoding.LINEAR16,
       # Adjust this according to your file's sample rate
         language_code=language,
         enable_automatic_punctuation=True