Spaces:

mrnoisette
/

teste

Sleeping

mrnoisette commited on Sep 18, 2024

Commit

9facbcc

verified ·

1 Parent(s): 9a38ef0

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -16,15 +16,20 @@ FLUX1_APIKEY = os.getenv('FLUX1_APIKEY')
 # LLM
 GEMINI_APIKEY = os.getenv('GEMINI_APIKEY')
 # Modèle Whisper pour la transcription audio
-WHISPER_MODEL_URL = "https://api-inference.huggingface.co/models/openai/whisper-large-v3"
-WHISPER_MODEL = InferenceClient(api_url=WHISPER_MODEL_URL, token=os.getenv('HUGGINGFACE_API_KEY'))
-def speech_to_text(audio):
-    audio_data = AudioSegment.from_file(audio)
-    audio_bytes = io.BytesIO()
-    audio_data.export(audio_bytes, format="wav")
-    response = WHISPER_MODEL.call({"inputs": audio_bytes.getvalue()})
-    return response['text']
 def GenerateTextLLM(inputText):
     url = f'https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash-latest:generateContent?key={GEMINI_APIKEY}'
@@ -64,7 +69,7 @@ def Main(text_input, audio_input):
     if text_input:
         input_data = text_input
     elif audio_input:
-        input_data = speech_to_text(audio_input)
     else:
         return "Veuillez fournir un texte ou un fichier audio", None

 # LLM
 GEMINI_APIKEY = os.getenv('GEMINI_APIKEY')
 # Modèle Whisper pour la transcription audio
+WHISPER_APIKEY = os.getenv('WHISPER_APIKEY')
+def TranscribeAudio(inputAudio):
+    API_URL = "https://api-inference.huggingface.co/models/openai/whisper-large-v3"
+    headers = {"Authorization": f"Bearer {WHISPER_APIKEY}"}
+    def query(filename):
+        with open(filename, "rb") as f:
+            data = f.read()
+        response = requests.post(API_URL, headers=headers, data=data)
+        return response.json()
+    output = query("sample1.flac")
 def GenerateTextLLM(inputText):
     url = f'https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash-latest:generateContent?key={GEMINI_APIKEY}'
     if text_input:
         input_data = text_input
     elif audio_input:
+        input_data = TranscribeAudio(audio_input)
     else:
         return "Veuillez fournir un texte ou un fichier audio", None