Spaces:

ImPolymath
/

demorrha

Paused

App Files Files Community

rick commited on Sep 29, 2024

Commit

1014150

unverified ·

1 Parent(s): 3a7fabd

update UI/UX...

Browse files

Files changed (1) hide show

app.py +55 -40

app.py CHANGED Viewed

@@ -144,32 +144,38 @@ def transcribe_audio(audio_file: IO, language: Optional[str] = None) -> str:
     file_size_mb = os.path.getsize(audio_file.name) / (1024 * 1024)
     try:
-        if file_size_mb > max_size_mb:
-            segments = split_audio(audio_file.name, max_size_mb)
-            full_transcript = ""
-            for segment in segments:
-                with open(segment, "rb") as audio_segment:
                     transcript = client.audio.transcriptions.create(
                         model="whisper-1",
-                        file=audio_segment,
                         language=language
                     )
-                    full_transcript += f"{transcript.text} "
-                os.unlink(segment)  # Supprime le fichier temporaire
-            return full_transcript.strip()
-        else:
-            with open(audio_file.name, "rb") as audio_file:
-                transcript = client.audio.transcriptions.create(
-                    model="whisper-1",
-                    file=audio_file,
-                    language=language
-                )
-            return transcript.text
     except IOError as e:
-        print(f"Erreur d'entrée/sortie lors de la transcription : {e}")
         return ""
     except client.APIError as e:
-        print(f"Erreur API lors de la transcription : {e}")
         return ""
 # Fonction pour détecter la langue d'un texte donné
@@ -343,32 +349,41 @@ def process_message(
     with st.chat_message("assistant", avatar="👻"):
         message_placeholder = st.empty()
         full_response = ""
-        try:
-            for response in client.chat.completions.create(
-                    model="gpt-4o-mini",
-                    messages=st.session_state.messages,
-                    stream=True,
-                    temperature=0.1):
-                full_response += (response.choices[0].delta.content or "")
-                message_placeholder.markdown(full_response + "▌")
-            # Utiliser regex pour supprimer les trois premiers et derniers guillemets doubles
-            full_response = re.sub(r'^"{3}|"{3}$', '', full_response.strip())
-            message_placeholder.markdown(full_response)
-        except Exception as e:
-            st.error(f"Une erreur s'est produite lors de la génération de la réponse : {e}")
-            return None, None
     st.session_state.messages.append(
         {"role": "assistant", "content": full_response}
     )
     if tts_enabled:
-        try:
-            tts_audio, tts_duration = text_to_speech(full_response)
-            return tts_audio, tts_duration
-        except Exception as e:
-            st.error(f"Une erreur s'est produite lors de la conversion texte-parole : {e}")
-            return None, None
     return None, None
 class GlobalSystemPrompts:
@@ -608,7 +623,7 @@ def main():
                 )
                 st.write(get_translation("langue_detectee").format(st.session_state.language_detected))
-            st.write(get_translation("transcription").format(transcription))
             audio_list = []
             for cursor_selected_lang in st.session_state.selected_languages:

     file_size_mb = os.path.getsize(audio_file.name) / (1024 * 1024)
     try:
+        with st.status("Transcription de l'audio en cours...") as status:
+            if file_size_mb > max_size_mb:
+                status.update(label="Découpage de l'audio en segments...")
+                segments = split_audio(audio_file.name, max_size_mb)
+                full_transcript = ""
+                for i, segment in enumerate(segments):
+                    status.update(label=f"Transcription du segment {i+1}/{len(segments)}...")
+                    with open(segment, "rb") as audio_segment:
+                        transcript = client.audio.transcriptions.create(
+                            model="whisper-1",
+                            file=audio_segment,
+                            language=language
+                        )
+                        full_transcript += f"{transcript.text} "
+                    os.unlink(segment)  # Supprime le fichier temporaire
+                status.update(label="Transcription terminée", state="complete")
+                return full_transcript.strip()
+            else:
+                status.update(label="Transcription de l'audio...")
+                with open(audio_file.name, "rb") as audio_file:
                     transcript = client.audio.transcriptions.create(
                         model="whisper-1",
+                        file=audio_file,
                         language=language
                     )
+                status.update(label="Transcription terminée", state="complete")
+                return transcript.text
     except IOError as e:
+        st.error(f"Erreur d'entrée/sortie lors de la transcription : {e}")
         return ""
     except client.APIError as e:
+        st.error(f"Erreur API lors de la transcription : {e}")
         return ""
 # Fonction pour détecter la langue d'un texte donné
     with st.chat_message("assistant", avatar="👻"):
         message_placeholder = st.empty()
         full_response = ""
+        with st.status("Traitement en cours...", expanded=True) as status:
+            status.update(label="Génération de la réponse", state="running", expanded=True)
+            try:
+                for response in client.chat.completions.create(
+                        model="gpt-4o-mini",
+                        messages=st.session_state.messages,
+                        stream=True,
+                        temperature=0.1):
+                    full_response += (response.choices[0].delta.content or "")
+                    message_placeholder.markdown(full_response + "▌")
+                # Utiliser regex pour supprimer les trois premiers et derniers guillemets doubles
+                full_response = re.sub(r'^"{3}|"{3}$', '', full_response.strip())
+                message_placeholder.markdown(full_response)
+                status.update(label="Réponse générée avec succès", state="complete")
+            except Exception as e:
+                st.error(f"Une erreur s'est produite lors de la génération de la réponse : {e}")
+                status.update(label="Erreur lors de la génération de la réponse", state="error")
+                return None, None
     st.session_state.messages.append(
         {"role": "assistant", "content": full_response}
     )
     if tts_enabled:
+        with st.status("Conversion texte-parole en cours...", expanded=True) as status:
+            status.update(label="Conversion texte-parole", state="running", expanded=True)
+            try:
+                tts_audio, tts_duration = text_to_speech(full_response)
+                status.update(label="Conversion texte-parole réussie", state="complete")
+                return tts_audio, tts_duration
+            except Exception as e:
+                st.error(f"Une erreur s'est produite lors de la conversion texte-parole : {e}")
+                status.update(label="Erreur lors de la conversion texte-parole", state="error")
+                return None, None
     return None, None
 class GlobalSystemPrompts:
                 )
                 st.write(get_translation("langue_detectee").format(st.session_state.language_detected))
+            #st.write(get_translation("transcription").format(transcription))
             audio_list = []
             for cursor_selected_lang in st.session_state.selected_languages: