Spaces:

ImPolymath
/

demorrha

Paused

App Files Files Community

rick commited on Oct 1, 2024

Commit

1733d92

unverified ·

1 Parent(s): 955d5f0

update patch

Browse files

Files changed (2) hide show

app.py +89 -2
ui_lang_support.json +9 -1

app.py CHANGED Viewed

@@ -175,8 +175,8 @@ def transcribe_audio(audio_file: IO, language: Optional[str] = None) -> str:
     except IOError as e:
         st.error(f"Erreur d'entrée/sortie lors de la transcription : {e}")
         return ""
-    except client.APIError as e:
-        st.error(f"Erreur API lors de la transcription : {e}")
         return ""
 # Fonction pour détecter la langue d'un texte donné
@@ -659,6 +659,93 @@ def main():
     # Configuration de la barre latérale
     with st.sidebar:
         st.logo("img/logo_2.png", icon_image="img/logo_2.png")

     except IOError as e:
         st.error(f"Erreur d'entrée/sortie lors de la transcription : {e}")
         return ""
+    except Exception as e:
+        st.error(f"Erreur lors de la transcription : {e}")
         return ""
 # Fonction pour détecter la langue d'un texte donné
+    with st.container(border=True):
+        # Interface utilisateur pour l'enregistrement audio
+        st.write(f"🗣️ {get_translation('enregistrez_message')}")
+        if audio := audiorecorder(
+            start_prompt=get_translation("cliquez_enregistrer"),
+            stop_prompt=get_translation("cliquez_arreter"),
+            pause_prompt=get_translation("cliquez_pause"),
+            show_visualizer=True,
+            key="vocal_chat_input"
+        ):
+            # Traitement de l'entrée audio de l'utilisateur
+            if len(audio) > 0:
+                #with st.status(get_translation("transcription_audio_en_cours"), expanded=False) as stt_status:
+                #try:
+                    #stt_status.update(label=get_translation("transcription_audio_en_cours"), state="running", expanded=True)
+                with tempfile.NamedTemporaryFile(delete=False, suffix=".wav") as temp_audio:
+                    audio.export(temp_audio.name, format="wav")
+                    st.write(f"Frame rate: {audio.frame_rate}, Frame width: {audio.frame_width}, Duration: {audio.duration_seconds} seconds")
+                    # Transcrire l'audio en texte
+                    transcription = transcribe_audio(temp_audio, language=st.session_state.language_detected)
+                # Detecter la langue du texte transcrit (si la langue source n'est pas détectée)
+                if st.session_state.language_detected is None:
+                    st.session_state.language_detected = detect_language(
+                        input_text=transcription, temperature=0.01
+                    )
+                    st.markdown(f"- {get_translation('langue_detectee')} : {convert_iso6391_to_language_name(st.session_state.language_detected)}")
+                st.markdown(f"🎤 {get_translation('transcription_audio')} : {transcription}")
+                audio_list = []
+                for cursor_selected_lang in st.session_state.selected_languages:
+                    st.session_state.target_language = cursor_selected_lang["iso-639-1"]
+                    st.session_state.full_response = ""
+                    # Initialisation du mode de traitement pour la langue cible actuelle
+                    system_prompt, operation_prompt = init_process_mode()
+                    with st.chat_message("assistant", avatar="👻"):
+                        message_placeholder = st.empty()
+                        response_generator = process_message(
+                            transcription, operation_prompt, st.session_state.enable_tts_for_input_from_audio_record
+                        )
+                        for response_chunk in response_generator:
+                            message_placeholder.markdown(response_chunk)
+                        full_response = response_generator.close()
+                        if st.session_state.full_response != "":
+                            message_placeholder.markdown(st.session_state.full_response)
+                            if st.session_state.enable_tts_for_input_from_audio_record:
+                                tts_audio, tts_duration = process_tts_message(st.session_state.full_response)
+                                if tts_audio:
+                                    audio_list.append((tts_audio, tts_duration))
+                            else:
+                                pass
+                if audio_list:
+                    #stt_status.update(label=f"{get_translation('concatenation_audio_en_cours')}", state="running", expanded=True)
+                    final_audio = concatenate_audio_files(audio_list)
+                    with st.container(border=True):
+                        # Générer un nom de fichier unique
+                        timestamp = time.strftime("%Y%m%d-%H%M%S")
+                        langues = "_".join([lang["iso-639-1"] for lang in st.session_state.selected_languages])
+                        nom_fichier = f"reponse_audio_{langues}_{timestamp}.mp3"
+                        st.audio(final_audio, format="audio/mp3", autoplay=st.session_state.autoplay_tts)
+                        st.download_button(
+                            label=f"📥 {get_translation('telecharger_audio')}",
+                            data=final_audio,
+                            file_name=nom_fichier,
+                            mime="audio/mp3",
+                            use_container_width=True,
+                            type="primary",
+                            key=f"download_button_{langues}_{timestamp}",
+                        )
+                            #stt_status.update(label=f"{get_translation('concatenation_audio_terminee')}", state="complete", expanded=True)
+                    #else:
+                        #stt_status.update(label=f"{get_translation('erreur_concatenation_audio')}", state="error", expanded=True)
+            #except Exception as e:
+            #    st.error(f"{get_translation('erreur_transcription_audio')} : {str(e)}")
+            #    stt_status.update(label=f"{get_translation('erreur_transcription_audio')} : {str(e)}", state="error", expanded=True)
     # Configuration de la barre latérale
     with st.sidebar:
         st.logo("img/logo_2.png", icon_image="img/logo_2.png")

ui_lang_support.json CHANGED Viewed

@@ -44,7 +44,15 @@
 	"synthese_vocale_terminee": "Synthèse vocale terminée !",
 	"concatenation_audio_en_cours": "Concaténation audio en cours...",
 	"erreur_concatenation_audio": "Une erreur s'est produite lors de la concaténation audio : {}",
-	"concatenation_audio_terminee": "Concaténation audio terminée !"
     },
     "Afrikaans": {
         "titre": "DEMORRHA APP - weergawe 1",

 	"synthese_vocale_terminee": "Synthèse vocale terminée !",
 	"concatenation_audio_en_cours": "Concaténation audio en cours...",
 	"erreur_concatenation_audio": "Une erreur s'est produite lors de la concaténation audio : {}",
+	"concatenation_audio_terminee": "Concaténation audio terminée !",
+	"transcription_audio_en_cours": "Transcription audio en cours...",
+	"erreur_transcription_audio": "Une erreur s'est produite lors de la transcription audio : {}",
+	"transcription_audio_terminee": "Transcription audio terminée !",
+	"detection_langue_en_cours": "Détection de la langue en cours...",
+	"erreur_detection_langue": "Une erreur s'est produite lors de la détection de la langue : {}",
+	"detection_langue_terminee": "Détection de la langue terminée !",
+	"langue_detectee": "Langue détectée : {}",
+	"transcription_audio": "Transcription audio : {}"
     },
     "Afrikaans": {
         "titre": "DEMORRHA APP - weergawe 1",