Spaces:

ImPolymath
/

demorrha

Paused

App Files Files Community

0x07CB commited on Feb 22, 2025

Commit

0515135

unverified ·

1 Parent(s): 38d7f4f

Désactivation temporaire de la détection automatique de langue et utilisation de la langue de l'interface

Browse files

Files changed (1) hide show

pages/main.py +39 -41

pages/main.py CHANGED Viewed

@@ -191,7 +191,6 @@ def tts_settings(name__tts_voice,
         st.session_state.enable_tts_for_input_from_audio_record = set__tts_with_audio
         st.session_state.enable_tts_for_input_from_text_field = set__tts_with_text
         st.session_state.tts_voice = set__tts_voice
-        #st.session_state.
         st.rerun()
 @st.fragment
@@ -213,37 +212,37 @@ def recorder_released():
                 # Isoler l'audio ici
                 audio = isolate_audio(audio)
-            if not st.session_state.language_detected:
-                # 1. Verifie si audio.duration_seconds est superieur a 600 secondes (10 minutes)
-                if audio.duration_seconds > 600:
-                    # PyDub handles time in milliseconds
-                    ten_minutes = 10 * 60 * 1000
-                    first_ten_minutes_audio = audio[:ten_minutes]
-                else:
-                    # less than ten minutes ... nervermind, the name of this variable is
-                    first_ten_minutes_audio = deepcopy(audio)
-                with tempfile.NamedTemporaryFile(suffix=".mp3", delete=False) as tmp_extract:
-                    first_ten_minutes_audio.export(tmp_extract, format="mp3")
-                    tmp_extract.close()
-                    # il faut transcrire sans specifier l'argument language dans la fonction transcribe_audio
-                    # ensuite on pourra utiliser la fonction detect_language pour detecter la langue du texte transcrit
-                    # Transcrire les 10 premiers minutes audio en texte
-                    st.session_state.language_detected = detect_language(
-                        input_text = transcribe_audio(tmp_extract),
-                        temperature = 0.2,
-                        context_window = 512,
-                        model = "gpt-4o-mini"
-                    )
-                    first_ten_minutes_audio = AudioSegment.empty()
-                st.markdown(
-                    f"- {get_translation('langue_detectee')} {convert_iso6391_to_language_name(st.session_state.language_detected)}"
-                )
             # ##############################################################
             try:
@@ -254,7 +253,7 @@ def recorder_released():
                     # Transcrire l'audio en texte
                     st.session_state.transcription = transcribe_audio(
                         tmp_file,
-                        language=st.session_state.language_detected
                     )
                     audio = AudioSegment.empty()
@@ -273,10 +272,9 @@ def recorder_released():
                     st.session_state.system_prompt, st.session_state.operation_prompt = init_langs_for_processing(
                         target_language = st.session_state.target_language,
                         interface_language = st.session_state.interface_language,
-                        language_detected = st.session_state.language_detected
                     )
                     with st.chat_message("assistant", avatar="👻"):
                         message_placeholder = st.empty()
                         st.session_state.response_generator = process_message(
@@ -288,9 +286,9 @@ def recorder_released():
                         for response_chunk in st.session_state.response_generator:
                             message_placeholder.markdown(response_chunk)
                         st.session_state.end_response = st.session_state.response_generator.close()
                         if st.session_state.full_response != "":
                             message_placeholder.markdown(st.session_state.full_response)
                             if st.session_state.enable_tts_for_input_from_audio_record:
                                 st.session_state.tts_audio, st.session_state.tts_duration = process_tts_message(st.session_state.full_response)
@@ -503,17 +501,17 @@ def main_page():
             st.session_state.full_response = ""
             st.session_state.audio_list = []
-            result_detection_lang_1 = detection_langue_du_message_utilisateur(
-                st.session_state.user_input
-            )
-            user_text_lang = result_detection_lang_1["language"] if (result_detection_lang_1["language"] != "default") else "Unknown"
             with st.chat_message("user", avatar="👤"):
                 timestamp = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
                 st.write(f"{timestamp}")
                 with st.container(border=True):
-                    st.subheader(f"🌐 lang: {user_text_lang}")
                     st.markdown(st.session_state.user_input)

         st.session_state.enable_tts_for_input_from_audio_record = set__tts_with_audio
         st.session_state.enable_tts_for_input_from_text_field = set__tts_with_text
         st.session_state.tts_voice = set__tts_voice
         st.rerun()
 @st.fragment
                 # Isoler l'audio ici
                 audio = isolate_audio(audio)
+            # if not st.session_state.language_detected:
+            #    # 1. Verifie si audio.duration_seconds est superieur a 600 secondes (10 minutes)
+            #    if audio.duration_seconds > 600:
+            #        # PyDub handles time in milliseconds
+            #        ten_minutes = 10 * 60 * 1000
+            #        first_ten_minutes_audio = audio[:ten_minutes]
+            #    else:
+            #        # less than ten minutes ... nervermind, the name of this variable is
+            #        first_ten_minutes_audio = deepcopy(audio)
+            #
+            #    with tempfile.NamedTemporaryFile(suffix=".mp3", delete=False) as tmp_extract:
+            #        first_ten_minutes_audio.export(tmp_extract, format="mp3")
+            #        tmp_extract.close()
+            #
+            #        # il faut transcrire sans specifier l'argument language dans la fonction transcribe_audio
+            #        # ensuite on pourra utiliser la fonction detect_language pour detecter la langue du texte transcrit
+            #
+            #        # Transcrire les 10 premiers minutes audio en texte
+            #        st.session_state.language_detected = detect_language(
+            #            input_text = transcribe_audio(tmp_extract),
+            #            temperature = 0.2,
+            #            context_window = 512,
+            #            model = "gpt-4o-mini"
+            #        )
+            #        first_ten_minutes_audio = AudioSegment.empty()
+            #
+            #    st.markdown(
+            #        f"- {get_translation('langue_detectee')} {convert_iso6391_to_language_name(st.session_state.language_detected)}"
+            #    )
+            #
+            #
             # ##############################################################
             try:
                     # Transcrire l'audio en texte
                     st.session_state.transcription = transcribe_audio(
                         tmp_file,
+                        language=st.session_state.interface_language
                     )
                     audio = AudioSegment.empty()
                     st.session_state.system_prompt, st.session_state.operation_prompt = init_langs_for_processing(
                         target_language = st.session_state.target_language,
                         interface_language = st.session_state.interface_language,
+                        language_detected = st.session_state.interface_language
                     )
                     with st.chat_message("assistant", avatar="👻"):
                         message_placeholder = st.empty()
                         st.session_state.response_generator = process_message(
                         for response_chunk in st.session_state.response_generator:
                             message_placeholder.markdown(response_chunk)
                         st.session_state.end_response = st.session_state.response_generator.close()
                         if st.session_state.full_response != "":
                             message_placeholder.markdown(st.session_state.full_response)
                             if st.session_state.enable_tts_for_input_from_audio_record:
                                 st.session_state.tts_audio, st.session_state.tts_duration = process_tts_message(st.session_state.full_response)
             st.session_state.full_response = ""
             st.session_state.audio_list = []
+            #result_detection_lang_1 = detection_langue_du_message_utilisateur(
+            #    st.session_state.user_input
+            #)
+            #user_text_lang = result_detection_lang_1["language"] if (result_detection_lang_1["language"] != "default") else "Unknown"
             with st.chat_message("user", avatar="👤"):
                 timestamp = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
                 st.write(f"{timestamp}")
                 with st.container(border=True):
+                    st.subheader(f"🌐 lang: {st.session_state.interface_language}")
                     st.markdown(st.session_state.user_input)