Spaces:

ImPolymath
/

demorrha

Paused

App Files Files Community

rick commited on Oct 4, 2024

Commit

32a007c

unverified ·

1 Parent(s): c4202cd

bug fixed now... not done...

Browse files

Files changed (1) hide show

pages/main.py +45 -15

pages/main.py CHANGED Viewed

@@ -15,7 +15,6 @@ from typing import Optional
 from typing import Tuple
 from typing import Union
 # Third-party libraries
 import requests
 import streamlit as st
@@ -91,9 +90,12 @@ def read_file(file_name: str) -> str:
     except IOError as e:
         return f"{get_translation('erreur_lecture_fichier')} {str(e)}"
-def split_audio(audio_file: str, max_size_mb: int = 25) -> List[str]:
     """
-    Divise un fichier audio en segments de 25 Mo ou moins.
     Args:
         audio_file (str): Chemin vers le fichier audio.
@@ -111,13 +113,36 @@ def split_audio(audio_file: str, max_size_mb: int = 25) -> List[str]:
         )
         segments = []
-        for start in range(0, duration_ms, segment_duration_ms):
-            end = min(start + segment_duration_ms, duration_ms)
-            segment = audio[start:end]
-            with tempfile.NamedTemporaryFile(delete=False, suffix=".wav") as temp_segment:
-                segment.export(temp_segment.name, format="wav")
-                segments.append(temp_segment.name)
-        os.unlink(temp_segment)
         return segments
     except IOError as e:
         print(f"Erreur lors de la lecture ou de l'écriture du fichier audio : {e}")
@@ -125,6 +150,9 @@ def split_audio(audio_file: str, max_size_mb: int = 25) -> List[str]:
     except ValueError as e:
         print(f"Erreur de valeur lors du traitement de l'audio : {e}")
         return []
 # Fonction modifiée pour transcrire l'audio en texte
 def transcribe_audio(audio_file: IO, language: Optional[str] = None) -> str:
@@ -153,10 +181,10 @@ def transcribe_audio(audio_file: IO, language: Optional[str] = None) -> str:
                         transcript = client.audio.transcriptions.create(
                             model="whisper-1",
                             file=audio_segment,
-                            language=language
                         )
-                        full_transcript += f"{transcript.text} "
-                    os.unlink(segment)  # Supprime le fichier temporaire
                 status.update(label="Transcription terminée", state="complete")
                 return full_transcript.strip()
             else:
@@ -165,16 +193,18 @@ def transcribe_audio(audio_file: IO, language: Optional[str] = None) -> str:
                     transcript = client.audio.transcriptions.create(
                         model="whisper-1",
                         file=audio_file,
-                        language=language
                     )
                 status.update(label="Transcription terminée", state="complete")
-                return transcript.text
     except IOError as e:
         st.error(f"Erreur d'entrée/sortie lors de la transcription : {e}")
         return ""
     except Exception as e:
         st.error(f"Erreur lors de la transcription : {e}")
         return ""
 # Fonction pour détecter la langue d'un texte donné
 def detect_language(input_text: str, temperature: float = 0.01) -> str:

 from typing import Tuple
 from typing import Union
 # Third-party libraries
 import requests
 import streamlit as st
     except IOError as e:
         return f"{get_translation('erreur_lecture_fichier')} {str(e)}"
+def split_audio(audio_file: str,
+                max_size_mb: int = 25) -> List[str]:
     """
+    Divise un fichier audio en segments de taille maximale spécifiée et retourne les chemins des segments.
     Args:
         audio_file (str): Chemin vers le fichier audio.
         )
         segments = []
+        with tempfile.TemporaryDirectory() as temp_dir:
+            for start in range(0, duration_ms, segment_duration_ms):
+                end = min(start + segment_duration_ms, duration_ms)
+                segment = audio[start:end]
+                temp_segment_path = os.path.join(temp_dir, f"segment_{start}_{end}.wav")
+                segment.export(temp_segment_path, format="wav")
+                segments.append(temp_segment_path)
+                # Start of Selection
+                # Traiter les segments ici
+                language = st.session_state.get('target_language', 'en')  # Définir la variable
+                transcriptions = []
+                for segment_path in segments:
+                    try:
+                        with open(segment_path, "rb") as audio_segment:
+                            transcript = client.audio.transcriptions.create(
+                                model="whisper-1",
+                                file=audio_segment,
+                                # Start of Selection
+                                language=language,
+                                response_format="text"
+                            )
+                            transcriptions.append(transcript.text)
+                    except Exception as e:
+                        print(f"Erreur lors de la transcription du segment {segment_path} : {e}")
+                    finally:
+                        os.remove(segment_path)  # Supprime le segment après traitement
+                # Fin du traitement des segments et suppression automatique du répertoire temporaire
         return segments
     except IOError as e:
         print(f"Erreur lors de la lecture ou de l'écriture du fichier audio : {e}")
     except ValueError as e:
         print(f"Erreur de valeur lors du traitement de l'audio : {e}")
         return []
+    except Exception as e:
+        print(f"Une erreur inattendue s'est produite : {e}")
+        return []
 # Fonction modifiée pour transcrire l'audio en texte
 def transcribe_audio(audio_file: IO, language: Optional[str] = None) -> str:
                         transcript = client.audio.transcriptions.create(
                             model="whisper-1",
                             file=audio_segment,
+                            language=language,
+                            response_format="text"
                         )
+                        full_transcript += f"{transcript} "
                 status.update(label="Transcription terminée", state="complete")
                 return full_transcript.strip()
             else:
                     transcript = client.audio.transcriptions.create(
                         model="whisper-1",
                         file=audio_file,
+                        language=language,
+                        response_format="text"
                     )
                 status.update(label="Transcription terminée", state="complete")
+                return transcript
     except IOError as e:
         st.error(f"Erreur d'entrée/sortie lors de la transcription : {e}")
         return ""
     except Exception as e:
         st.error(f"Erreur lors de la transcription : {e}")
         return ""
+## def transcribe_audio(audio_file: IO, language: Optional[str] = None) -> str:
 # Fonction pour détecter la langue d'un texte donné
 def detect_language(input_text: str, temperature: float = 0.01) -> str: