Spaces:

evannh
/

test_diarization

Sleeping

evannh commited on Jun 2, 2025

Commit

d24405c

verified ·

1 Parent(s): d0c0305

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,24 +1,27 @@
 # app.py
 import gradio as gr
-import whisper
 import spacy
 import torch
 import os
-from pyannote.audio import Pipeline
-# Chargement des modèles
-whisper_model = whisper.load_model("base")  # medium ou large possible
 nlp = spacy.load("fr_core_news_md")
-# Diarisation avec PyAnnote (nécessite un token HF dans les Secrets du Space)
 hf_token = os.getenv("HF_TOKEN")
 if hf_token:
-    diar_pipeline = Pipeline.from_pretrained("pyannote/speaker-diarization-3.1", use_auth_token=hf_token)
 else:
     diar_pipeline = None
 def process_audio(file):
-    result = whisper_model.transcribe(file, language="fr", verbose=False)
     transcription = result["text"]
     # Diarisation

 # app.py
 import gradio as gr
 import spacy
 import torch
 import os
+from transformers import pipeline
+from pyannote.audio import Pipeline as DiarizationPipeline
+# Chargement du modèle Whisper via transformers
+asr_pipeline = pipeline("automatic-speech-recognition", model="openai/whisper-small", chunk_length_s=30)
+# Chargement du modèle spaCy pour NER
 nlp = spacy.load("fr_core_news_md")
+# Diarisation avec PyAnnote (si HF_TOKEN dispo dans l'environnement)
 hf_token = os.getenv("HF_TOKEN")
 if hf_token:
+    diar_pipeline = DiarizationPipeline.from_pretrained("pyannote/speaker-diarization-3.1", use_auth_token=hf_token)
 else:
     diar_pipeline = None
 def process_audio(file):
+    # Transcription avec Whisper via transformers
+    result = asr_pipeline(file)
     transcription = result["text"]
     # Diarisation