Capstone04
/

Bootstrapping

Automatic Speech Recognition

speaker-diarization

Model card Files Files and versions

Capstone04 commited on Sep 23, 2025

Commit

2c34cb9

·

verified ·

1 Parent(s): 6520d67

Upload folder using huggingface_hub

Files changed (1) hide show

asr_diarization/pipeline.py +2 -1

asr_diarization/pipeline.py CHANGED Viewed

@@ -5,6 +5,7 @@ import torchaudio
 import noisereduce as nr
 from pyannote.audio import Pipeline
 from transformers import pipeline as hf_pipeline
 import tempfile
 from pyannote.core import Annotation, Segment
@@ -25,7 +26,7 @@ class ASR_Diarization:
         # Load ASR model with timestamps
         self.asr_pipeline = hf_pipeline(
             "automatic-speech-recognition",
-            model=asr_model,
             device=0 if self.device == "cuda" else -1,
             return_timestamps=True
         )

 import noisereduce as nr
 from pyannote.audio import Pipeline
 from transformers import pipeline as hf_pipeline
+from transformers import WhisperForConditionalGeneration, WhisperProcessor
 import tempfile
 from pyannote.core import Annotation, Segment
         # Load ASR model with timestamps
         self.asr_pipeline = hf_pipeline(
             "automatic-speech-recognition",
+            model=WhisperForConditionalGeneration.from_pretrained(asr_model),
             device=0 if self.device == "cuda" else -1,
             return_timestamps=True
         )