Capstone04
/

Bootstrapping

Automatic Speech Recognition

speaker-diarization

Model card Files Files and versions

Capstone04 commited on Sep 26, 2025

Commit

c10f9e3

·

verified ·

1 Parent(s): 5fd6c86

Upload folder using huggingface_hub

Files changed (1) hide show

asr_diarization/pipeline.py +7 -3

asr_diarization/pipeline.py CHANGED Viewed

@@ -21,12 +21,16 @@ class ASR_Diarization:
         # Load diarization model
         self.diar_pipeline = Pipeline.from_pretrained(diar_model, use_auth_token=HF_TOKEN)
-        # Load ASR model with timestamps
         self.asr_pipeline = hf_pipeline(
             "automatic-speech-recognition",
-            model=asr_model,
             device=0 if self.device == "cuda" else -1,
-            return_timestamps=True,
         )
     def run_diarization(self, audio_path):

         # Load diarization model
         self.diar_pipeline = Pipeline.from_pretrained(diar_model, use_auth_token=HF_TOKEN)
+        processor = WhisperProcessor.from_pretrained(asr_model, token=HF_TOKEN)
+        model = WhisperForConditionalGeneration.from_pretrained(asr_model, token=HF_TOKEN).to(self.device)
         self.asr_pipeline = hf_pipeline(
             "automatic-speech-recognition",
+            model=model,
+            tokenizer=processor.tokenizer,
+            feature_extractor=processor.feature_extractor,
             device=0 if self.device == "cuda" else -1,
+            return_timestamps=True
         )
     def run_diarization(self, audio_path):