shushukimura
/

asr_whisper_colab

Model card Files Files and versions

shushukimura commited on Nov 10, 2025

Commit

ca84573

·

1 Parent(s): a3653dc

commit files to HF hub

Files changed (1) hide show

asr_whisper_pipeline.py +15 -0

asr_whisper_pipeline.py ADDED Viewed

	@@ -0,0 +1,15 @@

+from transformers import AutoProcessor, AutoModelForSpeechSeq2Seq
+import torch, torchaudio
+def transcribe(audio_path):
+    model_name = "openai/whisper-tiny"
+    processor = AutoProcessor.from_pretrained(model_name)
+    model = AutoModelForSpeechSeq2Seq.from_pretrained(model_name)
+    speech, sr = torchaudio.load(audio_path)
+    if sr != 16000:
+        resampler = torchaudio.transforms.Resample(sr, 16000)
+        speech = resampler(speech)
+    inputs = processor(speech.squeeze(), sampling_rate=16000, return_tensors="pt")
+    with torch.no_grad():
+        ids = model.generate(**inputs)
+    return processor.batch_decode(ids, skip_special_tokens=True)[0]