openai
/

whisper-base

Automatic Speech Recognition

hf-asr-leaderboard

Eval Results (legacy)

Model card Files Files and versions

Closed bracket in whisper-base

#6

by cupofsanity - opened Dec 11, 2022

base: refs/heads/main

←

from: refs/pr/6

Discussion Files changed

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -227,7 +227,7 @@ The "<|en|>" token is used to specify that the speech is in english and should b
 >>> input_features = processor(ds[0]["audio"]["array"], return_tensors="pt").input_features
 >>> # Generate logits
->>> logits = model(input_features, decoder_input_ids = torch.tensor([[50258]]).logits
 >>> # take argmax and decode
 >>> predicted_ids = torch.argmax(logits, dim=-1)
 >>> transcription = processor.batch_decode(predicted_ids)

 >>> input_features = processor(ds[0]["audio"]["array"], return_tensors="pt").input_features
 >>> # Generate logits
+>>> logits = model(input_features, decoder_input_ids = torch.tensor([[50258]])).logits
 >>> # take argmax and decode
 >>> predicted_ids = torch.argmax(logits, dim=-1)
 >>> transcription = processor.batch_decode(predicted_ids)