anuragshas
/

wav2vec2-large-xls-r-300m-bg

Automatic Speech Recognition

Generated from Trainer

hf-asr-leaderboard

mozilla-foundation/common_voice_8_0

robust-speech-event

Model card Files Files and versions

anuragshas commited on Feb 6, 2022

Commit

3a559aa

·

1 Parent(s): 0b33ed3

Update eval.py

Files changed (1) hide show

eval.py +12 -1

eval.py CHANGED Viewed

@@ -4,6 +4,7 @@ import re
 import unicodedata
 from typing import Dict
 from datasets import Audio, Dataset, load_dataset, load_metric
 from transformers import AutoFeatureExtractor, pipeline
@@ -90,7 +91,11 @@ def main(args):
     dataset = dataset.cast_column("audio", Audio(sampling_rate=sampling_rate))
     # load eval pipeline
-    asr = pipeline("automatic-speech-recognition", model=args.model_id, device=0)
     # map function to decode audio
     def map_to_pred(batch):
@@ -153,6 +158,12 @@ if __name__ == "__main__":
         action="store_true",
         help="If defined, write outputs to log file for analysis.",
     )
     args = parser.parse_args()
     main(args)

 import unicodedata
 from typing import Dict
+import torch
 from datasets import Audio, Dataset, load_dataset, load_metric
 from transformers import AutoFeatureExtractor, pipeline
     dataset = dataset.cast_column("audio", Audio(sampling_rate=sampling_rate))
     # load eval pipeline
+    if args.device is None:
+        args.device = 0 if torch.cuda.is_available() else -1
+    asr = pipeline(
+        "automatic-speech-recognition", model=args.model_id, device=args.device
+    )
     # map function to decode audio
     def map_to_pred(batch):
         action="store_true",
         help="If defined, write outputs to log file for analysis.",
     )
+    parser.add_argument(
+        "--device",
+        type=int,
+        default=None,
+        help="The device to run the pipeline on. -1 for CPU (default), 0 for the first GPU and so on.",
+    )
     args = parser.parse_args()
     main(args)