Dallyana
/

espnet_asr_model2

Automatic Speech Recognition

Model card Files Files and versions

Dallyana commited on Feb 6, 2024

Commit

608cfc9

·

verified ·

1 Parent(s): abd3cd6

Upload 2 files

Files changed (2) hide show

README.md +18 -0
meta.yaml +9 -0

README.md ADDED Viewed

	@@ -0,0 +1,18 @@

+---
+license: apache-2.0
+language:
+- es
+library_name: espnet
+tags:
+- automatic-speech-recognition
+- speech
+- espnet
+- spanish
+---
+# reazonspeech-espnet-v1
+`reazonspeech-espnet-v1` es un modelo de reconocimiento automático del habla (ASR) entrenado con espnet2 para el español ecuatoriano. Este modelo tiene como objetivo reconocer el habla de diferentes regiones y acentos del Ecuador, usando un corpus propio y el corpus de Common Voice. El modelo usa una arquitectura de transformador con codificación por subpalabras (BPE). El modelo alcanza un WER de X% y un MOS de Y en el conjunto de datos de prueba. Para más detalles sobre el modelo, puedes consultar este artículo.

meta.yaml ADDED Viewed

	@@ -0,0 +1,9 @@

+espnet: '202310'
+files:
+  asr_model_file: exp/asr_train_asr_transformer_raw_es_bpe57_sp/valid.acc.ave_10best.pth
+  lm_file: exp/lm_train_lm_es_bpe57/20epoch.pth
+python: "3.8"
+pytorch: 1.12.1
+yaml_files:
+  asr_train_config: exp/asr_train_asr_transformer_raw_es_bpe57_sp/config.yaml
+  lm_train_config: exp/lm_train_lm_es_bpe57/config.yaml