How to use from the
Use from the
ESPnet library
from espnet2.bin.asr_inference import Speech2Text

model = Speech2Text.from_pretrained(
  "Dallyana/ASR_espnet_model2"
)

speech, rate = soundfile.read("speech.wav")
text, *_ = model(speech)[0]

reazonspeech-espnet-v1

reazonspeech-espnet-v1 es un modelo de reconocimiento automático del habla (ASR) entrenado con espnet2 para el español ecuatoriano. Este modelo tiene como objetivo reconocer el habla de diferentes regiones y acentos del Ecuador, usando un corpus propio y el corpus de Common Voice. El modelo usa una arquitectura de transformador con codificación por subpalabras (BPE). El modelo alcanza un WER de X% y un MOS de Y en el conjunto de datos de prueba. Para más detalles sobre el modelo, puedes consultar este artículo.

Downloads last month
3
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support