NEKAMUI - Traductor Español ↔ Pamiwa

Modelo de traducción entre español y pamiwa (lengua indígena).

Uso del modelo

from transformers import MBartForConditionalGeneration, MBart50TokenizerFast

model = MBartForConditionalGeneration.from_pretrained("omracines/nekamui-es-pam")
tokenizer = MBart50TokenizerFast.from_pretrained("omracines/nekamui-es-pam")

# Traducir español → pamiwa
tokenizer.src_lang = "es_XX"
texto = "Buenos días"
inputs = tokenizer(texto, return_tensors="pt")
outputs = model.generate(**inputs, forced_bos_token_id=tokenizer.lang_code_to_id["es_XX"])
traduccion = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(traduccion)

Características

  • Base: facebook/mbart-large-50-many-to-many-mmt
  • Dataset: ~9,140 pares español-pamiwa
  • BLEU Score: 23.03
  • Steps: 4,000 (entrenamiento completo)

Limitaciones

Modelo entrenado específicamente para traducción español-pamiwa.


  1. Click "Commit changes to main"

  2. Espera 30 segundos - 1 minuto

Downloads last month
-
Safetensors
Model size
0.6B params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support