---
language: es
tags:
- text-generation
- gpt
- tensorflow
- don-quijote
license: mit
---

# GPT OxideLLM_5M

Modelo de lenguaje tipo GPT entrenado desde cero con el texto de OxideLLM_5M de la Mancha.

## Configuración del modelo

- **Vocabulario**: 221 caracteres
- **Dimensión del modelo (d_model)**: 256
- **Número de cabezas de atención**: 4
- **Dimensión feedforward (dff)**: 512
- **Número de capas**: 4
- **Longitud máxima de secuencia**: 128

## Uso

```python
from huggingface_hub import snapshot_download
import tensorflow as tf
import json

# Descargar modelo
model_path = snapshot_download(repo_id="ULFBERTO/OxideLLM_5M")

# Cargar vocabulario
with open(f"{model_path}/vocab.json", "r", encoding="utf-8") as f:
    vocab_data = json.load(f)
    
char2idx = vocab_data["char2idx"]
idx2char = {int(k): v for k, v in vocab_data["idx2char"].items()}

# Cargar modelo
model = tf.keras.models.load_model(f"{model_path}/saved_model")
```

## Entrenamiento

Entrenado con TensorFlow 2.x usando arquitectura Transformer (decoder-only).