OxideLLM_5M / README.md
ULFBERTO's picture
Upload folder using huggingface_hub
9e2facb verified
---
language: es
tags:
- text-generation
- gpt
- tensorflow
- don-quijote
license: mit
---
# GPT OxideLLM_5M
Modelo de lenguaje tipo GPT entrenado desde cero con el texto de OxideLLM_5M de la Mancha.
## Configuración del modelo
- **Vocabulario**: 221 caracteres
- **Dimensión del modelo (d_model)**: 256
- **Número de cabezas de atención**: 4
- **Dimensión feedforward (dff)**: 512
- **Número de capas**: 4
- **Longitud máxima de secuencia**: 128
## Uso
```python
from huggingface_hub import snapshot_download
import tensorflow as tf
import json
# Descargar modelo
model_path = snapshot_download(repo_id="ULFBERTO/OxideLLM_5M")
# Cargar vocabulario
with open(f"{model_path}/vocab.json", "r", encoding="utf-8") as f:
vocab_data = json.load(f)
char2idx = vocab_data["char2idx"]
idx2char = {int(k): v for k, v in vocab_data["idx2char"].items()}
# Cargar modelo
model = tf.keras.models.load_model(f"{model_path}/saved_model")
```
## Entrenamiento
Entrenado con TensorFlow 2.x usando arquitectura Transformer (decoder-only).