ULFBERTO
/

OxideLLM_5M

Text Generation

Model card Files Files and versions

OxideLLM_5M / README.md

ULFBERTO's picture

Upload folder using huggingface_hub

9e2facb verified 24 days ago

|

history blame contribute delete

1.09 kB

	---
	language: es
	tags:
	- text-generation
	- gpt
	- tensorflow
	- don-quijote
	license: mit
	---

	# GPT OxideLLM_5M

	Modelo de lenguaje tipo GPT entrenado desde cero con el texto de OxideLLM_5M de la Mancha.

	## Configuración del modelo

	- Vocabulario: 221 caracteres
	- Dimensión del modelo (d_model): 256
	- Número de cabezas de atención: 4
	- Dimensión feedforward (dff): 512
	- Número de capas: 4
	- Longitud máxima de secuencia: 128

	## Uso

	```python
	from huggingface_hub import snapshot_download
	import tensorflow as tf
	import json

	# Descargar modelo
	model_path = snapshot_download(repo_id="ULFBERTO/OxideLLM_5M")

	# Cargar vocabulario
	with open(f"{model_path}/vocab.json", "r", encoding="utf-8") as f:
	vocab_data = json.load(f)

	char2idx = vocab_data["char2idx"]
	idx2char = {int(k): v for k, v in vocab_data["idx2char"].items()}

	# Cargar modelo
	model = tf.keras.models.load_model(f"{model_path}/saved_model")
	```

	## Entrenamiento

	Entrenado con TensorFlow 2.x usando arquitectura Transformer (decoder-only).