Spaces:

GenaroCoronel
/

godot_docs_fine_tune

Runtime error

GenaroCoronel commited on Feb 16, 2025

Commit

f47cc38

verified ·

1 Parent(s): d03512b

Create train.py

Files changed (1) hide show

train.py ADDED Viewed

+from transformers import AutoTokenizer, AutoModelForCausalLM, Trainer, TrainingArguments
+from datasets import load_dataset
+# Cargar el dataset de Hugging Face
+dataset = load_dataset("tu_usuario/mi_dataset", split="train")
+# Cargar el modelo y el tokenizador
+tokenizer = AutoTokenizer.from_pretrained("mistral-7b")
+model = AutoModelForCausalLM.from_pretrained("mistral-7b")
+# Preprocesar los datos (tokenización)
+def tokenize_function(examples):
+    return tokenizer(examples['text'], padding="max_length", truncation=True)
+dataset = dataset.map(tokenize_function, batched=True)
+# Configuración de entrenamiento
+training_args = TrainingArguments(
+    output_dir='./results',
+    num_train_epochs=3,
+    per_device_train_batch_size=8,
+    per_device_eval_batch_size=16,
+    logging_dir='./logs',
+)
+trainer = Trainer(
+    model=model,
+    args=training_args,
+    train_dataset=dataset,
+)
+# Entrenar el modelo
+trainer.train()
+# Guardar el modelo entrenado
+model.save_pretrained("tu_usuario/mi_modelo_entrenado")
+tokenizer.save_pretrained("tu_usuario/mi_modelo_entrenado")