Trat80
/

AdemGPT

Trat80 commited on Nov 5, 2023

Commit

7393bba

1 Parent(s): d0a1213

Update adem.python

Files changed (1) hide show

adem.python CHANGED Viewed

@@ -1,34 +1,27 @@
-donde pongo este codigo? "from transformers import GPT2LMHeadModel, GPT2Tokenizer, TextDataset, DataCollatorForLanguageModeling
-from transformers import Trainer, TrainingArguments
 # Cargar el tokenizador y el modelo
-tokenizer = GPT2Tokenizer.from_pretrained('gpt2')
-model = GPT2LMHeadModel.from_pretrained('gpt2')
 # Ejemplo de datos de entrenamiento (necesitarás un conjunto de datos mucho más grande)
-train_data = ["Texto de ejemplo 1.", "Texto de ejemplo 2.", "Texto de ejemplo 3."]
 # Preparar el conjunto de datos
-train_encodings = tokenizer(train_data, truncation=True, padding=True)
 train_dataset = TextDataset(train_encodings)
 # Configuración de entrenamiento
-training_args = TrainingArguments(
-    output_dir='./AdemGPT_model',  # directorio de salida
-    overwrite_output_dir=True,
     num_train_epochs=3,
     per_device_train_batch_size=4,
-    save_steps=500,
     save_total_limit=2
 )
 # Entrenamiento del modelo
-trainer = Trainer(
-    model=model,
-    args=training_args,
-    data_collator=DataCollatorForLanguageModeling(tokenizer=tokenizer),
-    train_dataset=train_dataset
 )
-trainer.train()
-"

+de transformadores importe GPT2LMHeadModel, GPT2Tokenizer, TextDataset, DataCollatorForLanguageModeling
+de transformadores importan Entrenador, TrainingArguments
 # Cargar el tokenizador y el modelo
+tokenizador = GPT2Tokenizer.from_pretrained('gpt2')
+modelo = GPT2LMHeadModel.from_pretrained('gpt2')
 # Ejemplo de datos de entrenamiento (necesitarás un conjunto de datos mucho más grande)
+train_data = [" Texto de ejemplo 1. ", " Texto de ejemplo 2. ", " Texto de ejemplo 3. "]
 # Preparar el conjunto de datos
+train_encodings = tokenizer(train_data, truncamiento=Verdadero, relleno=Verdadero)
 train_dataset = TextDataset(train_encodings)
 # Configuración de entrenamiento
+Training_args = Argumentos de entrenamiento(
+    output_dir='./AdemGPT_model', # directorio de salida
+    overwrite_output_dir=Verdadero,
     num_train_epochs=3,
     per_device_train_batch_size=4,
+    guardar_pasos = 500,
     save_total_limit=2
 )
 # Entrenamiento del modelo
+entrenador = entrenador (
+    modelo = modelo,
+    args=args_entrenamiento,
+    data_collator=DataCollatorForLanguageModeling(tokenizer=tokenizador),
+    train_dataset=entren_dataset
 )
+entrenador.entren()