chiapudding
/

question-answering-2

chiapudding commited on Mar 9, 2023

Commit

f3420c2

1 Parent(s): 0c732eb

added comments and more explicit training loop

Files changed (1) hide show

qatransformer2.py CHANGED Viewed

@@ -1,10 +1,12 @@
 from datasets import load_dataset
 from transformers import AutoTokenizer, AutoModelForQuestionAnswering, TrainingArguments, Trainer, DefaultDataCollator
 squad = load_dataset("squad", split="train[:5000]")
 squad = squad.train_test_split(test_size=0.2)
-# preprocess
 tokenizer = AutoTokenizer.from_pretrained("bert-base-uncased")
 def preprocess_function(examples):
@@ -58,13 +60,16 @@ def preprocess_function(examples):
     inputs["end_positions"] = end_positions
     return inputs
-# train
-train_dataset = squad["train"].map(preprocess_function, batched=True)
-eval_dataset = squad["test"].map(preprocess_function, batched=True)
-model = AutoModelForQuestionAnswering.from_pretrained("bert-base-uncased")
 training_args = TrainingArguments(
     output_dir="question-answering",
     evaluation_strategy="epoch",
@@ -76,16 +81,20 @@ training_args = TrainingArguments(
     push_to_hub=True,
 )
 trainer = Trainer(
     model=model,
     args=training_args,
     train_dataset=train_dataset,
     eval_dataset=eval_dataset,
     tokenizer=tokenizer,
-    data_collator=data_collator,
 )
 trainer.train()
 #evaluation - todo

 from datasets import load_dataset
 from transformers import AutoTokenizer, AutoModelForQuestionAnswering, TrainingArguments, Trainer, DefaultDataCollator
+from transformers.optimization import AdamW
+from transformers.data.data_collator import default_data_collator
 squad = load_dataset("squad", split="train[:5000]")
 squad = squad.train_test_split(test_size=0.2)
 tokenizer = AutoTokenizer.from_pretrained("bert-base-uncased")
 def preprocess_function(examples):
     inputs["end_positions"] = end_positions
     return inputs
+# Define the model
+model = AutoModelForQuestionAnswering.from_pretrained("bert-base-uncased")
+# Define the optimization algorithm
+optimizer = AdamW(model.parameters(), lr=2e-5)
+# Define the loss function
+loss_fn = default_data_collator
+# Define the training arguments
 training_args = TrainingArguments(
     output_dir="question-answering",
     evaluation_strategy="epoch",
     push_to_hub=True,
 )
+# Define the trainer
 trainer = Trainer(
     model=model,
     args=training_args,
     train_dataset=train_dataset,
     eval_dataset=eval_dataset,
     tokenizer=tokenizer,
+    data_collator=loss_fn,
+    optimizer=optimizer,
 )
+# Train the model
 trainer.train()
 #evaluation - todo