Model save

Files changed (5) hide show

README.md CHANGED Viewed

@@ -39,7 +39,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 2e-05
 - train_batch_size: 4
 - eval_batch_size: 4
 - seed: 42

 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 5e-05
 - train_batch_size: 4
 - eval_batch_size: 4
 - seed: 42

all_results.json CHANGED Viewed

@@ -2,8 +2,8 @@
     "epoch": 2.7540983606557377,
     "total_flos": 3971544514560.0,
     "train_loss": 0.0,
-    "train_runtime": 10.0086,
     "train_samples": 725,
-    "train_samples_per_second": 144.776,
-    "train_steps_per_second": 2.098
 }

     "epoch": 2.7540983606557377,
     "total_flos": 3971544514560.0,
     "train_loss": 0.0,
+    "train_runtime": 11.242,
     "train_samples": 725,
+    "train_samples_per_second": 128.892,
+    "train_steps_per_second": 1.868
 }

train_results.json CHANGED Viewed

@@ -2,8 +2,8 @@
     "epoch": 2.7540983606557377,
     "total_flos": 3971544514560.0,
     "train_loss": 0.0,
-    "train_runtime": 10.0086,
     "train_samples": 725,
-    "train_samples_per_second": 144.776,
-    "train_steps_per_second": 2.098
 }

     "epoch": 2.7540983606557377,
     "total_flos": 3971544514560.0,
     "train_loss": 0.0,
+    "train_runtime": 11.242,
     "train_samples": 725,
+    "train_samples_per_second": 128.892,
+    "train_steps_per_second": 1.868
 }

trainer_state.json CHANGED Viewed

@@ -184,9 +184,9 @@
       "step": 21,
       "total_flos": 3971544514560.0,
       "train_loss": 0.0,
-      "train_runtime": 10.0086,
-      "train_samples_per_second": 144.776,
-      "train_steps_per_second": 2.098
     }
   ],
   "logging_steps": 1,

       "step": 21,
       "total_flos": 3971544514560.0,
       "train_loss": 0.0,
+      "train_runtime": 11.242,
+      "train_samples_per_second": 128.892,
+      "train_steps_per_second": 1.868
     }
   ],
   "logging_steps": 1,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:07405ff6d1b5b71ed651e7e739c81409719374862297deab691404dc27f2a010
 size 6968

 version https://git-lfs.github.com/spec/v1
+oid sha256:d24fa0ac9a73f56ea1b65635ddd083d6aceb07fb2b335c2ec822fbb60422adc6
 size 6968