Model save

Files changed (7) hide show

README.md CHANGED Viewed

@@ -35,7 +35,7 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
-- train_batch_size: 32
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08

 The following hyperparameters were used during training:
 - learning_rate: 5e-05
+- train_batch_size: 14
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
-    "epoch": 1.0,
     "eval_accuracy": 0.42857142857142855,
-    "eval_f1": 0.33939393939393936,
-    "eval_loss": 1.7643522024154663,
-    "eval_runtime": 6.8329,
-    "eval_samples_per_second": 2.049,
-    "eval_steps_per_second": 0.293,
-    "train_loss": 2.4430296421051025,
-    "train_runtime": 13.7707,
-    "train_samples_per_second": 1.017,
-    "train_steps_per_second": 0.073
 }

 {
+    "epoch": 60.0,
     "eval_accuracy": 0.42857142857142855,
+    "eval_f1": 0.23982683982683983,
+    "eval_loss": 0.9305385947227478,
+    "eval_runtime": 5.6859,
+    "eval_samples_per_second": 2.462,
+    "eval_steps_per_second": 0.352,
+    "train_loss": 0.984285036722819,
+    "train_runtime": 679.6303,
+    "train_samples_per_second": 1.236,
+    "train_steps_per_second": 0.088
 }

eval_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-    "epoch": 1.0,
     "eval_accuracy": 0.42857142857142855,
-    "eval_f1": 0.33939393939393936,
-    "eval_loss": 1.7643522024154663,
-    "eval_runtime": 6.8329,
-    "eval_samples_per_second": 2.049,
-    "eval_steps_per_second": 0.293
 }

 {
+    "epoch": 60.0,
     "eval_accuracy": 0.42857142857142855,
+    "eval_f1": 0.23982683982683983,
+    "eval_loss": 0.9305385947227478,
+    "eval_runtime": 5.6859,
+    "eval_samples_per_second": 2.462,
+    "eval_steps_per_second": 0.352
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ada227cd5742a1b321fe3eeca873a29bf485942337687a50ee7159873bada9a9
 size 343293613

 version https://git-lfs.github.com/spec/v1
+oid sha256:9977f6f22f6526bef9f0f0886f9cf5a0e5d47adec06e5b438e326c3a4af86e0a
 size 343293613

train_results.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
-    "epoch": 1.0,
-    "train_loss": 2.4430296421051025,
-    "train_runtime": 13.7707,
-    "train_samples_per_second": 1.017,
-    "train_steps_per_second": 0.073
 }

 {
+    "epoch": 60.0,
+    "train_loss": 0.984285036722819,
+    "train_runtime": 679.6303,
+    "train_samples_per_second": 1.236,
+    "train_steps_per_second": 0.088
 }

trainer_state.json CHANGED Viewed

@@ -1,28 +1,28 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 1.0,
   "eval_steps": 1000,
-  "global_step": 1,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 1.0,
-      "step": 1,
-      "total_flos": 1084975366164480.0,
-      "train_loss": 2.4430296421051025,
-      "train_runtime": 13.7707,
-      "train_samples_per_second": 1.017,
-      "train_steps_per_second": 0.073
     }
   ],
   "logging_steps": 1000,
-  "max_steps": 1,
-  "num_train_epochs": 1,
   "save_steps": 1000,
-  "total_flos": 1084975366164480.0,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 60.0,
   "eval_steps": 1000,
+  "global_step": 60,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 60.0,
+      "step": 60,
+      "total_flos": 6.50985219698688e+16,
+      "train_loss": 0.984285036722819,
+      "train_runtime": 679.6303,
+      "train_samples_per_second": 1.236,
+      "train_steps_per_second": 0.088
     }
   ],
   "logging_steps": 1000,
+  "max_steps": 60,
+  "num_train_epochs": 60,
   "save_steps": 1000,
+  "total_flos": 6.50985219698688e+16,
   "trial_name": null,
   "trial_params": null
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d0f8ae252b4d6cc9563f4e253723ea6a22afed0965df161dddb07412ca0d4723
 size 4027

 version https://git-lfs.github.com/spec/v1
+oid sha256:663809c470c88a56675b03378fbc1481c331b2f77a456d9a3f86cdca9679e2f7
 size 4027