MHGanainy
/

roberta-base-downstream-ildc

@@ -20,8 +20,8 @@
     "predict_steps_per_second": 4.098,
     "total_flos": 6.343227643160166e+17,
     "train_loss": 0.6829259282291525,
-    "train_runtime": 2716.1998,
     "train_samples": 32305,
-    "train_samples_per_second": 237.869,
-    "train_steps_per_second": 7.437
 }

     "predict_steps_per_second": 4.098,
     "total_flos": 6.343227643160166e+17,
     "train_loss": 0.6829259282291525,
+    "train_runtime": 2722.2879,
     "train_samples": 32305,
+    "train_samples_per_second": 237.337,
+    "train_steps_per_second": 7.42
 }

train_results.json CHANGED Viewed

@@ -2,8 +2,8 @@
     "epoch": 4.0,
     "total_flos": 6.343227643160166e+17,
     "train_loss": 0.6829259282291525,
-    "train_runtime": 2716.1998,
     "train_samples": 32305,
-    "train_samples_per_second": 237.869,
-    "train_steps_per_second": 7.437
 }

     "epoch": 4.0,
     "total_flos": 6.343227643160166e+17,
     "train_loss": 0.6829259282291525,
+    "train_runtime": 2722.2879,
     "train_samples": 32305,
+    "train_samples_per_second": 237.337,
+    "train_steps_per_second": 7.42
 }

trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.0,
   "best_model_checkpoint": "logs/ildc/roberta-base/seed_1/checkpoint-1010",
   "epoch": 4.0,
   "eval_steps": 500,
@@ -24,14 +24,15 @@
     },
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.5,
-      "eval_f1": 0.0,
       "eval_loss": 0.7003927230834961,
-      "eval_precision": 0.0,
-      "eval_recall": 0.0,
-      "eval_runtime": 9.0772,
-      "eval_samples_per_second": 109.505,
-      "eval_steps_per_second": 3.525,
       "step": 1010
     },
     {
@@ -50,13 +51,14 @@
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.5,
-      "eval_f1": 0.0,
       "eval_loss": 0.699403703212738,
-      "eval_precision": 0.0,
-      "eval_recall": 0.0,
-      "eval_runtime": 8.2465,
-      "eval_samples_per_second": 120.536,
       "eval_steps_per_second": 3.88,
       "step": 2020
     },
@@ -76,14 +78,15 @@
     },
     {
       "epoch": 3.0,
-      "eval_accuracy": 0.5,
-      "eval_f1": 0.0,
       "eval_loss": 0.751548707485199,
-      "eval_precision": 0.0,
-      "eval_recall": 0.0,
-      "eval_runtime": 8.2525,
-      "eval_samples_per_second": 120.448,
-      "eval_steps_per_second": 3.878,
       "step": 3030
     },
     {
@@ -102,14 +105,15 @@
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.5,
-      "eval_f1": 0.0,
       "eval_loss": 0.7038925290107727,
-      "eval_precision": 0.0,
-      "eval_recall": 0.0,
-      "eval_runtime": 8.2406,
-      "eval_samples_per_second": 120.622,
-      "eval_steps_per_second": 3.883,
       "step": 4040
     },
     {
@@ -117,9 +121,9 @@
       "step": 4040,
       "total_flos": 6.343227643160166e+17,
       "train_loss": 0.6829259282291525,
-      "train_runtime": 2716.1998,
-      "train_samples_per_second": 237.869,
-      "train_steps_per_second": 7.437
     }
   ],
   "logging_steps": 500,

 {
+  "best_metric": 0.6684856753069577,
   "best_model_checkpoint": "logs/ildc/roberta-base/seed_1/checkpoint-1010",
   "epoch": 4.0,
   "eval_steps": 500,
     },
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.5110663983903421,
+      "eval_best_threshold": 0.43776339292526245,
+      "eval_f1": 0.6684856753069577,
       "eval_loss": 0.7003927230834961,
+      "eval_precision": 0.5056759545923633,
+      "eval_recall": 0.9859154929577465,
+      "eval_runtime": 8.3061,
+      "eval_samples_per_second": 119.671,
+      "eval_steps_per_second": 3.853,
       "step": 1010
     },
     {
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.5030181086519114,
+      "eval_best_threshold": 0.43332192301750183,
+      "eval_f1": 0.6671159029649596,
       "eval_loss": 0.699403703212738,
+      "eval_precision": 0.5015197568389058,
+      "eval_recall": 0.9959758551307847,
+      "eval_runtime": 8.2485,
+      "eval_samples_per_second": 120.507,
       "eval_steps_per_second": 3.88,
       "step": 2020
     },
     },
     {
       "epoch": 3.0,
+      "eval_accuracy": 0.5030181086519114,
+      "eval_best_threshold": 0.332852303981781,
+      "eval_f1": 0.6644021739130435,
       "eval_loss": 0.751548707485199,
+      "eval_precision": 0.5015384615384615,
+      "eval_recall": 0.9839034205231388,
+      "eval_runtime": 8.2689,
+      "eval_samples_per_second": 120.21,
+      "eval_steps_per_second": 3.87,
       "step": 3030
     },
     {
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.5030181086519114,
+      "eval_best_threshold": 0.4006907343864441,
+      "eval_f1": 0.6671159029649596,
       "eval_loss": 0.7038925290107727,
+      "eval_precision": 0.5015197568389058,
+      "eval_recall": 0.9959758551307847,
+      "eval_runtime": 8.2224,
+      "eval_samples_per_second": 120.89,
+      "eval_steps_per_second": 3.892,
       "step": 4040
     },
     {
       "step": 4040,
       "total_flos": 6.343227643160166e+17,
       "train_loss": 0.6829259282291525,
+      "train_runtime": 2722.2879,
+      "train_samples_per_second": 237.337,
+      "train_steps_per_second": 7.42
     }
   ],
   "logging_steps": 500,