re-trained topic classifier with new labels and prefix

Files changed (4) hide show

all_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
     "epoch": 2.0,
     "total_flos": 3512395654225920.0,
-    "train_loss": 4.116242085234606,
-    "train_runtime": 907.6783,
     "train_samples": 10842,
-    "train_samples_per_second": 23.89,
-    "train_steps_per_second": 2.988
 }

 {
     "epoch": 2.0,
     "total_flos": 3512395654225920.0,
+    "train_loss": 4.205222250789316,
+    "train_runtime": 910.1038,
     "train_samples": 10842,
+    "train_samples_per_second": 23.826,
+    "train_steps_per_second": 2.98
 }

train_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
     "epoch": 2.0,
     "total_flos": 3512395654225920.0,
-    "train_loss": 4.116242085234606,
-    "train_runtime": 907.6783,
     "train_samples": 10842,
-    "train_samples_per_second": 23.89,
-    "train_steps_per_second": 2.988
 }

 {
     "epoch": 2.0,
     "total_flos": 3512395654225920.0,
+    "train_loss": 4.205222250789316,
+    "train_runtime": 910.1038,
     "train_samples": 10842,
+    "train_samples_per_second": 23.826,
+    "train_steps_per_second": 2.98
 }

trainer_state.json CHANGED Viewed

@@ -10,23 +10,23 @@
     {
       "epoch": 1.0,
       "learning_rate": 5e-06,
-      "loss": 6.2504,
       "step": 1356
     },
     {
       "epoch": 2.0,
       "learning_rate": 0.0,
-      "loss": 1.9821,
       "step": 2712
     },
     {
       "epoch": 2.0,
       "step": 2712,
       "total_flos": 3512395654225920.0,
-      "train_loss": 4.116242085234606,
-      "train_runtime": 907.6783,
-      "train_samples_per_second": 23.89,
-      "train_steps_per_second": 2.988
     }
   ],
   "max_steps": 2712,

     {
       "epoch": 1.0,
       "learning_rate": 5e-06,
+      "loss": 6.2154,
       "step": 1356
     },
     {
       "epoch": 2.0,
       "learning_rate": 0.0,
+      "loss": 2.1951,
       "step": 2712
     },
     {
       "epoch": 2.0,
       "step": 2712,
       "total_flos": 3512395654225920.0,
+      "train_loss": 4.205222250789316,
+      "train_runtime": 910.1038,
+      "train_samples_per_second": 23.826,
+      "train_steps_per_second": 2.98
     }
   ],
   "max_steps": 2712,

training_args.bin CHANGED Viewed

Binary files a/training_args.bin and b/training_args.bin differ