Push MLM model

Browse files

Files changed (2) hide show

bert_embeddings_finetune/checkpoint-4662/trainer_state.json +42 -42
bert_embeddings_finetune/checkpoint-4995/trainer_state.json +45 -45

bert_embeddings_finetune/checkpoint-4662/trainer_state.json CHANGED Viewed

@@ -11,9 +11,9 @@
     {
       "epoch": 1.0,
       "eval_loss": 2.5209195613861084,
-      "eval_runtime": 7.238,
-      "eval_samples_per_second": 735.839,
-      "eval_steps_per_second": 46.007,
       "step": 333
     },
     {
@@ -26,17 +26,17 @@
     {
       "epoch": 2.0,
       "eval_loss": 2.278496742248535,
-      "eval_runtime": 7.3227,
-      "eval_samples_per_second": 727.328,
-      "eval_steps_per_second": 45.475,
       "step": 666
     },
     {
       "epoch": 3.0,
       "eval_loss": NaN,
-      "eval_runtime": 7.4657,
-      "eval_samples_per_second": 713.401,
-      "eval_steps_per_second": 44.604,
       "step": 999
     },
     {
@@ -49,9 +49,9 @@
     {
       "epoch": 4.0,
       "eval_loss": NaN,
-      "eval_runtime": 7.4388,
-      "eval_samples_per_second": 715.977,
-      "eval_steps_per_second": 44.765,
       "step": 1332
     },
     {
@@ -64,17 +64,17 @@
     {
       "epoch": 5.0,
       "eval_loss": 1.7883461713790894,
-      "eval_runtime": 7.3242,
-      "eval_samples_per_second": 727.175,
-      "eval_steps_per_second": 45.466,
       "step": 1665
     },
     {
       "epoch": 6.0,
       "eval_loss": 1.617417573928833,
-      "eval_runtime": 7.305,
-      "eval_samples_per_second": 729.085,
-      "eval_steps_per_second": 45.585,
       "step": 1998
     },
     {
@@ -87,9 +87,9 @@
     {
       "epoch": 7.0,
       "eval_loss": 1.5227739810943604,
-      "eval_runtime": 7.3236,
-      "eval_samples_per_second": 727.238,
-      "eval_steps_per_second": 45.469,
       "step": 2331
     },
     {
@@ -102,17 +102,17 @@
     {
       "epoch": 8.0,
       "eval_loss": 1.448709487915039,
-      "eval_runtime": 7.3349,
-      "eval_samples_per_second": 726.119,
-      "eval_steps_per_second": 45.399,
       "step": 2664
     },
     {
       "epoch": 9.0,
       "eval_loss": NaN,
-      "eval_runtime": 7.4098,
-      "eval_samples_per_second": 718.774,
-      "eval_steps_per_second": 44.94,
       "step": 2997
     },
     {
@@ -125,9 +125,9 @@
     {
       "epoch": 10.0,
       "eval_loss": NaN,
-      "eval_runtime": 7.4467,
-      "eval_samples_per_second": 715.218,
-      "eval_steps_per_second": 44.718,
       "step": 3330
     },
     {
@@ -140,17 +140,17 @@
     {
       "epoch": 11.0,
       "eval_loss": 1.2851027250289917,
-      "eval_runtime": 7.5809,
-      "eval_samples_per_second": 702.554,
-      "eval_steps_per_second": 43.926,
       "step": 3663
     },
     {
       "epoch": 12.0,
       "eval_loss": 1.2175213098526,
-      "eval_runtime": 7.6804,
-      "eval_samples_per_second": 693.45,
-      "eval_steps_per_second": 43.357,
       "step": 3996
     },
     {
@@ -163,9 +163,9 @@
     {
       "epoch": 13.0,
       "eval_loss": NaN,
-      "eval_runtime": 7.5087,
-      "eval_samples_per_second": 709.31,
-      "eval_steps_per_second": 44.349,
       "step": 4329
     },
     {
@@ -178,9 +178,9 @@
     {
       "epoch": 14.0,
       "eval_loss": 1.1719356775283813,
-      "eval_runtime": 7.5831,
-      "eval_samples_per_second": 702.355,
-      "eval_steps_per_second": 43.914,
       "step": 4662
     }
   ],

     {
       "epoch": 1.0,
       "eval_loss": 2.5209195613861084,
+      "eval_runtime": 7.2095,
+      "eval_samples_per_second": 738.75,
+      "eval_steps_per_second": 46.189,
       "step": 333
     },
     {
     {
       "epoch": 2.0,
       "eval_loss": 2.278496742248535,
+      "eval_runtime": 7.3416,
+      "eval_samples_per_second": 725.453,
+      "eval_steps_per_second": 45.358,
       "step": 666
     },
     {
       "epoch": 3.0,
       "eval_loss": NaN,
+      "eval_runtime": 7.386,
+      "eval_samples_per_second": 721.09,
+      "eval_steps_per_second": 45.085,
       "step": 999
     },
     {
     {
       "epoch": 4.0,
       "eval_loss": NaN,
+      "eval_runtime": 7.5366,
+      "eval_samples_per_second": 706.68,
+      "eval_steps_per_second": 44.184,
       "step": 1332
     },
     {
     {
       "epoch": 5.0,
       "eval_loss": 1.7883461713790894,
+      "eval_runtime": 7.5591,
+      "eval_samples_per_second": 704.577,
+      "eval_steps_per_second": 44.053,
       "step": 1665
     },
     {
       "epoch": 6.0,
       "eval_loss": 1.617417573928833,
+      "eval_runtime": 7.5921,
+      "eval_samples_per_second": 701.518,
+      "eval_steps_per_second": 43.861,
       "step": 1998
     },
     {
     {
       "epoch": 7.0,
       "eval_loss": 1.5227739810943604,
+      "eval_runtime": 7.4262,
+      "eval_samples_per_second": 717.188,
+      "eval_steps_per_second": 44.841,
       "step": 2331
     },
     {
     {
       "epoch": 8.0,
       "eval_loss": 1.448709487915039,
+      "eval_runtime": 7.4455,
+      "eval_samples_per_second": 715.331,
+      "eval_steps_per_second": 44.725,
       "step": 2664
     },
     {
       "epoch": 9.0,
       "eval_loss": NaN,
+      "eval_runtime": 7.5963,
+      "eval_samples_per_second": 701.13,
+      "eval_steps_per_second": 43.837,
       "step": 2997
     },
     {
     {
       "epoch": 10.0,
       "eval_loss": NaN,
+      "eval_runtime": 7.4766,
+      "eval_samples_per_second": 712.357,
+      "eval_steps_per_second": 44.539,
       "step": 3330
     },
     {
     {
       "epoch": 11.0,
       "eval_loss": 1.2851027250289917,
+      "eval_runtime": 7.5315,
+      "eval_samples_per_second": 707.164,
+      "eval_steps_per_second": 44.214,
       "step": 3663
     },
     {
       "epoch": 12.0,
       "eval_loss": 1.2175213098526,
+      "eval_runtime": 7.5286,
+      "eval_samples_per_second": 707.433,
+      "eval_steps_per_second": 44.231,
       "step": 3996
     },
     {
     {
       "epoch": 13.0,
       "eval_loss": NaN,
+      "eval_runtime": 7.4167,
+      "eval_samples_per_second": 718.113,
+      "eval_steps_per_second": 44.899,
       "step": 4329
     },
     {
     {
       "epoch": 14.0,
       "eval_loss": 1.1719356775283813,
+      "eval_runtime": 7.391,
+      "eval_samples_per_second": 720.609,
+      "eval_steps_per_second": 45.055,
       "step": 4662
     }
   ],

bert_embeddings_finetune/checkpoint-4995/trainer_state.json CHANGED Viewed

@@ -11,9 +11,9 @@
     {
       "epoch": 1.0,
       "eval_loss": 2.5209195613861084,
-      "eval_runtime": 7.238,
-      "eval_samples_per_second": 735.839,
-      "eval_steps_per_second": 46.007,
       "step": 333
     },
     {
@@ -26,17 +26,17 @@
     {
       "epoch": 2.0,
       "eval_loss": 2.278496742248535,
-      "eval_runtime": 7.3227,
-      "eval_samples_per_second": 727.328,
-      "eval_steps_per_second": 45.475,
       "step": 666
     },
     {
       "epoch": 3.0,
       "eval_loss": NaN,
-      "eval_runtime": 7.4657,
-      "eval_samples_per_second": 713.401,
-      "eval_steps_per_second": 44.604,
       "step": 999
     },
     {
@@ -49,9 +49,9 @@
     {
       "epoch": 4.0,
       "eval_loss": NaN,
-      "eval_runtime": 7.4388,
-      "eval_samples_per_second": 715.977,
-      "eval_steps_per_second": 44.765,
       "step": 1332
     },
     {
@@ -64,17 +64,17 @@
     {
       "epoch": 5.0,
       "eval_loss": 1.7883461713790894,
-      "eval_runtime": 7.3242,
-      "eval_samples_per_second": 727.175,
-      "eval_steps_per_second": 45.466,
       "step": 1665
     },
     {
       "epoch": 6.0,
       "eval_loss": 1.617417573928833,
-      "eval_runtime": 7.305,
-      "eval_samples_per_second": 729.085,
-      "eval_steps_per_second": 45.585,
       "step": 1998
     },
     {
@@ -87,9 +87,9 @@
     {
       "epoch": 7.0,
       "eval_loss": 1.5227739810943604,
-      "eval_runtime": 7.3236,
-      "eval_samples_per_second": 727.238,
-      "eval_steps_per_second": 45.469,
       "step": 2331
     },
     {
@@ -102,17 +102,17 @@
     {
       "epoch": 8.0,
       "eval_loss": 1.448709487915039,
-      "eval_runtime": 7.3349,
-      "eval_samples_per_second": 726.119,
-      "eval_steps_per_second": 45.399,
       "step": 2664
     },
     {
       "epoch": 9.0,
       "eval_loss": NaN,
-      "eval_runtime": 7.4098,
-      "eval_samples_per_second": 718.774,
-      "eval_steps_per_second": 44.94,
       "step": 2997
     },
     {
@@ -125,9 +125,9 @@
     {
       "epoch": 10.0,
       "eval_loss": NaN,
-      "eval_runtime": 7.4467,
-      "eval_samples_per_second": 715.218,
-      "eval_steps_per_second": 44.718,
       "step": 3330
     },
     {
@@ -140,17 +140,17 @@
     {
       "epoch": 11.0,
       "eval_loss": 1.2851027250289917,
-      "eval_runtime": 7.5809,
-      "eval_samples_per_second": 702.554,
-      "eval_steps_per_second": 43.926,
       "step": 3663
     },
     {
       "epoch": 12.0,
       "eval_loss": 1.2175213098526,
-      "eval_runtime": 7.6804,
-      "eval_samples_per_second": 693.45,
-      "eval_steps_per_second": 43.357,
       "step": 3996
     },
     {
@@ -163,9 +163,9 @@
     {
       "epoch": 13.0,
       "eval_loss": NaN,
-      "eval_runtime": 7.5087,
-      "eval_samples_per_second": 709.31,
-      "eval_steps_per_second": 44.349,
       "step": 4329
     },
     {
@@ -178,17 +178,17 @@
     {
       "epoch": 14.0,
       "eval_loss": 1.1719356775283813,
-      "eval_runtime": 7.5831,
-      "eval_samples_per_second": 702.355,
-      "eval_steps_per_second": 43.914,
       "step": 4662
     },
     {
       "epoch": 15.0,
       "eval_loss": 1.2066022157669067,
-      "eval_runtime": 7.6392,
-      "eval_samples_per_second": 697.198,
-      "eval_steps_per_second": 43.591,
       "step": 4995
     }
   ],

     {
       "epoch": 1.0,
       "eval_loss": 2.5209195613861084,
+      "eval_runtime": 7.2095,
+      "eval_samples_per_second": 738.75,
+      "eval_steps_per_second": 46.189,
       "step": 333
     },
     {
     {
       "epoch": 2.0,
       "eval_loss": 2.278496742248535,
+      "eval_runtime": 7.3416,
+      "eval_samples_per_second": 725.453,
+      "eval_steps_per_second": 45.358,
       "step": 666
     },
     {
       "epoch": 3.0,
       "eval_loss": NaN,
+      "eval_runtime": 7.386,
+      "eval_samples_per_second": 721.09,
+      "eval_steps_per_second": 45.085,
       "step": 999
     },
     {
     {
       "epoch": 4.0,
       "eval_loss": NaN,
+      "eval_runtime": 7.5366,
+      "eval_samples_per_second": 706.68,
+      "eval_steps_per_second": 44.184,
       "step": 1332
     },
     {
     {
       "epoch": 5.0,
       "eval_loss": 1.7883461713790894,
+      "eval_runtime": 7.5591,
+      "eval_samples_per_second": 704.577,
+      "eval_steps_per_second": 44.053,
       "step": 1665
     },
     {
       "epoch": 6.0,
       "eval_loss": 1.617417573928833,
+      "eval_runtime": 7.5921,
+      "eval_samples_per_second": 701.518,
+      "eval_steps_per_second": 43.861,
       "step": 1998
     },
     {
     {
       "epoch": 7.0,
       "eval_loss": 1.5227739810943604,
+      "eval_runtime": 7.4262,
+      "eval_samples_per_second": 717.188,
+      "eval_steps_per_second": 44.841,
       "step": 2331
     },
     {
     {
       "epoch": 8.0,
       "eval_loss": 1.448709487915039,
+      "eval_runtime": 7.4455,
+      "eval_samples_per_second": 715.331,
+      "eval_steps_per_second": 44.725,
       "step": 2664
     },
     {
       "epoch": 9.0,
       "eval_loss": NaN,
+      "eval_runtime": 7.5963,
+      "eval_samples_per_second": 701.13,
+      "eval_steps_per_second": 43.837,
       "step": 2997
     },
     {
     {
       "epoch": 10.0,
       "eval_loss": NaN,
+      "eval_runtime": 7.4766,
+      "eval_samples_per_second": 712.357,
+      "eval_steps_per_second": 44.539,
       "step": 3330
     },
     {
     {
       "epoch": 11.0,
       "eval_loss": 1.2851027250289917,
+      "eval_runtime": 7.5315,
+      "eval_samples_per_second": 707.164,
+      "eval_steps_per_second": 44.214,
       "step": 3663
     },
     {
       "epoch": 12.0,
       "eval_loss": 1.2175213098526,
+      "eval_runtime": 7.5286,
+      "eval_samples_per_second": 707.433,
+      "eval_steps_per_second": 44.231,
       "step": 3996
     },
     {
     {
       "epoch": 13.0,
       "eval_loss": NaN,
+      "eval_runtime": 7.4167,
+      "eval_samples_per_second": 718.113,
+      "eval_steps_per_second": 44.899,
       "step": 4329
     },
     {
     {
       "epoch": 14.0,
       "eval_loss": 1.1719356775283813,
+      "eval_runtime": 7.391,
+      "eval_samples_per_second": 720.609,
+      "eval_steps_per_second": 45.055,
       "step": 4662
     },
     {
       "epoch": 15.0,
       "eval_loss": 1.2066022157669067,
+      "eval_runtime": 7.4171,
+      "eval_samples_per_second": 718.067,
+      "eval_steps_per_second": 44.896,
       "step": 4995
     }
   ],