update model with 1.0 safeguard

Files changed (3) hide show

checkpoint-80000/trainer_state.json +30 -30
checkpoint-80000/training_args.bin +1 -1
training_args.bin +1 -1

checkpoint-80000/trainer_state.json CHANGED Viewed

@@ -18,9 +18,9 @@
       "eval_bleu": 42.2846,
       "eval_gen_len": 33.9099,
       "eval_loss": 0.09808671474456787,
-      "eval_runtime": 101.3103,
-      "eval_samples_per_second": 10.295,
-      "eval_steps_per_second": 0.651,
       "step": 8000
     },
     {
@@ -34,9 +34,9 @@
       "eval_bleu": 42.5263,
       "eval_gen_len": 33.9847,
       "eval_loss": 0.09837382286787033,
-      "eval_runtime": 88.4642,
-      "eval_samples_per_second": 11.79,
-      "eval_steps_per_second": 0.746,
       "step": 16000
     },
     {
@@ -50,9 +50,9 @@
       "eval_bleu": 42.8007,
       "eval_gen_len": 34.2359,
       "eval_loss": 0.09744028747081757,
-      "eval_runtime": 94.3167,
-      "eval_samples_per_second": 11.058,
-      "eval_steps_per_second": 0.7,
       "step": 24000
     },
     {
@@ -66,9 +66,9 @@
       "eval_bleu": 42.7644,
       "eval_gen_len": 34.2148,
       "eval_loss": 0.09636388719081879,
-      "eval_runtime": 100.6778,
-      "eval_samples_per_second": 10.36,
-      "eval_steps_per_second": 0.656,
       "step": 32000
     },
     {
@@ -82,9 +82,9 @@
       "eval_bleu": 42.9411,
       "eval_gen_len": 34.6865,
       "eval_loss": 0.09594809263944626,
-      "eval_runtime": 99.5677,
-      "eval_samples_per_second": 10.475,
-      "eval_steps_per_second": 0.663,
       "step": 40000
     },
     {
@@ -98,9 +98,9 @@
       "eval_bleu": 42.8809,
       "eval_gen_len": 34.4324,
       "eval_loss": 0.0971299335360527,
-      "eval_runtime": 179.2147,
-      "eval_samples_per_second": 5.82,
-      "eval_steps_per_second": 0.368,
       "step": 48000
     },
     {
@@ -114,9 +114,9 @@
       "eval_bleu": 42.9581,
       "eval_gen_len": 33.6337,
       "eval_loss": 0.09666970372200012,
-      "eval_runtime": 81.2036,
-      "eval_samples_per_second": 12.844,
-      "eval_steps_per_second": 0.813,
       "step": 56000
     },
     {
@@ -130,9 +130,9 @@
       "eval_bleu": 42.1891,
       "eval_gen_len": 35.0201,
       "eval_loss": 0.09686268866062164,
-      "eval_runtime": 100.7692,
-      "eval_samples_per_second": 10.35,
-      "eval_steps_per_second": 0.655,
       "step": 64000
     },
     {
@@ -146,9 +146,9 @@
       "eval_bleu": 42.9143,
       "eval_gen_len": 34.2848,
       "eval_loss": 0.09685871005058289,
-      "eval_runtime": 87.4036,
-      "eval_samples_per_second": 11.933,
-      "eval_steps_per_second": 0.755,
       "step": 72000
     },
     {
@@ -162,9 +162,9 @@
       "eval_bleu": 43.1757,
       "eval_gen_len": 34.069,
       "eval_loss": 0.09636421501636505,
-      "eval_runtime": 99.9416,
-      "eval_samples_per_second": 10.436,
-      "eval_steps_per_second": 0.66,
       "step": 80000
     }
   ],

       "eval_bleu": 42.2846,
       "eval_gen_len": 33.9099,
       "eval_loss": 0.09808671474456787,
+      "eval_runtime": 123.0699,
+      "eval_samples_per_second": 8.475,
+      "eval_steps_per_second": 0.536,
       "step": 8000
     },
     {
       "eval_bleu": 42.5263,
       "eval_gen_len": 33.9847,
       "eval_loss": 0.09837382286787033,
+      "eval_runtime": 110.1526,
+      "eval_samples_per_second": 9.469,
+      "eval_steps_per_second": 0.599,
       "step": 16000
     },
     {
       "eval_bleu": 42.8007,
       "eval_gen_len": 34.2359,
       "eval_loss": 0.09744028747081757,
+      "eval_runtime": 120.3105,
+      "eval_samples_per_second": 8.669,
+      "eval_steps_per_second": 0.549,
       "step": 24000
     },
     {
       "eval_bleu": 42.7644,
       "eval_gen_len": 34.2148,
       "eval_loss": 0.09636388719081879,
+      "eval_runtime": 124.8267,
+      "eval_samples_per_second": 8.356,
+      "eval_steps_per_second": 0.529,
       "step": 32000
     },
     {
       "eval_bleu": 42.9411,
       "eval_gen_len": 34.6865,
       "eval_loss": 0.09594809263944626,
+      "eval_runtime": 124.3057,
+      "eval_samples_per_second": 8.391,
+      "eval_steps_per_second": 0.531,
       "step": 40000
     },
     {
       "eval_bleu": 42.8809,
       "eval_gen_len": 34.4324,
       "eval_loss": 0.0971299335360527,
+      "eval_runtime": 209.1935,
+      "eval_samples_per_second": 4.986,
+      "eval_steps_per_second": 0.315,
       "step": 48000
     },
     {
       "eval_bleu": 42.9581,
       "eval_gen_len": 33.6337,
       "eval_loss": 0.09666970372200012,
+      "eval_runtime": 110.1198,
+      "eval_samples_per_second": 9.472,
+      "eval_steps_per_second": 0.599,
       "step": 56000
     },
     {
       "eval_bleu": 42.1891,
       "eval_gen_len": 35.0201,
       "eval_loss": 0.09686268866062164,
+      "eval_runtime": 132.6946,
+      "eval_samples_per_second": 7.86,
+      "eval_steps_per_second": 0.497,
       "step": 64000
     },
     {
       "eval_bleu": 42.9143,
       "eval_gen_len": 34.2848,
       "eval_loss": 0.09685871005058289,
+      "eval_runtime": 122.6555,
+      "eval_samples_per_second": 8.503,
+      "eval_steps_per_second": 0.538,
       "step": 72000
     },
     {
       "eval_bleu": 43.1757,
       "eval_gen_len": 34.069,
       "eval_loss": 0.09636421501636505,
+      "eval_runtime": 134.8008,
+      "eval_samples_per_second": 7.737,
+      "eval_steps_per_second": 0.49,
       "step": 80000
     }
   ],

checkpoint-80000/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:43072ea1f24ed9e4a40c898646c5b77ad1d5b8b7d2837ca1fab5fc4630684483
 size 3771

 version https://git-lfs.github.com/spec/v1
+oid sha256:10a31b74ed572f8ade9b00d1da9ed683d8a211c467ee888717946580b2cae4f3
 size 3771

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:43072ea1f24ed9e4a40c898646c5b77ad1d5b8b7d2837ca1fab5fc4630684483
 size 3771

 version https://git-lfs.github.com/spec/v1
+oid sha256:10a31b74ed572f8ade9b00d1da9ed683d8a211c467ee888717946580b2cae4f3
 size 3771