update model with 1.0 safeguard

Files changed (3) hide show

checkpoint-64000/trainer_state.json +23 -23
checkpoint-64000/training_args.bin +1 -1
training_args.bin +1 -1

checkpoint-64000/trainer_state.json CHANGED Viewed

@@ -18,9 +18,9 @@
       "eval_bleu": 42.0213,
       "eval_gen_len": 33.5187,
       "eval_loss": 0.0983896404504776,
-      "eval_runtime": 139.2335,
-      "eval_samples_per_second": 7.491,
-      "eval_steps_per_second": 0.474,
       "step": 8000
     },
     {
@@ -34,9 +34,9 @@
       "eval_bleu": 42.5956,
       "eval_gen_len": 34.3337,
       "eval_loss": 0.09711522608995438,
-      "eval_runtime": 204.7182,
-      "eval_samples_per_second": 5.095,
-      "eval_steps_per_second": 0.322,
       "step": 16000
     },
     {
@@ -50,9 +50,9 @@
       "eval_bleu": 42.4234,
       "eval_gen_len": 33.6222,
       "eval_loss": 0.09710835665464401,
-      "eval_runtime": 146.0195,
-      "eval_samples_per_second": 7.143,
-      "eval_steps_per_second": 0.452,
       "step": 24000
     },
     {
@@ -66,9 +66,9 @@
       "eval_bleu": 43.0677,
       "eval_gen_len": 33.6654,
       "eval_loss": 0.0967707633972168,
-      "eval_runtime": 131.5813,
-      "eval_samples_per_second": 7.927,
-      "eval_steps_per_second": 0.502,
       "step": 32000
     },
     {
@@ -82,8 +82,8 @@
       "eval_bleu": 42.7333,
       "eval_gen_len": 34.8533,
       "eval_loss": 0.09592821449041367,
-      "eval_runtime": 131.6747,
-      "eval_samples_per_second": 7.921,
       "eval_steps_per_second": 0.501,
       "step": 40000
     },
@@ -98,9 +98,9 @@
       "eval_bleu": 42.8479,
       "eval_gen_len": 34.2771,
       "eval_loss": 0.09712815284729004,
-      "eval_runtime": 126.0283,
-      "eval_samples_per_second": 8.276,
-      "eval_steps_per_second": 0.524,
       "step": 48000
     },
     {
@@ -114,9 +114,9 @@
       "eval_bleu": 42.4623,
       "eval_gen_len": 34.1122,
       "eval_loss": 0.09739168733358383,
-      "eval_runtime": 191.9796,
-      "eval_samples_per_second": 5.433,
-      "eval_steps_per_second": 0.344,
       "step": 56000
     },
     {
@@ -130,9 +130,9 @@
       "eval_bleu": 43.0883,
       "eval_gen_len": 34.9319,
       "eval_loss": 0.09650042653083801,
-      "eval_runtime": 182.5666,
-      "eval_samples_per_second": 5.713,
-      "eval_steps_per_second": 0.362,
       "step": 64000
     }
   ],

       "eval_bleu": 42.0213,
       "eval_gen_len": 33.5187,
       "eval_loss": 0.0983896404504776,
+      "eval_runtime": 137.809,
+      "eval_samples_per_second": 7.568,
+      "eval_steps_per_second": 0.479,
       "step": 8000
     },
     {
       "eval_bleu": 42.5956,
       "eval_gen_len": 34.3337,
       "eval_loss": 0.09711522608995438,
+      "eval_runtime": 202.6277,
+      "eval_samples_per_second": 5.147,
+      "eval_steps_per_second": 0.326,
       "step": 16000
     },
     {
       "eval_bleu": 42.4234,
       "eval_gen_len": 33.6222,
       "eval_loss": 0.09710835665464401,
+      "eval_runtime": 146.6065,
+      "eval_samples_per_second": 7.114,
+      "eval_steps_per_second": 0.45,
       "step": 24000
     },
     {
       "eval_bleu": 43.0677,
       "eval_gen_len": 33.6654,
       "eval_loss": 0.0967707633972168,
+      "eval_runtime": 133.705,
+      "eval_samples_per_second": 7.801,
+      "eval_steps_per_second": 0.494,
       "step": 32000
     },
     {
       "eval_bleu": 42.7333,
       "eval_gen_len": 34.8533,
       "eval_loss": 0.09592821449041367,
+      "eval_runtime": 131.6304,
+      "eval_samples_per_second": 7.924,
       "eval_steps_per_second": 0.501,
       "step": 40000
     },
       "eval_bleu": 42.8479,
       "eval_gen_len": 34.2771,
       "eval_loss": 0.09712815284729004,
+      "eval_runtime": 129.1233,
+      "eval_samples_per_second": 8.078,
+      "eval_steps_per_second": 0.511,
       "step": 48000
     },
     {
       "eval_bleu": 42.4623,
       "eval_gen_len": 34.1122,
       "eval_loss": 0.09739168733358383,
+      "eval_runtime": 183.6808,
+      "eval_samples_per_second": 5.678,
+      "eval_steps_per_second": 0.359,
       "step": 56000
     },
     {
       "eval_bleu": 43.0883,
       "eval_gen_len": 34.9319,
       "eval_loss": 0.09650042653083801,
+      "eval_runtime": 173.7588,
+      "eval_samples_per_second": 6.003,
+      "eval_steps_per_second": 0.38,
       "step": 64000
     }
   ],

checkpoint-64000/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b965fb713e6c062170dac4d0b33e4e1548a05b1f8ed80def4df395181fb884c6
 size 3771

 version https://git-lfs.github.com/spec/v1
+oid sha256:ab244e3a4172e40fce1ed515532fd49bc4ff6c8a2eee38489a8498756a4d1bbb
 size 3771

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b965fb713e6c062170dac4d0b33e4e1548a05b1f8ed80def4df395181fb884c6
 size 3771

 version https://git-lfs.github.com/spec/v1
+oid sha256:ab244e3a4172e40fce1ed515532fd49bc4ff6c8a2eee38489a8498756a4d1bbb
 size 3771