update model with 1.0 safeguard

Files changed (3) hide show

checkpoint-80000/trainer_state.json +30 -30
checkpoint-80000/training_args.bin +1 -1
training_args.bin +1 -1

checkpoint-80000/trainer_state.json CHANGED Viewed

@@ -18,9 +18,9 @@
       "eval_bleu": 42.1115,
       "eval_gen_len": 33.8782,
       "eval_loss": 0.09834092110395432,
-      "eval_runtime": 133.0059,
-      "eval_samples_per_second": 7.842,
-      "eval_steps_per_second": 0.496,
       "step": 8000
     },
     {
@@ -34,9 +34,9 @@
       "eval_bleu": 42.5044,
       "eval_gen_len": 34.0422,
       "eval_loss": 0.09755747765302658,
-      "eval_runtime": 123.2199,
-      "eval_samples_per_second": 8.465,
-      "eval_steps_per_second": 0.536,
       "step": 16000
     },
     {
@@ -50,9 +50,9 @@
       "eval_bleu": 42.1738,
       "eval_gen_len": 33.3921,
       "eval_loss": 0.09764789789915085,
-      "eval_runtime": 135.8363,
-      "eval_samples_per_second": 7.678,
-      "eval_steps_per_second": 0.486,
       "step": 24000
     },
     {
@@ -66,9 +66,9 @@
       "eval_bleu": 42.6761,
       "eval_gen_len": 33.8092,
       "eval_loss": 0.09669991582632065,
-      "eval_runtime": 112.788,
-      "eval_samples_per_second": 9.247,
-      "eval_steps_per_second": 0.585,
       "step": 32000
     },
     {
@@ -82,9 +82,9 @@
       "eval_bleu": 42.5089,
       "eval_gen_len": 33.814,
       "eval_loss": 0.09582150727510452,
-      "eval_runtime": 113.7375,
-      "eval_samples_per_second": 9.17,
-      "eval_steps_per_second": 0.58,
       "step": 40000
     },
     {
@@ -98,9 +98,9 @@
       "eval_bleu": 42.6428,
       "eval_gen_len": 33.954,
       "eval_loss": 0.09729909896850586,
-      "eval_runtime": 111.2244,
-      "eval_samples_per_second": 9.377,
-      "eval_steps_per_second": 0.593,
       "step": 48000
     },
     {
@@ -114,9 +114,9 @@
       "eval_bleu": 42.5021,
       "eval_gen_len": 33.7661,
       "eval_loss": 0.09766314178705215,
-      "eval_runtime": 149.7488,
-      "eval_samples_per_second": 6.965,
-      "eval_steps_per_second": 0.441,
       "step": 56000
     },
     {
@@ -130,9 +130,9 @@
       "eval_bleu": 42.8416,
       "eval_gen_len": 33.999,
       "eval_loss": 0.09677453339099884,
-      "eval_runtime": 156.1922,
-      "eval_samples_per_second": 6.678,
-      "eval_steps_per_second": 0.423,
       "step": 64000
     },
     {
@@ -146,9 +146,9 @@
       "eval_bleu": 42.797,
       "eval_gen_len": 34.5053,
       "eval_loss": 0.09712178260087967,
-      "eval_runtime": 127.7296,
-      "eval_samples_per_second": 8.166,
-      "eval_steps_per_second": 0.517,
       "step": 72000
     },
     {
@@ -162,9 +162,9 @@
       "eval_bleu": 43.3155,
       "eval_gen_len": 34.0355,
       "eval_loss": 0.09631923586130142,
-      "eval_runtime": 125.7048,
-      "eval_samples_per_second": 8.297,
-      "eval_steps_per_second": 0.525,
       "step": 80000
     }
   ],

       "eval_bleu": 42.1115,
       "eval_gen_len": 33.8782,
       "eval_loss": 0.09834092110395432,
+      "eval_runtime": 120.1201,
+      "eval_samples_per_second": 8.683,
+      "eval_steps_per_second": 0.549,
       "step": 8000
     },
     {
       "eval_bleu": 42.5044,
       "eval_gen_len": 34.0422,
       "eval_loss": 0.09755747765302658,
+      "eval_runtime": 108.595,
+      "eval_samples_per_second": 9.604,
+      "eval_steps_per_second": 0.608,
       "step": 16000
     },
     {
       "eval_bleu": 42.1738,
       "eval_gen_len": 33.3921,
       "eval_loss": 0.09764789789915085,
+      "eval_runtime": 129.8931,
+      "eval_samples_per_second": 8.03,
+      "eval_steps_per_second": 0.508,
       "step": 24000
     },
     {
       "eval_bleu": 42.6761,
       "eval_gen_len": 33.8092,
       "eval_loss": 0.09669991582632065,
+      "eval_runtime": 115.0248,
+      "eval_samples_per_second": 9.068,
+      "eval_steps_per_second": 0.574,
       "step": 32000
     },
     {
       "eval_bleu": 42.5089,
       "eval_gen_len": 33.814,
       "eval_loss": 0.09582150727510452,
+      "eval_runtime": 115.0911,
+      "eval_samples_per_second": 9.062,
+      "eval_steps_per_second": 0.573,
       "step": 40000
     },
     {
       "eval_bleu": 42.6428,
       "eval_gen_len": 33.954,
       "eval_loss": 0.09729909896850586,
+      "eval_runtime": 116.307,
+      "eval_samples_per_second": 8.968,
+      "eval_steps_per_second": 0.567,
       "step": 48000
     },
     {
       "eval_bleu": 42.5021,
       "eval_gen_len": 33.7661,
       "eval_loss": 0.09766314178705215,
+      "eval_runtime": 141.066,
+      "eval_samples_per_second": 7.394,
+      "eval_steps_per_second": 0.468,
       "step": 56000
     },
     {
       "eval_bleu": 42.8416,
       "eval_gen_len": 33.999,
       "eval_loss": 0.09677453339099884,
+      "eval_runtime": 152.4751,
+      "eval_samples_per_second": 6.84,
+      "eval_steps_per_second": 0.433,
       "step": 64000
     },
     {
       "eval_bleu": 42.797,
       "eval_gen_len": 34.5053,
       "eval_loss": 0.09712178260087967,
+      "eval_runtime": 129.5634,
+      "eval_samples_per_second": 8.05,
+      "eval_steps_per_second": 0.509,
       "step": 72000
     },
     {
       "eval_bleu": 43.3155,
       "eval_gen_len": 34.0355,
       "eval_loss": 0.09631923586130142,
+      "eval_runtime": 129.8003,
+      "eval_samples_per_second": 8.035,
+      "eval_steps_per_second": 0.508,
       "step": 80000
     }
   ],

checkpoint-80000/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d7754c0c1d221803f1ec03c42c8ec824faf828e5ad475618050f1176fed7e195
 size 3771

 version https://git-lfs.github.com/spec/v1
+oid sha256:0525360cd05bfbdd2df5f26e0857e71611200a70f3433da967d91c1e94623987
 size 3771

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d7754c0c1d221803f1ec03c42c8ec824faf828e5ad475618050f1176fed7e195
 size 3771

 version https://git-lfs.github.com/spec/v1
+oid sha256:0525360cd05bfbdd2df5f26e0857e71611200a70f3433da967d91c1e94623987
 size 3771