End of training

Browse files

Files changed (5) hide show

all_results.json +8 -8
eval_results.json +4 -4
runs/Dec20_18-16-58_129-146-32-172/events.out.tfevents.1671563202.129-146-32-172.137520.2 +3 -0
train_results.json +5 -5
trainer_state.json +357 -12

all_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
-    "epoch": 12.5,
     "eval_loss": 0.8710034489631653,
-    "eval_runtime": 202.2604,
-    "eval_samples_per_second": 2.531,
-    "eval_steps_per_second": 0.079,
     "eval_wer": 60.05599273607748,
-    "train_loss": 0.31471561336517334,
-    "train_runtime": 1275.0957,
-    "train_samples_per_second": 25.096,
-    "train_steps_per_second": 0.392
 }

 {
+    "epoch": 25.0,
     "eval_loss": 0.8710034489631653,
+    "eval_runtime": 324.5791,
+    "eval_samples_per_second": 1.577,
+    "eval_steps_per_second": 0.049,
     "eval_wer": 60.05599273607748,
+    "train_loss": 0.16543263983726503,
+    "train_runtime": 2579.5458,
+    "train_samples_per_second": 24.811,
+    "train_steps_per_second": 0.388
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 12.5,
     "eval_loss": 0.8710034489631653,
-    "eval_runtime": 202.2604,
-    "eval_samples_per_second": 2.531,
-    "eval_steps_per_second": 0.079,
     "eval_wer": 60.05599273607748
 }

 {
+    "epoch": 25.0,
     "eval_loss": 0.8710034489631653,
+    "eval_runtime": 324.5791,
+    "eval_samples_per_second": 1.577,
+    "eval_steps_per_second": 0.049,
     "eval_wer": 60.05599273607748
 }

runs/Dec20_18-16-58_129-146-32-172/events.out.tfevents.1671563202.129-146-32-172.137520.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c06e882b57bbb25ce16c01b5e19af5d55ef76cf57fb5e4836eeb3b94df95f92e
+size 358

train_results.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
-    "epoch": 12.5,
-    "train_loss": 0.31471561336517334,
-    "train_runtime": 1275.0957,
-    "train_samples_per_second": 25.096,
-    "train_steps_per_second": 0.392
 }

 {
+    "epoch": 25.0,
+    "train_loss": 0.16543263983726503,
+    "train_runtime": 2579.5458,
+    "train_samples_per_second": 24.811,
+    "train_steps_per_second": 0.388
 }

trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.8710034489631653,
   "best_model_checkpoint": "./checkpoint-400",
-  "epoch": 12.5,
-  "global_step": 500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -353,18 +353,363 @@
       "step": 500
     },
     {
-      "epoch": 12.5,
-      "step": 500,
-      "total_flos": 2.02648572002304e+18,
-      "train_loss": 0.31471561336517334,
-      "train_runtime": 1275.0957,
-      "train_samples_per_second": 25.096,
-      "train_steps_per_second": 0.392
     }
   ],
-  "max_steps": 500,
-  "num_train_epochs": 13,
-  "total_flos": 2.02648572002304e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.8710034489631653,
   "best_model_checkpoint": "./checkpoint-400",
+  "epoch": 25.0,
+  "global_step": 1000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "step": 500
     },
     {
+      "epoch": 12.75,
+      "learning_rate": 5.092783505154639e-06,
+      "loss": 0.4501,
+      "step": 510
+    },
+    {
+      "epoch": 13.0,
+      "learning_rate": 4.989690721649485e-06,
+      "loss": 0.4693,
+      "step": 520
+    },
+    {
+      "epoch": 13.25,
+      "learning_rate": 4.88659793814433e-06,
+      "loss": 0.4261,
+      "step": 530
+    },
+    {
+      "epoch": 13.5,
+      "learning_rate": 4.783505154639176e-06,
+      "loss": 0.4336,
+      "step": 540
+    },
+    {
+      "epoch": 13.75,
+      "learning_rate": 4.680412371134021e-06,
+      "loss": 0.4303,
+      "step": 550
+    },
+    {
+      "epoch": 14.0,
+      "learning_rate": 4.577319587628866e-06,
+      "loss": 0.4231,
+      "step": 560
+    },
+    {
+      "epoch": 14.25,
+      "learning_rate": 4.474226804123712e-06,
+      "loss": 0.4178,
+      "step": 570
+    },
+    {
+      "epoch": 14.5,
+      "learning_rate": 4.371134020618557e-06,
+      "loss": 0.4046,
+      "step": 580
+    },
+    {
+      "epoch": 14.75,
+      "learning_rate": 4.2680412371134025e-06,
+      "loss": 0.3927,
+      "step": 590
+    },
+    {
+      "epoch": 15.0,
+      "learning_rate": 4.164948453608248e-06,
+      "loss": 0.3882,
+      "step": 600
+    },
+    {
+      "epoch": 15.0,
+      "eval_loss": 0.8819407224655151,
+      "eval_runtime": 211.3554,
+      "eval_samples_per_second": 2.422,
+      "eval_steps_per_second": 0.076,
+      "eval_wer": 59.06476997578692,
+      "step": 600
+    },
+    {
+      "epoch": 15.25,
+      "learning_rate": 4.061855670103093e-06,
+      "loss": 0.372,
+      "step": 610
+    },
+    {
+      "epoch": 15.5,
+      "learning_rate": 3.958762886597938e-06,
+      "loss": 0.3832,
+      "step": 620
+    },
+    {
+      "epoch": 15.75,
+      "learning_rate": 3.855670103092784e-06,
+      "loss": 0.3756,
+      "step": 630
+    },
+    {
+      "epoch": 16.0,
+      "learning_rate": 3.752577319587629e-06,
+      "loss": 0.3818,
+      "step": 640
+    },
+    {
+      "epoch": 16.25,
+      "learning_rate": 3.6494845360824745e-06,
+      "loss": 0.3669,
+      "step": 650
+    },
+    {
+      "epoch": 16.5,
+      "learning_rate": 3.54639175257732e-06,
+      "loss": 0.3481,
+      "step": 660
+    },
+    {
+      "epoch": 16.75,
+      "learning_rate": 3.443298969072165e-06,
+      "loss": 0.3568,
+      "step": 670
+    },
+    {
+      "epoch": 17.0,
+      "learning_rate": 3.3402061855670103e-06,
+      "loss": 0.3567,
+      "step": 680
+    },
+    {
+      "epoch": 17.25,
+      "learning_rate": 3.2371134020618563e-06,
+      "loss": 0.3513,
+      "step": 690
+    },
+    {
+      "epoch": 17.5,
+      "learning_rate": 3.1340206185567014e-06,
+      "loss": 0.3346,
+      "step": 700
+    },
+    {
+      "epoch": 17.5,
+      "eval_loss": 0.9031797647476196,
+      "eval_runtime": 183.8672,
+      "eval_samples_per_second": 2.785,
+      "eval_steps_per_second": 0.087,
+      "eval_wer": 59.480932203389834,
+      "step": 700
+    },
+    {
+      "epoch": 17.75,
+      "learning_rate": 3.0309278350515465e-06,
+      "loss": 0.3322,
+      "step": 710
+    },
+    {
+      "epoch": 18.0,
+      "learning_rate": 2.927835051546392e-06,
+      "loss": 0.3114,
+      "step": 720
+    },
+    {
+      "epoch": 18.25,
+      "learning_rate": 2.8247422680412372e-06,
+      "loss": 0.3155,
+      "step": 730
+    },
+    {
+      "epoch": 18.5,
+      "learning_rate": 2.7216494845360823e-06,
+      "loss": 0.3295,
+      "step": 740
+    },
+    {
+      "epoch": 18.75,
+      "learning_rate": 2.6185567010309283e-06,
+      "loss": 0.314,
+      "step": 750
+    },
+    {
+      "epoch": 19.0,
+      "learning_rate": 2.5154639175257734e-06,
+      "loss": 0.3068,
+      "step": 760
+    },
+    {
+      "epoch": 19.25,
+      "learning_rate": 2.412371134020619e-06,
+      "loss": 0.312,
+      "step": 770
+    },
+    {
+      "epoch": 19.5,
+      "learning_rate": 2.309278350515464e-06,
+      "loss": 0.2938,
+      "step": 780
+    },
+    {
+      "epoch": 19.75,
+      "learning_rate": 2.2061855670103092e-06,
+      "loss": 0.3052,
+      "step": 790
+    },
+    {
+      "epoch": 20.0,
+      "learning_rate": 2.1030927835051548e-06,
+      "loss": 0.2947,
+      "step": 800
+    },
+    {
+      "epoch": 20.0,
+      "eval_loss": 0.9144465923309326,
+      "eval_runtime": 185.6121,
+      "eval_samples_per_second": 2.758,
+      "eval_steps_per_second": 0.086,
+      "eval_wer": 59.76846246973365,
+      "step": 800
+    },
+    {
+      "epoch": 20.25,
+      "learning_rate": 2.0000000000000003e-06,
+      "loss": 0.2897,
+      "step": 810
+    },
+    {
+      "epoch": 20.5,
+      "learning_rate": 1.8969072164948455e-06,
+      "loss": 0.2856,
+      "step": 820
+    },
+    {
+      "epoch": 20.75,
+      "learning_rate": 1.7938144329896908e-06,
+      "loss": 0.3027,
+      "step": 830
+    },
+    {
+      "epoch": 21.0,
+      "learning_rate": 1.6907216494845363e-06,
+      "loss": 0.3446,
+      "step": 840
+    },
+    {
+      "epoch": 21.25,
+      "learning_rate": 1.5876288659793815e-06,
+      "loss": 0.2766,
+      "step": 850
+    },
+    {
+      "epoch": 21.5,
+      "learning_rate": 1.484536082474227e-06,
+      "loss": 0.2816,
+      "step": 860
+    },
+    {
+      "epoch": 21.75,
+      "learning_rate": 1.3814432989690724e-06,
+      "loss": 0.2845,
+      "step": 870
+    },
+    {
+      "epoch": 22.0,
+      "learning_rate": 1.2783505154639175e-06,
+      "loss": 0.2828,
+      "step": 880
+    },
+    {
+      "epoch": 22.25,
+      "learning_rate": 1.175257731958763e-06,
+      "loss": 0.2766,
+      "step": 890
+    },
+    {
+      "epoch": 22.5,
+      "learning_rate": 1.0721649484536084e-06,
+      "loss": 0.2724,
+      "step": 900
+    },
+    {
+      "epoch": 22.5,
+      "eval_loss": 0.9288888573646545,
+      "eval_runtime": 275.793,
+      "eval_samples_per_second": 1.856,
+      "eval_steps_per_second": 0.058,
+      "eval_wer": 58.98153753026635,
+      "step": 900
+    },
+    {
+      "epoch": 22.75,
+      "learning_rate": 9.690721649484537e-07,
+      "loss": 0.267,
+      "step": 910
+    },
+    {
+      "epoch": 23.0,
+      "learning_rate": 8.65979381443299e-07,
+      "loss": 0.2602,
+      "step": 920
+    },
+    {
+      "epoch": 23.25,
+      "learning_rate": 7.628865979381445e-07,
+      "loss": 0.2692,
+      "step": 930
+    },
+    {
+      "epoch": 23.5,
+      "learning_rate": 6.597938144329897e-07,
+      "loss": 0.2623,
+      "step": 940
+    },
+    {
+      "epoch": 23.75,
+      "learning_rate": 5.567010309278352e-07,
+      "loss": 0.2729,
+      "step": 950
+    },
+    {
+      "epoch": 24.0,
+      "learning_rate": 4.5360824742268044e-07,
+      "loss": 0.263,
+      "step": 960
+    },
+    {
+      "epoch": 24.25,
+      "learning_rate": 3.505154639175258e-07,
+      "loss": 0.2656,
+      "step": 970
+    },
+    {
+      "epoch": 24.5,
+      "learning_rate": 2.474226804123711e-07,
+      "loss": 0.2633,
+      "step": 980
+    },
+    {
+      "epoch": 24.75,
+      "learning_rate": 1.443298969072165e-07,
+      "loss": 0.2661,
+      "step": 990
+    },
+    {
+      "epoch": 25.0,
+      "learning_rate": 4.123711340206186e-08,
+      "loss": 0.2785,
+      "step": 1000
+    },
+    {
+      "epoch": 25.0,
+      "eval_loss": 0.933917224407196,
+      "eval_runtime": 339.9994,
+      "eval_samples_per_second": 1.506,
+      "eval_steps_per_second": 0.047,
+      "eval_wer": 59.200968523002416,
+      "step": 1000
+    },
+    {
+      "epoch": 25.0,
+      "step": 1000,
+      "total_flos": 4.048885260288e+18,
+      "train_loss": 0.16543263983726503,
+      "train_runtime": 2579.5458,
+      "train_samples_per_second": 24.811,
+      "train_steps_per_second": 0.388
     }
   ],
+  "max_steps": 1000,
+  "num_train_epochs": 25,
+  "total_flos": 4.048885260288e+18,
   "trial_name": null,
   "trial_params": null
 }