End of training

Browse files

Files changed (5) hide show

all_results.json +12 -0
eval_results.json +8 -0
runs/Aug18_10-10-50_gpu01/events.out.tfevents.1692356548.gpu01.18551.1 +3 -0
train_results.json +7 -0
trainer_state.json +232 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,12 @@

+{
+    "epoch": 4.36,
+    "eval_loss": 0.642578125,
+    "eval_runtime": 165.5744,
+    "eval_samples_per_second": 53.323,
+    "eval_steps_per_second": 3.334,
+    "eval_wer": 53.0400387724153,
+    "train_loss": 0.8101146443684896,
+    "train_runtime": 1696.2635,
+    "train_samples_per_second": 45.276,
+    "train_steps_per_second": 0.177
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 4.36,
+    "eval_loss": 0.642578125,
+    "eval_runtime": 165.5744,
+    "eval_samples_per_second": 53.323,
+    "eval_steps_per_second": 3.334,
+    "eval_wer": 53.0400387724153
+}

runs/Aug18_10-10-50_gpu01/events.out.tfevents.1692356548.gpu01.18551.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:68e7bf8ad7e1761c738066685e218b1d02fb6c93f1c0089401bf3b026027afa2
+size 406

train_results.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+    "epoch": 4.36,
+    "train_loss": 0.8101146443684896,
+    "train_runtime": 1696.2635,
+    "train_samples_per_second": 45.276,
+    "train_steps_per_second": 0.177
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,232 @@

+{
+  "best_metric": 53.0400387724153,
+  "best_model_checkpoint": "./whisper_tiny_cs/checkpoint-300",
+  "epoch": 4.363636363636363,
+  "global_step": 300,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.15,
+      "learning_rate": 2.5938375012788124e-06,
+      "loss": 1.9204,
+      "step": 10
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 4.0137332755197495e-06,
+      "loss": 1.6483,
+      "step": 20
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 4.716577826569394e-06,
+      "loss": 1.3926,
+      "step": 30
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 5.187675002557625e-06,
+      "loss": 1.215,
+      "step": 40
+    },
+    {
+      "epoch": 0.73,
+      "learning_rate": 5.542526105605248e-06,
+      "loss": 1.0921,
+      "step": 50
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 5.827293423354003e-06,
+      "loss": 1.0174,
+      "step": 60
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 6.065146451806229e-06,
+      "loss": 0.9591,
+      "step": 70
+    },
+    {
+      "epoch": 1.16,
+      "learning_rate": 6.2693786409359715e-06,
+      "loss": 0.8963,
+      "step": 80
+    },
+    {
+      "epoch": 1.31,
+      "learning_rate": 6.448328170811893e-06,
+      "loss": 0.8609,
+      "step": 90
+    },
+    {
+      "epoch": 1.45,
+      "learning_rate": 6.607570776798562e-06,
+      "loss": 0.8297,
+      "step": 100
+    },
+    {
+      "epoch": 1.45,
+      "eval_loss": 0.873046875,
+      "eval_runtime": 168.9595,
+      "eval_samples_per_second": 52.255,
+      "eval_steps_per_second": 3.267,
+      "eval_wer": 66.3524224942545,
+      "step": 100
+    },
+    {
+      "epoch": 1.6,
+      "learning_rate": 6.751019550882568e-06,
+      "loss": 0.7988,
+      "step": 110
+    },
+    {
+      "epoch": 1.75,
+      "learning_rate": 6.881526630756396e-06,
+      "loss": 0.7724,
+      "step": 120
+    },
+    {
+      "epoch": 1.89,
+      "learning_rate": 7.001235150391877e-06,
+      "loss": 0.7666,
+      "step": 130
+    },
+    {
+      "epoch": 2.04,
+      "learning_rate": 7.11179636123406e-06,
+      "loss": 0.7285,
+      "step": 140
+    },
+    {
+      "epoch": 2.18,
+      "learning_rate": 7.214509519281458e-06,
+      "loss": 0.6919,
+      "step": 150
+    },
+    {
+      "epoch": 2.33,
+      "learning_rate": 7.310415327848206e-06,
+      "loss": 0.6813,
+      "step": 160
+    },
+    {
+      "epoch": 2.47,
+      "learning_rate": 7.400360293466852e-06,
+      "loss": 0.6646,
+      "step": 170
+    },
+    {
+      "epoch": 2.62,
+      "learning_rate": 7.485042226047167e-06,
+      "loss": 0.6515,
+      "step": 180
+    },
+    {
+      "epoch": 2.76,
+      "learning_rate": 7.565043147393057e-06,
+      "loss": 0.6322,
+      "step": 190
+    },
+    {
+      "epoch": 2.91,
+      "learning_rate": 7.640853571188253e-06,
+      "loss": 0.62,
+      "step": 200
+    },
+    {
+      "epoch": 2.91,
+      "eval_loss": 0.71875,
+      "eval_runtime": 169.5645,
+      "eval_samples_per_second": 52.069,
+      "eval_steps_per_second": 3.255,
+      "eval_wer": 57.866266435282895,
+      "step": 200
+    },
+    {
+      "epoch": 3.05,
+      "learning_rate": 7.712890734563846e-06,
+      "loss": 0.6029,
+      "step": 210
+    },
+    {
+      "epoch": 3.2,
+      "learning_rate": 7.781512503836438e-06,
+      "loss": 0.5771,
+      "step": 220
+    },
+    {
+      "epoch": 3.35,
+      "learning_rate": 7.847028130491337e-06,
+      "loss": 0.5742,
+      "step": 230
+    },
+    {
+      "epoch": 3.49,
+      "learning_rate": 7.909706676567024e-06,
+      "loss": 0.5557,
+      "step": 240
+    },
+    {
+      "epoch": 3.64,
+      "learning_rate": 7.969783690344598e-06,
+      "loss": 0.5569,
+      "step": 250
+    },
+    {
+      "epoch": 3.78,
+      "learning_rate": 8.027466551039499e-06,
+      "loss": 0.5467,
+      "step": 260
+    },
+    {
+      "epoch": 3.93,
+      "learning_rate": 8.082938788770226e-06,
+      "loss": 0.5358,
+      "step": 270
+    },
+    {
+      "epoch": 4.07,
+      "learning_rate": 8.13636360688406e-06,
+      "loss": 0.5169,
+      "step": 280
+    },
+    {
+      "epoch": 4.22,
+      "learning_rate": 8.187886777096811e-06,
+      "loss": 0.499,
+      "step": 290
+    },
+    {
+      "epoch": 4.36,
+      "learning_rate": 8.237639036863129e-06,
+      "loss": 0.4986,
+      "step": 300
+    },
+    {
+      "epoch": 4.36,
+      "eval_loss": 0.642578125,
+      "eval_runtime": 166.9295,
+      "eval_samples_per_second": 52.891,
+      "eval_steps_per_second": 3.307,
+      "eval_wer": 53.0400387724153,
+      "step": 300
+    },
+    {
+      "epoch": 4.36,
+      "step": 300,
+      "total_flos": 1.890730374196101e+18,
+      "train_loss": 0.8101146443684896,
+      "train_runtime": 1696.2635,
+      "train_samples_per_second": 45.276,
+      "train_steps_per_second": 0.177
+    }
+  ],
+  "max_steps": 300,
+  "num_train_epochs": 5,
+  "total_flos": 1.890730374196101e+18,
+  "trial_name": null,
+  "trial_params": null
+}