Aadithyak
/

asr-til-wav2vec

+{
+  "best_global_step": null,
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 0.8296296296296296,
+  "eval_steps": 70,
+  "global_step": 140,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.005925925925925926,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 1
+    },
+    {
+      "epoch": 0.011851851851851851,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 2
+    },
+    {
+      "epoch": 0.017777777777777778,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 3
+    },
+    {
+      "epoch": 0.023703703703703703,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 4
+    },
+    {
+      "epoch": 0.02962962962962963,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 5
+    },
+    {
+      "epoch": 0.035555555555555556,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 6
+    },
+    {
+      "epoch": 0.04148148148148148,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 7
+    },
+    {
+      "epoch": 0.047407407407407405,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 8
+    },
+    {
+      "epoch": 0.05333333333333334,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 9
+    },
+    {
+      "epoch": 0.05925925925925926,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 10
+    },
+    {
+      "epoch": 0.06518518518518518,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 11
+    },
+    {
+      "epoch": 0.07111111111111111,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 12
+    },
+    {
+      "epoch": 0.07703703703703704,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 13
+    },
+    {
+      "epoch": 0.08296296296296296,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 14
+    },
+    {
+      "epoch": 0.08888888888888889,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 15
+    },
+    {
+      "epoch": 0.09481481481481481,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 16
+    },
+    {
+      "epoch": 0.10074074074074074,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 17
+    },
+    {
+      "epoch": 0.10666666666666667,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 18
+    },
+    {
+      "epoch": 0.11259259259259259,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 19
+    },
+    {
+      "epoch": 0.11851851851851852,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 20
+    },
+    {
+      "epoch": 0.12444444444444444,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 21
+    },
+    {
+      "epoch": 0.13037037037037036,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 22
+    },
+    {
+      "epoch": 0.1362962962962963,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 23
+    },
+    {
+      "epoch": 0.14222222222222222,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 24
+    },
+    {
+      "epoch": 0.14814814814814814,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 25
+    },
+    {
+      "epoch": 0.15407407407407409,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 26
+    },
+    {
+      "epoch": 0.16,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 27
+    },
+    {
+      "epoch": 0.16592592592592592,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 28
+    },
+    {
+      "epoch": 0.17185185185185184,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 29
+    },
+    {
+      "epoch": 0.17777777777777778,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 30
+    },
+    {
+      "epoch": 0.1837037037037037,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 31
+    },
+    {
+      "epoch": 0.18962962962962962,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 32
+    },
+    {
+      "epoch": 0.19555555555555557,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 33
+    },
+    {
+      "epoch": 0.20148148148148148,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 34
+    },
+    {
+      "epoch": 0.2074074074074074,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 35
+    },
+    {
+      "epoch": 0.21333333333333335,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 36
+    },
+    {
+      "epoch": 0.21925925925925926,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 37
+    },
+    {
+      "epoch": 0.22518518518518518,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 38
+    },
+    {
+      "epoch": 0.2311111111111111,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 39
+    },
+    {
+      "epoch": 0.23703703703703705,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 40
+    },
+    {
+      "epoch": 0.24296296296296296,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 41
+    },
+    {
+      "epoch": 0.24888888888888888,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 42
+    },
+    {
+      "epoch": 0.2548148148148148,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 43
+    },
+    {
+      "epoch": 0.2607407407407407,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 44
+    },
+    {
+      "epoch": 0.26666666666666666,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 45
+    },
+    {
+      "epoch": 0.2725925925925926,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 46
+    },
+    {
+      "epoch": 0.2785185185185185,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 47
+    },
+    {
+      "epoch": 0.28444444444444444,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 48
+    },
+    {
+      "epoch": 0.2903703703703704,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 49
+    },
+    {
+      "epoch": 0.2962962962962963,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 50
+    },
+    {
+      "epoch": 0.3022222222222222,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 51
+    },
+    {
+      "epoch": 0.30814814814814817,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 52
+    },
+    {
+      "epoch": 0.31407407407407406,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 53
+    },
+    {
+      "epoch": 0.32,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 54
+    },
+    {
+      "epoch": 0.32592592592592595,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 55
+    },
+    {
+      "epoch": 0.33185185185185184,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 56
+    },
+    {
+      "epoch": 0.3377777777777778,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 57
+    },
+    {
+      "epoch": 0.3437037037037037,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 58
+    },
+    {
+      "epoch": 0.3496296296296296,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 59
+    },
+    {
+      "epoch": 0.35555555555555557,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 60
+    },
+    {
+      "epoch": 0.36148148148148146,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 61
+    },
+    {
+      "epoch": 0.3674074074074074,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 62
+    },
+    {
+      "epoch": 0.37333333333333335,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 63
+    },
+    {
+      "epoch": 0.37925925925925924,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 64
+    },
+    {
+      "epoch": 0.3851851851851852,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 65
+    },
+    {
+      "epoch": 0.39111111111111113,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 66
+    },
+    {
+      "epoch": 0.397037037037037,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 67
+    },
+    {
+      "epoch": 0.40296296296296297,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 68
+    },
+    {
+      "epoch": 0.4088888888888889,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 69
+    },
+    {
+      "epoch": 0.4148148148148148,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 70
+    },
+    {
+      "epoch": 0.4148148148148148,
+      "eval_loss": 40297.44140625,
+      "eval_runtime": 63.992,
+      "eval_samples_per_second": 7.032,
+      "eval_steps_per_second": 1.172,
+      "eval_wer": 1.0381992969974168,
+      "step": 70
+    },
+    {
+      "epoch": 0.42074074074074075,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 71
+    },
+    {
+      "epoch": 0.4266666666666667,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 72
+    },
+    {
+      "epoch": 0.4325925925925926,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 73
+    },
+    {
+      "epoch": 0.43851851851851853,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 74
+    },
+    {
+      "epoch": 0.4444444444444444,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 75
+    },
+    {
+      "epoch": 0.45037037037037037,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 76
+    },
+    {
+      "epoch": 0.4562962962962963,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 77
+    },
+    {
+      "epoch": 0.4622222222222222,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 78
+    },
+    {
+      "epoch": 0.46814814814814815,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 79
+    },
+    {
+      "epoch": 0.4740740740740741,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 80
+    },
+    {
+      "epoch": 0.48,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 81
+    },
+    {
+      "epoch": 0.48592592592592593,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 82
+    },
+    {
+      "epoch": 0.4918518518518519,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 83
+    },
+    {
+      "epoch": 0.49777777777777776,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 84
+    },
+    {
+      "epoch": 0.5037037037037037,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 85
+    },
+    {
+      "epoch": 0.5096296296296297,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 86
+    },
+    {
+      "epoch": 0.5155555555555555,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 87
+    },
+    {
+      "epoch": 0.5214814814814814,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 88
+    },
+    {
+      "epoch": 0.5274074074074074,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 89
+    },
+    {
+      "epoch": 0.5333333333333333,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 90
+    },
+    {
+      "epoch": 0.5392592592592592,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 91
+    },
+    {
+      "epoch": 0.5451851851851852,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 92
+    },
+    {
+      "epoch": 0.5511111111111111,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 93
+    },
+    {
+      "epoch": 0.557037037037037,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 94
+    },
+    {
+      "epoch": 0.562962962962963,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 95
+    },
+    {
+      "epoch": 0.5688888888888889,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 96
+    },
+    {
+      "epoch": 0.5748148148148148,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 97
+    },
+    {
+      "epoch": 0.5807407407407408,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 98
+    },
+    {
+      "epoch": 0.5866666666666667,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 99
+    },
+    {
+      "epoch": 0.5925925925925926,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 100
+    },
+    {
+      "epoch": 0.5985185185185186,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 101
+    },
+    {
+      "epoch": 0.6044444444444445,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 102
+    },
+    {
+      "epoch": 0.6103703703703703,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 103
+    },
+    {
+      "epoch": 0.6162962962962963,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 104
+    },
+    {
+      "epoch": 0.6222222222222222,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 105
+    },
+    {
+      "epoch": 0.6281481481481481,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 106
+    },
+    {
+      "epoch": 0.6340740740740741,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 107
+    },
+    {
+      "epoch": 0.64,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 108
+    },
+    {
+      "epoch": 0.6459259259259259,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 109
+    },
+    {
+      "epoch": 0.6518518518518519,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 110
+    },
+    {
+      "epoch": 0.6577777777777778,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 111
+    },
+    {
+      "epoch": 0.6637037037037037,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 112
+    },
+    {
+      "epoch": 0.6696296296296296,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 113
+    },
+    {
+      "epoch": 0.6755555555555556,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 114
+    },
+    {
+      "epoch": 0.6814814814814815,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 115
+    },
+    {
+      "epoch": 0.6874074074074074,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 116
+    },
+    {
+      "epoch": 0.6933333333333334,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 117
+    },
+    {
+      "epoch": 0.6992592592592592,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 118
+    },
+    {
+      "epoch": 0.7051851851851851,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 119
+    },
+    {
+      "epoch": 0.7111111111111111,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 120
+    },
+    {
+      "epoch": 0.717037037037037,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 121
+    },
+    {
+      "epoch": 0.7229629629629629,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 122
+    },
+    {
+      "epoch": 0.7288888888888889,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 123
+    },
+    {
+      "epoch": 0.7348148148148148,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 124
+    },
+    {
+      "epoch": 0.7407407407407407,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 125
+    },
+    {
+      "epoch": 0.7466666666666667,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 126
+    },
+    {
+      "epoch": 0.7525925925925926,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 127
+    },
+    {
+      "epoch": 0.7585185185185185,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 128
+    },
+    {
+      "epoch": 0.7644444444444445,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 129
+    },
+    {
+      "epoch": 0.7703703703703704,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 130
+    },
+    {
+      "epoch": 0.7762962962962963,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 131
+    },
+    {
+      "epoch": 0.7822222222222223,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 132
+    },
+    {
+      "epoch": 0.7881481481481482,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 133
+    },
+    {
+      "epoch": 0.794074074074074,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 134
+    },
+    {
+      "epoch": 0.8,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 135
+    },
+    {
+      "epoch": 0.8059259259259259,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 136
+    },
+    {
+      "epoch": 0.8118518518518518,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 137
+    },
+    {
+      "epoch": 0.8177777777777778,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 138
+    },
+    {
+      "epoch": 0.8237037037037037,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 139
+    },
+    {
+      "epoch": 0.8296296296296296,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 140
+    },
+    {
+      "epoch": 0.8296296296296296,
+      "eval_loss": 40297.44140625,
+      "eval_runtime": 63.7847,
+      "eval_samples_per_second": 7.055,
+      "eval_steps_per_second": 1.176,
+      "eval_wer": 1.0381992969974168,
+      "step": 140
+    }
+  ],
+  "logging_steps": 1,
+  "max_steps": 1008,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 6,
+  "save_steps": 70,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 1.149038015806368e+18,
+  "train_batch_size": 6,
+  "trial_name": null,
+  "trial_params": null
+}