Aadithyak
/

asr-til-wav2vec

+{
+  "best_global_step": null,
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 0.4148148148148148,
+  "eval_steps": 70,
+  "global_step": 70,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.005925925925925926,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 1
+    },
+    {
+      "epoch": 0.011851851851851851,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 2
+    },
+    {
+      "epoch": 0.017777777777777778,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 3
+    },
+    {
+      "epoch": 0.023703703703703703,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 4
+    },
+    {
+      "epoch": 0.02962962962962963,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 5
+    },
+    {
+      "epoch": 0.035555555555555556,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 6
+    },
+    {
+      "epoch": 0.04148148148148148,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 7
+    },
+    {
+      "epoch": 0.047407407407407405,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 8
+    },
+    {
+      "epoch": 0.05333333333333334,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 9
+    },
+    {
+      "epoch": 0.05925925925925926,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 10
+    },
+    {
+      "epoch": 0.06518518518518518,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 11
+    },
+    {
+      "epoch": 0.07111111111111111,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 12
+    },
+    {
+      "epoch": 0.07703703703703704,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 13
+    },
+    {
+      "epoch": 0.08296296296296296,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 14
+    },
+    {
+      "epoch": 0.08888888888888889,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 15
+    },
+    {
+      "epoch": 0.09481481481481481,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 16
+    },
+    {
+      "epoch": 0.10074074074074074,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 17
+    },
+    {
+      "epoch": 0.10666666666666667,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 18
+    },
+    {
+      "epoch": 0.11259259259259259,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 19
+    },
+    {
+      "epoch": 0.11851851851851852,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 20
+    },
+    {
+      "epoch": 0.12444444444444444,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 21
+    },
+    {
+      "epoch": 0.13037037037037036,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 22
+    },
+    {
+      "epoch": 0.1362962962962963,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 23
+    },
+    {
+      "epoch": 0.14222222222222222,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 24
+    },
+    {
+      "epoch": 0.14814814814814814,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 25
+    },
+    {
+      "epoch": 0.15407407407407409,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 26
+    },
+    {
+      "epoch": 0.16,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 27
+    },
+    {
+      "epoch": 0.16592592592592592,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 28
+    },
+    {
+      "epoch": 0.17185185185185184,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 29
+    },
+    {
+      "epoch": 0.17777777777777778,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 30
+    },
+    {
+      "epoch": 0.1837037037037037,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 31
+    },
+    {
+      "epoch": 0.18962962962962962,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 32
+    },
+    {
+      "epoch": 0.19555555555555557,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 33
+    },
+    {
+      "epoch": 0.20148148148148148,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 34
+    },
+    {
+      "epoch": 0.2074074074074074,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 35
+    },
+    {
+      "epoch": 0.21333333333333335,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 36
+    },
+    {
+      "epoch": 0.21925925925925926,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 37
+    },
+    {
+      "epoch": 0.22518518518518518,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 38
+    },
+    {
+      "epoch": 0.2311111111111111,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 39
+    },
+    {
+      "epoch": 0.23703703703703705,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 40
+    },
+    {
+      "epoch": 0.24296296296296296,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 41
+    },
+    {
+      "epoch": 0.24888888888888888,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 42
+    },
+    {
+      "epoch": 0.2548148148148148,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 43
+    },
+    {
+      "epoch": 0.2607407407407407,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 44
+    },
+    {
+      "epoch": 0.26666666666666666,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 45
+    },
+    {
+      "epoch": 0.2725925925925926,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 46
+    },
+    {
+      "epoch": 0.2785185185185185,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 47
+    },
+    {
+      "epoch": 0.28444444444444444,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 48
+    },
+    {
+      "epoch": 0.2903703703703704,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 49
+    },
+    {
+      "epoch": 0.2962962962962963,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 50
+    },
+    {
+      "epoch": 0.3022222222222222,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 51
+    },
+    {
+      "epoch": 0.30814814814814817,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 52
+    },
+    {
+      "epoch": 0.31407407407407406,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 53
+    },
+    {
+      "epoch": 0.32,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 54
+    },
+    {
+      "epoch": 0.32592592592592595,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 55
+    },
+    {
+      "epoch": 0.33185185185185184,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 56
+    },
+    {
+      "epoch": 0.3377777777777778,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 57
+    },
+    {
+      "epoch": 0.3437037037037037,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 58
+    },
+    {
+      "epoch": 0.3496296296296296,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 59
+    },
+    {
+      "epoch": 0.35555555555555557,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 60
+    },
+    {
+      "epoch": 0.36148148148148146,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 61
+    },
+    {
+      "epoch": 0.3674074074074074,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 62
+    },
+    {
+      "epoch": 0.37333333333333335,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 63
+    },
+    {
+      "epoch": 0.37925925925925924,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 64
+    },
+    {
+      "epoch": 0.3851851851851852,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 65
+    },
+    {
+      "epoch": 0.39111111111111113,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 66
+    },
+    {
+      "epoch": 0.397037037037037,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 67
+    },
+    {
+      "epoch": 0.40296296296296297,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 68
+    },
+    {
+      "epoch": 0.4088888888888889,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 69
+    },
+    {
+      "epoch": 0.4148148148148148,
+      "grad_norm": NaN,
+      "learning_rate": 5e-05,
+      "loss": 0.0,
+      "step": 70
+    },
+    {
+      "epoch": 0.4148148148148148,
+      "eval_loss": 40297.44140625,
+      "eval_runtime": 63.992,
+      "eval_samples_per_second": 7.032,
+      "eval_steps_per_second": 1.172,
+      "eval_wer": 1.0381992969974168,
+      "step": 70
+    }
+  ],
+  "logging_steps": 1,
+  "max_steps": 1008,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 6,
+  "save_steps": 70,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 5.741987041980864e+17,
+  "train_batch_size": 6,
+  "trial_name": null,
+  "trial_params": null
+}