afaqalinagra
/

PASHTO-ASR-MODEL

Safetensors

whisper

Model card Files Files and versions

xet

Community

afaqalinagra commited on Jan 23

Commit

1160f76

verified ·

1 Parent(s): 7e9b56d

Delete trainer_state (2).json

Browse files

Files changed (1) hide show

trainer_state (2).json +0 -386

trainer_state (2).json DELETED Viewed

@@ -1,386 +0,0 @@
-{
-  "best_global_step": 400,
-  "best_metric": 39.02045209903122,
-  "best_model_checkpoint": "./whisper-small-ps/checkpoint-400",
-  "epoch": 7.017817371937639,
-  "eval_steps": 50,
-  "global_step": 400,
-  "is_hyper_param_search": false,
-  "is_local_process_zero": true,
-  "is_world_process_zero": true,
-  "log_history": [
-    {
-      "epoch": 0.17817371937639198,
-      "grad_norm": 25.405925750732422,
-      "learning_rate": 9e-06,
-      "loss": 3.7318,
-      "step": 10
-    },
-    {
-      "epoch": 0.35634743875278396,
-      "grad_norm": 15.668482780456543,
-      "learning_rate": 1.9e-05,
-      "loss": 1.9857,
-      "step": 20
-    },
-    {
-      "epoch": 0.534521158129176,
-      "grad_norm": 28.658483505249023,
-      "learning_rate": 1.9625e-05,
-      "loss": 1.4661,
-      "step": 30
-    },
-    {
-      "epoch": 0.7126948775055679,
-      "grad_norm": 18.580156326293945,
-      "learning_rate": 1.9208333333333337e-05,
-      "loss": 1.3166,
-      "step": 40
-    },
-    {
-      "epoch": 0.89086859688196,
-      "grad_norm": 14.863431930541992,
-      "learning_rate": 1.8791666666666668e-05,
-      "loss": 1.1666,
-      "step": 50
-    },
-    {
-      "epoch": 0.89086859688196,
-      "eval_loss": 1.0706024169921875,
-      "eval_runtime": 172.0309,
-      "eval_samples_per_second": 0.657,
-      "eval_steps_per_second": 0.657,
-      "eval_wer": 58.50376749192681,
-      "step": 50
-    },
-    {
-      "epoch": 1.0534521158129175,
-      "grad_norm": 11.499765396118164,
-      "learning_rate": 1.8375e-05,
-      "loss": 1.0377,
-      "step": 60
-    },
-    {
-      "epoch": 1.2316258351893095,
-      "grad_norm": 11.639135360717773,
-      "learning_rate": 1.7958333333333334e-05,
-      "loss": 0.786,
-      "step": 70
-    },
-    {
-      "epoch": 1.4097995545657016,
-      "grad_norm": 11.476306915283203,
-      "learning_rate": 1.754166666666667e-05,
-      "loss": 0.7532,
-      "step": 80
-    },
-    {
-      "epoch": 1.5879732739420935,
-      "grad_norm": 9.792712211608887,
-      "learning_rate": 1.7125e-05,
-      "loss": 0.6477,
-      "step": 90
-    },
-    {
-      "epoch": 1.7661469933184857,
-      "grad_norm": 9.391416549682617,
-      "learning_rate": 1.6708333333333334e-05,
-      "loss": 0.6258,
-      "step": 100
-    },
-    {
-      "epoch": 1.7661469933184857,
-      "eval_loss": 0.7860051393508911,
-      "eval_runtime": 144.957,
-      "eval_samples_per_second": 0.78,
-      "eval_steps_per_second": 0.78,
-      "eval_wer": 46.716899892357375,
-      "step": 100
-    },
-    {
-      "epoch": 1.9443207126948776,
-      "grad_norm": 8.822958946228027,
-      "learning_rate": 1.629166666666667e-05,
-      "loss": 0.5398,
-      "step": 110
-    },
-    {
-      "epoch": 2.106904231625835,
-      "grad_norm": 6.613277435302734,
-      "learning_rate": 1.5875e-05,
-      "loss": 0.4014,
-      "step": 120
-    },
-    {
-      "epoch": 2.285077951002227,
-      "grad_norm": 5.975327491760254,
-      "learning_rate": 1.5458333333333334e-05,
-      "loss": 0.3024,
-      "step": 130
-    },
-    {
-      "epoch": 2.463251670378619,
-      "grad_norm": 6.35911226272583,
-      "learning_rate": 1.5041666666666667e-05,
-      "loss": 0.2958,
-      "step": 140
-    },
-    {
-      "epoch": 2.6414253897550113,
-      "grad_norm": 7.164131164550781,
-      "learning_rate": 1.4625e-05,
-      "loss": 0.3249,
-      "step": 150
-    },
-    {
-      "epoch": 2.6414253897550113,
-      "eval_loss": 0.7021090984344482,
-      "eval_runtime": 142.4441,
-      "eval_samples_per_second": 0.793,
-      "eval_steps_per_second": 0.793,
-      "eval_wer": 44.40258342303552,
-      "step": 150
-    },
-    {
-      "epoch": 2.819599109131403,
-      "grad_norm": 7.799057483673096,
-      "learning_rate": 1.4208333333333336e-05,
-      "loss": 0.2982,
-      "step": 160
-    },
-    {
-      "epoch": 2.997772828507795,
-      "grad_norm": 8.640966415405273,
-      "learning_rate": 1.3791666666666667e-05,
-      "loss": 0.2577,
-      "step": 170
-    },
-    {
-      "epoch": 3.1603563474387526,
-      "grad_norm": 4.808525562286377,
-      "learning_rate": 1.3375e-05,
-      "loss": 0.1443,
-      "step": 180
-    },
-    {
-      "epoch": 3.338530066815145,
-      "grad_norm": 6.588418960571289,
-      "learning_rate": 1.2958333333333334e-05,
-      "loss": 0.1435,
-      "step": 190
-    },
-    {
-      "epoch": 3.516703786191537,
-      "grad_norm": 4.835176944732666,
-      "learning_rate": 1.2541666666666667e-05,
-      "loss": 0.1268,
-      "step": 200
-    },
-    {
-      "epoch": 3.516703786191537,
-      "eval_loss": 0.7087017893791199,
-      "eval_runtime": 140.8539,
-      "eval_samples_per_second": 0.802,
-      "eval_steps_per_second": 0.802,
-      "eval_wer": 41.980624327233585,
-      "step": 200
-    },
-    {
-      "epoch": 3.694877505567929,
-      "grad_norm": 7.006318092346191,
-      "learning_rate": 1.2125e-05,
-      "loss": 0.1368,
-      "step": 210
-    },
-    {
-      "epoch": 3.8730512249443207,
-      "grad_norm": 5.319632530212402,
-      "learning_rate": 1.1708333333333334e-05,
-      "loss": 0.1536,
-      "step": 220
-    },
-    {
-      "epoch": 4.035634743875279,
-      "grad_norm": 3.353001594543457,
-      "learning_rate": 1.1291666666666667e-05,
-      "loss": 0.1396,
-      "step": 230
-    },
-    {
-      "epoch": 4.21380846325167,
-      "grad_norm": 4.065522193908691,
-      "learning_rate": 1.0875e-05,
-      "loss": 0.0629,
-      "step": 240
-    },
-    {
-      "epoch": 4.3919821826280625,
-      "grad_norm": 2.539537191390991,
-      "learning_rate": 1.0458333333333335e-05,
-      "loss": 0.0651,
-      "step": 250
-    },
-    {
-      "epoch": 4.3919821826280625,
-      "eval_loss": 0.7520610094070435,
-      "eval_runtime": 144.9719,
-      "eval_samples_per_second": 0.779,
-      "eval_steps_per_second": 0.779,
-      "eval_wer": 40.74273412271259,
-      "step": 250
-    },
-    {
-      "epoch": 4.570155902004454,
-      "grad_norm": 3.364603281021118,
-      "learning_rate": 1.0041666666666667e-05,
-      "loss": 0.0498,
-      "step": 260
-    },
-    {
-      "epoch": 4.748329621380846,
-      "grad_norm": 4.829373359680176,
-      "learning_rate": 9.625e-06,
-      "loss": 0.076,
-      "step": 270
-    },
-    {
-      "epoch": 4.926503340757238,
-      "grad_norm": 2.1371731758117676,
-      "learning_rate": 9.208333333333333e-06,
-      "loss": 0.0671,
-      "step": 280
-    },
-    {
-      "epoch": 5.089086859688196,
-      "grad_norm": 2.170490264892578,
-      "learning_rate": 8.791666666666667e-06,
-      "loss": 0.0477,
-      "step": 290
-    },
-    {
-      "epoch": 5.267260579064588,
-      "grad_norm": 3.078660249710083,
-      "learning_rate": 8.375e-06,
-      "loss": 0.0278,
-      "step": 300
-    },
-    {
-      "epoch": 5.267260579064588,
-      "eval_loss": 0.766233503818512,
-      "eval_runtime": 140.8607,
-      "eval_samples_per_second": 0.802,
-      "eval_steps_per_second": 0.802,
-      "eval_wer": 40.635091496232505,
-      "step": 300
-    },
-    {
-      "epoch": 5.44543429844098,
-      "grad_norm": 0.5123298764228821,
-      "learning_rate": 7.958333333333333e-06,
-      "loss": 0.0222,
-      "step": 310
-    },
-    {
-      "epoch": 5.6236080178173715,
-      "grad_norm": 4.809408664703369,
-      "learning_rate": 7.541666666666667e-06,
-      "loss": 0.025,
-      "step": 320
-    },
-    {
-      "epoch": 5.801781737193764,
-      "grad_norm": 1.5985106229782104,
-      "learning_rate": 7.125e-06,
-      "loss": 0.0359,
-      "step": 330
-    },
-    {
-      "epoch": 5.979955456570156,
-      "grad_norm": 1.767372727394104,
-      "learning_rate": 6.708333333333333e-06,
-      "loss": 0.0352,
-      "step": 340
-    },
-    {
-      "epoch": 6.142538975501114,
-      "grad_norm": 1.209718108177185,
-      "learning_rate": 6.291666666666667e-06,
-      "loss": 0.0194,
-      "step": 350
-    },
-    {
-      "epoch": 6.142538975501114,
-      "eval_loss": 0.7994771003723145,
-      "eval_runtime": 141.1898,
-      "eval_samples_per_second": 0.8,
-      "eval_steps_per_second": 0.8,
-      "eval_wer": 39.82777179763186,
-      "step": 350
-    },
-    {
-      "epoch": 6.320712694877505,
-      "grad_norm": 0.5679605007171631,
-      "learning_rate": 5.8750000000000005e-06,
-      "loss": 0.0173,
-      "step": 360
-    },
-    {
-      "epoch": 6.498886414253898,
-      "grad_norm": 1.3990226984024048,
-      "learning_rate": 5.458333333333333e-06,
-      "loss": 0.0144,
-      "step": 370
-    },
-    {
-      "epoch": 6.67706013363029,
-      "grad_norm": 0.8713251352310181,
-      "learning_rate": 5.041666666666667e-06,
-      "loss": 0.0088,
-      "step": 380
-    },
-    {
-      "epoch": 6.855233853006681,
-      "grad_norm": 0.9836070537567139,
-      "learning_rate": 4.625000000000001e-06,
-      "loss": 0.01,
-      "step": 390
-    },
-    {
-      "epoch": 7.017817371937639,
-      "grad_norm": 0.4024389982223511,
-      "learning_rate": 4.208333333333333e-06,
-      "loss": 0.0125,
-      "step": 400
-    },
-    {
-      "epoch": 7.017817371937639,
-      "eval_loss": 0.805569052696228,
-      "eval_runtime": 141.5404,
-      "eval_samples_per_second": 0.798,
-      "eval_steps_per_second": 0.798,
-      "eval_wer": 39.02045209903122,
-      "step": 400
-    }
-  ],
-  "logging_steps": 10,
-  "max_steps": 500,
-  "num_input_tokens_seen": 0,
-  "num_train_epochs": 9,
-  "save_steps": 50,
-  "stateful_callbacks": {
-    "TrainerControl": {
-      "args": {
-        "should_epoch_stop": false,
-        "should_evaluate": false,
-        "should_log": false,
-        "should_save": true,
-        "should_training_stop": false
-      },
-      "attributes": {}
-    }
-  },
-  "total_flos": 9.0933259640832e+17,
-  "train_batch_size": 1,
-  "trial_name": null,
-  "trial_params": null
-}