Model save

Browse files

Files changed (7) hide show

config.json +1 -1
runs/Jun20_16-32-55_bharatsahaiyak-test/events.out.tfevents.1718901175.bharatsahaiyak-test.584004.9 +3 -0
runs/Jun20_16-32-55_bharatsahaiyak-test/events.out.tfevents.1718901729.bharatsahaiyak-test.584004.10 +3 -0
training_args.bin +1 -1
whisper-tiny-hi-checkpoint-5/trainer_state.json +97 -97
whisper-tiny-hi-checkpoint-6/model.safetensors +1 -1
whisper-tiny-hi-checkpoint-6/training_args.bin +1 -1

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "./whisper-tiny-hi2_test/whisper-tiny-hi-checkpoint-4",
   "activation_dropout": 0.0,
   "activation_function": "gelu",
   "apply_spec_augment": false,

 {
+  "_name_or_path": "./whisper-tiny-hi2_test/whisper-tiny-hi-checkpoint-5",
   "activation_dropout": 0.0,
   "activation_function": "gelu",
   "apply_spec_augment": false,

runs/Jun20_16-32-55_bharatsahaiyak-test/events.out.tfevents.1718901175.bharatsahaiyak-test.584004.9 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:df447129bd81e3df977ba18126deff6e8d1b367a1929a3b49f62432b58146ad0
+size 6041

runs/Jun20_16-32-55_bharatsahaiyak-test/events.out.tfevents.1718901729.bharatsahaiyak-test.584004.10 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:728230a75f3a023d5e7f45f5b7dfb0f4e13d18059e1efb879468a2e72d3bdc91
+size 406

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fa5e527ce8bfb8fc127d02e63369a0c87d27cf046d5c9db273f93e3ab605fc0c
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:319a37cc1be11f31107d50f5d1c738bcbdf762b1adfd84cac855fe8bbf608c5e
 size 5240

whisper-tiny-hi-checkpoint-5/trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 63.60403082394783,
-  "best_model_checkpoint": "./whisper-tiny-hi2_test/checkpoint-200",
   "epoch": 6.375,
   "eval_steps": 40,
   "global_step": 204,
@@ -10,198 +10,198 @@
   "log_history": [
     {
       "epoch": 0.625,
-      "grad_norm": 10.62358283996582,
-      "learning_rate": 1e-05,
-      "loss": 2.3669,
       "step": 20
     },
     {
       "epoch": 1.25,
-      "grad_norm": 7.5668721199035645,
-      "learning_rate": 1e-05,
-      "loss": 1.1887,
       "step": 40
     },
     {
       "epoch": 1.25,
-      "eval_loss": 0.9953901171684265,
-      "eval_runtime": 571.1605,
-      "eval_samples_per_second": 1.751,
-      "eval_steps_per_second": 1.751,
-      "eval_wer": 87.29782369379288,
       "step": 40
     },
     {
       "epoch": 1.875,
-      "grad_norm": 6.932765960693359,
-      "learning_rate": 1e-05,
-      "loss": 0.855,
       "step": 60
     },
     {
       "epoch": 2.5,
-      "grad_norm": 6.589940547943115,
-      "learning_rate": 1e-05,
-      "loss": 0.6663,
       "step": 80
     },
     {
       "epoch": 2.5,
-      "eval_loss": 0.6780964136123657,
-      "eval_runtime": 554.1893,
-      "eval_samples_per_second": 1.804,
-      "eval_steps_per_second": 1.804,
-      "eval_wer": 73.29155728681515,
       "step": 80
     },
     {
       "epoch": 3.125,
-      "grad_norm": 6.102142810821533,
-      "learning_rate": 1e-05,
-      "loss": 0.5761,
       "step": 100
     },
     {
       "epoch": 3.75,
-      "grad_norm": 5.4204583168029785,
-      "learning_rate": 1e-05,
-      "loss": 0.5053,
       "step": 120
     },
     {
       "epoch": 3.75,
-      "eval_loss": 0.5857690572738647,
-      "eval_runtime": 567.8481,
-      "eval_samples_per_second": 1.761,
-      "eval_steps_per_second": 1.761,
-      "eval_wer": 66.22914726056398,
       "step": 120
     },
     {
       "epoch": 4.375,
-      "grad_norm": 4.851945400238037,
-      "learning_rate": 1e-05,
-      "loss": 0.4369,
       "step": 140
     },
     {
       "epoch": 5.0,
-      "grad_norm": 9.788898468017578,
-      "learning_rate": 1e-05,
-      "loss": 0.406,
       "step": 160
     },
     {
       "epoch": 5.0,
-      "eval_loss": 0.5440137982368469,
-      "eval_runtime": 560.2795,
-      "eval_samples_per_second": 1.785,
-      "eval_steps_per_second": 1.785,
-      "eval_wer": 66.13599796765179,
       "step": 160
     },
     {
       "epoch": 5.625,
-      "grad_norm": 4.664266109466553,
-      "learning_rate": 1e-05,
-      "loss": 0.356,
       "step": 180
     },
     {
       "epoch": 6.25,
-      "grad_norm": 4.6183037757873535,
-      "learning_rate": 1e-05,
-      "loss": 0.3236,
       "step": 200
     },
     {
       "epoch": 6.25,
-      "eval_loss": 0.5290657877922058,
-      "eval_runtime": 553.81,
-      "eval_samples_per_second": 1.806,
-      "eval_steps_per_second": 1.806,
-      "eval_wer": 63.60403082394783,
       "step": 200
     },
     {
       "epoch": 6.25,
       "step": 200,
       "total_flos": 1.5401574531072e+17,
-      "train_loss": 0.7680861353874207,
-      "train_runtime": 3626.9505,
-      "train_samples_per_second": 1.765,
-      "train_steps_per_second": 0.055
     },
     {
       "epoch": 6.28125,
       "step": 201,
       "total_flos": 1.5480354963456e+17,
-      "train_loss": 0.002653346132876268,
-      "train_runtime": 7.7901,
-      "train_samples_per_second": 821.558,
-      "train_steps_per_second": 25.674
     },
     {
       "epoch": 6.28125,
-      "eval_loss": 0.5290657877922058,
-      "eval_runtime": 551.3177,
-      "eval_samples_per_second": 1.814,
-      "eval_steps_per_second": 1.814,
-      "eval_wer": 63.60403082394783,
       "step": 201
     },
     {
       "epoch": 6.3125,
       "step": 202,
       "total_flos": 1.555913539584e+17,
-      "train_loss": 0.002912604867821873,
-      "train_runtime": 7.6856,
-      "train_samples_per_second": 832.727,
-      "train_steps_per_second": 26.023
     },
     {
       "epoch": 6.3125,
-      "eval_loss": 0.5290657877922058,
-      "eval_runtime": 543.8685,
-      "eval_samples_per_second": 1.839,
-      "eval_steps_per_second": 1.839,
-      "eval_wer": 63.60403082394783,
       "step": 202
     },
     {
       "epoch": 6.34375,
       "step": 203,
       "total_flos": 1.5637915828224e+17,
-      "train_loss": 0.0022250449128926094,
-      "train_runtime": 7.6745,
-      "train_samples_per_second": 833.935,
-      "train_steps_per_second": 26.06
     },
     {
       "epoch": 6.34375,
-      "eval_loss": 0.5290657877922058,
-      "eval_runtime": 542.3404,
-      "eval_samples_per_second": 1.844,
-      "eval_steps_per_second": 1.844,
-      "eval_wer": 63.60403082394783,
       "step": 203
     },
     {
       "epoch": 6.375,
       "step": 204,
       "total_flos": 1.5716696260608e+17,
-      "train_loss": 0.002586784608223859,
-      "train_runtime": 7.6824,
-      "train_samples_per_second": 833.073,
-      "train_steps_per_second": 26.034
     },
     {
       "epoch": 6.375,
-      "eval_loss": 0.5290657877922058,
-      "eval_runtime": 544.5113,
-      "eval_samples_per_second": 1.837,
-      "eval_steps_per_second": 1.837,
-      "eval_wer": 63.60403082394783,
       "step": 204
     }
   ],

 {
+  "best_metric": 69.98899144720129,
+  "best_model_checkpoint": "./whisper-tiny-hi2_test/checkpoint-120",
   "epoch": 6.375,
   "eval_steps": 40,
   "global_step": 204,
   "log_history": [
     {
       "epoch": 0.625,
+      "grad_norm": 10.95101547241211,
+      "learning_rate": 9.200000000000002e-06,
+      "loss": 2.3747,
       "step": 20
     },
     {
       "epoch": 1.25,
+      "grad_norm": 7.747081279754639,
+      "learning_rate": 8.2e-06,
+      "loss": 1.2169,
       "step": 40
     },
     {
       "epoch": 1.25,
+      "eval_loss": 1.0360029935836792,
+      "eval_runtime": 574.5339,
+      "eval_samples_per_second": 1.741,
+      "eval_steps_per_second": 1.741,
+      "eval_wer": 91.60809552036582,
       "step": 40
     },
     {
       "epoch": 1.875,
+      "grad_norm": 7.32460355758667,
+      "learning_rate": 7.2000000000000005e-06,
+      "loss": 0.9058,
       "step": 60
     },
     {
       "epoch": 2.5,
+      "grad_norm": 6.835532188415527,
+      "learning_rate": 6.200000000000001e-06,
+      "loss": 0.7302,
       "step": 80
     },
     {
       "epoch": 2.5,
+      "eval_loss": 0.7368654608726501,
+      "eval_runtime": 549.562,
+      "eval_samples_per_second": 1.82,
+      "eval_steps_per_second": 1.82,
+      "eval_wer": 79.80353967313066,
       "step": 80
     },
     {
       "epoch": 3.125,
+      "grad_norm": 6.408384323120117,
+      "learning_rate": 5.2e-06,
+      "loss": 0.6453,
       "step": 100
     },
     {
       "epoch": 3.75,
+      "grad_norm": 5.809150695800781,
+      "learning_rate": 4.2000000000000004e-06,
+      "loss": 0.5917,
       "step": 120
     },
     {
       "epoch": 3.75,
+      "eval_loss": 0.6504533886909485,
+      "eval_runtime": 548.8688,
+      "eval_samples_per_second": 1.822,
+      "eval_steps_per_second": 1.822,
+      "eval_wer": 69.98899144720129,
       "step": 120
     },
     {
       "epoch": 4.375,
+      "grad_norm": 5.724637508392334,
+      "learning_rate": 3.2000000000000003e-06,
+      "loss": 0.5356,
       "step": 140
     },
     {
       "epoch": 5.0,
+      "grad_norm": 10.124310493469238,
+      "learning_rate": 2.2e-06,
+      "loss": 0.5156,
       "step": 160
     },
     {
       "epoch": 5.0,
+      "eval_loss": 0.6157090663909912,
+      "eval_runtime": 549.7895,
+      "eval_samples_per_second": 1.819,
+      "eval_steps_per_second": 1.819,
+      "eval_wer": 70.4293335591498,
       "step": 160
     },
     {
       "epoch": 5.625,
+      "grad_norm": 4.947811126708984,
+      "learning_rate": 1.2000000000000002e-06,
+      "loss": 0.4986,
       "step": 180
     },
     {
       "epoch": 6.25,
+      "grad_norm": 4.541861057281494,
+      "learning_rate": 2.0000000000000002e-07,
+      "loss": 0.481,
       "step": 200
     },
     {
       "epoch": 6.25,
+      "eval_loss": 0.6050636768341064,
+      "eval_runtime": 552.964,
+      "eval_samples_per_second": 1.808,
+      "eval_steps_per_second": 1.808,
+      "eval_wer": 70.03980015242611,
       "step": 200
     },
     {
       "epoch": 6.25,
       "step": 200,
       "total_flos": 1.5401574531072e+17,
+      "train_loss": 0.8495243072509766,
+      "train_runtime": 3592.94,
+      "train_samples_per_second": 1.781,
+      "train_steps_per_second": 0.056
     },
     {
       "epoch": 6.28125,
       "step": 201,
       "total_flos": 1.5480354963456e+17,
+      "train_loss": 0.003230639654605543,
+      "train_runtime": 7.5043,
+      "train_samples_per_second": 852.844,
+      "train_steps_per_second": 26.651
     },
     {
       "epoch": 6.28125,
+      "eval_loss": 0.6504533886909485,
+      "eval_runtime": 548.5863,
+      "eval_samples_per_second": 1.823,
+      "eval_steps_per_second": 1.823,
+      "eval_wer": 69.98899144720129,
       "step": 201
     },
     {
       "epoch": 6.3125,
       "step": 202,
       "total_flos": 1.555913539584e+17,
+      "train_loss": 0.0035205459830784562,
+      "train_runtime": 7.6486,
+      "train_samples_per_second": 836.753,
+      "train_steps_per_second": 26.149
     },
     {
       "epoch": 6.3125,
+      "eval_loss": 0.6504533886909485,
+      "eval_runtime": 548.2984,
+      "eval_samples_per_second": 1.824,
+      "eval_steps_per_second": 1.824,
+      "eval_wer": 69.98899144720129,
       "step": 202
     },
     {
       "epoch": 6.34375,
       "step": 203,
       "total_flos": 1.5637915828224e+17,
+      "train_loss": 0.002875891812329222,
+      "train_runtime": 7.5227,
+      "train_samples_per_second": 850.756,
+      "train_steps_per_second": 26.586
     },
     {
       "epoch": 6.34375,
+      "eval_loss": 0.6504533886909485,
+      "eval_runtime": 547.5722,
+      "eval_samples_per_second": 1.826,
+      "eval_steps_per_second": 1.826,
+      "eval_wer": 69.98899144720129,
       "step": 203
     },
     {
       "epoch": 6.375,
       "step": 204,
       "total_flos": 1.5716696260608e+17,
+      "train_loss": 0.003042735305486941,
+      "train_runtime": 7.3464,
+      "train_samples_per_second": 871.18,
+      "train_steps_per_second": 27.224
     },
     {
       "epoch": 6.375,
+      "eval_loss": 0.6504533886909485,
+      "eval_runtime": 547.015,
+      "eval_samples_per_second": 1.828,
+      "eval_steps_per_second": 1.828,
+      "eval_wer": 69.98899144720129,
       "step": 204
     }
   ],

whisper-tiny-hi-checkpoint-6/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:65486a040e9edffe3575e458f27f57a36d8b2427a1a78dbd727b53bf7ff9bc9a
 size 151061672

 version https://git-lfs.github.com/spec/v1
+oid sha256:a59c8982089b3ffb0f35b2a8b93a329827d3603f741f4d47ddb7a17dc5a7e5e2
 size 151061672

whisper-tiny-hi-checkpoint-6/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e1445f90ea066b719c6f11b72dfcb44e26f1f122c5f102a79c5ebab74ddd094d
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:319a37cc1be11f31107d50f5d1c738bcbdf762b1adfd84cac855fe8bbf608c5e
 size 5240