SamagraDataGov commited on Jun 28, 2024

Commit

2fe25c9

verified ·

1 Parent(s): ab2e6e4

Training in progress, step 40

Browse files

Files changed (36) hide show

README.md +16 -13
config.json +105 -3
model.safetensors +1 -1
pytorch_model.bin +3 -0
runs/Jun20_17-12-17_bharatsahaiyak-test/events.out.tfevents.1718903538.bharatsahaiyak-test.584004.17 +3 -0
runs/Jun25_19-32-54_bharatsahaiyak-test/events.out.tfevents.1719343975.bharatsahaiyak-test.945044.0 +3 -0
runs/Jun25_20-15-53_bharatsahaiyak-test/events.out.tfevents.1719346554.bharatsahaiyak-test.945044.1 +3 -0
runs/Jun25_21-12-28_bharatsahaiyak-test/events.out.tfevents.1719349949.bharatsahaiyak-test.990312.0 +3 -0
runs/Jun25_21-25-06_bharatsahaiyak-test/events.out.tfevents.1719350707.bharatsahaiyak-test.945044.2 +3 -0
runs/Jun25_21-25-06_bharatsahaiyak-test/events.out.tfevents.1719351329.bharatsahaiyak-test.945044.3 +3 -0
runs/Jun25_21-43-21_bharatsahaiyak-test/events.out.tfevents.1719351802.bharatsahaiyak-test.945044.4 +3 -0
runs/Jun25_21-43-21_bharatsahaiyak-test/events.out.tfevents.1719352396.bharatsahaiyak-test.945044.5 +3 -0
runs/Jun25_22-02-00_bharatsahaiyak-test/events.out.tfevents.1719352921.bharatsahaiyak-test.945044.6 +3 -0
runs/Jun26_08-14-03_bharatsahaiyak-test/events.out.tfevents.1719389644.bharatsahaiyak-test.1215638.0 +3 -0
runs/Jun26_08-55-05_bharatsahaiyak-test/events.out.tfevents.1719392105.bharatsahaiyak-test.1215638.1 +3 -0
runs/Jun26_08-55-05_bharatsahaiyak-test/events.out.tfevents.1719392419.bharatsahaiyak-test.1215638.2 +3 -0
runs/Jun26_09-01-10_bharatsahaiyak-test/events.out.tfevents.1719392471.bharatsahaiyak-test.1215638.3 +3 -0
runs/Jun26_09-01-10_bharatsahaiyak-test/events.out.tfevents.1719392836.bharatsahaiyak-test.1215638.4 +3 -0
runs/Jun28_19-45-26_bharatsahaiyak-test/events.out.tfevents.1719603928.bharatsahaiyak-test.1799391.0 +3 -0
training_args.bin +1 -1
whisper-tiny-hi-checkpoint-1/config.json +1 -1
whisper-tiny-hi-checkpoint-1/model.safetensors +1 -1
whisper-tiny-hi-checkpoint-1/pytorch_model.bin +3 -0
whisper-tiny-hi-checkpoint-1/trainer_state.json +80 -80
whisper-tiny-hi-checkpoint-1/training_args.bin +1 -1
whisper-tiny-hi-checkpoint-2/config.json +1 -1
whisper-tiny-hi-checkpoint-2/model.safetensors +1 -1
whisper-tiny-hi-checkpoint-2/pytorch_model.bin +3 -0
whisper-tiny-hi-checkpoint-2/trainer_state.json +94 -94
whisper-tiny-hi-checkpoint-2/training_args.bin +1 -1
whisper-tiny-hi-checkpoint-3/config.json +1 -1
whisper-tiny-hi-checkpoint-3/model.safetensors +1 -1
whisper-tiny-hi-checkpoint-3/pytorch_model.bin +3 -0
whisper-tiny-hi-checkpoint-3/trainer_state.json +78 -78
whisper-tiny-hi-checkpoint-3/training_args.bin +1 -1
whisper-tiny-hi-checkpoint-9/trainer_state.json +301 -0

README.md CHANGED Viewed

@@ -15,8 +15,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model was trained from scratch on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.6505
-- Wer: 69.9890
 ## Model description
@@ -35,24 +35,27 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 1e-05
-- train_batch_size: 32
-- eval_batch_size: 1
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
-- lr_scheduler_type: linear
 - training_steps: 200
 - mixed_precision_training: Native AMP
 ### Training results
-| Training Loss | Epoch | Step | Validation Loss | Wer     |
-|:-------------:|:-----:|:----:|:---------------:|:-------:|
-| 1.2169        | 1.25  | 40   | 1.0360          | 91.6081 |
-| 0.7302        | 2.5   | 80   | 0.7369          | 79.8035 |
-| 0.5917        | 3.75  | 120  | 0.6505          | 69.9890 |
-| 0.5156        | 5.0   | 160  | 0.6157          | 70.4293 |
-| 0.481         | 6.25  | 200  | 0.6051          | 70.0398 |
 ### Framework versions

 This model was trained from scratch on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.4940
+- Wer: 59.7206
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 3.75e-05
+- train_batch_size: 16
+- eval_batch_size: 4
 - seed: 42
+- gradient_accumulation_steps: 2
+- total_train_batch_size: 32
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: constant
+- lr_scheduler_warmup_steps: 50
 - training_steps: 200
 - mixed_precision_training: Native AMP
 ### Training results
+| Training Loss | Epoch  | Step | Validation Loss | Wer     |
+|:-------------:|:------:|:----:|:---------------:|:-------:|
+| 0.6766        | 1.2698 | 40   | 0.6154          | 81.4733 |
+| 0.3599        | 2.5397 | 80   | 0.5078          | 67.0110 |
+| 0.2297        | 3.8095 | 120  | 0.4940          | 59.7206 |
+| 0.153         | 5.0794 | 160  | 0.5193          | 62.0745 |
+| 0.0885        | 6.3492 | 200  | 0.5557          | 60.5843 |
 ### Framework versions

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "./whisper-tiny-hi2_test/whisper-tiny-hi-checkpoint-8",
   "activation_dropout": 0.0,
   "activation_function": "gelu",
   "apply_spec_augment": false,
@@ -25,7 +25,20 @@
   "encoder_layerdrop": 0.0,
   "encoder_layers": 4,
   "eos_token_id": 50257,
-  "forced_decoder_ids": null,
   "init_std": 0.02,
   "is_encoder_decoder": true,
   "mask_feature_length": 10,
@@ -43,7 +56,96 @@
   "num_mel_bins": 80,
   "pad_token_id": 50257,
   "scale_embedding": false,
-  "suppress_tokens": [],
   "torch_dtype": "float32",
   "transformers_version": "4.41.1",
   "use_cache": true,

 {
+  "_name_or_path": "openai/whisper-tiny",
   "activation_dropout": 0.0,
   "activation_function": "gelu",
   "apply_spec_augment": false,
   "encoder_layerdrop": 0.0,
   "encoder_layers": 4,
   "eos_token_id": 50257,
+  "forced_decoder_ids": [
+    [
+      1,
+      50259
+    ],
+    [
+      2,
+      50359
+    ],
+    [
+      3,
+      50363
+    ]
+  ],
   "init_std": 0.02,
   "is_encoder_decoder": true,
   "mask_feature_length": 10,
   "num_mel_bins": 80,
   "pad_token_id": 50257,
   "scale_embedding": false,
+  "suppress_tokens": [
+    1,
+    2,
+    7,
+    8,
+    9,
+    10,
+    14,
+    25,
+    26,
+    27,
+    28,
+    29,
+    31,
+    58,
+    59,
+    60,
+    61,
+    62,
+    63,
+    90,
+    91,
+    92,
+    93,
+    359,
+    503,
+    522,
+    542,
+    873,
+    893,
+    902,
+    918,
+    922,
+    931,
+    1350,
+    1853,
+    1982,
+    2460,
+    2627,
+    3246,
+    3253,
+    3268,
+    3536,
+    3846,
+    3961,
+    4183,
+    4667,
+    6585,
+    6647,
+    7273,
+    9061,
+    9383,
+    10428,
+    10929,
+    11938,
+    12033,
+    12331,
+    12562,
+    13793,
+    14157,
+    14635,
+    15265,
+    15618,
+    16553,
+    16604,
+    18362,
+    18956,
+    20075,
+    21675,
+    22520,
+    26130,
+    26161,
+    26435,
+    28279,
+    29464,
+    31650,
+    32302,
+    32470,
+    36865,
+    42863,
+    47425,
+    49870,
+    50254,
+    50258,
+    50358,
+    50359,
+    50360,
+    50361,
+    50362
+  ],
   "torch_dtype": "float32",
   "transformers_version": "4.41.1",
   "use_cache": true,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a59c8982089b3ffb0f35b2a8b93a329827d3603f741f4d47ddb7a17dc5a7e5e2
 size 151061672

 version https://git-lfs.github.com/spec/v1
+oid sha256:8391a512f727d4bff056237acc3255c51e1c540d618e2a36bbcb5ff4e3d67b9e
 size 151061672

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ac3cef835a24908d9f4ca10612961248e57318d2137495d93cf150b4aada444c
+size 151099494

runs/Jun20_17-12-17_bharatsahaiyak-test/events.out.tfevents.1718903538.bharatsahaiyak-test.584004.17 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fc21cff19d8da62d157be35e39c6e543d5e06b24e395581958ad47a1b58a4f8f
+size 6041

runs/Jun25_19-32-54_bharatsahaiyak-test/events.out.tfevents.1719343975.bharatsahaiyak-test.945044.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:32ea47ed7805b390543a0fdece61b93fac693e053e54e98f158c867a9dc4cab8
+size 8257

runs/Jun25_20-15-53_bharatsahaiyak-test/events.out.tfevents.1719346554.bharatsahaiyak-test.945044.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:43c88a94e9915f794c941f692cb1e6d0f4d91cb35b92392892187f4ed9c5b453
+size 9672

runs/Jun25_21-12-28_bharatsahaiyak-test/events.out.tfevents.1719349949.bharatsahaiyak-test.990312.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:02ed85b0e945d2e7d1ca43a423ce270bb6db762abc0a20cd57885f19d5738987
+size 6796

runs/Jun25_21-25-06_bharatsahaiyak-test/events.out.tfevents.1719350707.bharatsahaiyak-test.945044.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cf4c9bb256acdfef047d08be61d3bdf3f8e4a0dc2d4afed391ab2d8155506300
+size 6047

runs/Jun25_21-25-06_bharatsahaiyak-test/events.out.tfevents.1719351329.bharatsahaiyak-test.945044.3 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d97a19fd12d5b1ccb44d90206d795c9fbdd8fe053881c14c441bfb993249a25b
+size 406

runs/Jun25_21-43-21_bharatsahaiyak-test/events.out.tfevents.1719351802.bharatsahaiyak-test.945044.4 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ac54ea5634bcee3dbc86b92a1cccb1abccdbf2ed682afca1b1e20b7f0b79bac4
+size 6047

runs/Jun25_21-43-21_bharatsahaiyak-test/events.out.tfevents.1719352396.bharatsahaiyak-test.945044.5 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8032919c2782097e631dc680b67b003a4061a58eee4f96c8016d2b0855c5ccf4
+size 406

runs/Jun25_22-02-00_bharatsahaiyak-test/events.out.tfevents.1719352921.bharatsahaiyak-test.945044.6 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7c4309d2f1655bb13fd980419f849b27252aa5935a577da2655b8fe5708e5b13
+size 6047

runs/Jun26_08-14-03_bharatsahaiyak-test/events.out.tfevents.1719389644.bharatsahaiyak-test.1215638.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8d267c65def0ee6598d4887f45121902e836b16611747bf66db17b409357cedc
+size 9673

runs/Jun26_08-55-05_bharatsahaiyak-test/events.out.tfevents.1719392105.bharatsahaiyak-test.1215638.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:165d0582673ef188b9d52b9c14d1a45c51671773f3298a7eb630d6fb6f82e50a
+size 6048

runs/Jun26_08-55-05_bharatsahaiyak-test/events.out.tfevents.1719392419.bharatsahaiyak-test.1215638.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:778b4630a2197cb19c0539dab2ab6c6ebbfe08a5a766bb35019cf7a58d314172
+size 406

runs/Jun26_09-01-10_bharatsahaiyak-test/events.out.tfevents.1719392471.bharatsahaiyak-test.1215638.3 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:16b3d3b1228637f0424cd544116d5762921a132e40112df77d5772202d481236
+size 6048

runs/Jun26_09-01-10_bharatsahaiyak-test/events.out.tfevents.1719392836.bharatsahaiyak-test.1215638.4 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:04b513f668d1fb6272239f09cabc467830355aeb006b023b49b4c837f258e67c
+size 406

runs/Jun28_19-45-26_bharatsahaiyak-test/events.out.tfevents.1719603928.bharatsahaiyak-test.1799391.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ede0928aa24113fd4cb8c80d4d30ca006747b321ea6844fd562cde3f9521fc30
+size 7347

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:491ea0b3fac64ea37df87b10285499fb08a8bcc03ba05abb9770d611ee81c6e0
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:6e2def70f73f2a79252976d7c743511eccda12a2480b3b51c124f1ebcb9504d7
 size 5240

whisper-tiny-hi-checkpoint-1/config.json CHANGED Viewed

@@ -19,7 +19,7 @@
   "decoder_layerdrop": 0.0,
   "decoder_layers": 4,
   "decoder_start_token_id": 50258,
-  "dropout": 0.0,
   "encoder_attention_heads": 6,
   "encoder_ffn_dim": 1536,
   "encoder_layerdrop": 0.0,

   "decoder_layerdrop": 0.0,
   "decoder_layers": 4,
   "decoder_start_token_id": 50258,
+  "dropout": 0.1,
   "encoder_attention_heads": 6,
   "encoder_ffn_dim": 1536,
   "encoder_layerdrop": 0.0,

whisper-tiny-hi-checkpoint-1/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a59c8982089b3ffb0f35b2a8b93a329827d3603f741f4d47ddb7a17dc5a7e5e2
 size 151061672

 version https://git-lfs.github.com/spec/v1
+oid sha256:daeea7778cdeda935a2e90f442518eb60512721cd10bce0921a80c47aa8f2543
 size 151061672

whisper-tiny-hi-checkpoint-1/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:802a25ee7db91faba0d8c4d8ea560053183efcadf455712cb855292076f680e4
+size 151099494

whisper-tiny-hi-checkpoint-1/trainer_state.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
-  "best_metric": 69.98899144720129,
   "best_model_checkpoint": "./whisper-tiny-hi2_test/checkpoint-120",
-  "epoch": 6.25,
   "eval_steps": 40,
   "global_step": 200,
   "is_hyper_param_search": false,
@@ -9,128 +9,128 @@
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.625,
-      "grad_norm": 10.95101547241211,
-      "learning_rate": 9.200000000000002e-06,
-      "loss": 2.3747,
       "step": 20
     },
     {
-      "epoch": 1.25,
-      "grad_norm": 7.747081279754639,
-      "learning_rate": 8.2e-06,
-      "loss": 1.2169,
       "step": 40
     },
     {
-      "epoch": 1.25,
-      "eval_loss": 1.0360029935836792,
-      "eval_runtime": 574.5339,
-      "eval_samples_per_second": 1.741,
-      "eval_steps_per_second": 1.741,
-      "eval_wer": 91.60809552036582,
       "step": 40
     },
     {
-      "epoch": 1.875,
-      "grad_norm": 7.32460355758667,
-      "learning_rate": 7.2000000000000005e-06,
-      "loss": 0.9058,
       "step": 60
     },
     {
-      "epoch": 2.5,
-      "grad_norm": 6.835532188415527,
-      "learning_rate": 6.200000000000001e-06,
-      "loss": 0.7302,
       "step": 80
     },
     {
-      "epoch": 2.5,
-      "eval_loss": 0.7368654608726501,
-      "eval_runtime": 549.562,
-      "eval_samples_per_second": 1.82,
-      "eval_steps_per_second": 1.82,
-      "eval_wer": 79.80353967313066,
       "step": 80
     },
     {
-      "epoch": 3.125,
-      "grad_norm": 6.408384323120117,
-      "learning_rate": 5.2e-06,
-      "loss": 0.6453,
       "step": 100
     },
     {
-      "epoch": 3.75,
-      "grad_norm": 5.809150695800781,
-      "learning_rate": 4.2000000000000004e-06,
-      "loss": 0.5917,
       "step": 120
     },
     {
-      "epoch": 3.75,
-      "eval_loss": 0.6504533886909485,
-      "eval_runtime": 548.8688,
-      "eval_samples_per_second": 1.822,
-      "eval_steps_per_second": 1.822,
-      "eval_wer": 69.98899144720129,
       "step": 120
     },
     {
-      "epoch": 4.375,
-      "grad_norm": 5.724637508392334,
-      "learning_rate": 3.2000000000000003e-06,
-      "loss": 0.5356,
       "step": 140
     },
     {
-      "epoch": 5.0,
-      "grad_norm": 10.124310493469238,
-      "learning_rate": 2.2e-06,
-      "loss": 0.5156,
       "step": 160
     },
     {
-      "epoch": 5.0,
-      "eval_loss": 0.6157090663909912,
-      "eval_runtime": 549.7895,
-      "eval_samples_per_second": 1.819,
-      "eval_steps_per_second": 1.819,
-      "eval_wer": 70.4293335591498,
       "step": 160
     },
     {
-      "epoch": 5.625,
-      "grad_norm": 4.947811126708984,
-      "learning_rate": 1.2000000000000002e-06,
-      "loss": 0.4986,
       "step": 180
     },
     {
-      "epoch": 6.25,
-      "grad_norm": 4.541861057281494,
-      "learning_rate": 2.0000000000000002e-07,
-      "loss": 0.481,
       "step": 200
     },
     {
-      "epoch": 6.25,
-      "eval_loss": 0.6050636768341064,
-      "eval_runtime": 552.964,
-      "eval_samples_per_second": 1.808,
-      "eval_steps_per_second": 1.808,
-      "eval_wer": 70.03980015242611,
       "step": 200
     },
     {
-      "epoch": 6.25,
       "step": 200,
-      "total_flos": 1.5401574531072e+17,
-      "train_loss": 0.8495243072509766,
-      "train_runtime": 3592.94,
-      "train_samples_per_second": 1.781,
-      "train_steps_per_second": 0.056
     }
   ],
   "logging_steps": 20,
@@ -150,8 +150,8 @@
       "attributes": {}
     }
   },
-  "total_flos": 1.5401574531072e+17,
-  "train_batch_size": 32,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 59.720575783234544,
   "best_model_checkpoint": "./whisper-tiny-hi2_test/checkpoint-120",
+  "epoch": 6.349206349206349,
   "eval_steps": 40,
   "global_step": 200,
   "is_hyper_param_search": false,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.6349206349206349,
+      "grad_norm": 8.253315925598145,
+      "learning_rate": 3.75e-05,
+      "loss": 1.7555,
       "step": 20
     },
     {
+      "epoch": 1.2698412698412698,
+      "grad_norm": 6.022846698760986,
+      "learning_rate": 3.75e-05,
+      "loss": 0.6766,
       "step": 40
     },
     {
+      "epoch": 1.2698412698412698,
+      "eval_loss": 0.6153799295425415,
+      "eval_runtime": 368.3001,
+      "eval_samples_per_second": 2.715,
+      "eval_steps_per_second": 0.679,
+      "eval_wer": 81.47332768839966,
       "step": 40
     },
     {
+      "epoch": 1.9047619047619047,
+      "grad_norm": 6.249065399169922,
+      "learning_rate": 3.75e-05,
+      "loss": 0.4907,
       "step": 60
     },
     {
+      "epoch": 2.5396825396825395,
+      "grad_norm": 5.881297588348389,
+      "learning_rate": 3.75e-05,
+      "loss": 0.3599,
       "step": 80
     },
     {
+      "epoch": 2.5396825396825395,
+      "eval_loss": 0.5078147649765015,
+      "eval_runtime": 314.278,
+      "eval_samples_per_second": 3.182,
+      "eval_steps_per_second": 0.795,
+      "eval_wer": 67.01100762066045,
       "step": 80
     },
     {
+      "epoch": 3.1746031746031744,
+      "grad_norm": 4.2090606689453125,
+      "learning_rate": 3.75e-05,
+      "loss": 0.301,
       "step": 100
     },
     {
+      "epoch": 3.8095238095238093,
+      "grad_norm": 4.868574142456055,
+      "learning_rate": 3.75e-05,
+      "loss": 0.2297,
       "step": 120
     },
     {
+      "epoch": 3.8095238095238093,
+      "eval_loss": 0.49397116899490356,
+      "eval_runtime": 304.836,
+      "eval_samples_per_second": 3.28,
+      "eval_steps_per_second": 0.82,
+      "eval_wer": 59.720575783234544,
       "step": 120
     },
     {
+      "epoch": 4.444444444444445,
+      "grad_norm": 4.324865341186523,
+      "learning_rate": 3.75e-05,
+      "loss": 0.1754,
       "step": 140
     },
     {
+      "epoch": 5.079365079365079,
+      "grad_norm": 3.0074007511138916,
+      "learning_rate": 3.75e-05,
+      "loss": 0.153,
       "step": 160
     },
     {
+      "epoch": 5.079365079365079,
+      "eval_loss": 0.5192885994911194,
+      "eval_runtime": 309.7886,
+      "eval_samples_per_second": 3.228,
+      "eval_steps_per_second": 0.807,
+      "eval_wer": 62.07451312447078,
       "step": 160
     },
     {
+      "epoch": 5.714285714285714,
+      "grad_norm": 2.9954638481140137,
+      "learning_rate": 3.75e-05,
+      "loss": 0.1049,
       "step": 180
     },
     {
+      "epoch": 6.349206349206349,
+      "grad_norm": 3.4090383052825928,
+      "learning_rate": 3.75e-05,
+      "loss": 0.0885,
       "step": 200
     },
     {
+      "epoch": 6.349206349206349,
+      "eval_loss": 0.5557394027709961,
+      "eval_runtime": 308.2851,
+      "eval_samples_per_second": 3.244,
+      "eval_steps_per_second": 0.811,
+      "eval_wer": 60.584250635055035,
       "step": 200
     },
     {
+      "epoch": 6.349206349206349,
       "step": 200,
+      "total_flos": 1.5637915828224e+17,
+      "train_loss": 0.4335097998380661,
+      "train_runtime": 2402.3095,
+      "train_samples_per_second": 2.664,
+      "train_steps_per_second": 0.083
     }
   ],
   "logging_steps": 20,
       "attributes": {}
     }
   },
+  "total_flos": 1.5637915828224e+17,
+  "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null
 }

whisper-tiny-hi-checkpoint-1/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8c982fa9327e2e49f4765e9f4a5be54ca2c672121610ce55b8168505a2beb3b7
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:e3a2d63b5e8da641a253ed23f58db5d3da9941bebd2a70aef95105c81a4fa484
 size 5240

whisper-tiny-hi-checkpoint-2/config.json CHANGED Viewed

@@ -19,7 +19,7 @@
   "decoder_layerdrop": 0.0,
   "decoder_layers": 4,
   "decoder_start_token_id": 50258,
-  "dropout": 0.0,
   "encoder_attention_heads": 6,
   "encoder_ffn_dim": 1536,
   "encoder_layerdrop": 0.0,

   "decoder_layerdrop": 0.0,
   "decoder_layers": 4,
   "decoder_start_token_id": 50258,
+  "dropout": 0.1,
   "encoder_attention_heads": 6,
   "encoder_ffn_dim": 1536,
   "encoder_layerdrop": 0.0,

whisper-tiny-hi-checkpoint-2/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a59c8982089b3ffb0f35b2a8b93a329827d3603f741f4d47ddb7a17dc5a7e5e2
 size 151061672

 version https://git-lfs.github.com/spec/v1
+oid sha256:daeea7778cdeda935a2e90f442518eb60512721cd10bce0921a80c47aa8f2543
 size 151061672

whisper-tiny-hi-checkpoint-2/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:802a25ee7db91faba0d8c4d8ea560053183efcadf455712cb855292076f680e4
+size 151099494

whisper-tiny-hi-checkpoint-2/trainer_state.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
-  "best_metric": 69.98899144720129,
   "best_model_checkpoint": "./whisper-tiny-hi2_test/checkpoint-120",
-  "epoch": 6.28125,
   "eval_steps": 40,
   "global_step": 201,
   "is_hyper_param_search": false,
@@ -9,145 +9,145 @@
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.625,
-      "grad_norm": 10.95101547241211,
-      "learning_rate": 9.200000000000002e-06,
-      "loss": 2.3747,
       "step": 20
     },
     {
-      "epoch": 1.25,
-      "grad_norm": 7.747081279754639,
-      "learning_rate": 8.2e-06,
-      "loss": 1.2169,
       "step": 40
     },
     {
-      "epoch": 1.25,
-      "eval_loss": 1.0360029935836792,
-      "eval_runtime": 574.5339,
-      "eval_samples_per_second": 1.741,
-      "eval_steps_per_second": 1.741,
-      "eval_wer": 91.60809552036582,
       "step": 40
     },
     {
-      "epoch": 1.875,
-      "grad_norm": 7.32460355758667,
-      "learning_rate": 7.2000000000000005e-06,
-      "loss": 0.9058,
       "step": 60
     },
     {
-      "epoch": 2.5,
-      "grad_norm": 6.835532188415527,
-      "learning_rate": 6.200000000000001e-06,
-      "loss": 0.7302,
       "step": 80
     },
     {
-      "epoch": 2.5,
-      "eval_loss": 0.7368654608726501,
-      "eval_runtime": 549.562,
-      "eval_samples_per_second": 1.82,
-      "eval_steps_per_second": 1.82,
-      "eval_wer": 79.80353967313066,
       "step": 80
     },
     {
-      "epoch": 3.125,
-      "grad_norm": 6.408384323120117,
-      "learning_rate": 5.2e-06,
-      "loss": 0.6453,
       "step": 100
     },
     {
-      "epoch": 3.75,
-      "grad_norm": 5.809150695800781,
-      "learning_rate": 4.2000000000000004e-06,
-      "loss": 0.5917,
       "step": 120
     },
     {
-      "epoch": 3.75,
-      "eval_loss": 0.6504533886909485,
-      "eval_runtime": 548.8688,
-      "eval_samples_per_second": 1.822,
-      "eval_steps_per_second": 1.822,
-      "eval_wer": 69.98899144720129,
       "step": 120
     },
     {
-      "epoch": 4.375,
-      "grad_norm": 5.724637508392334,
-      "learning_rate": 3.2000000000000003e-06,
-      "loss": 0.5356,
       "step": 140
     },
     {
-      "epoch": 5.0,
-      "grad_norm": 10.124310493469238,
-      "learning_rate": 2.2e-06,
-      "loss": 0.5156,
       "step": 160
     },
     {
-      "epoch": 5.0,
-      "eval_loss": 0.6157090663909912,
-      "eval_runtime": 549.7895,
-      "eval_samples_per_second": 1.819,
-      "eval_steps_per_second": 1.819,
-      "eval_wer": 70.4293335591498,
       "step": 160
     },
     {
-      "epoch": 5.625,
-      "grad_norm": 4.947811126708984,
-      "learning_rate": 1.2000000000000002e-06,
-      "loss": 0.4986,
       "step": 180
     },
     {
-      "epoch": 6.25,
-      "grad_norm": 4.541861057281494,
-      "learning_rate": 2.0000000000000002e-07,
-      "loss": 0.481,
       "step": 200
     },
     {
-      "epoch": 6.25,
-      "eval_loss": 0.6050636768341064,
-      "eval_runtime": 552.964,
-      "eval_samples_per_second": 1.808,
-      "eval_steps_per_second": 1.808,
-      "eval_wer": 70.03980015242611,
       "step": 200
     },
     {
-      "epoch": 6.25,
       "step": 200,
-      "total_flos": 1.5401574531072e+17,
-      "train_loss": 0.8495243072509766,
-      "train_runtime": 3592.94,
-      "train_samples_per_second": 1.781,
-      "train_steps_per_second": 0.056
     },
     {
-      "epoch": 6.28125,
       "step": 201,
-      "total_flos": 1.5480354963456e+17,
-      "train_loss": 0.003230639654605543,
-      "train_runtime": 7.5043,
-      "train_samples_per_second": 852.844,
-      "train_steps_per_second": 26.651
-    },
-    {
-      "epoch": 6.28125,
-      "eval_loss": 0.6504533886909485,
-      "eval_runtime": 548.5863,
-      "eval_samples_per_second": 1.823,
-      "eval_steps_per_second": 1.823,
-      "eval_wer": 69.98899144720129,
       "step": 201
     }
   ],
@@ -168,8 +168,8 @@
       "attributes": {}
     }
   },
-  "total_flos": 1.5480354963456e+17,
-  "train_batch_size": 32,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 59.720575783234544,
   "best_model_checkpoint": "./whisper-tiny-hi2_test/checkpoint-120",
+  "epoch": 6.476190476190476,
   "eval_steps": 40,
   "global_step": 201,
   "is_hyper_param_search": false,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.6349206349206349,
+      "grad_norm": 8.253315925598145,
+      "learning_rate": 3.75e-05,
+      "loss": 1.7555,
       "step": 20
     },
     {
+      "epoch": 1.2698412698412698,
+      "grad_norm": 6.022846698760986,
+      "learning_rate": 3.75e-05,
+      "loss": 0.6766,
       "step": 40
     },
     {
+      "epoch": 1.2698412698412698,
+      "eval_loss": 0.6153799295425415,
+      "eval_runtime": 368.3001,
+      "eval_samples_per_second": 2.715,
+      "eval_steps_per_second": 0.679,
+      "eval_wer": 81.47332768839966,
       "step": 40
     },
     {
+      "epoch": 1.9047619047619047,
+      "grad_norm": 6.249065399169922,
+      "learning_rate": 3.75e-05,
+      "loss": 0.4907,
       "step": 60
     },
     {
+      "epoch": 2.5396825396825395,
+      "grad_norm": 5.881297588348389,
+      "learning_rate": 3.75e-05,
+      "loss": 0.3599,
       "step": 80
     },
     {
+      "epoch": 2.5396825396825395,
+      "eval_loss": 0.5078147649765015,
+      "eval_runtime": 314.278,
+      "eval_samples_per_second": 3.182,
+      "eval_steps_per_second": 0.795,
+      "eval_wer": 67.01100762066045,
       "step": 80
     },
     {
+      "epoch": 3.1746031746031744,
+      "grad_norm": 4.2090606689453125,
+      "learning_rate": 3.75e-05,
+      "loss": 0.301,
       "step": 100
     },
     {
+      "epoch": 3.8095238095238093,
+      "grad_norm": 4.868574142456055,
+      "learning_rate": 3.75e-05,
+      "loss": 0.2297,
       "step": 120
     },
     {
+      "epoch": 3.8095238095238093,
+      "eval_loss": 0.49397116899490356,
+      "eval_runtime": 304.836,
+      "eval_samples_per_second": 3.28,
+      "eval_steps_per_second": 0.82,
+      "eval_wer": 59.720575783234544,
       "step": 120
     },
     {
+      "epoch": 4.444444444444445,
+      "grad_norm": 4.324865341186523,
+      "learning_rate": 3.75e-05,
+      "loss": 0.1754,
       "step": 140
     },
     {
+      "epoch": 5.079365079365079,
+      "grad_norm": 3.0074007511138916,
+      "learning_rate": 3.75e-05,
+      "loss": 0.153,
       "step": 160
     },
     {
+      "epoch": 5.079365079365079,
+      "eval_loss": 0.5192885994911194,
+      "eval_runtime": 309.7886,
+      "eval_samples_per_second": 3.228,
+      "eval_steps_per_second": 0.807,
+      "eval_wer": 62.07451312447078,
       "step": 160
     },
     {
+      "epoch": 5.714285714285714,
+      "grad_norm": 2.9954638481140137,
+      "learning_rate": 3.75e-05,
+      "loss": 0.1049,
       "step": 180
     },
     {
+      "epoch": 6.349206349206349,
+      "grad_norm": 3.4090383052825928,
+      "learning_rate": 3.75e-05,
+      "loss": 0.0885,
       "step": 200
     },
     {
+      "epoch": 6.349206349206349,
+      "eval_loss": 0.5557394027709961,
+      "eval_runtime": 308.2851,
+      "eval_samples_per_second": 3.244,
+      "eval_steps_per_second": 0.811,
+      "eval_wer": 60.584250635055035,
       "step": 200
     },
     {
+      "epoch": 6.349206349206349,
       "step": 200,
+      "total_flos": 1.5637915828224e+17,
+      "train_loss": 0.4335097998380661,
+      "train_runtime": 2402.3095,
+      "train_samples_per_second": 2.664,
+      "train_steps_per_second": 0.083
     },
     {
+      "epoch": 6.476190476190476,
       "step": 201,
+      "total_flos": 1.5716696260608e+17,
+      "train_loss": 0.043295191295111356,
+      "train_runtime": 5.6453,
+      "train_samples_per_second": 1133.694,
+      "train_steps_per_second": 35.428
+    },
+    {
+      "epoch": 6.476190476190476,
+      "eval_loss": 0.49397116899490356,
+      "eval_runtime": 307.542,
+      "eval_samples_per_second": 3.252,
+      "eval_steps_per_second": 0.813,
+      "eval_wer": 59.720575783234544,
       "step": 201
     }
   ],
       "attributes": {}
     }
   },
+  "total_flos": 1.5716696260608e+17,
+  "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null
 }

whisper-tiny-hi-checkpoint-2/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:57320ccedcf473157fcb44c0152851471c74170811def3aa0279b4a3552d63db
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:d9287bb38beb16bf58664c3ed10f735c1bd05dd62bb178cf34a56cf97c52b277
 size 5240

whisper-tiny-hi-checkpoint-3/config.json CHANGED Viewed

@@ -19,7 +19,7 @@
   "decoder_layerdrop": 0.0,
   "decoder_layers": 4,
   "decoder_start_token_id": 50258,
-  "dropout": 0.0,
   "encoder_attention_heads": 6,
   "encoder_ffn_dim": 1536,
   "encoder_layerdrop": 0.0,

   "decoder_layerdrop": 0.0,
   "decoder_layers": 4,
   "decoder_start_token_id": 50258,
+  "dropout": 0.1,
   "encoder_attention_heads": 6,
   "encoder_ffn_dim": 1536,
   "encoder_layerdrop": 0.0,

whisper-tiny-hi-checkpoint-3/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a59c8982089b3ffb0f35b2a8b93a329827d3603f741f4d47ddb7a17dc5a7e5e2
 size 151061672

 version https://git-lfs.github.com/spec/v1
+oid sha256:daeea7778cdeda935a2e90f442518eb60512721cd10bce0921a80c47aa8f2543
 size 151061672

whisper-tiny-hi-checkpoint-3/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:802a25ee7db91faba0d8c4d8ea560053183efcadf455712cb855292076f680e4
+size 151099494

whisper-tiny-hi-checkpoint-3/trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 69.98899144720129,
-  "best_model_checkpoint": "./whisper-tiny-hi2_test/checkpoint-120",
   "epoch": 6.3125,
   "eval_steps": 40,
   "global_step": 202,
@@ -10,162 +10,162 @@
   "log_history": [
     {
       "epoch": 0.625,
-      "grad_norm": 10.95101547241211,
-      "learning_rate": 9.200000000000002e-06,
-      "loss": 2.3747,
       "step": 20
     },
     {
       "epoch": 1.25,
-      "grad_norm": 7.747081279754639,
-      "learning_rate": 8.2e-06,
-      "loss": 1.2169,
       "step": 40
     },
     {
       "epoch": 1.25,
-      "eval_loss": 1.0360029935836792,
-      "eval_runtime": 574.5339,
-      "eval_samples_per_second": 1.741,
-      "eval_steps_per_second": 1.741,
-      "eval_wer": 91.60809552036582,
       "step": 40
     },
     {
       "epoch": 1.875,
-      "grad_norm": 7.32460355758667,
-      "learning_rate": 7.2000000000000005e-06,
-      "loss": 0.9058,
       "step": 60
     },
     {
       "epoch": 2.5,
-      "grad_norm": 6.835532188415527,
-      "learning_rate": 6.200000000000001e-06,
-      "loss": 0.7302,
       "step": 80
     },
     {
       "epoch": 2.5,
-      "eval_loss": 0.7368654608726501,
-      "eval_runtime": 549.562,
-      "eval_samples_per_second": 1.82,
-      "eval_steps_per_second": 1.82,
-      "eval_wer": 79.80353967313066,
       "step": 80
     },
     {
       "epoch": 3.125,
-      "grad_norm": 6.408384323120117,
-      "learning_rate": 5.2e-06,
-      "loss": 0.6453,
       "step": 100
     },
     {
       "epoch": 3.75,
-      "grad_norm": 5.809150695800781,
-      "learning_rate": 4.2000000000000004e-06,
-      "loss": 0.5917,
       "step": 120
     },
     {
       "epoch": 3.75,
-      "eval_loss": 0.6504533886909485,
-      "eval_runtime": 548.8688,
-      "eval_samples_per_second": 1.822,
-      "eval_steps_per_second": 1.822,
-      "eval_wer": 69.98899144720129,
       "step": 120
     },
     {
       "epoch": 4.375,
-      "grad_norm": 5.724637508392334,
-      "learning_rate": 3.2000000000000003e-06,
-      "loss": 0.5356,
       "step": 140
     },
     {
       "epoch": 5.0,
-      "grad_norm": 10.124310493469238,
-      "learning_rate": 2.2e-06,
-      "loss": 0.5156,
       "step": 160
     },
     {
       "epoch": 5.0,
-      "eval_loss": 0.6157090663909912,
-      "eval_runtime": 549.7895,
-      "eval_samples_per_second": 1.819,
-      "eval_steps_per_second": 1.819,
-      "eval_wer": 70.4293335591498,
       "step": 160
     },
     {
       "epoch": 5.625,
-      "grad_norm": 4.947811126708984,
-      "learning_rate": 1.2000000000000002e-06,
-      "loss": 0.4986,
       "step": 180
     },
     {
       "epoch": 6.25,
-      "grad_norm": 4.541861057281494,
-      "learning_rate": 2.0000000000000002e-07,
-      "loss": 0.481,
       "step": 200
     },
     {
       "epoch": 6.25,
-      "eval_loss": 0.6050636768341064,
-      "eval_runtime": 552.964,
-      "eval_samples_per_second": 1.808,
-      "eval_steps_per_second": 1.808,
-      "eval_wer": 70.03980015242611,
       "step": 200
     },
     {
       "epoch": 6.25,
       "step": 200,
       "total_flos": 1.5401574531072e+17,
-      "train_loss": 0.8495243072509766,
-      "train_runtime": 3592.94,
-      "train_samples_per_second": 1.781,
       "train_steps_per_second": 0.056
     },
     {
       "epoch": 6.28125,
       "step": 201,
       "total_flos": 1.5480354963456e+17,
-      "train_loss": 0.003230639654605543,
-      "train_runtime": 7.5043,
-      "train_samples_per_second": 852.844,
-      "train_steps_per_second": 26.651
     },
     {
       "epoch": 6.28125,
-      "eval_loss": 0.6504533886909485,
-      "eval_runtime": 548.5863,
-      "eval_samples_per_second": 1.823,
-      "eval_steps_per_second": 1.823,
-      "eval_wer": 69.98899144720129,
       "step": 201
     },
     {
       "epoch": 6.3125,
       "step": 202,
       "total_flos": 1.555913539584e+17,
-      "train_loss": 0.0035205459830784562,
-      "train_runtime": 7.6486,
-      "train_samples_per_second": 836.753,
-      "train_steps_per_second": 26.149
     },
     {
       "epoch": 6.3125,
-      "eval_loss": 0.6504533886909485,
-      "eval_runtime": 548.2984,
-      "eval_samples_per_second": 1.824,
-      "eval_steps_per_second": 1.824,
-      "eval_wer": 69.98899144720129,
       "step": 202
     }
   ],

 {
+  "best_metric": 58.31498729889923,
+  "best_model_checkpoint": "./whisper-tiny-hi2_test/checkpoint-80",
   "epoch": 6.3125,
   "eval_steps": 40,
   "global_step": 202,
   "log_history": [
     {
       "epoch": 0.625,
+      "grad_norm": 8.544885635375977,
+      "learning_rate": 3.75e-05,
+      "loss": 1.8228,
       "step": 20
     },
     {
       "epoch": 1.25,
+      "grad_norm": 6.32118558883667,
+      "learning_rate": 3.75e-05,
+      "loss": 0.6803,
       "step": 40
     },
     {
       "epoch": 1.25,
+      "eval_loss": 0.6102083325386047,
+      "eval_runtime": 542.5987,
+      "eval_samples_per_second": 1.843,
+      "eval_steps_per_second": 1.843,
+      "eval_wer": 65.94411515664692,
       "step": 40
     },
     {
       "epoch": 1.875,
+      "grad_norm": 6.4600510597229,
+      "learning_rate": 3.75e-05,
+      "loss": 0.4966,
       "step": 60
     },
     {
       "epoch": 2.5,
+      "grad_norm": 5.194849491119385,
+      "learning_rate": 3.75e-05,
+      "loss": 0.3649,
       "step": 80
     },
     {
       "epoch": 2.5,
+      "eval_loss": 0.5036975741386414,
+      "eval_runtime": 540.6408,
+      "eval_samples_per_second": 1.85,
+      "eval_steps_per_second": 1.85,
+      "eval_wer": 58.31498729889923,
       "step": 80
     },
     {
       "epoch": 3.125,
+      "grad_norm": 4.111001014709473,
+      "learning_rate": 3.75e-05,
+      "loss": 0.3075,
       "step": 100
     },
     {
       "epoch": 3.75,
+      "grad_norm": 4.358007431030273,
+      "learning_rate": 3.75e-05,
+      "loss": 0.2296,
       "step": 120
     },
     {
       "epoch": 3.75,
+      "eval_loss": 0.48966631293296814,
+      "eval_runtime": 538.04,
+      "eval_samples_per_second": 1.859,
+      "eval_steps_per_second": 1.859,
+      "eval_wer": 66.71464860287891,
       "step": 120
     },
     {
       "epoch": 4.375,
+      "grad_norm": 4.111566066741943,
+      "learning_rate": 3.75e-05,
+      "loss": 0.1811,
       "step": 140
     },
     {
       "epoch": 5.0,
+      "grad_norm": 6.702174186706543,
+      "learning_rate": 3.75e-05,
+      "loss": 0.1564,
       "step": 160
     },
     {
       "epoch": 5.0,
+      "eval_loss": 0.5130774974822998,
+      "eval_runtime": 529.7879,
+      "eval_samples_per_second": 1.888,
+      "eval_steps_per_second": 1.888,
+      "eval_wer": 65.34292972057578,
       "step": 160
     },
     {
       "epoch": 5.625,
+      "grad_norm": 3.0882856845855713,
+      "learning_rate": 3.75e-05,
+      "loss": 0.101,
       "step": 180
     },
     {
       "epoch": 6.25,
+      "grad_norm": 4.524318695068359,
+      "learning_rate": 3.75e-05,
+      "loss": 0.0905,
       "step": 200
     },
     {
       "epoch": 6.25,
+      "eval_loss": 0.5503659248352051,
+      "eval_runtime": 587.5545,
+      "eval_samples_per_second": 1.702,
+      "eval_steps_per_second": 1.702,
+      "eval_wer": 63.903471634208294,
       "step": 200
     },
     {
       "epoch": 6.25,
       "step": 200,
       "total_flos": 1.5401574531072e+17,
+      "train_loss": 0.44307032763957976,
+      "train_runtime": 3561.8571,
+      "train_samples_per_second": 1.797,
       "train_steps_per_second": 0.056
     },
     {
       "epoch": 6.28125,
       "step": 201,
       "total_flos": 1.5480354963456e+17,
+      "train_loss": 0.04041733433358112,
+      "train_runtime": 8.5506,
+      "train_samples_per_second": 748.49,
+      "train_steps_per_second": 23.39
     },
     {
       "epoch": 6.28125,
+      "eval_loss": 0.5036975741386414,
+      "eval_runtime": 613.1737,
+      "eval_samples_per_second": 1.631,
+      "eval_steps_per_second": 1.631,
+      "eval_wer": 58.31498729889923,
       "step": 201
     },
     {
       "epoch": 6.3125,
       "step": 202,
       "total_flos": 1.555913539584e+17,
+      "train_loss": 0.04091336939594533,
+      "train_runtime": 7.7232,
+      "train_samples_per_second": 828.669,
+      "train_steps_per_second": 25.896
     },
     {
       "epoch": 6.3125,
+      "eval_loss": 0.5036975741386414,
+      "eval_runtime": 586.1638,
+      "eval_samples_per_second": 1.706,
+      "eval_steps_per_second": 1.706,
+      "eval_wer": 58.31498729889923,
       "step": 202
     }
   ],

whisper-tiny-hi-checkpoint-3/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cf420e0b38b82d46a55cd7ad07aeb13abc779974b6f703a2306e4deb9f513f5b
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:b76e24b44f2bb0092eb34ce034df2972a05583438e44c5c896bc9865acf1d9d2
 size 5240

whisper-tiny-hi-checkpoint-9/trainer_state.json ADDED Viewed

	@@ -0,0 +1,301 @@

+{
+  "best_metric": 69.98899144720129,
+  "best_model_checkpoint": "./whisper-tiny-hi2_test/checkpoint-120",
+  "epoch": 6.5,
+  "eval_steps": 40,
+  "global_step": 208,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.625,
+      "grad_norm": 10.95101547241211,
+      "learning_rate": 9.200000000000002e-06,
+      "loss": 2.3747,
+      "step": 20
+    },
+    {
+      "epoch": 1.25,
+      "grad_norm": 7.747081279754639,
+      "learning_rate": 8.2e-06,
+      "loss": 1.2169,
+      "step": 40
+    },
+    {
+      "epoch": 1.25,
+      "eval_loss": 1.0360029935836792,
+      "eval_runtime": 574.5339,
+      "eval_samples_per_second": 1.741,
+      "eval_steps_per_second": 1.741,
+      "eval_wer": 91.60809552036582,
+      "step": 40
+    },
+    {
+      "epoch": 1.875,
+      "grad_norm": 7.32460355758667,
+      "learning_rate": 7.2000000000000005e-06,
+      "loss": 0.9058,
+      "step": 60
+    },
+    {
+      "epoch": 2.5,
+      "grad_norm": 6.835532188415527,
+      "learning_rate": 6.200000000000001e-06,
+      "loss": 0.7302,
+      "step": 80
+    },
+    {
+      "epoch": 2.5,
+      "eval_loss": 0.7368654608726501,
+      "eval_runtime": 549.562,
+      "eval_samples_per_second": 1.82,
+      "eval_steps_per_second": 1.82,
+      "eval_wer": 79.80353967313066,
+      "step": 80
+    },
+    {
+      "epoch": 3.125,
+      "grad_norm": 6.408384323120117,
+      "learning_rate": 5.2e-06,
+      "loss": 0.6453,
+      "step": 100
+    },
+    {
+      "epoch": 3.75,
+      "grad_norm": 5.809150695800781,
+      "learning_rate": 4.2000000000000004e-06,
+      "loss": 0.5917,
+      "step": 120
+    },
+    {
+      "epoch": 3.75,
+      "eval_loss": 0.6504533886909485,
+      "eval_runtime": 548.8688,
+      "eval_samples_per_second": 1.822,
+      "eval_steps_per_second": 1.822,
+      "eval_wer": 69.98899144720129,
+      "step": 120
+    },
+    {
+      "epoch": 4.375,
+      "grad_norm": 5.724637508392334,
+      "learning_rate": 3.2000000000000003e-06,
+      "loss": 0.5356,
+      "step": 140
+    },
+    {
+      "epoch": 5.0,
+      "grad_norm": 10.124310493469238,
+      "learning_rate": 2.2e-06,
+      "loss": 0.5156,
+      "step": 160
+    },
+    {
+      "epoch": 5.0,
+      "eval_loss": 0.6157090663909912,
+      "eval_runtime": 549.7895,
+      "eval_samples_per_second": 1.819,
+      "eval_steps_per_second": 1.819,
+      "eval_wer": 70.4293335591498,
+      "step": 160
+    },
+    {
+      "epoch": 5.625,
+      "grad_norm": 4.947811126708984,
+      "learning_rate": 1.2000000000000002e-06,
+      "loss": 0.4986,
+      "step": 180
+    },
+    {
+      "epoch": 6.25,
+      "grad_norm": 4.541861057281494,
+      "learning_rate": 2.0000000000000002e-07,
+      "loss": 0.481,
+      "step": 200
+    },
+    {
+      "epoch": 6.25,
+      "eval_loss": 0.6050636768341064,
+      "eval_runtime": 552.964,
+      "eval_samples_per_second": 1.808,
+      "eval_steps_per_second": 1.808,
+      "eval_wer": 70.03980015242611,
+      "step": 200
+    },
+    {
+      "epoch": 6.25,
+      "step": 200,
+      "total_flos": 1.5401574531072e+17,
+      "train_loss": 0.8495243072509766,
+      "train_runtime": 3592.94,
+      "train_samples_per_second": 1.781,
+      "train_steps_per_second": 0.056
+    },
+    {
+      "epoch": 6.28125,
+      "step": 201,
+      "total_flos": 1.5480354963456e+17,
+      "train_loss": 0.003230639654605543,
+      "train_runtime": 7.5043,
+      "train_samples_per_second": 852.844,
+      "train_steps_per_second": 26.651
+    },
+    {
+      "epoch": 6.28125,
+      "eval_loss": 0.6504533886909485,
+      "eval_runtime": 548.5863,
+      "eval_samples_per_second": 1.823,
+      "eval_steps_per_second": 1.823,
+      "eval_wer": 69.98899144720129,
+      "step": 201
+    },
+    {
+      "epoch": 6.3125,
+      "step": 202,
+      "total_flos": 1.555913539584e+17,
+      "train_loss": 0.0035205459830784562,
+      "train_runtime": 7.6486,
+      "train_samples_per_second": 836.753,
+      "train_steps_per_second": 26.149
+    },
+    {
+      "epoch": 6.3125,
+      "eval_loss": 0.6504533886909485,
+      "eval_runtime": 548.2984,
+      "eval_samples_per_second": 1.824,
+      "eval_steps_per_second": 1.824,
+      "eval_wer": 69.98899144720129,
+      "step": 202
+    },
+    {
+      "epoch": 6.34375,
+      "step": 203,
+      "total_flos": 1.5637915828224e+17,
+      "train_loss": 0.002875891812329222,
+      "train_runtime": 7.5227,
+      "train_samples_per_second": 850.756,
+      "train_steps_per_second": 26.586
+    },
+    {
+      "epoch": 6.34375,
+      "eval_loss": 0.6504533886909485,
+      "eval_runtime": 547.5722,
+      "eval_samples_per_second": 1.826,
+      "eval_steps_per_second": 1.826,
+      "eval_wer": 69.98899144720129,
+      "step": 203
+    },
+    {
+      "epoch": 6.375,
+      "step": 204,
+      "total_flos": 1.5716696260608e+17,
+      "train_loss": 0.003042735305486941,
+      "train_runtime": 7.3464,
+      "train_samples_per_second": 871.18,
+      "train_steps_per_second": 27.224
+    },
+    {
+      "epoch": 6.375,
+      "eval_loss": 0.6504533886909485,
+      "eval_runtime": 547.015,
+      "eval_samples_per_second": 1.828,
+      "eval_steps_per_second": 1.828,
+      "eval_wer": 69.98899144720129,
+      "step": 204
+    },
+    {
+      "epoch": 6.40625,
+      "step": 205,
+      "total_flos": 1.5795476692992e+17,
+      "train_loss": 0.0033008325390699433,
+      "train_runtime": 7.3265,
+      "train_samples_per_second": 873.547,
+      "train_steps_per_second": 27.298
+    },
+    {
+      "epoch": 6.40625,
+      "eval_loss": 0.6504533886909485,
+      "eval_runtime": 545.7731,
+      "eval_samples_per_second": 1.832,
+      "eval_steps_per_second": 1.832,
+      "eval_wer": 69.98899144720129,
+      "step": 205
+    },
+    {
+      "epoch": 6.4375,
+      "step": 206,
+      "total_flos": 1.5874257125376e+17,
+      "train_loss": 0.0030977731769524734,
+      "train_runtime": 7.5608,
+      "train_samples_per_second": 846.467,
+      "train_steps_per_second": 26.452
+    },
+    {
+      "epoch": 6.4375,
+      "eval_loss": 0.6504533886909485,
+      "eval_runtime": 546.3323,
+      "eval_samples_per_second": 1.83,
+      "eval_steps_per_second": 1.83,
+      "eval_wer": 69.98899144720129,
+      "step": 206
+    },
+    {
+      "epoch": 6.46875,
+      "step": 207,
+      "total_flos": 1.595303755776e+17,
+      "train_loss": 0.0028965755361289795,
+      "train_runtime": 7.5526,
+      "train_samples_per_second": 847.394,
+      "train_steps_per_second": 26.481
+    },
+    {
+      "epoch": 6.46875,
+      "eval_loss": 0.6504533886909485,
+      "eval_runtime": 546.1485,
+      "eval_samples_per_second": 1.831,
+      "eval_steps_per_second": 1.831,
+      "eval_wer": 69.98899144720129,
+      "step": 207
+    },
+    {
+      "epoch": 6.5,
+      "step": 208,
+      "total_flos": 1.6031817990144e+17,
+      "train_loss": 0.003312833607196808,
+      "train_runtime": 7.6251,
+      "train_samples_per_second": 839.332,
+      "train_steps_per_second": 26.229
+    },
+    {
+      "epoch": 6.5,
+      "eval_loss": 0.6504533886909485,
+      "eval_runtime": 547.4069,
+      "eval_samples_per_second": 1.827,
+      "eval_steps_per_second": 1.827,
+      "eval_wer": 69.98899144720129,
+      "step": 208
+    }
+  ],
+  "logging_steps": 20,
+  "max_steps": 200,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 7,
+  "save_steps": 40,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 1.6031817990144e+17,
+  "train_batch_size": 32,
+  "trial_name": null,
+  "trial_params": null
+}