Training in progress, step 300

Browse files

Files changed (10) hide show

checkpoint-300/optimizer.pt +1 -1
checkpoint-300/pytorch_model.bin +1 -1
checkpoint-300/rng_state.pth +2 -2
checkpoint-300/scaler.pt +1 -1
checkpoint-300/scheduler.pt +1 -1
checkpoint-300/trainer_state.json +116 -116
checkpoint-300/training_args.bin +2 -2
pytorch_model.bin +1 -1
runs/Dec20_20-28-50_129-146-32-172/events.out.tfevents.1671568135.129-146-32-172.151517.0 +2 -2
whisper_small_ps_augmented.py +1 -0

checkpoint-300/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2a29af7e42a8cc291c7dc41a87ab9bec819ca5e7407672e72ed2528611450ee9
 size 1934161093

 version https://git-lfs.github.com/spec/v1
+oid sha256:22e62120437d4a5d43ed19f559839cbc39250df020c1097fa01f356bcbf4bba8
 size 1934161093

checkpoint-300/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3659cbd57caabfa6834081314e1044f720d4f82db5a36a341158bdc9fc0cf4f2
 size 967102601

 version https://git-lfs.github.com/spec/v1
+oid sha256:18928fdec4a6f78c294cc9f60f25b8acac276650309efc21ceb0ecf42f321cb0
 size 967102601

checkpoint-300/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0968b0e39b19cec9553e062832c01be226fad3fe583411f84809dfd1a9c08ee1
-size 14511

 version https://git-lfs.github.com/spec/v1
+oid sha256:1ab614b521b578676b3402f6dd6f0907952e16f2d208b34af9d84266a360fc37
+size 14639

checkpoint-300/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1ef418a6ac4669ffd3c7cffe1d7df12a1bb116658f99f16e613cb28c6cbef5cf
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:ce7f2249620974c2bcc6e52f5d48799672ec47f32baf09849b58c0ab5addde0f
 size 557

checkpoint-300/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c6c1d870d593d2993fc02f7df3f7be41e6fce04eb6216560256b783d35551c95
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:cbb349d7867b639670f1b127be8892c37cb67d6956f365801519932598abf657
 size 627

checkpoint-300/trainer_state.json CHANGED Viewed

@@ -1,226 +1,226 @@
 {
-  "best_metric": 53.62439467312349,
   "best_model_checkpoint": "./checkpoint-300",
-  "epoch": 3.566371681415929,
   "global_step": 300,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.12,
-      "learning_rate": 3e-06,
-      "loss": 4.1495,
       "step": 10
     },
     {
-      "epoch": 0.24,
-      "learning_rate": 6.333333333333333e-06,
-      "loss": 2.9287,
       "step": 20
     },
     {
-      "epoch": 0.35,
-      "learning_rate": 9.666666666666667e-06,
-      "loss": 2.0462,
       "step": 30
     },
     {
-      "epoch": 0.47,
-      "learning_rate": 9.666666666666667e-06,
-      "loss": 1.6138,
       "step": 40
     },
     {
-      "epoch": 0.59,
-      "learning_rate": 9.296296296296296e-06,
-      "loss": 1.3862,
       "step": 50
     },
     {
-      "epoch": 0.71,
-      "learning_rate": 8.925925925925927e-06,
-      "loss": 1.2604,
       "step": 60
     },
     {
-      "epoch": 0.83,
-      "learning_rate": 8.555555555555556e-06,
-      "loss": 1.1436,
       "step": 70
     },
     {
-      "epoch": 0.94,
-      "learning_rate": 8.185185185185187e-06,
-      "loss": 1.168,
       "step": 80
     },
     {
-      "epoch": 1.07,
-      "learning_rate": 7.814814814814816e-06,
-      "loss": 1.1041,
       "step": 90
     },
     {
-      "epoch": 1.19,
-      "learning_rate": 7.444444444444445e-06,
-      "loss": 0.9683,
       "step": 100
     },
     {
-      "epoch": 1.19,
-      "eval_cer": 131.61659035460045,
-      "eval_loss": 0.8811978697776794,
-      "eval_runtime": 593.3196,
-      "eval_samples_per_second": 0.863,
-      "eval_steps_per_second": 0.431,
-      "eval_wer": 139.37651331719127,
       "step": 100
     },
     {
-      "epoch": 1.31,
-      "learning_rate": 7.074074074074074e-06,
-      "loss": 0.909,
       "step": 110
     },
     {
-      "epoch": 1.42,
-      "learning_rate": 6.703703703703704e-06,
-      "loss": 0.9213,
       "step": 120
     },
     {
-      "epoch": 1.54,
-      "learning_rate": 6.333333333333333e-06,
-      "loss": 0.9092,
       "step": 130
     },
     {
-      "epoch": 1.66,
-      "learning_rate": 5.962962962962963e-06,
-      "loss": 0.8481,
       "step": 140
     },
     {
-      "epoch": 1.78,
-      "learning_rate": 5.5925925925925926e-06,
-      "loss": 0.8471,
       "step": 150
     },
     {
-      "epoch": 1.9,
-      "learning_rate": 5.2222222222222226e-06,
-      "loss": 0.8504,
       "step": 160
     },
     {
-      "epoch": 2.02,
-      "learning_rate": 4.851851851851852e-06,
-      "loss": 0.8264,
       "step": 170
     },
     {
-      "epoch": 2.14,
-      "learning_rate": 4.481481481481482e-06,
-      "loss": 0.7236,
       "step": 180
     },
     {
-      "epoch": 2.26,
-      "learning_rate": 4.111111111111111e-06,
-      "loss": 0.6898,
       "step": 190
     },
     {
-      "epoch": 2.38,
-      "learning_rate": 3.740740740740741e-06,
-      "loss": 0.6848,
       "step": 200
     },
     {
-      "epoch": 2.38,
-      "eval_cer": 151.33685371478225,
-      "eval_loss": 0.7542899250984192,
-      "eval_runtime": 551.6472,
-      "eval_samples_per_second": 0.928,
-      "eval_steps_per_second": 0.464,
-      "eval_wer": 145.9972760290557,
       "step": 200
     },
     {
-      "epoch": 2.5,
-      "learning_rate": 3.3703703703703705e-06,
-      "loss": 0.7021,
       "step": 210
     },
     {
-      "epoch": 2.61,
-      "learning_rate": 3e-06,
-      "loss": 0.6956,
       "step": 220
     },
     {
-      "epoch": 2.73,
-      "learning_rate": 2.6296296296296297e-06,
-      "loss": 0.629,
       "step": 230
     },
     {
-      "epoch": 2.85,
-      "learning_rate": 2.2592592592592592e-06,
-      "loss": 0.6661,
       "step": 240
     },
     {
-      "epoch": 2.97,
-      "learning_rate": 1.888888888888889e-06,
-      "loss": 0.6251,
       "step": 250
     },
     {
-      "epoch": 3.09,
-      "learning_rate": 1.5185185185185186e-06,
-      "loss": 0.6852,
       "step": 260
     },
     {
-      "epoch": 3.21,
-      "learning_rate": 1.1481481481481482e-06,
-      "loss": 0.5772,
       "step": 270
     },
     {
-      "epoch": 3.33,
-      "learning_rate": 7.777777777777779e-07,
-      "loss": 0.5592,
       "step": 280
     },
     {
-      "epoch": 3.45,
-      "learning_rate": 4.074074074074075e-07,
-      "loss": 0.5845,
       "step": 290
     },
     {
-      "epoch": 3.57,
-      "learning_rate": 3.703703703703704e-08,
-      "loss": 0.5548,
       "step": 300
     },
     {
-      "epoch": 3.57,
-      "eval_cer": 22.68473647271147,
-      "eval_loss": 0.6978507041931152,
-      "eval_runtime": 832.954,
-      "eval_samples_per_second": 0.615,
-      "eval_steps_per_second": 0.307,
-      "eval_wer": 53.62439467312349,
       "step": 300
     }
   ],
-  "max_steps": 300,
-  "num_train_epochs": 4,
-  "total_flos": 2.79033223569408e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 50.13619854721549,
   "best_model_checkpoint": "./checkpoint-300",
+  "epoch": 7.141176470588236,
   "global_step": 300,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.24,
+      "learning_rate": 2.666666666666667e-06,
+      "loss": 4.3134,
       "step": 10
     },
     {
+      "epoch": 0.47,
+      "learning_rate": 6e-06,
+      "loss": 2.9329,
       "step": 20
     },
     {
+      "epoch": 0.71,
+      "learning_rate": 9.333333333333334e-06,
+      "loss": 2.0584,
       "step": 30
     },
     {
+      "epoch": 0.94,
+      "learning_rate": 9.829787234042554e-06,
+      "loss": 1.566,
       "step": 40
     },
     {
+      "epoch": 1.19,
+      "learning_rate": 9.617021276595745e-06,
+      "loss": 1.3777,
       "step": 50
     },
     {
+      "epoch": 1.42,
+      "learning_rate": 9.404255319148937e-06,
+      "loss": 1.1469,
       "step": 60
     },
     {
+      "epoch": 1.66,
+      "learning_rate": 9.191489361702128e-06,
+      "loss": 1.0638,
       "step": 70
     },
     {
+      "epoch": 1.89,
+      "learning_rate": 8.97872340425532e-06,
+      "loss": 0.9974,
       "step": 80
     },
     {
+      "epoch": 2.14,
+      "learning_rate": 8.765957446808512e-06,
+      "loss": 0.9615,
       "step": 90
     },
     {
+      "epoch": 2.38,
+      "learning_rate": 8.553191489361703e-06,
+      "loss": 0.8262,
       "step": 100
     },
     {
+      "epoch": 2.38,
+      "eval_cer": 149.33157314260887,
+      "eval_loss": 0.8188337683677673,
+      "eval_runtime": 459.9395,
+      "eval_samples_per_second": 1.113,
+      "eval_steps_per_second": 0.139,
+      "eval_wer": 146.85230024213075,
       "step": 100
     },
     {
+      "epoch": 2.61,
+      "learning_rate": 8.340425531914894e-06,
+      "loss": 0.7986,
       "step": 110
     },
     {
+      "epoch": 2.85,
+      "learning_rate": 8.127659574468085e-06,
+      "loss": 0.7707,
       "step": 120
     },
     {
+      "epoch": 3.09,
+      "learning_rate": 7.914893617021278e-06,
+      "loss": 0.7623,
       "step": 130
     },
     {
+      "epoch": 3.33,
+      "learning_rate": 7.702127659574469e-06,
+      "loss": 0.6451,
       "step": 140
     },
     {
+      "epoch": 3.56,
+      "learning_rate": 7.48936170212766e-06,
+      "loss": 0.6205,
       "step": 150
     },
     {
+      "epoch": 3.8,
+      "learning_rate": 7.2765957446808524e-06,
+      "loss": 0.6097,
       "step": 160
     },
     {
+      "epoch": 4.05,
+      "learning_rate": 7.0638297872340434e-06,
+      "loss": 0.6217,
       "step": 170
     },
     {
+      "epoch": 4.28,
+      "learning_rate": 6.8510638297872344e-06,
+      "loss": 0.4584,
       "step": 180
     },
     {
+      "epoch": 4.52,
+      "learning_rate": 6.6382978723404254e-06,
+      "loss": 0.4929,
       "step": 190
     },
     {
+      "epoch": 4.75,
+      "learning_rate": 6.425531914893618e-06,
+      "loss": 0.4843,
       "step": 200
     },
     {
+      "epoch": 4.75,
+      "eval_cer": 22.099862972494236,
+      "eval_loss": 0.6699215173721313,
+      "eval_runtime": 1062.3991,
+      "eval_samples_per_second": 0.482,
+      "eval_steps_per_second": 0.06,
+      "eval_wer": 52.66343825665859,
       "step": 200
     },
     {
+      "epoch": 4.99,
+      "learning_rate": 6.212765957446809e-06,
+      "loss": 0.4678,
       "step": 210
     },
     {
+      "epoch": 5.24,
+      "learning_rate": 6e-06,
+      "loss": 0.4014,
       "step": 220
     },
     {
+      "epoch": 5.47,
+      "learning_rate": 5.787234042553191e-06,
+      "loss": 0.3926,
       "step": 230
     },
     {
+      "epoch": 5.71,
+      "learning_rate": 5.574468085106384e-06,
+      "loss": 0.3806,
       "step": 240
     },
     {
+      "epoch": 5.94,
+      "learning_rate": 5.361702127659575e-06,
+      "loss": 0.3855,
       "step": 250
     },
     {
+      "epoch": 6.19,
+      "learning_rate": 5.148936170212766e-06,
+      "loss": 0.3478,
       "step": 260
     },
     {
+      "epoch": 6.42,
+      "learning_rate": 4.936170212765958e-06,
+      "loss": 0.3078,
       "step": 270
     },
     {
+      "epoch": 6.66,
+      "learning_rate": 4.7234042553191496e-06,
+      "loss": 0.3147,
       "step": 280
     },
     {
+      "epoch": 6.89,
+      "learning_rate": 4.5106382978723406e-06,
+      "loss": 0.3213,
       "step": 290
     },
     {
+      "epoch": 7.14,
+      "learning_rate": 4.297872340425532e-06,
+      "loss": 0.287,
       "step": 300
     },
     {
+      "epoch": 7.14,
+      "eval_cer": 20.677784833394604,
+      "eval_loss": 0.6913720369338989,
+      "eval_runtime": 1003.603,
+      "eval_samples_per_second": 0.51,
+      "eval_steps_per_second": 0.064,
+      "eval_wer": 50.13619854721549,
       "step": 300
     }
   ],
+  "max_steps": 500,
+  "num_train_epochs": 12,
+  "total_flos": 5.58730193559552e+18,
   "trial_name": null,
   "trial_params": null
 }

checkpoint-300/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bcf3a24325bb49c25270193816ed6035a253ca3ae300c31ffcec0afeb4229266
-size 3579

 version https://git-lfs.github.com/spec/v1
+oid sha256:5518cd575512706c66c89476ae9c64328c1bcac98ec06151bdc9afebf6c503fb
+size 3643

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:187c1d7674c7d7e27b2030f3c8b472ab80d8863925d52fe41abcfd44c6675a3a
 size 967102601

 version https://git-lfs.github.com/spec/v1
+oid sha256:18928fdec4a6f78c294cc9f60f25b8acac276650309efc21ceb0ecf42f321cb0
 size 967102601

runs/Dec20_20-28-50_129-146-32-172/events.out.tfevents.1671568135.129-146-32-172.151517.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1bb9fad7bb496cbe780fc5b737f82d64309e3290a5409c43485e045f47471fed
-size 8114

 version https://git-lfs.github.com/spec/v1
+oid sha256:c9f730aa019c3fdfb3bb29b6c3bdc8df372194567bace669c0490525c9864f8b
+size 10049

whisper_small_ps_augmented.py CHANGED Viewed

@@ -287,6 +287,7 @@ trainer = Seq2SeqTrainer(
     tokenizer=processor.feature_extractor
 )
 """We'll save the processor object once before starting training. Since the processor is not trainable, it won't change over the course of training:"""

     tokenizer=processor.feature_extractor
 )
+trainer.train(resume_from_checkpoint = True)
 """We'll save the processor object once before starting training. Since the processor is not trainable, it won't change over the course of training:"""