crossdelenna
/

medium_cross.en

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7a782efdc728d114f90b12def8869d82a4bf4bb08077c7177e3d627cb2a10945
 size 693625338

 version https://git-lfs.github.com/spec/v1
+oid sha256:38a5fc0cf6ea40392dd62729ffdf797cefab021b41cd8c36fb187c0ae23a4d58
 size 693625338

rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c6d738b7a51be6af562af846720ffa1b521b2f642ec0a840cd45d5f4c9b24e16
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:bb6f255d22039016bd368cbeb9ec67a3324aba476af2ac6fa3c2b31955be7e84
 size 14244

scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6cd5fe0deafc847e744377630a02b485aaadcbf0c8a2ff89b7560cd716efb140
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:46991dd2d014c7aba31aaaa97536010ff42c613f93552beac5e9b051ec0c9ebd
 size 1064

trainer_state.json CHANGED Viewed

@@ -1,51 +1,67 @@
 {
-  "best_metric": 34.65030047308528,
-  "best_model_checkpoint": "./whisper-medium.en/checkpoint-400",
-  "epoch": 1.0335051546391754,
-  "eval_steps": 200,
-  "global_step": 401,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.5154639175257731,
-      "grad_norm": 14.852355003356934,
-      "learning_rate": 5.2685421994884914e-06,
-      "loss": 2.2838,
-      "step": 200
     },
     {
-      "epoch": 0.5154639175257731,
-      "eval_loss": 1.0020978450775146,
-      "eval_runtime": 808.3907,
-      "eval_samples_per_second": 1.277,
-      "eval_steps_per_second": 0.16,
-      "eval_wer": 36.01841196777906,
-      "step": 200
     },
     {
-      "epoch": 1.0309278350515463,
-      "grad_norm": 8.327604293823242,
-      "learning_rate": 1.534526854219949e-07,
-      "loss": 0.9275,
-      "step": 400
     },
     {
-      "epoch": 1.0309278350515463,
-      "eval_loss": 0.7616046071052551,
-      "eval_runtime": 806.233,
-      "eval_samples_per_second": 1.28,
-      "eval_steps_per_second": 0.16,
-      "eval_wer": 34.65030047308528,
-      "step": 400
     }
   ],
-  "logging_steps": 200,
-  "max_steps": 401,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 2,
-  "save_steps": 200,
   "stateful_callbacks": {
     "TrainerControl": {
       "args": {
@@ -53,13 +69,13 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": true
       },
       "attributes": {}
     }
   },
-  "total_flos": 6.53799503757312e+18,
-  "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 15.138377050364909,
+  "best_model_checkpoint": "./whisper-medium.en/checkpoint-1050",
+  "epoch": 3.723404255319149,
+  "eval_steps": 350,
+  "global_step": 1050,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 1.2411347517730495,
+      "grad_norm": 7.018165111541748,
+      "learning_rate": 6.753121998078771e-06,
+      "loss": 0.664,
+      "step": 350
     },
     {
+      "epoch": 1.2411347517730495,
+      "eval_loss": 0.399837464094162,
+      "eval_runtime": 733.8278,
+      "eval_samples_per_second": 1.406,
+      "eval_steps_per_second": 0.064,
+      "eval_wer": 18.209408194233685,
+      "step": 350
     },
     {
+      "epoch": 2.482269503546099,
+      "grad_norm": 4.022040367126465,
+      "learning_rate": 3.390970220941403e-06,
+      "loss": 0.4625,
+      "step": 700
     },
     {
+      "epoch": 2.482269503546099,
+      "eval_loss": 0.3244483172893524,
+      "eval_runtime": 737.4383,
+      "eval_samples_per_second": 1.399,
+      "eval_steps_per_second": 0.064,
+      "eval_wer": 16.06329937134186,
+      "step": 700
+    },
+    {
+      "epoch": 3.723404255319149,
+      "grad_norm": 4.158984661102295,
+      "learning_rate": 2.8818443804034583e-08,
+      "loss": 0.3703,
+      "step": 1050
+    },
+    {
+      "epoch": 3.723404255319149,
+      "eval_loss": 0.3033762276172638,
+      "eval_runtime": 728.0181,
+      "eval_samples_per_second": 1.418,
+      "eval_steps_per_second": 0.065,
+      "eval_wer": 15.138377050364909,
+      "step": 1050
     }
   ],
+  "logging_steps": 350,
+  "max_steps": 1051,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 4,
+  "save_steps": 350,
   "stateful_callbacks": {
     "TrainerControl": {
       "args": {
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": false
       },
       "attributes": {}
     }
   },
+  "total_flos": 2.355760247537664e+19,
+  "train_batch_size": 22,
   "trial_name": null,
   "trial_params": null
 }