Upload 17 files

Browse files

Files changed (6) hide show

optimizer.pt +2 -2
pytorch_model.bin +2 -2
rng_state.pth +1 -1
scaler.pt +1 -1
scheduler.pt +1 -1
trainer_state.json +3 -252

optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e3b0c44298fc1c149afbf4c8996fb92427ae41e4649b934ca495991b7852b855
-size 0

 version https://git-lfs.github.com/spec/v1
+oid sha256:47ea4092ddde682d366002e26f501e8f2c43fa7a07916494a0a33eef1122e075
+size 6111428695

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e3b0c44298fc1c149afbf4c8996fb92427ae41e4649b934ca495991b7852b855
-size 0

 version https://git-lfs.github.com/spec/v1
+oid sha256:f2685daba978c2b8d65cb43ad777cda963664eba2acb444794a1480b6a6afd6b
+size 3055754841

rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0c49a19341b10faeb7bf1e2f2e25fe3d9dd5140c056ce7ce4e4e5b493b4d2568
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:12d7e6b7df767721053ff9f6323a231cf0852ba9410e5b7d74ee3079d462119a
 size 14575

scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:013b05fcefe78bf3963cc49dbbe22e39344ba52082d1913dcd60b29a95d1e7e8
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:2e769351f21ac92d172aed90d39bd27fe1d1e537736f1318d4c2465433f1bbfa
 size 557

scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3e37efdae495a667db75aa2ae3d9a00298d25e92b65955065a8365d55e484799
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:7d8eb51cc9c26967d17a84e7b6820a0d26198ba86110325f72bafd766eeb13bb
 size 627

trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 100.0,
   "best_model_checkpoint": "./Malasar_ASR_DICtandLuke/checkpoint-1000",
-  "epoch": 7.590132827324478,
-  "global_step": 4000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -753,260 +753,11 @@
       "eval_steps_per_second": 0.204,
       "eval_wer": 100.0,
       "step": 3000
-    },
-    {
-      "epoch": 5.74,
-      "learning_rate": 2.802857142857143e-06,
-      "loss": 0.0062,
-      "step": 3025
-    },
-    {
-      "epoch": 5.79,
-      "learning_rate": 2.7314285714285714e-06,
-      "loss": 0.0063,
-      "step": 3050
-    },
-    {
-      "epoch": 5.83,
-      "learning_rate": 2.6600000000000004e-06,
-      "loss": 0.0072,
-      "step": 3075
-    },
-    {
-      "epoch": 5.88,
-      "learning_rate": 2.5885714285714285e-06,
-      "loss": 0.0047,
-      "step": 3100
-    },
-    {
-      "epoch": 5.93,
-      "learning_rate": 2.5171428571428575e-06,
-      "loss": 0.0078,
-      "step": 3125
-    },
-    {
-      "epoch": 5.98,
-      "learning_rate": 2.445714285714286e-06,
-      "loss": 0.0069,
-      "step": 3150
-    },
-    {
-      "epoch": 6.02,
-      "learning_rate": 2.3742857142857147e-06,
-      "loss": 0.0039,
-      "step": 3175
-    },
-    {
-      "epoch": 6.07,
-      "learning_rate": 2.302857142857143e-06,
-      "loss": 0.0035,
-      "step": 3200
-    },
-    {
-      "epoch": 6.12,
-      "learning_rate": 2.2314285714285715e-06,
-      "loss": 0.0043,
-      "step": 3225
-    },
-    {
-      "epoch": 6.17,
-      "learning_rate": 2.16e-06,
-      "loss": 0.0045,
-      "step": 3250
-    },
-    {
-      "epoch": 6.21,
-      "learning_rate": 2.0885714285714287e-06,
-      "loss": 0.0023,
-      "step": 3275
-    },
-    {
-      "epoch": 6.26,
-      "learning_rate": 2.0171428571428573e-06,
-      "loss": 0.0031,
-      "step": 3300
-    },
-    {
-      "epoch": 6.31,
-      "learning_rate": 1.945714285714286e-06,
-      "loss": 0.0028,
-      "step": 3325
-    },
-    {
-      "epoch": 6.36,
-      "learning_rate": 1.8742857142857142e-06,
-      "loss": 0.0053,
-      "step": 3350
-    },
-    {
-      "epoch": 6.4,
-      "learning_rate": 1.8028571428571432e-06,
-      "loss": 0.0016,
-      "step": 3375
-    },
-    {
-      "epoch": 6.45,
-      "learning_rate": 1.7314285714285716e-06,
-      "loss": 0.0019,
-      "step": 3400
-    },
-    {
-      "epoch": 6.5,
-      "learning_rate": 1.6600000000000002e-06,
-      "loss": 0.0038,
-      "step": 3425
-    },
-    {
-      "epoch": 6.55,
-      "learning_rate": 1.5885714285714288e-06,
-      "loss": 0.0028,
-      "step": 3450
-    },
-    {
-      "epoch": 6.59,
-      "learning_rate": 1.5171428571428574e-06,
-      "loss": 0.0047,
-      "step": 3475
-    },
-    {
-      "epoch": 6.64,
-      "learning_rate": 1.4457142857142858e-06,
-      "loss": 0.0041,
-      "step": 3500
-    },
-    {
-      "epoch": 6.69,
-      "learning_rate": 1.3742857142857143e-06,
-      "loss": 0.0015,
-      "step": 3525
-    },
-    {
-      "epoch": 6.74,
-      "learning_rate": 1.302857142857143e-06,
-      "loss": 0.002,
-      "step": 3550
-    },
-    {
-      "epoch": 6.78,
-      "learning_rate": 1.2314285714285715e-06,
-      "loss": 0.007,
-      "step": 3575
-    },
-    {
-      "epoch": 6.83,
-      "learning_rate": 1.1600000000000001e-06,
-      "loss": 0.0023,
-      "step": 3600
-    },
-    {
-      "epoch": 6.88,
-      "learning_rate": 1.0885714285714287e-06,
-      "loss": 0.0023,
-      "step": 3625
-    },
-    {
-      "epoch": 6.93,
-      "learning_rate": 1.0171428571428573e-06,
-      "loss": 0.0022,
-      "step": 3650
-    },
-    {
-      "epoch": 6.97,
-      "learning_rate": 9.457142857142858e-07,
-      "loss": 0.0034,
-      "step": 3675
-    },
-    {
-      "epoch": 7.02,
-      "learning_rate": 8.742857142857144e-07,
-      "loss": 0.0057,
-      "step": 3700
-    },
-    {
-      "epoch": 7.07,
-      "learning_rate": 8.028571428571429e-07,
-      "loss": 0.0009,
-      "step": 3725
-    },
-    {
-      "epoch": 7.12,
-      "learning_rate": 7.314285714285715e-07,
-      "loss": 0.003,
-      "step": 3750
-    },
-    {
-      "epoch": 7.16,
-      "learning_rate": 6.6e-07,
-      "loss": 0.0037,
-      "step": 3775
-    },
-    {
-      "epoch": 7.21,
-      "learning_rate": 5.885714285714286e-07,
-      "loss": 0.0007,
-      "step": 3800
-    },
-    {
-      "epoch": 7.26,
-      "learning_rate": 5.171428571428572e-07,
-      "loss": 0.0009,
-      "step": 3825
-    },
-    {
-      "epoch": 7.31,
-      "learning_rate": 4.457142857142858e-07,
-      "loss": 0.0008,
-      "step": 3850
-    },
-    {
-      "epoch": 7.35,
-      "learning_rate": 3.7428571428571434e-07,
-      "loss": 0.0019,
-      "step": 3875
-    },
-    {
-      "epoch": 7.4,
-      "learning_rate": 3.028571428571429e-07,
-      "loss": 0.001,
-      "step": 3900
-    },
-    {
-      "epoch": 7.45,
-      "learning_rate": 2.3142857142857144e-07,
-      "loss": 0.0011,
-      "step": 3925
-    },
-    {
-      "epoch": 7.5,
-      "learning_rate": 1.6e-07,
-      "loss": 0.0031,
-      "step": 3950
-    },
-    {
-      "epoch": 7.54,
-      "learning_rate": 8.857142857142858e-08,
-      "loss": 0.002,
-      "step": 3975
-    },
-    {
-      "epoch": 7.59,
-      "learning_rate": 1.7142857142857143e-08,
-      "loss": 0.002,
-      "step": 4000
-    },
-    {
-      "epoch": 7.59,
-      "eval_loss": 0.09421070665121078,
-      "eval_runtime": 575.1216,
-      "eval_samples_per_second": 3.257,
-      "eval_steps_per_second": 0.205,
-      "eval_wer": 100.0,
-      "step": 4000
     }
   ],
   "max_steps": 4000,
   "num_train_epochs": 8,
-  "total_flos": 1.3053740888162304e+20,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 100.0,
   "best_model_checkpoint": "./Malasar_ASR_DICtandLuke/checkpoint-1000",
+  "epoch": 5.692599620493358,
+  "global_step": 3000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.204,
       "eval_wer": 100.0,
       "step": 3000
     }
   ],
   "max_steps": 4000,
   "num_train_epochs": 8,
+  "total_flos": 9.79066287783936e+19,
   "trial_name": null,
   "trial_params": null
 }