Upload folder using huggingface_hub

by michaelsh - opened Jul 25, 2023

base: refs/heads/main

←

from: refs/pr/3

Discussion Files changed

+80

-32

Files changed (4) hide show

optimizer.pt +1 -1
pytorch_model.bin +1 -1
trainer_state.json +77 -29
training_args.bin +1 -1

optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4601382e37ca15b9060d170a50d1ce572d6e3ffde3be7fc76354d533f3101faa
 size 302183045

 version https://git-lfs.github.com/spec/v1
+oid sha256:ce7ec66048f0a6dbe35016acc67dbf341024e5dae5f14d6429219b36382cf6f5
 size 302183045

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2aceaf170565b15f68cf16576729c9d98a02f1b0bf1178bc349a1e8bcb501ba5
 size 151099049

 version https://git-lfs.github.com/spec/v1
+oid sha256:0099691db067fe152ea4f9295dfb3c6f98492b719fa87d0c05f8b9ab3e237107
 size 151099049

trainer_state.json CHANGED Viewed

@@ -9,28 +9,46 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_loss": 1.5109972953796387,
-      "eval_runtime": 39.8139,
-      "eval_samples_per_second": 2.688,
-      "eval_steps_per_second": 0.176,
       "eval_wer": 0.7574039067422811,
       "eval_wer_ortho": 0.8027704485488126,
       "step": 29
     },
     {
       "epoch": 2.0,
-      "eval_loss": 0.5695223808288574,
-      "eval_runtime": 34.2898,
-      "eval_samples_per_second": 3.12,
-      "eval_steps_per_second": 0.204,
       "eval_wer": 0.43163201008191554,
       "eval_wer_ortho": 0.4346965699208443,
       "step": 58
     },
     {
       "epoch": 3.0,
-      "eval_loss": 0.5170513987541199,
-      "eval_runtime": 33.1576,
       "eval_samples_per_second": 3.227,
       "eval_steps_per_second": 0.211,
       "eval_wer": 0.391304347826087,
@@ -39,39 +57,63 @@
     },
     {
       "epoch": 4.0,
-      "eval_loss": 0.5165203213691711,
-      "eval_runtime": 33.1994,
-      "eval_samples_per_second": 3.223,
-      "eval_steps_per_second": 0.211,
       "eval_wer": 0.3906742281033396,
       "eval_wer_ortho": 0.39116094986807387,
       "step": 116
     },
     {
       "epoch": 5.0,
-      "eval_loss": 0.5296039581298828,
-      "eval_runtime": 33.4623,
-      "eval_samples_per_second": 3.198,
-      "eval_steps_per_second": 0.209,
       "eval_wer": 0.38248267170762446,
       "eval_wer_ortho": 0.38192612137203164,
       "step": 145
     },
     {
       "epoch": 6.0,
-      "eval_loss": 0.5532421469688416,
-      "eval_runtime": 33.084,
-      "eval_samples_per_second": 3.234,
-      "eval_steps_per_second": 0.212,
       "eval_wer": 0.37366099558916194,
       "eval_wer_ortho": 0.37467018469656993,
       "step": 174
     },
     {
       "epoch": 7.0,
-      "eval_loss": 0.5614312887191772,
-      "eval_runtime": 33.2048,
-      "eval_samples_per_second": 3.222,
       "eval_steps_per_second": 0.211,
       "eval_wer": 0.38815374921235035,
       "eval_wer_ortho": 0.3865435356200528,
@@ -79,10 +121,16 @@
     },
     {
       "epoch": 8.0,
-      "eval_loss": 0.6009427309036255,
-      "eval_runtime": 34.1493,
-      "eval_samples_per_second": 3.133,
-      "eval_steps_per_second": 0.205,
       "eval_wer": 0.36546943919344677,
       "eval_wer_ortho": 0.3627968337730871,
       "step": 232

   "log_history": [
     {
       "epoch": 1.0,
+      "learning_rate": 1e-05,
+      "loss": 3.1128,
+      "step": 29
+    },
+    {
+      "epoch": 1.0,
+      "eval_loss": 1.5109970569610596,
+      "eval_runtime": 39.2215,
+      "eval_samples_per_second": 2.728,
+      "eval_steps_per_second": 0.178,
       "eval_wer": 0.7574039067422811,
       "eval_wer_ortho": 0.8027704485488126,
       "step": 29
     },
     {
       "epoch": 2.0,
+      "learning_rate": 1e-05,
+      "loss": 0.6583,
+      "step": 58
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 0.569522500038147,
+      "eval_runtime": 33.882,
+      "eval_samples_per_second": 3.158,
+      "eval_steps_per_second": 0.207,
       "eval_wer": 0.43163201008191554,
       "eval_wer_ortho": 0.4346965699208443,
       "step": 58
     },
     {
       "epoch": 3.0,
+      "learning_rate": 1e-05,
+      "loss": 0.3271,
+      "step": 87
+    },
+    {
+      "epoch": 3.0,
+      "eval_loss": 0.5170509219169617,
+      "eval_runtime": 33.1578,
       "eval_samples_per_second": 3.227,
       "eval_steps_per_second": 0.211,
       "eval_wer": 0.391304347826087,
     },
     {
       "epoch": 4.0,
+      "learning_rate": 1e-05,
+      "loss": 0.2003,
+      "step": 116
+    },
+    {
+      "epoch": 4.0,
+      "eval_loss": 0.5165189504623413,
+      "eval_runtime": 33.0788,
+      "eval_samples_per_second": 3.235,
+      "eval_steps_per_second": 0.212,
       "eval_wer": 0.3906742281033396,
       "eval_wer_ortho": 0.39116094986807387,
       "step": 116
     },
     {
       "epoch": 5.0,
+      "learning_rate": 1e-05,
+      "loss": 0.1189,
+      "step": 145
+    },
+    {
+      "epoch": 5.0,
+      "eval_loss": 0.5296050906181335,
+      "eval_runtime": 33.2182,
+      "eval_samples_per_second": 3.221,
+      "eval_steps_per_second": 0.211,
       "eval_wer": 0.38248267170762446,
       "eval_wer_ortho": 0.38192612137203164,
       "step": 145
     },
     {
       "epoch": 6.0,
+      "learning_rate": 1e-05,
+      "loss": 0.0623,
+      "step": 174
+    },
+    {
+      "epoch": 6.0,
+      "eval_loss": 0.553246021270752,
+      "eval_runtime": 33.3882,
+      "eval_samples_per_second": 3.205,
+      "eval_steps_per_second": 0.21,
       "eval_wer": 0.37366099558916194,
       "eval_wer_ortho": 0.37467018469656993,
       "step": 174
     },
     {
       "epoch": 7.0,
+      "learning_rate": 1e-05,
+      "loss": 0.0326,
+      "step": 203
+    },
+    {
+      "epoch": 7.0,
+      "eval_loss": 0.5614295601844788,
+      "eval_runtime": 33.1777,
+      "eval_samples_per_second": 3.225,
       "eval_steps_per_second": 0.211,
       "eval_wer": 0.38815374921235035,
       "eval_wer_ortho": 0.3865435356200528,
     },
     {
       "epoch": 8.0,
+      "learning_rate": 1e-05,
+      "loss": 0.0149,
+      "step": 232
+    },
+    {
+      "epoch": 8.0,
+      "eval_loss": 0.6009227633476257,
+      "eval_runtime": 33.313,
+      "eval_samples_per_second": 3.212,
+      "eval_steps_per_second": 0.21,
       "eval_wer": 0.36546943919344677,
       "eval_wer_ortho": 0.3627968337730871,
       "step": 232

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:081a84ed2977aff43516b2448a4decafc69047f8b0537bc45625f2b4d4d49ff5
 size 4155

 version https://git-lfs.github.com/spec/v1
+oid sha256:1bcaa651a0a8b268e2d17fe0d8d04a867832736edf6f51740cb2f6ba3a317d63
 size 4155