Upload 9 files

Browse files

Files changed (6) hide show

pytorch_model.bin +1 -1
rng_state.pth +3 -0
scaler.pt +3 -0
scheduler.pt +3 -0
trainer_state.json +244 -0
training_args.bin +1 -1

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:20d28f676369b64d5020b7369ba186b3f58a223547cb08976fa99c4a1785b0f9
 size 967102601

 version https://git-lfs.github.com/spec/v1
+oid sha256:6b96916efb04821b8f34e0eb2cb9b774612ddee6a64a2456a60010bf3c2267ff
 size 967102601

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dc7429d9d6abaf0f9a7f0884ac5f19724496065526eee29c4e31250843167a65
+size 14511

scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3d15232b452895e36dc91e0446f6e8ef9af073f8677f732bb005840a10ca7266
+size 557

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2478370688e920d6f6653d668ddacc94f12fd60a8da1b22d5ff9a3df70437e30
+size 627

trainer_state.json ADDED Viewed

	@@ -0,0 +1,244 @@

+{
+  "best_metric": 12.92352371732817,
+  "best_model_checkpoint": "./whisper-small-ja/checkpoint-800",
+  "epoch": 2.9962546816479403,
+  "global_step": 800,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.09,
+      "learning_rate": 2.1000000000000002e-06,
+      "loss": 0.7741,
+      "step": 25
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 4.600000000000001e-06,
+      "loss": 0.6088,
+      "step": 50
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 7.100000000000001e-06,
+      "loss": 0.642,
+      "step": 75
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 9.600000000000001e-06,
+      "loss": 0.4286,
+      "step": 100
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 9.7e-06,
+      "loss": 0.2252,
+      "step": 125
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 9.342857142857144e-06,
+      "loss": 0.1987,
+      "step": 150
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 8.985714285714287e-06,
+      "loss": 0.1903,
+      "step": 175
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 8.628571428571429e-06,
+      "loss": 0.1446,
+      "step": 200
+    },
+    {
+      "epoch": 0.75,
+      "eval_loss": 0.24177707731723785,
+      "eval_runtime": 349.354,
+      "eval_samples_per_second": 4.809,
+      "eval_steps_per_second": 0.601,
+      "eval_wer": 14.714424007744434,
+      "step": 200
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 8.271428571428572e-06,
+      "loss": 0.135,
+      "step": 225
+    },
+    {
+      "epoch": 0.94,
+      "learning_rate": 7.914285714285715e-06,
+      "loss": 0.1365,
+      "step": 250
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 7.557142857142857e-06,
+      "loss": 0.1029,
+      "step": 275
+    },
+    {
+      "epoch": 1.12,
+      "learning_rate": 7.2000000000000005e-06,
+      "loss": 0.0364,
+      "step": 300
+    },
+    {
+      "epoch": 1.22,
+      "learning_rate": 6.842857142857143e-06,
+      "loss": 0.0495,
+      "step": 325
+    },
+    {
+      "epoch": 1.31,
+      "learning_rate": 6.485714285714286e-06,
+      "loss": 0.0403,
+      "step": 350
+    },
+    {
+      "epoch": 1.4,
+      "learning_rate": 6.128571428571429e-06,
+      "loss": 0.0384,
+      "step": 375
+    },
+    {
+      "epoch": 1.5,
+      "learning_rate": 5.771428571428572e-06,
+      "loss": 0.0402,
+      "step": 400
+    },
+    {
+      "epoch": 1.5,
+      "eval_loss": 0.21568405628204346,
+      "eval_runtime": 367.8332,
+      "eval_samples_per_second": 4.567,
+      "eval_steps_per_second": 0.571,
+      "eval_wer": 13.220854653574888,
+      "step": 400
+    },
+    {
+      "epoch": 1.59,
+      "learning_rate": 5.414285714285715e-06,
+      "loss": 0.0418,
+      "step": 425
+    },
+    {
+      "epoch": 1.69,
+      "learning_rate": 5.057142857142857e-06,
+      "loss": 0.0365,
+      "step": 450
+    },
+    {
+      "epoch": 1.78,
+      "learning_rate": 4.7e-06,
+      "loss": 0.0357,
+      "step": 475
+    },
+    {
+      "epoch": 1.87,
+      "learning_rate": 4.342857142857143e-06,
+      "loss": 0.0419,
+      "step": 500
+    },
+    {
+      "epoch": 1.97,
+      "learning_rate": 3.985714285714286e-06,
+      "loss": 0.0349,
+      "step": 525
+    },
+    {
+      "epoch": 2.06,
+      "learning_rate": 3.628571428571429e-06,
+      "loss": 0.0221,
+      "step": 550
+    },
+    {
+      "epoch": 2.15,
+      "learning_rate": 3.2714285714285717e-06,
+      "loss": 0.0088,
+      "step": 575
+    },
+    {
+      "epoch": 2.25,
+      "learning_rate": 2.9142857142857146e-06,
+      "loss": 0.0086,
+      "step": 600
+    },
+    {
+      "epoch": 2.25,
+      "eval_loss": 0.2222386747598648,
+      "eval_runtime": 351.4131,
+      "eval_samples_per_second": 4.781,
+      "eval_steps_per_second": 0.598,
+      "eval_wer": 13.075646521919513,
+      "step": 600
+    },
+    {
+      "epoch": 2.34,
+      "learning_rate": 2.5571428571428576e-06,
+      "loss": 0.01,
+      "step": 625
+    },
+    {
+      "epoch": 2.43,
+      "learning_rate": 2.2e-06,
+      "loss": 0.0094,
+      "step": 650
+    },
+    {
+      "epoch": 2.53,
+      "learning_rate": 1.8428571428571428e-06,
+      "loss": 0.009,
+      "step": 675
+    },
+    {
+      "epoch": 2.62,
+      "learning_rate": 1.4857142857142858e-06,
+      "loss": 0.0073,
+      "step": 700
+    },
+    {
+      "epoch": 2.72,
+      "learning_rate": 1.1285714285714285e-06,
+      "loss": 0.0092,
+      "step": 725
+    },
+    {
+      "epoch": 2.81,
+      "learning_rate": 7.714285714285715e-07,
+      "loss": 0.0083,
+      "step": 750
+    },
+    {
+      "epoch": 2.9,
+      "learning_rate": 4.142857142857143e-07,
+      "loss": 0.007,
+      "step": 775
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 5.714285714285715e-08,
+      "loss": 0.0083,
+      "step": 800
+    },
+    {
+      "epoch": 3.0,
+      "eval_loss": 0.2183152139186859,
+      "eval_runtime": 351.6231,
+      "eval_samples_per_second": 4.778,
+      "eval_steps_per_second": 0.597,
+      "eval_wer": 12.92352371732817,
+      "step": 800
+    }
+  ],
+  "max_steps": 800,
+  "num_train_epochs": 3,
+  "total_flos": 3.69273878249472e+18,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2620822bf2eccfcf0ff6dd4652009f6dc2d9bc4af7a69f9416ed9b0bbd2285db
 size 3643

 version https://git-lfs.github.com/spec/v1
+oid sha256:40aa8cde2009b6c026271957e82c37ba5779c3880ced0c387121acb310ffded0
 size 3643