Check commited on Aug 28, 2021

Commit

7d068f9

1 Parent(s): 2808233

"auto-commit"

Browse files

Files changed (23) hide show

model-bin/finetune/base/{checkpoint-117722 → checkpoint-118592}/config.json +0 -0
model-bin/finetune/base/{checkpoint-117722 → checkpoint-118592}/optimizer.pt +1 -1
model-bin/finetune/base/{checkpoint-117722 → checkpoint-118592}/preprocessor_config.json +0 -0
model-bin/finetune/base/{checkpoint-117722 → checkpoint-118592}/pytorch_model.bin +1 -1
model-bin/finetune/base/{checkpoint-117722 → checkpoint-118592}/rng_state.pth +2 -2
model-bin/finetune/base/{checkpoint-117722 → checkpoint-118592}/scaler.pt +1 -1
model-bin/finetune/base/{checkpoint-117722 → checkpoint-118592}/scheduler.pt +1 -1
model-bin/finetune/base/{checkpoint-117722 → checkpoint-118592}/trainer_state.json +1111 -4
model-bin/finetune/base/{checkpoint-117722 → checkpoint-118592}/training_args.bin +0 -0
model-bin/finetune/base/log/1630120105.1763353/events.out.tfevents.1630120105.86bb0ddabf9b.1042.61 +3 -0
model-bin/finetune/base/log/1630120512.9155197/events.out.tfevents.1630120512.86bb0ddabf9b.1042.63 +3 -0
model-bin/finetune/base/log/1630122518.2177079/events.out.tfevents.1630122518.86bb0ddabf9b.4092.1 +3 -0
model-bin/finetune/base/log/1630122917.3648393/events.out.tfevents.1630122917.86bb0ddabf9b.4092.3 +3 -0
model-bin/finetune/base/log/1630123316.325624/events.out.tfevents.1630123316.86bb0ddabf9b.4092.5 +3 -0
model-bin/finetune/base/log/1630123712.2616467/events.out.tfevents.1630123712.86bb0ddabf9b.4092.7 +3 -0
model-bin/finetune/base/log/1630124107.8066275/events.out.tfevents.1630124107.86bb0ddabf9b.4092.9 +3 -0
model-bin/finetune/base/log/events.out.tfevents.1630120105.86bb0ddabf9b.1042.60 +3 -0
model-bin/finetune/base/log/events.out.tfevents.1630120512.86bb0ddabf9b.1042.62 +3 -0
model-bin/finetune/base/log/events.out.tfevents.1630122518.86bb0ddabf9b.4092.0 +3 -0
model-bin/finetune/base/log/events.out.tfevents.1630122917.86bb0ddabf9b.4092.2 +3 -0
model-bin/finetune/base/log/events.out.tfevents.1630123316.86bb0ddabf9b.4092.4 +3 -0
model-bin/finetune/base/log/events.out.tfevents.1630123712.86bb0ddabf9b.4092.6 +3 -0
model-bin/finetune/base/log/events.out.tfevents.1630124107.86bb0ddabf9b.4092.8 +3 -0

model-bin/finetune/base/{checkpoint-117722 → checkpoint-118592}/config.json RENAMED Viewed

File without changes

model-bin/finetune/base/{checkpoint-117722 → checkpoint-118592}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2f8f9d9e29f9c4357eccefce34b1788641cbf79fdb30f31166c13d2a3991cec7
 size 722165393

 version https://git-lfs.github.com/spec/v1
+oid sha256:824bdd08c7df579935f156e28209c69d29ed3abb148c9e232ef084a81064b9f6
 size 722165393

model-bin/finetune/base/{checkpoint-117722 → checkpoint-118592}/preprocessor_config.json RENAMED Viewed

File without changes

model-bin/finetune/base/{checkpoint-117722 → checkpoint-118592}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8d6fd2acf7aa2ca9a155077ce484b63264f0447cd4f800916e207dcb087cf3dc
 size 377909911

 version https://git-lfs.github.com/spec/v1
+oid sha256:4aaa5ecf7855c883590283b7ea54bd9eae633f0bbdccd988047d5691c3d47d2d
 size 377909911

model-bin/finetune/base/{checkpoint-117722 → checkpoint-118592}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3883b24ab055ced9e5920bf2f787c0bf5fe045f5bc46d3e0a656d2fb11a7e73e
-size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:86357397e153f05f9f45bd29caf9103edf34eadb7eb5627658dcefb2f331a9ca
+size 14567

model-bin/finetune/base/{checkpoint-117722 → checkpoint-118592}/scaler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:85667687b163c74870e550a93ae8876dd8fc5752af02aeaab176e91efede68c0
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:33dab386f477ad09c561d8867f5af2329e81990e9d6cd66bae89bce2f60ded3e
 size 559

model-bin/finetune/base/{checkpoint-117722 → checkpoint-118592}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ee5116ffc5a6492b87e5b79cfa6a431988c523d33002a0376caef480f1a04f73
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:bc05e9bcb031fbc882d03868ce2a3c5093e01bdd14c38bd6f2151f7329b735e5
 size 623

model-bin/finetune/base/{checkpoint-117722 → checkpoint-118592}/trainer_state.json RENAMED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.1743826049391605,
   "best_model_checkpoint": "./model-bin/finetune/base/checkpoint-101551",
-  "epoch": 941.0,
-  "global_step": 117722,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -249144,11 +249144,1118 @@
       "eval_steps_per_second": 0.701,
       "eval_wer": 0.18467364669191358,
       "step": 117722
     }
   ],
-  "max_steps": 625000,
   "num_train_epochs": 5000,
-  "total_flos": 3.313008475394062e+20,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.1743826049391605,
   "best_model_checkpoint": "./model-bin/finetune/base/checkpoint-101551",
+  "epoch": 956.0,
+  "global_step": 118592,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.701,
       "eval_wer": 0.18467364669191358,
       "step": 117722
+    },
+    {
+      "epoch": 941.02,
+      "learning_rate": 8.130160256410257e-06,
+      "loss": 0.3663,
+      "step": 117725
+    },
+    {
+      "epoch": 941.06,
+      "learning_rate": 8.130080128205129e-06,
+      "loss": 0.282,
+      "step": 117730
+    },
+    {
+      "epoch": 941.1,
+      "learning_rate": 8.13e-06,
+      "loss": 0.312,
+      "step": 117735
+    },
+    {
+      "epoch": 941.14,
+      "learning_rate": 8.129919871794873e-06,
+      "loss": 0.3393,
+      "step": 117740
+    },
+    {
+      "epoch": 941.18,
+      "learning_rate": 8.129839743589744e-06,
+      "loss": 0.7809,
+      "step": 117745
+    },
+    {
+      "epoch": 941.22,
+      "learning_rate": 8.129759615384616e-06,
+      "loss": 0.8867,
+      "step": 117750
+    },
+    {
+      "epoch": 941.26,
+      "learning_rate": 8.129679487179489e-06,
+      "loss": 0.2999,
+      "step": 117755
+    },
+    {
+      "epoch": 941.3,
+      "learning_rate": 8.129599358974359e-06,
+      "loss": 0.2899,
+      "step": 117760
+    },
+    {
+      "epoch": 941.34,
+      "learning_rate": 8.129519230769232e-06,
+      "loss": 0.3377,
+      "step": 117765
+    },
+    {
+      "epoch": 941.38,
+      "learning_rate": 8.129439102564103e-06,
+      "loss": 0.8005,
+      "step": 117770
+    },
+    {
+      "epoch": 941.42,
+      "learning_rate": 8.129358974358974e-06,
+      "loss": 0.8139,
+      "step": 117775
+    },
+    {
+      "epoch": 941.46,
+      "learning_rate": 8.129278846153846e-06,
+      "loss": 0.2583,
+      "step": 117780
+    },
+    {
+      "epoch": 941.5,
+      "learning_rate": 8.129198717948719e-06,
+      "loss": 0.2831,
+      "step": 117785
+    },
+    {
+      "epoch": 941.54,
+      "learning_rate": 8.12911858974359e-06,
+      "loss": 0.3552,
+      "step": 117790
+    },
+    {
+      "epoch": 941.58,
+      "learning_rate": 8.129038461538461e-06,
+      "loss": 0.7863,
+      "step": 117795
+    },
+    {
+      "epoch": 941.62,
+      "learning_rate": 8.128958333333335e-06,
+      "loss": 0.8211,
+      "step": 117800
+    },
+    {
+      "epoch": 941.66,
+      "learning_rate": 8.128878205128206e-06,
+      "loss": 0.3191,
+      "step": 117805
+    },
+    {
+      "epoch": 941.7,
+      "learning_rate": 8.128798076923077e-06,
+      "loss": 0.3874,
+      "step": 117810
+    },
+    {
+      "epoch": 941.74,
+      "learning_rate": 8.128717948717949e-06,
+      "loss": 0.418,
+      "step": 117815
+    },
+    {
+      "epoch": 941.78,
+      "learning_rate": 8.128637820512822e-06,
+      "loss": 0.8736,
+      "step": 117820
+    },
+    {
+      "epoch": 941.82,
+      "learning_rate": 8.128557692307693e-06,
+      "loss": 0.9431,
+      "step": 117825
+    },
+    {
+      "epoch": 941.86,
+      "learning_rate": 8.128477564102564e-06,
+      "loss": 0.2709,
+      "step": 117830
+    },
+    {
+      "epoch": 941.9,
+      "learning_rate": 8.128397435897436e-06,
+      "loss": 0.2832,
+      "step": 117835
+    },
+    {
+      "epoch": 941.94,
+      "learning_rate": 8.128317307692309e-06,
+      "loss": 0.3677,
+      "step": 117840
+    },
+    {
+      "epoch": 941.98,
+      "learning_rate": 8.12823717948718e-06,
+      "loss": 0.8872,
+      "step": 117845
+    },
+    {
+      "epoch": 942.0,
+      "eval_loss": 0.32367920875549316,
+      "eval_runtime": 39.3812,
+      "eval_samples_per_second": 21.305,
+      "eval_steps_per_second": 0.686,
+      "eval_wer": 0.1751803751803752,
+      "step": 117847
+    },
+    {
+      "epoch": 950.02,
+      "learning_rate": 8.128157051282051e-06,
+      "loss": 0.3156,
+      "step": 117850
+    },
+    {
+      "epoch": 950.06,
+      "learning_rate": 8.128076923076925e-06,
+      "loss": 0.2643,
+      "step": 117855
+    },
+    {
+      "epoch": 950.1,
+      "learning_rate": 8.127996794871796e-06,
+      "loss": 0.2823,
+      "step": 117860
+    },
+    {
+      "epoch": 950.15,
+      "learning_rate": 8.127916666666667e-06,
+      "loss": 0.3811,
+      "step": 117865
+    },
+    {
+      "epoch": 950.19,
+      "learning_rate": 8.127836538461539e-06,
+      "loss": 0.7131,
+      "step": 117870
+    },
+    {
+      "epoch": 950.23,
+      "learning_rate": 8.127756410256412e-06,
+      "loss": 0.9671,
+      "step": 117875
+    },
+    {
+      "epoch": 950.27,
+      "learning_rate": 8.127676282051283e-06,
+      "loss": 0.2583,
+      "step": 117880
+    },
+    {
+      "epoch": 950.31,
+      "learning_rate": 8.127596153846154e-06,
+      "loss": 0.2812,
+      "step": 117885
+    },
+    {
+      "epoch": 950.35,
+      "learning_rate": 8.127516025641027e-06,
+      "loss": 0.3449,
+      "step": 117890
+    },
+    {
+      "epoch": 950.39,
+      "learning_rate": 8.127435897435899e-06,
+      "loss": 0.7129,
+      "step": 117895
+    },
+    {
+      "epoch": 950.43,
+      "learning_rate": 8.12735576923077e-06,
+      "loss": 0.8821,
+      "step": 117900
+    },
+    {
+      "epoch": 950.47,
+      "learning_rate": 8.127275641025642e-06,
+      "loss": 0.2769,
+      "step": 117905
+    },
+    {
+      "epoch": 950.51,
+      "learning_rate": 8.127195512820515e-06,
+      "loss": 0.3113,
+      "step": 117910
+    },
+    {
+      "epoch": 950.55,
+      "learning_rate": 8.127115384615384e-06,
+      "loss": 0.3599,
+      "step": 117915
+    },
+    {
+      "epoch": 950.59,
+      "learning_rate": 8.127035256410257e-06,
+      "loss": 0.6893,
+      "step": 117920
+    },
+    {
+      "epoch": 950.63,
+      "learning_rate": 8.126955128205129e-06,
+      "loss": 0.8505,
+      "step": 117925
+    },
+    {
+      "epoch": 950.67,
+      "learning_rate": 8.126875e-06,
+      "loss": 0.2853,
+      "step": 117930
+    },
+    {
+      "epoch": 950.71,
+      "learning_rate": 8.126794871794871e-06,
+      "loss": 0.31,
+      "step": 117935
+    },
+    {
+      "epoch": 950.75,
+      "learning_rate": 8.126714743589744e-06,
+      "loss": 0.3777,
+      "step": 117940
+    },
+    {
+      "epoch": 950.79,
+      "learning_rate": 8.126634615384616e-06,
+      "loss": 0.7106,
+      "step": 117945
+    },
+    {
+      "epoch": 950.83,
+      "learning_rate": 8.126554487179487e-06,
+      "loss": 0.7565,
+      "step": 117950
+    },
+    {
+      "epoch": 950.87,
+      "learning_rate": 8.12647435897436e-06,
+      "loss": 0.3012,
+      "step": 117955
+    },
+    {
+      "epoch": 950.91,
+      "learning_rate": 8.126394230769232e-06,
+      "loss": 0.2882,
+      "step": 117960
+    },
+    {
+      "epoch": 950.95,
+      "learning_rate": 8.126314102564103e-06,
+      "loss": 0.4194,
+      "step": 117965
+    },
+    {
+      "epoch": 950.99,
+      "learning_rate": 8.126233974358974e-06,
+      "loss": 1.0347,
+      "step": 117970
+    },
+    {
+      "epoch": 951.0,
+      "eval_loss": 0.3759602904319763,
+      "eval_runtime": 38.3896,
+      "eval_samples_per_second": 21.855,
+      "eval_steps_per_second": 0.703,
+      "eval_wer": 0.17543605703119347,
+      "step": 117971
+    },
+    {
+      "epoch": 943.03,
+      "learning_rate": 8.126153846153847e-06,
+      "loss": 0.3532,
+      "step": 117975
+    },
+    {
+      "epoch": 943.07,
+      "learning_rate": 8.126073717948719e-06,
+      "loss": 0.2588,
+      "step": 117980
+    },
+    {
+      "epoch": 943.11,
+      "learning_rate": 8.12599358974359e-06,
+      "loss": 0.3235,
+      "step": 117985
+    },
+    {
+      "epoch": 943.15,
+      "learning_rate": 8.125913461538463e-06,
+      "loss": 0.4366,
+      "step": 117990
+    },
+    {
+      "epoch": 943.19,
+      "learning_rate": 8.125833333333334e-06,
+      "loss": 0.8924,
+      "step": 117995
+    },
+    {
+      "epoch": 943.23,
+      "learning_rate": 8.125753205128206e-06,
+      "loss": 0.6004,
+      "step": 118000
+    },
+    {
+      "epoch": 943.27,
+      "learning_rate": 8.125673076923077e-06,
+      "loss": 0.2538,
+      "step": 118005
+    },
+    {
+      "epoch": 943.31,
+      "learning_rate": 8.12559294871795e-06,
+      "loss": 0.3154,
+      "step": 118010
+    },
+    {
+      "epoch": 943.35,
+      "learning_rate": 8.125512820512822e-06,
+      "loss": 0.358,
+      "step": 118015
+    },
+    {
+      "epoch": 943.39,
+      "learning_rate": 8.125432692307693e-06,
+      "loss": 0.9675,
+      "step": 118020
+    },
+    {
+      "epoch": 943.43,
+      "learning_rate": 8.125352564102564e-06,
+      "loss": 0.676,
+      "step": 118025
+    },
+    {
+      "epoch": 943.47,
+      "learning_rate": 8.125272435897437e-06,
+      "loss": 0.2939,
+      "step": 118030
+    },
+    {
+      "epoch": 943.51,
+      "learning_rate": 8.125192307692307e-06,
+      "loss": 0.3516,
+      "step": 118035
+    },
+    {
+      "epoch": 943.55,
+      "learning_rate": 8.12511217948718e-06,
+      "loss": 0.3801,
+      "step": 118040
+    },
+    {
+      "epoch": 943.59,
+      "learning_rate": 8.125032051282053e-06,
+      "loss": 0.8063,
+      "step": 118045
+    },
+    {
+      "epoch": 943.63,
+      "learning_rate": 8.124951923076923e-06,
+      "loss": 0.8844,
+      "step": 118050
+    },
+    {
+      "epoch": 943.67,
+      "learning_rate": 8.124871794871796e-06,
+      "loss": 0.3227,
+      "step": 118055
+    },
+    {
+      "epoch": 943.71,
+      "learning_rate": 8.124791666666667e-06,
+      "loss": 0.3623,
+      "step": 118060
+    },
+    {
+      "epoch": 943.75,
+      "learning_rate": 8.124711538461539e-06,
+      "loss": 0.3823,
+      "step": 118065
+    },
+    {
+      "epoch": 943.79,
+      "learning_rate": 8.12463141025641e-06,
+      "loss": 1.0083,
+      "step": 118070
+    },
+    {
+      "epoch": 943.83,
+      "learning_rate": 8.124551282051283e-06,
+      "loss": 0.5787,
+      "step": 118075
+    },
+    {
+      "epoch": 943.87,
+      "learning_rate": 8.124471153846154e-06,
+      "loss": 0.3008,
+      "step": 118080
+    },
+    {
+      "epoch": 943.91,
+      "learning_rate": 8.124391025641026e-06,
+      "loss": 0.3161,
+      "step": 118085
+    },
+    {
+      "epoch": 943.95,
+      "learning_rate": 8.124310897435899e-06,
+      "loss": 0.3868,
+      "step": 118090
+    },
+    {
+      "epoch": 943.99,
+      "learning_rate": 8.12423076923077e-06,
+      "loss": 0.8324,
+      "step": 118095
+    },
+    {
+      "epoch": 944.0,
+      "eval_loss": 0.47608083486557007,
+      "eval_runtime": 36.6003,
+      "eval_samples_per_second": 22.923,
+      "eval_steps_per_second": 0.738,
+      "eval_wer": 0.1929916710437458,
+      "step": 118096
+    },
+    {
+      "epoch": 952.03,
+      "learning_rate": 8.124150641025641e-06,
+      "loss": 0.3001,
+      "step": 118100
+    },
+    {
+      "epoch": 952.07,
+      "learning_rate": 8.124070512820513e-06,
+      "loss": 0.2851,
+      "step": 118105
+    },
+    {
+      "epoch": 952.11,
+      "learning_rate": 8.123990384615386e-06,
+      "loss": 0.2918,
+      "step": 118110
+    },
+    {
+      "epoch": 952.15,
+      "learning_rate": 8.123910256410257e-06,
+      "loss": 0.3754,
+      "step": 118115
+    },
+    {
+      "epoch": 952.19,
+      "learning_rate": 8.123830128205129e-06,
+      "loss": 0.8105,
+      "step": 118120
+    },
+    {
+      "epoch": 952.23,
+      "learning_rate": 8.12375e-06,
+      "loss": 0.6714,
+      "step": 118125
+    },
+    {
+      "epoch": 952.27,
+      "learning_rate": 8.123669871794873e-06,
+      "loss": 0.3082,
+      "step": 118130
+    },
+    {
+      "epoch": 952.31,
+      "learning_rate": 8.123589743589744e-06,
+      "loss": 0.3015,
+      "step": 118135
+    },
+    {
+      "epoch": 952.35,
+      "learning_rate": 8.123509615384616e-06,
+      "loss": 0.4073,
+      "step": 118140
+    },
+    {
+      "epoch": 952.39,
+      "learning_rate": 8.123429487179489e-06,
+      "loss": 1.0138,
+      "step": 118145
+    },
+    {
+      "epoch": 952.43,
+      "learning_rate": 8.12334935897436e-06,
+      "loss": 0.6503,
+      "step": 118150
+    },
+    {
+      "epoch": 952.47,
+      "learning_rate": 8.123269230769231e-06,
+      "loss": 0.283,
+      "step": 118155
+    },
+    {
+      "epoch": 952.51,
+      "learning_rate": 8.123189102564103e-06,
+      "loss": 0.2965,
+      "step": 118160
+    },
+    {
+      "epoch": 952.55,
+      "learning_rate": 8.123108974358976e-06,
+      "loss": 0.4055,
+      "step": 118165
+    },
+    {
+      "epoch": 952.59,
+      "learning_rate": 8.123028846153847e-06,
+      "loss": 0.856,
+      "step": 118170
+    },
+    {
+      "epoch": 952.63,
+      "learning_rate": 8.122948717948719e-06,
+      "loss": 0.6568,
+      "step": 118175
+    },
+    {
+      "epoch": 952.67,
+      "learning_rate": 8.12286858974359e-06,
+      "loss": 0.3454,
+      "step": 118180
+    },
+    {
+      "epoch": 952.71,
+      "learning_rate": 8.122788461538463e-06,
+      "loss": 0.3327,
+      "step": 118185
+    },
+    {
+      "epoch": 952.76,
+      "learning_rate": 8.122708333333334e-06,
+      "loss": 0.3899,
+      "step": 118190
+    },
+    {
+      "epoch": 952.8,
+      "learning_rate": 8.122628205128206e-06,
+      "loss": 0.9436,
+      "step": 118195
+    },
+    {
+      "epoch": 952.84,
+      "learning_rate": 8.122548076923079e-06,
+      "loss": 0.5313,
+      "step": 118200
+    },
+    {
+      "epoch": 952.88,
+      "learning_rate": 8.122467948717948e-06,
+      "loss": 0.2523,
+      "step": 118205
+    },
+    {
+      "epoch": 952.92,
+      "learning_rate": 8.122387820512822e-06,
+      "loss": 0.3375,
+      "step": 118210
+    },
+    {
+      "epoch": 952.96,
+      "learning_rate": 8.122307692307693e-06,
+      "loss": 0.4248,
+      "step": 118215
+    },
+    {
+      "epoch": 953.0,
+      "learning_rate": 8.122227564102564e-06,
+      "loss": 0.9152,
+      "step": 118220
+    },
+    {
+      "epoch": 953.0,
+      "eval_loss": 0.3905293643474579,
+      "eval_runtime": 36.1162,
+      "eval_samples_per_second": 23.258,
+      "eval_steps_per_second": 0.748,
+      "eval_wer": 0.18685816341717518,
+      "step": 118220
+    },
+    {
+      "epoch": 953.04,
+      "learning_rate": 8.122147435897436e-06,
+      "loss": 0.3212,
+      "step": 118225
+    },
+    {
+      "epoch": 953.08,
+      "learning_rate": 8.122067307692309e-06,
+      "loss": 0.3003,
+      "step": 118230
+    },
+    {
+      "epoch": 953.12,
+      "learning_rate": 8.12198717948718e-06,
+      "loss": 0.3147,
+      "step": 118235
+    },
+    {
+      "epoch": 953.16,
+      "learning_rate": 8.121907051282051e-06,
+      "loss": 0.4301,
+      "step": 118240
+    },
+    {
+      "epoch": 953.2,
+      "learning_rate": 8.121826923076924e-06,
+      "loss": 1.0591,
+      "step": 118245
+    },
+    {
+      "epoch": 953.24,
+      "learning_rate": 8.121746794871796e-06,
+      "loss": 0.3709,
+      "step": 118250
+    },
+    {
+      "epoch": 953.28,
+      "learning_rate": 8.121666666666667e-06,
+      "loss": 0.3037,
+      "step": 118255
+    },
+    {
+      "epoch": 953.32,
+      "learning_rate": 8.121586538461538e-06,
+      "loss": 0.3362,
+      "step": 118260
+    },
+    {
+      "epoch": 953.36,
+      "learning_rate": 8.121506410256412e-06,
+      "loss": 0.5091,
+      "step": 118265
+    },
+    {
+      "epoch": 953.4,
+      "learning_rate": 8.121426282051283e-06,
+      "loss": 1.252,
+      "step": 118270
+    },
+    {
+      "epoch": 953.44,
+      "learning_rate": 8.121346153846154e-06,
+      "loss": 0.3504,
+      "step": 118275
+    },
+    {
+      "epoch": 953.48,
+      "learning_rate": 8.121266025641026e-06,
+      "loss": 0.2573,
+      "step": 118280
+    },
+    {
+      "epoch": 953.52,
+      "learning_rate": 8.121185897435899e-06,
+      "loss": 0.3457,
+      "step": 118285
+    },
+    {
+      "epoch": 953.56,
+      "learning_rate": 8.12110576923077e-06,
+      "loss": 0.5181,
+      "step": 118290
+    },
+    {
+      "epoch": 953.6,
+      "learning_rate": 8.121025641025641e-06,
+      "loss": 1.2063,
+      "step": 118295
+    },
+    {
+      "epoch": 953.64,
+      "learning_rate": 8.120945512820514e-06,
+      "loss": 0.2867,
+      "step": 118300
+    },
+    {
+      "epoch": 953.68,
+      "learning_rate": 8.120865384615386e-06,
+      "loss": 0.3127,
+      "step": 118305
+    },
+    {
+      "epoch": 953.72,
+      "learning_rate": 8.120785256410257e-06,
+      "loss": 0.3992,
+      "step": 118310
+    },
+    {
+      "epoch": 953.76,
+      "learning_rate": 8.120705128205129e-06,
+      "loss": 0.4856,
+      "step": 118315
+    },
+    {
+      "epoch": 953.8,
+      "learning_rate": 8.120625000000002e-06,
+      "loss": 1.1835,
+      "step": 118320
+    },
+    {
+      "epoch": 953.84,
+      "learning_rate": 8.120544871794871e-06,
+      "loss": 0.2638,
+      "step": 118325
+    },
+    {
+      "epoch": 953.88,
+      "learning_rate": 8.120464743589744e-06,
+      "loss": 0.2925,
+      "step": 118330
+    },
+    {
+      "epoch": 953.92,
+      "learning_rate": 8.120384615384616e-06,
+      "loss": 0.2602,
+      "step": 118335
+    },
+    {
+      "epoch": 953.96,
+      "learning_rate": 8.120304487179487e-06,
+      "loss": 0.4767,
+      "step": 118340
+    },
+    {
+      "epoch": 954.0,
+      "eval_loss": 0.5237769484519958,
+      "eval_runtime": 37.4896,
+      "eval_samples_per_second": 22.406,
+      "eval_steps_per_second": 0.72,
+      "eval_wer": 0.18330558169840006,
+      "step": 118344
+    },
+    {
+      "epoch": 954.01,
+      "learning_rate": 8.12022435897436e-06,
+      "loss": 0.3711,
+      "step": 118345
+    },
+    {
+      "epoch": 954.05,
+      "learning_rate": 8.120144230769231e-06,
+      "loss": 0.3008,
+      "step": 118350
+    },
+    {
+      "epoch": 954.09,
+      "learning_rate": 8.120064102564103e-06,
+      "loss": 0.2683,
+      "step": 118355
+    },
+    {
+      "epoch": 954.13,
+      "learning_rate": 8.119983974358974e-06,
+      "loss": 0.2991,
+      "step": 118360
+    },
+    {
+      "epoch": 954.17,
+      "learning_rate": 8.119903846153847e-06,
+      "loss": 0.4376,
+      "step": 118365
+    },
+    {
+      "epoch": 954.21,
+      "learning_rate": 8.119823717948719e-06,
+      "loss": 1.0462,
+      "step": 118370
+    },
+    {
+      "epoch": 954.25,
+      "learning_rate": 8.11974358974359e-06,
+      "loss": 0.2917,
+      "step": 118375
+    },
+    {
+      "epoch": 954.29,
+      "learning_rate": 8.119663461538461e-06,
+      "loss": 0.2586,
+      "step": 118380
+    },
+    {
+      "epoch": 954.33,
+      "learning_rate": 8.119583333333334e-06,
+      "loss": 0.32,
+      "step": 118385
+    },
+    {
+      "epoch": 954.37,
+      "learning_rate": 8.119503205128206e-06,
+      "loss": 0.5745,
+      "step": 118390
+    },
+    {
+      "epoch": 954.41,
+      "learning_rate": 8.119423076923077e-06,
+      "loss": 1.1579,
+      "step": 118395
+    },
+    {
+      "epoch": 954.45,
+      "learning_rate": 8.11934294871795e-06,
+      "loss": 0.2653,
+      "step": 118400
+    },
+    {
+      "epoch": 954.49,
+      "learning_rate": 8.119262820512821e-06,
+      "loss": 0.2799,
+      "step": 118405
+    },
+    {
+      "epoch": 954.53,
+      "learning_rate": 8.119182692307693e-06,
+      "loss": 0.317,
+      "step": 118410
+    },
+    {
+      "epoch": 954.57,
+      "learning_rate": 8.119102564102564e-06,
+      "loss": 0.524,
+      "step": 118415
+    },
+    {
+      "epoch": 954.61,
+      "learning_rate": 8.119022435897437e-06,
+      "loss": 1.0891,
+      "step": 118420
+    },
+    {
+      "epoch": 954.65,
+      "learning_rate": 8.118942307692309e-06,
+      "loss": 0.2812,
+      "step": 118425
+    },
+    {
+      "epoch": 954.69,
+      "learning_rate": 8.11886217948718e-06,
+      "loss": 0.3314,
+      "step": 118430
+    },
+    {
+      "epoch": 954.73,
+      "learning_rate": 8.118782051282051e-06,
+      "loss": 0.3237,
+      "step": 118435
+    },
+    {
+      "epoch": 954.77,
+      "learning_rate": 8.118701923076924e-06,
+      "loss": 0.6018,
+      "step": 118440
+    },
+    {
+      "epoch": 954.81,
+      "learning_rate": 8.118621794871796e-06,
+      "loss": 1.1353,
+      "step": 118445
+    },
+    {
+      "epoch": 954.85,
+      "learning_rate": 8.118541666666667e-06,
+      "loss": 0.2756,
+      "step": 118450
+    },
+    {
+      "epoch": 954.89,
+      "learning_rate": 8.11846153846154e-06,
+      "loss": 0.3134,
+      "step": 118455
+    },
+    {
+      "epoch": 954.93,
+      "learning_rate": 8.118381410256411e-06,
+      "loss": 0.2983,
+      "step": 118460
+    },
+    {
+      "epoch": 954.97,
+      "learning_rate": 8.118301282051283e-06,
+      "loss": 0.5291,
+      "step": 118465
+    },
+    {
+      "epoch": 955.0,
+      "eval_loss": 0.39194896817207336,
+      "eval_runtime": 36.8334,
+      "eval_samples_per_second": 22.805,
+      "eval_steps_per_second": 0.733,
+      "eval_wer": 0.17496909315686132,
+      "step": 118468
+    },
+    {
+      "epoch": 955.02,
+      "learning_rate": 8.118221153846154e-06,
+      "loss": 0.3078,
+      "step": 118470
+    },
+    {
+      "epoch": 955.06,
+      "learning_rate": 8.118141025641027e-06,
+      "loss": 0.3107,
+      "step": 118475
+    },
+    {
+      "epoch": 955.1,
+      "learning_rate": 8.118060897435897e-06,
+      "loss": 0.2864,
+      "step": 118480
+    },
+    {
+      "epoch": 955.14,
+      "learning_rate": 8.11798076923077e-06,
+      "loss": 0.3148,
+      "step": 118485
+    },
+    {
+      "epoch": 955.18,
+      "learning_rate": 8.117900641025643e-06,
+      "loss": 0.5148,
+      "step": 118490
+    },
+    {
+      "epoch": 955.22,
+      "learning_rate": 8.117820512820513e-06,
+      "loss": 0.8883,
+      "step": 118495
+    },
+    {
+      "epoch": 955.26,
+      "learning_rate": 8.117740384615386e-06,
+      "loss": 0.3215,
+      "step": 118500
+    },
+    {
+      "epoch": 955.3,
+      "learning_rate": 8.117660256410257e-06,
+      "loss": 0.2788,
+      "step": 118505
+    },
+    {
+      "epoch": 955.34,
+      "learning_rate": 8.117580128205128e-06,
+      "loss": 0.4172,
+      "step": 118510
+    },
+    {
+      "epoch": 955.38,
+      "learning_rate": 8.1175e-06,
+      "loss": 0.7161,
+      "step": 118515
+    },
+    {
+      "epoch": 955.42,
+      "learning_rate": 8.117419871794873e-06,
+      "loss": 1.0977,
+      "step": 118520
+    },
+    {
+      "epoch": 955.46,
+      "learning_rate": 8.117339743589744e-06,
+      "loss": 0.2489,
+      "step": 118525
+    },
+    {
+      "epoch": 955.5,
+      "learning_rate": 8.117259615384616e-06,
+      "loss": 0.2679,
+      "step": 118530
+    },
+    {
+      "epoch": 955.54,
+      "learning_rate": 8.117179487179487e-06,
+      "loss": 0.311,
+      "step": 118535
+    },
+    {
+      "epoch": 955.58,
+      "learning_rate": 8.11709935897436e-06,
+      "loss": 0.6199,
+      "step": 118540
+    },
+    {
+      "epoch": 955.62,
+      "learning_rate": 8.117019230769231e-06,
+      "loss": 1.0061,
+      "step": 118545
+    },
+    {
+      "epoch": 955.66,
+      "learning_rate": 8.116939102564103e-06,
+      "loss": 0.2723,
+      "step": 118550
+    },
+    {
+      "epoch": 955.7,
+      "learning_rate": 8.116858974358976e-06,
+      "loss": 0.3127,
+      "step": 118555
+    },
+    {
+      "epoch": 955.74,
+      "learning_rate": 8.116778846153847e-06,
+      "loss": 0.3329,
+      "step": 118560
+    },
+    {
+      "epoch": 955.78,
+      "learning_rate": 8.116698717948718e-06,
+      "loss": 0.6651,
+      "step": 118565
+    },
+    {
+      "epoch": 955.82,
+      "learning_rate": 8.11661858974359e-06,
+      "loss": 0.9592,
+      "step": 118570
+    },
+    {
+      "epoch": 955.86,
+      "learning_rate": 8.116538461538463e-06,
+      "loss": 0.3461,
+      "step": 118575
+    },
+    {
+      "epoch": 955.9,
+      "learning_rate": 8.116458333333334e-06,
+      "loss": 0.3026,
+      "step": 118580
+    },
+    {
+      "epoch": 955.94,
+      "learning_rate": 8.116378205128206e-06,
+      "loss": 0.3226,
+      "step": 118585
+    },
+    {
+      "epoch": 955.98,
+      "learning_rate": 8.116298076923079e-06,
+      "loss": 0.7119,
+      "step": 118590
+    },
+    {
+      "epoch": 956.0,
+      "eval_loss": 0.450756698846817,
+      "eval_runtime": 36.2725,
+      "eval_samples_per_second": 23.13,
+      "eval_steps_per_second": 0.744,
+      "eval_wer": 0.19291367167646845,
+      "step": 118592
     }
   ],
+  "max_steps": 620000,
   "num_train_epochs": 5000,
+  "total_flos": 3.337482219007906e+20,
   "trial_name": null,
   "trial_params": null
 }

model-bin/finetune/base/{checkpoint-117722 → checkpoint-118592}/training_args.bin RENAMED Viewed

File without changes

model-bin/finetune/base/log/1630120105.1763353/events.out.tfevents.1630120105.86bb0ddabf9b.1042.61 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1fd411888b605a4bce813c5a78a4aa71068cafffeb22509913b5b7e1b4008d09
+size 4194

model-bin/finetune/base/log/1630120512.9155197/events.out.tfevents.1630120512.86bb0ddabf9b.1042.63 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d42dc9fe90f56f7df13a3a3d032acddc5d00dbac73340c9ac699ba0f09707501
+size 4194

model-bin/finetune/base/log/1630122518.2177079/events.out.tfevents.1630122518.86bb0ddabf9b.4092.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6588e586958501de11ff0888ba2564d38e6d1733a041463d675164f2379ce878
+size 4194

model-bin/finetune/base/log/1630122917.3648393/events.out.tfevents.1630122917.86bb0ddabf9b.4092.3 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8403ff0f34403c9492ffc6d3f681dfc73a9b39812bf0269b7e04e2700de8b658
+size 4194

model-bin/finetune/base/log/1630123316.325624/events.out.tfevents.1630123316.86bb0ddabf9b.4092.5 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5bd80980e3f96a26ecb60c46c327402515f8e7be256c342189b987105729d217
+size 4194

model-bin/finetune/base/log/1630123712.2616467/events.out.tfevents.1630123712.86bb0ddabf9b.4092.7 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a0c6e6a4214dd36c6164af3529a289edf05223f9f1ecb89d7c006b4931c4ccea
+size 4194

model-bin/finetune/base/log/1630124107.8066275/events.out.tfevents.1630124107.86bb0ddabf9b.4092.9 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:466ee521d8c1ee5da1c2626835d25c15032cd2021e61e89ea92f4e81ea163c8e
+size 4194

model-bin/finetune/base/log/events.out.tfevents.1630120105.86bb0ddabf9b.1042.60 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2ac3a79215d1dbb0818235f26b5a4a7423c498e1eda10a620a47200579974ea7
+size 8622

model-bin/finetune/base/log/events.out.tfevents.1630120512.86bb0ddabf9b.1042.62 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5f179f8e97a3037a75d368e022645f69f8a027815c8ff6a57cacaf8918135d44
+size 8622

model-bin/finetune/base/log/events.out.tfevents.1630122518.86bb0ddabf9b.4092.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c5ebe7fe919e08c99e09e92f23f1a35efd76edd491d3531a76aaa88dcbf8a5a5
+size 8630

model-bin/finetune/base/log/events.out.tfevents.1630122917.86bb0ddabf9b.4092.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e7df4eaed912c7fdeaac75d6f5a4059e2d33f9879077b9d4f5b4c3e94fa22aaa
+size 8622

model-bin/finetune/base/log/events.out.tfevents.1630123316.86bb0ddabf9b.4092.4 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:68c8705b0f637ddc66a4231d385f6c0f252fd31ea76d254e961b4097ecab43a7
+size 8462

model-bin/finetune/base/log/events.out.tfevents.1630123712.86bb0ddabf9b.4092.6 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:473c4f96f82c1568c0b7f38b870f6e27f7cf39a1db2b97720035669fdce0ad81
+size 8622

model-bin/finetune/base/log/events.out.tfevents.1630124107.86bb0ddabf9b.4092.8 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f58b9291dc819badcbac31ec6c4430e209a9890f0468938fd443cb67aaae2474
+size 8622