Check commited on Aug 20, 2021

Commit

7c91348

1 Parent(s): b19ee7f

auto commit

Browse files

Files changed (28) hide show

main.py +1 -1
model-bin/finetune/base/checkpoint-8212/pytorch_model.bin +0 -3
model-bin/finetune/base/checkpoint-8212/rng_state.pth +0 -3
model-bin/finetune/base/checkpoint-8212/scaler.pt +0 -3
model-bin/finetune/base/checkpoint-8212/trainer_state.json +0 -0
model-bin/finetune/base/checkpoint-8336/config.json +0 -78
model-bin/finetune/base/checkpoint-8336/optimizer.pt +0 -3
model-bin/finetune/base/checkpoint-8336/preprocessor_config.json +0 -9
model-bin/finetune/base/checkpoint-8336/scheduler.pt +0 -3
model-bin/finetune/base/checkpoint-8336/trainer_state.json +0 -0
model-bin/finetune/base/checkpoint-8336/training_args.bin +0 -3
model-bin/finetune/base/checkpoint-8709/config.json +0 -78
model-bin/finetune/base/checkpoint-8709/optimizer.pt +0 -3
model-bin/finetune/base/checkpoint-8709/preprocessor_config.json +0 -9
model-bin/finetune/base/checkpoint-8709/pytorch_model.bin +0 -3
model-bin/finetune/base/checkpoint-8709/scheduler.pt +0 -3
model-bin/finetune/base/checkpoint-8709/training_args.bin +0 -3
model-bin/finetune/base/{checkpoint-8212 → checkpoint-8958}/config.json +0 -0
model-bin/finetune/base/{checkpoint-8212 → checkpoint-8958}/optimizer.pt +1 -1
model-bin/finetune/base/{checkpoint-8212 → checkpoint-8958}/preprocessor_config.json +0 -0
model-bin/finetune/base/{checkpoint-8336 → checkpoint-8958}/pytorch_model.bin +1 -1
model-bin/finetune/base/{checkpoint-8709 → checkpoint-8958}/rng_state.pth +2 -2
model-bin/finetune/base/{checkpoint-8709 → checkpoint-8958}/scaler.pt +1 -1
model-bin/finetune/base/{checkpoint-8212 → checkpoint-8958}/scheduler.pt +1 -1
model-bin/finetune/base/{checkpoint-8709 → checkpoint-8958}/trainer_state.json +1517 -5
model-bin/finetune/base/{checkpoint-8212 → checkpoint-8958}/training_args.bin +0 -0
model-bin/finetune/base/{checkpoint-8336/scaler.pt → log/1629481571.7415848/events.out.tfevents.1629481571.2977154bd390.32087.9} +2 -2
model-bin/finetune/base/{checkpoint-8336/rng_state.pth → log/events.out.tfevents.1629481571.2977154bd390.32087.8} +2 -2

main.py CHANGED Viewed

@@ -89,7 +89,7 @@ def load_prepared_dataset(path, processor, cache_file_filter_name, cache_file_ma
 def commit_checkpoint():
     submit_commands = [
         'git add model-bin/finetune/base/*',
-        'git commit -m "auto commit"',
         'git push origin main'
     ]
     for command in submit_commands:

 def commit_checkpoint():
     submit_commands = [
         'git add model-bin/finetune/base/*',
+        'git commit -m "auto-commit"',
         'git push origin main'
     ]
     for command in submit_commands:

model-bin/finetune/base/checkpoint-8212/pytorch_model.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:c9ceae04a6996246ad6724a00462738dd9f08e397a51090cccaabc78fd64342b
-size 377909911

model-bin/finetune/base/checkpoint-8212/rng_state.pth DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:369a5523390db45490fad840928af02d3bc252ff7791aae167c93deca4d91b7f
-size 14503

model-bin/finetune/base/checkpoint-8212/scaler.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:ce3caf9fa11cbc306f2acff0c04546dc0430f5ec115580be46b6feffffb1db78
-size 559

model-bin/finetune/base/checkpoint-8212/trainer_state.json DELETED Viewed

The diff for this file is too large to render. See raw diff

model-bin/finetune/base/checkpoint-8336/config.json DELETED Viewed

@@ -1,78 +0,0 @@
-{
-  "_name_or_path": "./model-bin/pretrained/base",
-  "activation_dropout": 0.1,
-  "apply_spec_augment": true,
-  "architectures": [
-    "Wav2Vec2ForCTC"
-  ],
-  "attention_dropout": 0.1,
-  "bos_token_id": 1,
-  "codevector_dim": 256,
-  "contrastive_logits_temperature": 0.1,
-  "conv_bias": false,
-  "conv_dim": [
-    512,
-    512,
-    512,
-    512,
-    512,
-    512,
-    512
-  ],
-  "conv_kernel": [
-    10,
-    3,
-    3,
-    3,
-    3,
-    2,
-    2
-  ],
-  "conv_stride": [
-    5,
-    2,
-    2,
-    2,
-    2,
-    2,
-    2
-  ],
-  "ctc_loss_reduction": "mean",
-  "ctc_zero_infinity": false,
-  "diversity_loss_weight": 0.1,
-  "do_stable_layer_norm": false,
-  "eos_token_id": 2,
-  "feat_extract_activation": "gelu",
-  "feat_extract_dropout": 0.0,
-  "feat_extract_norm": "group",
-  "feat_proj_dropout": 0.1,
-  "feat_quantizer_dropout": 0.0,
-  "final_dropout": 0.1,
-  "gradient_checkpointing": true,
-  "hidden_act": "gelu",
-  "hidden_dropout": 0.1,
-  "hidden_dropout_prob": 0.1,
-  "hidden_size": 768,
-  "initializer_range": 0.02,
-  "intermediate_size": 3072,
-  "layer_norm_eps": 1e-05,
-  "layerdrop": 0.1,
-  "mask_feature_length": 10,
-  "mask_feature_prob": 0.0,
-  "mask_time_length": 10,
-  "mask_time_prob": 0.05,
-  "model_type": "wav2vec2",
-  "num_attention_heads": 12,
-  "num_codevector_groups": 2,
-  "num_codevectors_per_group": 320,
-  "num_conv_pos_embedding_groups": 16,
-  "num_conv_pos_embeddings": 128,
-  "num_feat_extract_layers": 7,
-  "num_hidden_layers": 12,
-  "num_negatives": 100,
-  "pad_token_id": 109,
-  "proj_codevector_dim": 256,
-  "torch_dtype": "float32",
-  "transformers_version": "4.9.2",
-  "vocab_size": 110
-}

model-bin/finetune/base/checkpoint-8336/optimizer.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:66d052e5cd2897e521431ffac494367dd2fc0682d7655dcef9e944a91f3f9462
-size 722165009

model-bin/finetune/base/checkpoint-8336/preprocessor_config.json DELETED Viewed

@@ -1,9 +0,0 @@
-{
-  "do_normalize": true,
-  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
-  "feature_size": 1,
-  "padding_side": "right",
-  "padding_value": 0.0,
-  "return_attention_mask": false,
-  "sampling_rate": 16000
-}

model-bin/finetune/base/checkpoint-8336/scheduler.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:52cdb53167833ea5ec421b4bc4792a7a88ca2114418372fb1cd508a5ebcca6b1
-size 623

model-bin/finetune/base/checkpoint-8336/trainer_state.json DELETED Viewed

The diff for this file is too large to render. See raw diff

model-bin/finetune/base/checkpoint-8336/training_args.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:53d5f6b64d43d7a5c22d92f1aa4114a0ed5474a4ee16170f4a83fcd9522f9c6e
-size 2671

model-bin/finetune/base/checkpoint-8709/config.json DELETED Viewed

@@ -1,78 +0,0 @@
-{
-  "_name_or_path": "./model-bin/pretrained/base",
-  "activation_dropout": 0.1,
-  "apply_spec_augment": true,
-  "architectures": [
-    "Wav2Vec2ForCTC"
-  ],
-  "attention_dropout": 0.1,
-  "bos_token_id": 1,
-  "codevector_dim": 256,
-  "contrastive_logits_temperature": 0.1,
-  "conv_bias": false,
-  "conv_dim": [
-    512,
-    512,
-    512,
-    512,
-    512,
-    512,
-    512
-  ],
-  "conv_kernel": [
-    10,
-    3,
-    3,
-    3,
-    3,
-    2,
-    2
-  ],
-  "conv_stride": [
-    5,
-    2,
-    2,
-    2,
-    2,
-    2,
-    2
-  ],
-  "ctc_loss_reduction": "mean",
-  "ctc_zero_infinity": false,
-  "diversity_loss_weight": 0.1,
-  "do_stable_layer_norm": false,
-  "eos_token_id": 2,
-  "feat_extract_activation": "gelu",
-  "feat_extract_dropout": 0.0,
-  "feat_extract_norm": "group",
-  "feat_proj_dropout": 0.1,
-  "feat_quantizer_dropout": 0.0,
-  "final_dropout": 0.1,
-  "gradient_checkpointing": true,
-  "hidden_act": "gelu",
-  "hidden_dropout": 0.1,
-  "hidden_dropout_prob": 0.1,
-  "hidden_size": 768,
-  "initializer_range": 0.02,
-  "intermediate_size": 3072,
-  "layer_norm_eps": 1e-05,
-  "layerdrop": 0.1,
-  "mask_feature_length": 10,
-  "mask_feature_prob": 0.0,
-  "mask_time_length": 10,
-  "mask_time_prob": 0.05,
-  "model_type": "wav2vec2",
-  "num_attention_heads": 12,
-  "num_codevector_groups": 2,
-  "num_codevectors_per_group": 320,
-  "num_conv_pos_embedding_groups": 16,
-  "num_conv_pos_embeddings": 128,
-  "num_feat_extract_layers": 7,
-  "num_hidden_layers": 12,
-  "num_negatives": 100,
-  "pad_token_id": 109,
-  "proj_codevector_dim": 256,
-  "torch_dtype": "float32",
-  "transformers_version": "4.9.2",
-  "vocab_size": 110
-}

model-bin/finetune/base/checkpoint-8709/optimizer.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:415b0246c463cd5ceb4041b8f28843eda1a8031b909e1738d3c2a92a64e7c7d6
-size 722165009

model-bin/finetune/base/checkpoint-8709/preprocessor_config.json DELETED Viewed

@@ -1,9 +0,0 @@
-{
-  "do_normalize": true,
-  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
-  "feature_size": 1,
-  "padding_side": "right",
-  "padding_value": 0.0,
-  "return_attention_mask": false,
-  "sampling_rate": 16000
-}

model-bin/finetune/base/checkpoint-8709/pytorch_model.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:5c6dc6a2981c4ed21a7a862e57603e9e9f7c71d41e65b7c711ef7d511ef61fc8
-size 377909911

model-bin/finetune/base/checkpoint-8709/scheduler.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:36c2d8351b8dc01af8da53704884d2363d46bcdd9e86d18e980d29bde05879ec
-size 623

model-bin/finetune/base/checkpoint-8709/training_args.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:53d5f6b64d43d7a5c22d92f1aa4114a0ed5474a4ee16170f4a83fcd9522f9c6e
-size 2671

model-bin/finetune/base/{checkpoint-8212 → checkpoint-8958}/config.json RENAMED Viewed

File without changes

model-bin/finetune/base/{checkpoint-8212 → checkpoint-8958}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f60be19033d40758a8fa0ddb172463d630c79e031795a839b90adbc6b4d9c2df
 size 722165009

 version https://git-lfs.github.com/spec/v1
+oid sha256:d66880966a57a8c87bdda1b410b4f3e68c34d3b8a424197028887abc7e150c55
 size 722165009

model-bin/finetune/base/{checkpoint-8212 → checkpoint-8958}/preprocessor_config.json RENAMED Viewed

File without changes

model-bin/finetune/base/{checkpoint-8336 → checkpoint-8958}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:93ccdc196aff3c82e59b51b65baf9e79353a7c8c64d1acdd81f5ae176c169c93
 size 377909911

 version https://git-lfs.github.com/spec/v1
+oid sha256:3c254f8ad282308ea33bb83c758ef8293899f150adc41b570833d7b458c78bfc
 size 377909911

model-bin/finetune/base/{checkpoint-8709 → checkpoint-8958}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:51a4880d340c77f40515f04f749e39abccbe6111e450e52ab35bc472d7f0a68c
-size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:a91a6dcfed691871e13767ddc06caddb7fcdfd1c0a09919cf6d6f6999f8cf961
+size 14567

model-bin/finetune/base/{checkpoint-8709 → checkpoint-8958}/scaler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e8159c1d1c63d3825e8a05cb5ddecb5b6c3e8a74bed03176fab5ab56815b0464
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:13952a1cb28382e67abf3075b93cfb164b5d815d475d2f1573c4e3e812c1dba1
 size 559

model-bin/finetune/base/{checkpoint-8212 → checkpoint-8958}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ed8e00b421f4e21c7d4abfffcb970f5149329fc3025b9a68b3cac08248258d67
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:cfaf4fa12293f359b8f566ee48e8288f4f3121c30617ecd31186b7e3d795a959
 size 623

model-bin/finetune/base/{checkpoint-8709 → checkpoint-8958}/trainer_state.json RENAMED Viewed

@@ -1,8 +1,8 @@
 {
-  "best_metric": 0.7469591821505858,
-  "best_model_checkpoint": "./model-bin/finetune/base/checkpoint-8709",
-  "epoch": 70.0,
-  "global_step": 8709,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -52890,11 +52890,1523 @@
       "eval_steps_per_second": 0.631,
       "eval_wer": 0.7469591821505858,
       "step": 8709
     }
   ],
   "max_steps": 620000,
   "num_train_epochs": 5000,
-  "total_flos": 2.448174582026537e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.6824567855829349,
+  "best_model_checkpoint": "./model-bin/finetune/base/checkpoint-8958",
+  "epoch": 72.0,
+  "global_step": 8958,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.631,
       "eval_wer": 0.7469591821505858,
       "step": 8709
+    },
+    {
+      "epoch": 69.01,
+      "learning_rate": 9.875525040387724e-06,
+      "loss": 1.6153,
+      "step": 8710
+    },
+    {
+      "epoch": 69.02,
+      "learning_rate": 9.87550888529887e-06,
+      "loss": 1.4633,
+      "step": 8711
+    },
+    {
+      "epoch": 69.02,
+      "learning_rate": 9.875492730210016e-06,
+      "loss": 1.5134,
+      "step": 8712
+    },
+    {
+      "epoch": 69.03,
+      "learning_rate": 9.875476575121163e-06,
+      "loss": 1.5621,
+      "step": 8713
+    },
+    {
+      "epoch": 69.04,
+      "learning_rate": 9.875460420032311e-06,
+      "loss": 1.4003,
+      "step": 8714
+    },
+    {
+      "epoch": 69.05,
+      "learning_rate": 9.875444264943458e-06,
+      "loss": 1.54,
+      "step": 8715
+    },
+    {
+      "epoch": 69.06,
+      "learning_rate": 9.875428109854605e-06,
+      "loss": 1.3723,
+      "step": 8716
+    },
+    {
+      "epoch": 69.06,
+      "learning_rate": 9.875411954765752e-06,
+      "loss": 1.672,
+      "step": 8717
+    },
+    {
+      "epoch": 69.07,
+      "learning_rate": 9.875395799676899e-06,
+      "loss": 1.5243,
+      "step": 8718
+    },
+    {
+      "epoch": 69.08,
+      "learning_rate": 9.875379644588046e-06,
+      "loss": 1.593,
+      "step": 8719
+    },
+    {
+      "epoch": 69.09,
+      "learning_rate": 9.875363489499194e-06,
+      "loss": 1.3595,
+      "step": 8720
+    },
+    {
+      "epoch": 69.1,
+      "learning_rate": 9.87534733441034e-06,
+      "loss": 1.4388,
+      "step": 8721
+    },
+    {
+      "epoch": 69.1,
+      "learning_rate": 9.875331179321486e-06,
+      "loss": 1.3854,
+      "step": 8722
+    },
+    {
+      "epoch": 69.11,
+      "learning_rate": 9.875315024232635e-06,
+      "loss": 1.8071,
+      "step": 8723
+    },
+    {
+      "epoch": 69.12,
+      "learning_rate": 9.875298869143781e-06,
+      "loss": 1.5355,
+      "step": 8724
+    },
+    {
+      "epoch": 69.13,
+      "learning_rate": 9.875282714054928e-06,
+      "loss": 1.4477,
+      "step": 8725
+    },
+    {
+      "epoch": 69.14,
+      "learning_rate": 9.875266558966075e-06,
+      "loss": 1.5663,
+      "step": 8726
+    },
+    {
+      "epoch": 69.14,
+      "learning_rate": 9.875250403877222e-06,
+      "loss": 1.7814,
+      "step": 8727
+    },
+    {
+      "epoch": 69.15,
+      "learning_rate": 9.875234248788369e-06,
+      "loss": 1.4415,
+      "step": 8728
+    },
+    {
+      "epoch": 69.16,
+      "learning_rate": 9.875218093699516e-06,
+      "loss": 1.7214,
+      "step": 8729
+    },
+    {
+      "epoch": 69.17,
+      "learning_rate": 9.875201938610664e-06,
+      "loss": 1.8272,
+      "step": 8730
+    },
+    {
+      "epoch": 69.18,
+      "learning_rate": 9.875185783521811e-06,
+      "loss": 1.8333,
+      "step": 8731
+    },
+    {
+      "epoch": 69.18,
+      "learning_rate": 9.875169628432956e-06,
+      "loss": 2.2468,
+      "step": 8732
+    },
+    {
+      "epoch": 69.19,
+      "learning_rate": 9.875153473344105e-06,
+      "loss": 2.7862,
+      "step": 8733
+    },
+    {
+      "epoch": 69.2,
+      "learning_rate": 9.875137318255251e-06,
+      "loss": 3.3676,
+      "step": 8734
+    },
+    {
+      "epoch": 69.21,
+      "learning_rate": 9.875121163166398e-06,
+      "loss": 1.5527,
+      "step": 8735
+    },
+    {
+      "epoch": 69.22,
+      "learning_rate": 9.875105008077545e-06,
+      "loss": 1.4331,
+      "step": 8736
+    },
+    {
+      "epoch": 69.22,
+      "learning_rate": 9.875088852988692e-06,
+      "loss": 1.3974,
+      "step": 8737
+    },
+    {
+      "epoch": 69.23,
+      "learning_rate": 9.875072697899839e-06,
+      "loss": 1.3391,
+      "step": 8738
+    },
+    {
+      "epoch": 69.24,
+      "learning_rate": 9.875056542810987e-06,
+      "loss": 1.3186,
+      "step": 8739
+    },
+    {
+      "epoch": 69.25,
+      "learning_rate": 9.875040387722134e-06,
+      "loss": 1.5476,
+      "step": 8740
+    },
+    {
+      "epoch": 69.26,
+      "learning_rate": 9.875024232633281e-06,
+      "loss": 1.6061,
+      "step": 8741
+    },
+    {
+      "epoch": 69.26,
+      "learning_rate": 9.875008077544426e-06,
+      "loss": 1.5964,
+      "step": 8742
+    },
+    {
+      "epoch": 69.27,
+      "learning_rate": 9.874991922455575e-06,
+      "loss": 1.4022,
+      "step": 8743
+    },
+    {
+      "epoch": 69.28,
+      "learning_rate": 9.874975767366721e-06,
+      "loss": 1.6853,
+      "step": 8744
+    },
+    {
+      "epoch": 69.29,
+      "learning_rate": 9.874959612277868e-06,
+      "loss": 2.0233,
+      "step": 8745
+    },
+    {
+      "epoch": 69.3,
+      "learning_rate": 9.874943457189015e-06,
+      "loss": 1.4809,
+      "step": 8746
+    },
+    {
+      "epoch": 69.3,
+      "learning_rate": 9.874927302100162e-06,
+      "loss": 1.3434,
+      "step": 8747
+    },
+    {
+      "epoch": 69.31,
+      "learning_rate": 9.874911147011309e-06,
+      "loss": 1.5711,
+      "step": 8748
+    },
+    {
+      "epoch": 69.32,
+      "learning_rate": 9.874894991922457e-06,
+      "loss": 1.5846,
+      "step": 8749
+    },
+    {
+      "epoch": 69.33,
+      "learning_rate": 9.874878836833604e-06,
+      "loss": 1.5662,
+      "step": 8750
+    },
+    {
+      "epoch": 69.34,
+      "learning_rate": 9.874862681744751e-06,
+      "loss": 1.5346,
+      "step": 8751
+    },
+    {
+      "epoch": 69.34,
+      "learning_rate": 9.874846526655898e-06,
+      "loss": 1.5122,
+      "step": 8752
+    },
+    {
+      "epoch": 69.35,
+      "learning_rate": 9.874830371567045e-06,
+      "loss": 1.6172,
+      "step": 8753
+    },
+    {
+      "epoch": 69.36,
+      "learning_rate": 9.874814216478191e-06,
+      "loss": 1.6781,
+      "step": 8754
+    },
+    {
+      "epoch": 69.37,
+      "learning_rate": 9.874798061389338e-06,
+      "loss": 1.8096,
+      "step": 8755
+    },
+    {
+      "epoch": 69.38,
+      "learning_rate": 9.874781906300485e-06,
+      "loss": 2.1775,
+      "step": 8756
+    },
+    {
+      "epoch": 69.38,
+      "learning_rate": 9.874765751211632e-06,
+      "loss": 2.7198,
+      "step": 8757
+    },
+    {
+      "epoch": 69.39,
+      "learning_rate": 9.874749596122779e-06,
+      "loss": 2.4698,
+      "step": 8758
+    },
+    {
+      "epoch": 69.4,
+      "learning_rate": 9.874733441033927e-06,
+      "loss": 3.2068,
+      "step": 8759
+    },
+    {
+      "epoch": 69.41,
+      "learning_rate": 9.874717285945074e-06,
+      "loss": 1.5313,
+      "step": 8760
+    },
+    {
+      "epoch": 69.42,
+      "learning_rate": 9.874701130856221e-06,
+      "loss": 1.5581,
+      "step": 8761
+    },
+    {
+      "epoch": 69.42,
+      "learning_rate": 9.874684975767368e-06,
+      "loss": 1.4189,
+      "step": 8762
+    },
+    {
+      "epoch": 69.43,
+      "learning_rate": 9.874668820678515e-06,
+      "loss": 1.5631,
+      "step": 8763
+    },
+    {
+      "epoch": 69.44,
+      "learning_rate": 9.874652665589661e-06,
+      "loss": 1.3352,
+      "step": 8764
+    },
+    {
+      "epoch": 69.45,
+      "learning_rate": 9.87463651050081e-06,
+      "loss": 1.4554,
+      "step": 8765
+    },
+    {
+      "epoch": 69.46,
+      "learning_rate": 9.874620355411955e-06,
+      "loss": 1.3733,
+      "step": 8766
+    },
+    {
+      "epoch": 69.46,
+      "learning_rate": 9.874604200323102e-06,
+      "loss": 1.7026,
+      "step": 8767
+    },
+    {
+      "epoch": 69.47,
+      "learning_rate": 9.874588045234249e-06,
+      "loss": 1.5812,
+      "step": 8768
+    },
+    {
+      "epoch": 69.48,
+      "learning_rate": 9.874571890145397e-06,
+      "loss": 1.3614,
+      "step": 8769
+    },
+    {
+      "epoch": 69.49,
+      "learning_rate": 9.874555735056544e-06,
+      "loss": 1.3396,
+      "step": 8770
+    },
+    {
+      "epoch": 69.5,
+      "learning_rate": 9.874539579967691e-06,
+      "loss": 1.5401,
+      "step": 8771
+    },
+    {
+      "epoch": 69.5,
+      "learning_rate": 9.874523424878838e-06,
+      "loss": 1.438,
+      "step": 8772
+    },
+    {
+      "epoch": 69.51,
+      "learning_rate": 9.874507269789985e-06,
+      "loss": 1.4894,
+      "step": 8773
+    },
+    {
+      "epoch": 69.52,
+      "learning_rate": 9.874491114701131e-06,
+      "loss": 1.3303,
+      "step": 8774
+    },
+    {
+      "epoch": 69.53,
+      "learning_rate": 9.87447495961228e-06,
+      "loss": 1.3972,
+      "step": 8775
+    },
+    {
+      "epoch": 69.54,
+      "learning_rate": 9.874458804523425e-06,
+      "loss": 1.6936,
+      "step": 8776
+    },
+    {
+      "epoch": 69.54,
+      "learning_rate": 9.874442649434572e-06,
+      "loss": 1.5058,
+      "step": 8777
+    },
+    {
+      "epoch": 69.55,
+      "learning_rate": 9.87442649434572e-06,
+      "loss": 1.5953,
+      "step": 8778
+    },
+    {
+      "epoch": 69.56,
+      "learning_rate": 9.874410339256867e-06,
+      "loss": 1.7185,
+      "step": 8779
+    },
+    {
+      "epoch": 69.57,
+      "learning_rate": 9.874394184168014e-06,
+      "loss": 1.956,
+      "step": 8780
+    },
+    {
+      "epoch": 69.58,
+      "learning_rate": 9.87437802907916e-06,
+      "loss": 1.9566,
+      "step": 8781
+    },
+    {
+      "epoch": 69.58,
+      "learning_rate": 9.874361873990308e-06,
+      "loss": 2.2227,
+      "step": 8782
+    },
+    {
+      "epoch": 69.59,
+      "learning_rate": 9.874345718901454e-06,
+      "loss": 2.3693,
+      "step": 8783
+    },
+    {
+      "epoch": 69.6,
+      "learning_rate": 9.874329563812601e-06,
+      "loss": 2.9933,
+      "step": 8784
+    },
+    {
+      "epoch": 69.61,
+      "learning_rate": 9.87431340872375e-06,
+      "loss": 2.1501,
+      "step": 8785
+    },
+    {
+      "epoch": 69.62,
+      "learning_rate": 9.874297253634895e-06,
+      "loss": 2.1441,
+      "step": 8786
+    },
+    {
+      "epoch": 69.62,
+      "learning_rate": 9.874281098546042e-06,
+      "loss": 1.6236,
+      "step": 8787
+    },
+    {
+      "epoch": 69.63,
+      "learning_rate": 9.87426494345719e-06,
+      "loss": 1.4453,
+      "step": 8788
+    },
+    {
+      "epoch": 69.64,
+      "learning_rate": 9.874248788368337e-06,
+      "loss": 1.4271,
+      "step": 8789
+    },
+    {
+      "epoch": 69.65,
+      "learning_rate": 9.874232633279484e-06,
+      "loss": 2.0905,
+      "step": 8790
+    },
+    {
+      "epoch": 69.66,
+      "learning_rate": 9.87421647819063e-06,
+      "loss": 1.6809,
+      "step": 8791
+    },
+    {
+      "epoch": 69.66,
+      "learning_rate": 9.874200323101778e-06,
+      "loss": 2.1893,
+      "step": 8792
+    },
+    {
+      "epoch": 69.67,
+      "learning_rate": 9.874184168012924e-06,
+      "loss": 1.4405,
+      "step": 8793
+    },
+    {
+      "epoch": 69.68,
+      "learning_rate": 9.874168012924071e-06,
+      "loss": 1.4139,
+      "step": 8794
+    },
+    {
+      "epoch": 69.69,
+      "learning_rate": 9.87415185783522e-06,
+      "loss": 1.5473,
+      "step": 8795
+    },
+    {
+      "epoch": 69.7,
+      "learning_rate": 9.874135702746367e-06,
+      "loss": 1.4509,
+      "step": 8796
+    },
+    {
+      "epoch": 69.7,
+      "learning_rate": 9.874119547657512e-06,
+      "loss": 1.3682,
+      "step": 8797
+    },
+    {
+      "epoch": 69.71,
+      "learning_rate": 9.87410339256866e-06,
+      "loss": 1.3525,
+      "step": 8798
+    },
+    {
+      "epoch": 69.72,
+      "learning_rate": 9.874087237479807e-06,
+      "loss": 1.5427,
+      "step": 8799
+    },
+    {
+      "epoch": 69.73,
+      "learning_rate": 9.874071082390954e-06,
+      "loss": 1.4963,
+      "step": 8800
+    },
+    {
+      "epoch": 69.74,
+      "learning_rate": 9.8740549273021e-06,
+      "loss": 1.3988,
+      "step": 8801
+    },
+    {
+      "epoch": 69.74,
+      "learning_rate": 9.874038772213248e-06,
+      "loss": 1.8708,
+      "step": 8802
+    },
+    {
+      "epoch": 69.75,
+      "learning_rate": 9.874022617124394e-06,
+      "loss": 1.7412,
+      "step": 8803
+    },
+    {
+      "epoch": 69.76,
+      "learning_rate": 9.874006462035543e-06,
+      "loss": 2.0043,
+      "step": 8804
+    },
+    {
+      "epoch": 69.77,
+      "learning_rate": 9.87399030694669e-06,
+      "loss": 2.1015,
+      "step": 8805
+    },
+    {
+      "epoch": 69.78,
+      "learning_rate": 9.873974151857837e-06,
+      "loss": 2.205,
+      "step": 8806
+    },
+    {
+      "epoch": 69.78,
+      "learning_rate": 9.873957996768983e-06,
+      "loss": 2.1445,
+      "step": 8807
+    },
+    {
+      "epoch": 69.79,
+      "learning_rate": 9.87394184168013e-06,
+      "loss": 2.7113,
+      "step": 8808
+    },
+    {
+      "epoch": 69.8,
+      "learning_rate": 9.873925686591277e-06,
+      "loss": 3.3649,
+      "step": 8809
+    },
+    {
+      "epoch": 69.81,
+      "learning_rate": 9.873909531502424e-06,
+      "loss": 1.4795,
+      "step": 8810
+    },
+    {
+      "epoch": 69.82,
+      "learning_rate": 9.87389337641357e-06,
+      "loss": 1.5267,
+      "step": 8811
+    },
+    {
+      "epoch": 69.82,
+      "learning_rate": 9.873877221324718e-06,
+      "loss": 1.5875,
+      "step": 8812
+    },
+    {
+      "epoch": 69.83,
+      "learning_rate": 9.873861066235864e-06,
+      "loss": 1.5205,
+      "step": 8813
+    },
+    {
+      "epoch": 69.84,
+      "learning_rate": 9.873844911147013e-06,
+      "loss": 1.3915,
+      "step": 8814
+    },
+    {
+      "epoch": 69.85,
+      "learning_rate": 9.87382875605816e-06,
+      "loss": 1.5903,
+      "step": 8815
+    },
+    {
+      "epoch": 69.86,
+      "learning_rate": 9.873812600969307e-06,
+      "loss": 1.4766,
+      "step": 8816
+    },
+    {
+      "epoch": 69.86,
+      "learning_rate": 9.873796445880453e-06,
+      "loss": 2.2292,
+      "step": 8817
+    },
+    {
+      "epoch": 69.87,
+      "learning_rate": 9.8737802907916e-06,
+      "loss": 1.6554,
+      "step": 8818
+    },
+    {
+      "epoch": 69.88,
+      "learning_rate": 9.873764135702747e-06,
+      "loss": 1.3882,
+      "step": 8819
+    },
+    {
+      "epoch": 69.89,
+      "learning_rate": 9.873747980613894e-06,
+      "loss": 1.5054,
+      "step": 8820
+    },
+    {
+      "epoch": 69.9,
+      "learning_rate": 9.87373182552504e-06,
+      "loss": 1.6373,
+      "step": 8821
+    },
+    {
+      "epoch": 69.9,
+      "learning_rate": 9.873715670436188e-06,
+      "loss": 1.5243,
+      "step": 8822
+    },
+    {
+      "epoch": 69.91,
+      "learning_rate": 9.873699515347334e-06,
+      "loss": 2.1341,
+      "step": 8823
+    },
+    {
+      "epoch": 69.92,
+      "learning_rate": 9.873683360258483e-06,
+      "loss": 1.317,
+      "step": 8824
+    },
+    {
+      "epoch": 69.93,
+      "learning_rate": 9.87366720516963e-06,
+      "loss": 1.7215,
+      "step": 8825
+    },
+    {
+      "epoch": 69.94,
+      "learning_rate": 9.873651050080777e-06,
+      "loss": 1.3331,
+      "step": 8826
+    },
+    {
+      "epoch": 69.94,
+      "learning_rate": 9.873634894991923e-06,
+      "loss": 1.6016,
+      "step": 8827
+    },
+    {
+      "epoch": 69.95,
+      "learning_rate": 9.87361873990307e-06,
+      "loss": 1.5569,
+      "step": 8828
+    },
+    {
+      "epoch": 69.96,
+      "learning_rate": 9.873602584814217e-06,
+      "loss": 2.2356,
+      "step": 8829
+    },
+    {
+      "epoch": 69.97,
+      "learning_rate": 9.873586429725366e-06,
+      "loss": 2.2153,
+      "step": 8830
+    },
+    {
+      "epoch": 69.98,
+      "learning_rate": 9.87357027463651e-06,
+      "loss": 1.9975,
+      "step": 8831
+    },
+    {
+      "epoch": 69.98,
+      "learning_rate": 9.873554119547658e-06,
+      "loss": 2.2298,
+      "step": 8832
+    },
+    {
+      "epoch": 69.99,
+      "learning_rate": 9.873537964458806e-06,
+      "loss": 2.9414,
+      "step": 8833
+    },
+    {
+      "epoch": 70.0,
+      "learning_rate": 9.873521809369953e-06,
+      "loss": 3.4378,
+      "step": 8834
+    },
+    {
+      "epoch": 70.0,
+      "eval_loss": 1.3710267543792725,
+      "eval_runtime": 43.6624,
+      "eval_samples_per_second": 19.147,
+      "eval_steps_per_second": 0.618,
+      "eval_wer": 0.7103508263264714,
+      "step": 8834
+    },
+    {
+      "epoch": 71.01,
+      "learning_rate": 9.8735056542811e-06,
+      "loss": 1.5553,
+      "step": 8835
+    },
+    {
+      "epoch": 71.02,
+      "learning_rate": 9.873489499192247e-06,
+      "loss": 1.4501,
+      "step": 8836
+    },
+    {
+      "epoch": 71.02,
+      "learning_rate": 9.873473344103393e-06,
+      "loss": 1.349,
+      "step": 8837
+    },
+    {
+      "epoch": 71.03,
+      "learning_rate": 9.87345718901454e-06,
+      "loss": 1.436,
+      "step": 8838
+    },
+    {
+      "epoch": 71.04,
+      "learning_rate": 9.873441033925687e-06,
+      "loss": 1.3992,
+      "step": 8839
+    },
+    {
+      "epoch": 71.05,
+      "learning_rate": 9.873424878836836e-06,
+      "loss": 1.6298,
+      "step": 8840
+    },
+    {
+      "epoch": 71.06,
+      "learning_rate": 9.87340872374798e-06,
+      "loss": 1.4596,
+      "step": 8841
+    },
+    {
+      "epoch": 71.06,
+      "learning_rate": 9.873392568659128e-06,
+      "loss": 1.2296,
+      "step": 8842
+    },
+    {
+      "epoch": 71.07,
+      "learning_rate": 9.873376413570276e-06,
+      "loss": 1.6262,
+      "step": 8843
+    },
+    {
+      "epoch": 71.08,
+      "learning_rate": 9.873360258481423e-06,
+      "loss": 1.5551,
+      "step": 8844
+    },
+    {
+      "epoch": 71.09,
+      "learning_rate": 9.87334410339257e-06,
+      "loss": 1.3272,
+      "step": 8845
+    },
+    {
+      "epoch": 71.1,
+      "learning_rate": 9.873327948303717e-06,
+      "loss": 1.3513,
+      "step": 8846
+    },
+    {
+      "epoch": 71.1,
+      "learning_rate": 9.873311793214863e-06,
+      "loss": 1.6325,
+      "step": 8847
+    },
+    {
+      "epoch": 71.11,
+      "learning_rate": 9.87329563812601e-06,
+      "loss": 1.406,
+      "step": 8848
+    },
+    {
+      "epoch": 71.12,
+      "learning_rate": 9.873279483037157e-06,
+      "loss": 2.1379,
+      "step": 8849
+    },
+    {
+      "epoch": 71.13,
+      "learning_rate": 9.873263327948306e-06,
+      "loss": 1.3738,
+      "step": 8850
+    },
+    {
+      "epoch": 71.14,
+      "learning_rate": 9.87324717285945e-06,
+      "loss": 1.5013,
+      "step": 8851
+    },
+    {
+      "epoch": 71.15,
+      "learning_rate": 9.873231017770597e-06,
+      "loss": 1.7028,
+      "step": 8852
+    },
+    {
+      "epoch": 71.15,
+      "learning_rate": 9.873214862681746e-06,
+      "loss": 1.5341,
+      "step": 8853
+    },
+    {
+      "epoch": 71.16,
+      "learning_rate": 9.873198707592893e-06,
+      "loss": 1.6287,
+      "step": 8854
+    },
+    {
+      "epoch": 71.17,
+      "learning_rate": 9.87318255250404e-06,
+      "loss": 1.9904,
+      "step": 8855
+    },
+    {
+      "epoch": 71.18,
+      "learning_rate": 9.873166397415186e-06,
+      "loss": 2.2276,
+      "step": 8856
+    },
+    {
+      "epoch": 71.19,
+      "learning_rate": 9.873150242326333e-06,
+      "loss": 2.1806,
+      "step": 8857
+    },
+    {
+      "epoch": 71.19,
+      "learning_rate": 9.87313408723748e-06,
+      "loss": 2.4198,
+      "step": 8858
+    },
+    {
+      "epoch": 71.2,
+      "learning_rate": 9.873117932148629e-06,
+      "loss": 3.2983,
+      "step": 8859
+    },
+    {
+      "epoch": 71.21,
+      "learning_rate": 9.873101777059775e-06,
+      "loss": 1.4535,
+      "step": 8860
+    },
+    {
+      "epoch": 71.22,
+      "learning_rate": 9.87308562197092e-06,
+      "loss": 1.6163,
+      "step": 8861
+    },
+    {
+      "epoch": 71.23,
+      "learning_rate": 9.873069466882067e-06,
+      "loss": 1.4652,
+      "step": 8862
+    },
+    {
+      "epoch": 71.23,
+      "learning_rate": 9.873053311793216e-06,
+      "loss": 1.4324,
+      "step": 8863
+    },
+    {
+      "epoch": 71.24,
+      "learning_rate": 9.873037156704363e-06,
+      "loss": 1.5285,
+      "step": 8864
+    },
+    {
+      "epoch": 71.25,
+      "learning_rate": 9.87302100161551e-06,
+      "loss": 1.655,
+      "step": 8865
+    },
+    {
+      "epoch": 71.26,
+      "learning_rate": 9.873004846526656e-06,
+      "loss": 1.5131,
+      "step": 8866
+    },
+    {
+      "epoch": 71.27,
+      "learning_rate": 9.872988691437803e-06,
+      "loss": 1.7416,
+      "step": 8867
+    },
+    {
+      "epoch": 71.27,
+      "learning_rate": 9.87297253634895e-06,
+      "loss": 1.2547,
+      "step": 8868
+    },
+    {
+      "epoch": 71.28,
+      "learning_rate": 9.872956381260099e-06,
+      "loss": 1.4199,
+      "step": 8869
+    },
+    {
+      "epoch": 71.29,
+      "learning_rate": 9.872940226171245e-06,
+      "loss": 1.3792,
+      "step": 8870
+    },
+    {
+      "epoch": 71.3,
+      "learning_rate": 9.872924071082392e-06,
+      "loss": 1.3612,
+      "step": 8871
+    },
+    {
+      "epoch": 71.31,
+      "learning_rate": 9.872907915993539e-06,
+      "loss": 1.8577,
+      "step": 8872
+    },
+    {
+      "epoch": 71.31,
+      "learning_rate": 9.872891760904686e-06,
+      "loss": 2.244,
+      "step": 8873
+    },
+    {
+      "epoch": 71.32,
+      "learning_rate": 9.872875605815833e-06,
+      "loss": 1.5285,
+      "step": 8874
+    },
+    {
+      "epoch": 71.33,
+      "learning_rate": 9.87285945072698e-06,
+      "loss": 1.6464,
+      "step": 8875
+    },
+    {
+      "epoch": 71.34,
+      "learning_rate": 9.872843295638126e-06,
+      "loss": 1.7209,
+      "step": 8876
+    },
+    {
+      "epoch": 71.35,
+      "learning_rate": 9.872827140549273e-06,
+      "loss": 1.7093,
+      "step": 8877
+    },
+    {
+      "epoch": 71.35,
+      "learning_rate": 9.87281098546042e-06,
+      "loss": 1.6397,
+      "step": 8878
+    },
+    {
+      "epoch": 71.36,
+      "learning_rate": 9.872794830371569e-06,
+      "loss": 1.6429,
+      "step": 8879
+    },
+    {
+      "epoch": 71.37,
+      "learning_rate": 9.872778675282715e-06,
+      "loss": 1.744,
+      "step": 8880
+    },
+    {
+      "epoch": 71.38,
+      "learning_rate": 9.872762520193862e-06,
+      "loss": 1.9573,
+      "step": 8881
+    },
+    {
+      "epoch": 71.39,
+      "learning_rate": 9.872746365105009e-06,
+      "loss": 2.7426,
+      "step": 8882
+    },
+    {
+      "epoch": 71.4,
+      "learning_rate": 9.872730210016156e-06,
+      "loss": 2.7319,
+      "step": 8883
+    },
+    {
+      "epoch": 71.4,
+      "learning_rate": 9.872714054927303e-06,
+      "loss": 2.8469,
+      "step": 8884
+    },
+    {
+      "epoch": 71.41,
+      "learning_rate": 9.87269789983845e-06,
+      "loss": 1.6622,
+      "step": 8885
+    },
+    {
+      "epoch": 71.42,
+      "learning_rate": 9.872681744749596e-06,
+      "loss": 1.7123,
+      "step": 8886
+    },
+    {
+      "epoch": 71.43,
+      "learning_rate": 9.872665589660743e-06,
+      "loss": 1.2474,
+      "step": 8887
+    },
+    {
+      "epoch": 71.44,
+      "learning_rate": 9.87264943457189e-06,
+      "loss": 1.358,
+      "step": 8888
+    },
+    {
+      "epoch": 71.44,
+      "learning_rate": 9.872633279483039e-06,
+      "loss": 1.3671,
+      "step": 8889
+    },
+    {
+      "epoch": 71.45,
+      "learning_rate": 9.872617124394185e-06,
+      "loss": 1.3765,
+      "step": 8890
+    },
+    {
+      "epoch": 71.46,
+      "learning_rate": 9.872600969305332e-06,
+      "loss": 1.2602,
+      "step": 8891
+    },
+    {
+      "epoch": 71.47,
+      "learning_rate": 9.872584814216479e-06,
+      "loss": 1.3128,
+      "step": 8892
+    },
+    {
+      "epoch": 71.48,
+      "learning_rate": 9.872568659127626e-06,
+      "loss": 1.4784,
+      "step": 8893
+    },
+    {
+      "epoch": 71.48,
+      "learning_rate": 9.872552504038773e-06,
+      "loss": 1.2873,
+      "step": 8894
+    },
+    {
+      "epoch": 71.49,
+      "learning_rate": 9.872536348949921e-06,
+      "loss": 1.9668,
+      "step": 8895
+    },
+    {
+      "epoch": 71.5,
+      "learning_rate": 9.872520193861066e-06,
+      "loss": 1.5462,
+      "step": 8896
+    },
+    {
+      "epoch": 71.51,
+      "learning_rate": 9.872504038772213e-06,
+      "loss": 1.6144,
+      "step": 8897
+    },
+    {
+      "epoch": 71.52,
+      "learning_rate": 9.872487883683362e-06,
+      "loss": 1.3621,
+      "step": 8898
+    },
+    {
+      "epoch": 71.52,
+      "learning_rate": 9.872471728594509e-06,
+      "loss": 1.4176,
+      "step": 8899
+    },
+    {
+      "epoch": 71.53,
+      "learning_rate": 9.872455573505655e-06,
+      "loss": 1.3091,
+      "step": 8900
+    },
+    {
+      "epoch": 71.54,
+      "learning_rate": 9.872439418416802e-06,
+      "loss": 1.456,
+      "step": 8901
+    },
+    {
+      "epoch": 71.55,
+      "learning_rate": 9.872423263327949e-06,
+      "loss": 1.7665,
+      "step": 8902
+    },
+    {
+      "epoch": 71.56,
+      "learning_rate": 9.872407108239096e-06,
+      "loss": 2.1338,
+      "step": 8903
+    },
+    {
+      "epoch": 71.56,
+      "learning_rate": 9.872390953150243e-06,
+      "loss": 1.6296,
+      "step": 8904
+    },
+    {
+      "epoch": 71.57,
+      "learning_rate": 9.872374798061391e-06,
+      "loss": 1.8227,
+      "step": 8905
+    },
+    {
+      "epoch": 71.58,
+      "learning_rate": 9.872358642972536e-06,
+      "loss": 1.856,
+      "step": 8906
+    },
+    {
+      "epoch": 71.59,
+      "learning_rate": 9.872342487883683e-06,
+      "loss": 2.1192,
+      "step": 8907
+    },
+    {
+      "epoch": 71.6,
+      "learning_rate": 9.872326332794832e-06,
+      "loss": 2.9905,
+      "step": 8908
+    },
+    {
+      "epoch": 71.6,
+      "learning_rate": 9.872310177705979e-06,
+      "loss": 3.6145,
+      "step": 8909
+    },
+    {
+      "epoch": 71.61,
+      "learning_rate": 9.872294022617125e-06,
+      "loss": 1.8041,
+      "step": 8910
+    },
+    {
+      "epoch": 71.62,
+      "learning_rate": 9.872277867528272e-06,
+      "loss": 1.5373,
+      "step": 8911
+    },
+    {
+      "epoch": 71.63,
+      "learning_rate": 9.872261712439419e-06,
+      "loss": 1.3917,
+      "step": 8912
+    },
+    {
+      "epoch": 71.64,
+      "learning_rate": 9.872245557350566e-06,
+      "loss": 1.4048,
+      "step": 8913
+    },
+    {
+      "epoch": 71.65,
+      "learning_rate": 9.872229402261714e-06,
+      "loss": 1.5666,
+      "step": 8914
+    },
+    {
+      "epoch": 71.65,
+      "learning_rate": 9.872213247172861e-06,
+      "loss": 1.5705,
+      "step": 8915
+    },
+    {
+      "epoch": 71.66,
+      "learning_rate": 9.872197092084006e-06,
+      "loss": 1.6069,
+      "step": 8916
+    },
+    {
+      "epoch": 71.67,
+      "learning_rate": 9.872180936995153e-06,
+      "loss": 1.5663,
+      "step": 8917
+    },
+    {
+      "epoch": 71.68,
+      "learning_rate": 9.872164781906302e-06,
+      "loss": 1.3925,
+      "step": 8918
+    },
+    {
+      "epoch": 71.69,
+      "learning_rate": 9.872148626817449e-06,
+      "loss": 1.2773,
+      "step": 8919
+    },
+    {
+      "epoch": 71.69,
+      "learning_rate": 9.872132471728595e-06,
+      "loss": 1.5319,
+      "step": 8920
+    },
+    {
+      "epoch": 71.7,
+      "learning_rate": 9.872116316639742e-06,
+      "loss": 1.4748,
+      "step": 8921
+    },
+    {
+      "epoch": 71.71,
+      "learning_rate": 9.872100161550889e-06,
+      "loss": 1.4809,
+      "step": 8922
+    },
+    {
+      "epoch": 71.72,
+      "learning_rate": 9.872084006462036e-06,
+      "loss": 1.285,
+      "step": 8923
+    },
+    {
+      "epoch": 71.73,
+      "learning_rate": 9.872067851373184e-06,
+      "loss": 1.3257,
+      "step": 8924
+    },
+    {
+      "epoch": 71.73,
+      "learning_rate": 9.872051696284331e-06,
+      "loss": 1.6072,
+      "step": 8925
+    },
+    {
+      "epoch": 71.74,
+      "learning_rate": 9.872035541195476e-06,
+      "loss": 1.3755,
+      "step": 8926
+    },
+    {
+      "epoch": 71.75,
+      "learning_rate": 9.872019386106625e-06,
+      "loss": 1.5515,
+      "step": 8927
+    },
+    {
+      "epoch": 71.76,
+      "learning_rate": 9.872003231017772e-06,
+      "loss": 1.8547,
+      "step": 8928
+    },
+    {
+      "epoch": 71.77,
+      "learning_rate": 9.871987075928918e-06,
+      "loss": 1.7236,
+      "step": 8929
+    },
+    {
+      "epoch": 71.77,
+      "learning_rate": 9.871970920840065e-06,
+      "loss": 1.939,
+      "step": 8930
+    },
+    {
+      "epoch": 71.78,
+      "learning_rate": 9.871954765751212e-06,
+      "loss": 1.864,
+      "step": 8931
+    },
+    {
+      "epoch": 71.79,
+      "learning_rate": 9.871938610662359e-06,
+      "loss": 1.8672,
+      "step": 8932
+    },
+    {
+      "epoch": 71.8,
+      "learning_rate": 9.871922455573506e-06,
+      "loss": 2.3148,
+      "step": 8933
+    },
+    {
+      "epoch": 71.81,
+      "learning_rate": 9.871906300484654e-06,
+      "loss": 3.0736,
+      "step": 8934
+    },
+    {
+      "epoch": 71.81,
+      "learning_rate": 9.871890145395801e-06,
+      "loss": 1.783,
+      "step": 8935
+    },
+    {
+      "epoch": 71.82,
+      "learning_rate": 9.871873990306948e-06,
+      "loss": 1.6798,
+      "step": 8936
+    },
+    {
+      "epoch": 71.83,
+      "learning_rate": 9.871857835218095e-06,
+      "loss": 1.6412,
+      "step": 8937
+    },
+    {
+      "epoch": 71.84,
+      "learning_rate": 9.871841680129242e-06,
+      "loss": 1.474,
+      "step": 8938
+    },
+    {
+      "epoch": 71.85,
+      "learning_rate": 9.871825525040388e-06,
+      "loss": 1.45,
+      "step": 8939
+    },
+    {
+      "epoch": 71.85,
+      "learning_rate": 9.871809369951535e-06,
+      "loss": 1.3193,
+      "step": 8940
+    },
+    {
+      "epoch": 71.86,
+      "learning_rate": 9.871793214862682e-06,
+      "loss": 1.5135,
+      "step": 8941
+    },
+    {
+      "epoch": 71.87,
+      "learning_rate": 9.871777059773829e-06,
+      "loss": 1.2765,
+      "step": 8942
+    },
+    {
+      "epoch": 71.88,
+      "learning_rate": 9.871760904684976e-06,
+      "loss": 1.4524,
+      "step": 8943
+    },
+    {
+      "epoch": 71.89,
+      "learning_rate": 9.871744749596124e-06,
+      "loss": 2.1673,
+      "step": 8944
+    },
+    {
+      "epoch": 71.9,
+      "learning_rate": 9.871728594507271e-06,
+      "loss": 1.2339,
+      "step": 8945
+    },
+    {
+      "epoch": 71.9,
+      "learning_rate": 9.871712439418418e-06,
+      "loss": 1.7509,
+      "step": 8946
+    },
+    {
+      "epoch": 71.91,
+      "learning_rate": 9.871696284329565e-06,
+      "loss": 1.7138,
+      "step": 8947
+    },
+    {
+      "epoch": 71.92,
+      "learning_rate": 9.871680129240712e-06,
+      "loss": 1.4647,
+      "step": 8948
+    },
+    {
+      "epoch": 71.93,
+      "learning_rate": 9.871663974151858e-06,
+      "loss": 1.7137,
+      "step": 8949
+    },
+    {
+      "epoch": 71.94,
+      "learning_rate": 9.871647819063005e-06,
+      "loss": 1.337,
+      "step": 8950
+    },
+    {
+      "epoch": 71.94,
+      "learning_rate": 9.871631663974152e-06,
+      "loss": 1.5527,
+      "step": 8951
+    },
+    {
+      "epoch": 71.95,
+      "learning_rate": 9.871615508885299e-06,
+      "loss": 1.8695,
+      "step": 8952
+    },
+    {
+      "epoch": 71.96,
+      "learning_rate": 9.871599353796447e-06,
+      "loss": 1.7975,
+      "step": 8953
+    },
+    {
+      "epoch": 71.97,
+      "learning_rate": 9.871583198707594e-06,
+      "loss": 1.6534,
+      "step": 8954
+    },
+    {
+      "epoch": 71.98,
+      "learning_rate": 9.871567043618741e-06,
+      "loss": 1.8484,
+      "step": 8955
+    },
+    {
+      "epoch": 71.98,
+      "learning_rate": 9.871550888529888e-06,
+      "loss": 2.1141,
+      "step": 8956
+    },
+    {
+      "epoch": 71.99,
+      "learning_rate": 9.871534733441035e-06,
+      "loss": 2.2151,
+      "step": 8957
+    },
+    {
+      "epoch": 72.0,
+      "learning_rate": 9.871518578352182e-06,
+      "loss": 3.2212,
+      "step": 8958
+    },
+    {
+      "epoch": 72.0,
+      "eval_loss": 1.2623388767242432,
+      "eval_runtime": 44.0571,
+      "eval_samples_per_second": 18.953,
+      "eval_steps_per_second": 0.613,
+      "eval_wer": 0.6824567855829349,
+      "step": 8958
     }
   ],
   "max_steps": 620000,
   "num_train_epochs": 5000,
+  "total_flos": 2.51807555223276e+19,
   "trial_name": null,
   "trial_params": null
 }

model-bin/finetune/base/{checkpoint-8212 → checkpoint-8958}/training_args.bin RENAMED Viewed

File without changes

model-bin/finetune/base/{checkpoint-8336/scaler.pt → log/1629481571.7415848/events.out.tfevents.1629481571.2977154bd390.32087.9} RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:162281c921fbe203093bbc2adae6f3b62e85331a06e7f509a629558a6a8662b9
-size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:67f17e14d8cf993f84d88b28619579c5abb3e0c20187e367c7928549f62e28a9
+size 4194

model-bin/finetune/base/{checkpoint-8336/rng_state.pth → log/events.out.tfevents.1629481571.2977154bd390.32087.8} RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ec13d36c08d3fcc58e321efac60e8451e506e89e6cacc44674409ea4dade1ec6
-size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:3ce1f4c04e01e6683904fb61a0dba575d640fb8538ce171444466011b00fa888
+size 24078