Upload 9 files

Browse files

Files changed (9) hide show

config.json +117 -0
optimizer.pt +3 -0
preprocessor_config.json +10 -0
pytorch_model.bin +3 -0
rng_state.pth +3 -0
scaler.pt +3 -0
scheduler.pt +3 -0
trainer_state.json +1621 -0
training_args.bin +3 -0

config.json ADDED Viewed

	@@ -0,0 +1,117 @@

+{
+  "_name_or_path": "facebook/wav2vec2-base",
+  "activation_dropout": 0.0,
+  "adapter_kernel_size": 3,
+  "adapter_stride": 2,
+  "add_adapter": false,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 256,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": false,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": false,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": false,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_norm": "group",
+  "feat_proj_dropout": 0.1,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "freeze_feat_extract_train": true,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.0,
+  "mask_channel_length": 10,
+  "mask_channel_min_space": 1,
+  "mask_channel_other": 0.0,
+  "mask_channel_prob": 0.0,
+  "mask_channel_selection": "static",
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_min_space": 1,
+  "mask_time_other": 0.0,
+  "mask_time_prob": 0.05,
+  "mask_time_selection": "static",
+  "model_type": "wav2vec2",
+  "no_mask_channel_overlap": false,
+  "no_mask_time_overlap": false,
+  "num_adapter_layers": 3,
+  "num_attention_heads": 12,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 12,
+  "num_negatives": 100,
+  "output_hidden_size": 768,
+  "pad_token_id": 28,
+  "proj_codevector_dim": 256,
+  "tdnn_dilation": [
+    1,
+    2,
+    3,
+    1,
+    1
+  ],
+  "tdnn_dim": [
+    512,
+    512,
+    512,
+    512,
+    1500
+  ],
+  "tdnn_kernel": [
+    5,
+    3,
+    3,
+    1,
+    1
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.17.0",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 32,
+  "xvector_output_dim": 512
+}

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c256927a27da68b67120eeac851a76d0db02662b13ad4196ecf4f84c05f4cfab
+size 29822559

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "processor_class": "Wav2Vec2Processor",
+  "return_attention_mask": false,
+  "sampling_rate": 16000
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:56f3248ca1580ac5c75f8a0c5c5e616d46d62fdc46e7dae73cacf92d5a7b26e9
+size 29980831

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7284e7f19df473c3a179ec4662bc6ad2aa5b3f879ac682f6858983a95d109e02
+size 14639

scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9e0bf33d9dd70901e017176dd7f4d53da792e70c44225c094c290b98be218cca
+size 557

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2ba6395ec13a8a096493a777284e644acdccdbe49def73c60b9ff333880e3ea8
+size 627

trainer_state.json ADDED Viewed

	@@ -0,0 +1,1621 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 29.98878923766816,
+  "global_step": 53500,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.28,
+      "learning_rate": 4.92e-05,
+      "loss": 3.6567,
+      "step": 500
+    },
+    {
+      "epoch": 0.28,
+      "eval_loss": 2.2588322162628174,
+      "eval_runtime": 172.2499,
+      "eval_samples_per_second": 15.21,
+      "eval_steps_per_second": 1.904,
+      "eval_wer": 1.006447808886184,
+      "step": 500
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 9.92e-05,
+      "loss": 0.5607,
+      "step": 1000
+    },
+    {
+      "epoch": 0.56,
+      "eval_loss": 0.9839454293251038,
+      "eval_runtime": 172.8549,
+      "eval_samples_per_second": 15.157,
+      "eval_steps_per_second": 1.898,
+      "eval_wer": 0.829142574558734,
+      "step": 1000
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 9.906321401370907e-05,
+      "loss": 0.2159,
+      "step": 1500
+    },
+    {
+      "epoch": 0.84,
+      "eval_loss": 0.720267653465271,
+      "eval_runtime": 172.1686,
+      "eval_samples_per_second": 15.218,
+      "eval_steps_per_second": 1.905,
+      "eval_wer": 0.8293137553256239,
+      "step": 1500
+    },
+    {
+      "epoch": 1.12,
+      "learning_rate": 9.811119573495812e-05,
+      "loss": 0.167,
+      "step": 2000
+    },
+    {
+      "epoch": 1.12,
+      "eval_loss": 0.2308063805103302,
+      "eval_runtime": 171.8565,
+      "eval_samples_per_second": 15.245,
+      "eval_steps_per_second": 1.909,
+      "eval_wer": 0.8286670724284845,
+      "step": 2000
+    },
+    {
+      "epoch": 1.4,
+      "learning_rate": 9.715917745620717e-05,
+      "loss": 0.1381,
+      "step": 2500
+    },
+    {
+      "epoch": 1.4,
+      "eval_loss": 0.1806459128856659,
+      "eval_runtime": 173.2886,
+      "eval_samples_per_second": 15.119,
+      "eval_steps_per_second": 1.893,
+      "eval_wer": 0.8606017954960439,
+      "step": 2500
+    },
+    {
+      "epoch": 1.68,
+      "learning_rate": 9.62071591774562e-05,
+      "loss": 0.1313,
+      "step": 3000
+    },
+    {
+      "epoch": 1.68,
+      "eval_loss": 0.20655015110969543,
+      "eval_runtime": 173.1734,
+      "eval_samples_per_second": 15.129,
+      "eval_steps_per_second": 1.894,
+      "eval_wer": 0.8578819233110164,
+      "step": 3000
+    },
+    {
+      "epoch": 1.96,
+      "learning_rate": 9.525514089870527e-05,
+      "loss": 0.125,
+      "step": 3500
+    },
+    {
+      "epoch": 1.96,
+      "eval_loss": 0.17935717105865479,
+      "eval_runtime": 172.7498,
+      "eval_samples_per_second": 15.166,
+      "eval_steps_per_second": 1.899,
+      "eval_wer": 0.8602213937918441,
+      "step": 3500
+    },
+    {
+      "epoch": 2.24,
+      "learning_rate": 9.43031226199543e-05,
+      "loss": 0.1044,
+      "step": 4000
+    },
+    {
+      "epoch": 2.24,
+      "eval_loss": 0.1682695746421814,
+      "eval_runtime": 172.1701,
+      "eval_samples_per_second": 15.218,
+      "eval_steps_per_second": 1.905,
+      "eval_wer": 0.8638352099817407,
+      "step": 4000
+    },
+    {
+      "epoch": 2.52,
+      "learning_rate": 9.335110434120336e-05,
+      "loss": 0.1017,
+      "step": 4500
+    },
+    {
+      "epoch": 2.52,
+      "eval_loss": 0.16941602528095245,
+      "eval_runtime": 173.2001,
+      "eval_samples_per_second": 15.127,
+      "eval_steps_per_second": 1.894,
+      "eval_wer": 0.8537735849056604,
+      "step": 4500
+    },
+    {
+      "epoch": 2.8,
+      "learning_rate": 9.23990860624524e-05,
+      "loss": 0.0991,
+      "step": 5000
+    },
+    {
+      "epoch": 2.8,
+      "eval_loss": 0.31116464734077454,
+      "eval_runtime": 174.2757,
+      "eval_samples_per_second": 15.034,
+      "eval_steps_per_second": 1.882,
+      "eval_wer": 0.8972344796104686,
+      "step": 5000
+    },
+    {
+      "epoch": 3.08,
+      "learning_rate": 9.144706778370146e-05,
+      "loss": 0.0944,
+      "step": 5500
+    },
+    {
+      "epoch": 3.08,
+      "eval_loss": 0.15802101790905,
+      "eval_runtime": 173.1104,
+      "eval_samples_per_second": 15.135,
+      "eval_steps_per_second": 1.895,
+      "eval_wer": 0.8589850882531954,
+      "step": 5500
+    },
+    {
+      "epoch": 3.36,
+      "learning_rate": 9.04950495049505e-05,
+      "loss": 0.0839,
+      "step": 6000
+    },
+    {
+      "epoch": 3.36,
+      "eval_loss": 0.14672406017780304,
+      "eval_runtime": 172.4692,
+      "eval_samples_per_second": 15.191,
+      "eval_steps_per_second": 1.902,
+      "eval_wer": 0.8793746195982958,
+      "step": 6000
+    },
+    {
+      "epoch": 3.64,
+      "learning_rate": 8.954303122619954e-05,
+      "loss": 0.0847,
+      "step": 6500
+    },
+    {
+      "epoch": 3.64,
+      "eval_loss": 0.1362634152173996,
+      "eval_runtime": 172.397,
+      "eval_samples_per_second": 15.197,
+      "eval_steps_per_second": 1.903,
+      "eval_wer": 0.8613055386488131,
+      "step": 6500
+    },
+    {
+      "epoch": 3.92,
+      "learning_rate": 8.85910129474486e-05,
+      "loss": 0.0839,
+      "step": 7000
+    },
+    {
+      "epoch": 3.92,
+      "eval_loss": 0.13779252767562866,
+      "eval_runtime": 173.1232,
+      "eval_samples_per_second": 15.134,
+      "eval_steps_per_second": 1.895,
+      "eval_wer": 0.8749809799147901,
+      "step": 7000
+    },
+    {
+      "epoch": 4.2,
+      "learning_rate": 8.763899466869764e-05,
+      "loss": 0.0756,
+      "step": 7500
+    },
+    {
+      "epoch": 4.2,
+      "eval_loss": 0.1471327692270279,
+      "eval_runtime": 173.0172,
+      "eval_samples_per_second": 15.143,
+      "eval_steps_per_second": 1.896,
+      "eval_wer": 0.857330340839927,
+      "step": 7500
+    },
+    {
+      "epoch": 4.48,
+      "learning_rate": 8.66869763899467e-05,
+      "loss": 0.0726,
+      "step": 8000
+    },
+    {
+      "epoch": 4.48,
+      "eval_loss": 0.14172284305095673,
+      "eval_runtime": 175.2167,
+      "eval_samples_per_second": 14.953,
+      "eval_steps_per_second": 1.872,
+      "eval_wer": 0.8881428788800974,
+      "step": 8000
+    },
+    {
+      "epoch": 4.76,
+      "learning_rate": 8.573495811119574e-05,
+      "loss": 0.0733,
+      "step": 8500
+    },
+    {
+      "epoch": 4.76,
+      "eval_loss": 0.14988631010055542,
+      "eval_runtime": 174.4611,
+      "eval_samples_per_second": 15.018,
+      "eval_steps_per_second": 1.88,
+      "eval_wer": 0.8689896530736457,
+      "step": 8500
+    },
+    {
+      "epoch": 5.04,
+      "learning_rate": 8.478293983244478e-05,
+      "loss": 0.0711,
+      "step": 9000
+    },
+    {
+      "epoch": 5.04,
+      "eval_loss": 0.2800207734107971,
+      "eval_runtime": 173.1977,
+      "eval_samples_per_second": 15.127,
+      "eval_steps_per_second": 1.894,
+      "eval_wer": 0.8613245587340231,
+      "step": 9000
+    },
+    {
+      "epoch": 5.33,
+      "learning_rate": 8.383092155369383e-05,
+      "loss": 0.0661,
+      "step": 9500
+    },
+    {
+      "epoch": 5.33,
+      "eval_loss": 0.1751021295785904,
+      "eval_runtime": 170.8086,
+      "eval_samples_per_second": 15.339,
+      "eval_steps_per_second": 1.92,
+      "eval_wer": 0.8714812842361533,
+      "step": 9500
+    },
+    {
+      "epoch": 5.61,
+      "learning_rate": 8.287890327494288e-05,
+      "loss": 0.0651,
+      "step": 10000
+    },
+    {
+      "epoch": 5.61,
+      "eval_loss": 0.15104886889457703,
+      "eval_runtime": 170.1342,
+      "eval_samples_per_second": 15.4,
+      "eval_steps_per_second": 1.928,
+      "eval_wer": 0.8766927875836884,
+      "step": 10000
+    },
+    {
+      "epoch": 5.89,
+      "learning_rate": 8.192878903274944e-05,
+      "loss": 0.0662,
+      "step": 10500
+    },
+    {
+      "epoch": 5.89,
+      "eval_loss": 0.13780978322029114,
+      "eval_runtime": 170.7672,
+      "eval_samples_per_second": 15.343,
+      "eval_steps_per_second": 1.921,
+      "eval_wer": 0.8781763542300669,
+      "step": 10500
+    },
+    {
+      "epoch": 6.17,
+      "learning_rate": 8.097677075399847e-05,
+      "loss": 0.0601,
+      "step": 11000
+    },
+    {
+      "epoch": 6.17,
+      "eval_loss": 0.15003788471221924,
+      "eval_runtime": 170.8745,
+      "eval_samples_per_second": 15.333,
+      "eval_steps_per_second": 1.92,
+      "eval_wer": 0.852099817407182,
+      "step": 11000
+    },
+    {
+      "epoch": 6.45,
+      "learning_rate": 8.002475247524754e-05,
+      "loss": 0.0599,
+      "step": 11500
+    },
+    {
+      "epoch": 6.45,
+      "eval_loss": 0.15895423293113708,
+      "eval_runtime": 171.3813,
+      "eval_samples_per_second": 15.288,
+      "eval_steps_per_second": 1.914,
+      "eval_wer": 0.8785947961046866,
+      "step": 11500
+    },
+    {
+      "epoch": 6.73,
+      "learning_rate": 7.907273419649657e-05,
+      "loss": 0.0592,
+      "step": 12000
+    },
+    {
+      "epoch": 6.73,
+      "eval_loss": 0.1461658626794815,
+      "eval_runtime": 170.9782,
+      "eval_samples_per_second": 15.324,
+      "eval_steps_per_second": 1.918,
+      "eval_wer": 0.8844910225197808,
+      "step": 12000
+    },
+    {
+      "epoch": 7.01,
+      "learning_rate": 7.812071591774562e-05,
+      "loss": 0.0605,
+      "step": 12500
+    },
+    {
+      "epoch": 7.01,
+      "eval_loss": 0.1626746654510498,
+      "eval_runtime": 171.4984,
+      "eval_samples_per_second": 15.277,
+      "eval_steps_per_second": 1.913,
+      "eval_wer": 0.8526513998782714,
+      "step": 12500
+    },
+    {
+      "epoch": 7.29,
+      "learning_rate": 7.716869763899467e-05,
+      "loss": 0.0522,
+      "step": 13000
+    },
+    {
+      "epoch": 7.29,
+      "eval_loss": 0.13948819041252136,
+      "eval_runtime": 172.0496,
+      "eval_samples_per_second": 15.228,
+      "eval_steps_per_second": 1.906,
+      "eval_wer": 0.8781002738892271,
+      "step": 13000
+    },
+    {
+      "epoch": 7.57,
+      "learning_rate": 7.621667936024372e-05,
+      "loss": 0.0545,
+      "step": 13500
+    },
+    {
+      "epoch": 7.57,
+      "eval_loss": 0.17240145802497864,
+      "eval_runtime": 172.0023,
+      "eval_samples_per_second": 15.232,
+      "eval_steps_per_second": 1.907,
+      "eval_wer": 0.8662127206329885,
+      "step": 13500
+    },
+    {
+      "epoch": 7.85,
+      "learning_rate": 7.526466108149277e-05,
+      "loss": 0.0557,
+      "step": 14000
+    },
+    {
+      "epoch": 7.85,
+      "eval_loss": 0.15961869060993195,
+      "eval_runtime": 172.3758,
+      "eval_samples_per_second": 15.199,
+      "eval_steps_per_second": 1.903,
+      "eval_wer": 0.8705873402312843,
+      "step": 14000
+    },
+    {
+      "epoch": 8.13,
+      "learning_rate": 7.431264280274181e-05,
+      "loss": 0.0532,
+      "step": 14500
+    },
+    {
+      "epoch": 8.13,
+      "eval_loss": 0.2017827332019806,
+      "eval_runtime": 172.5156,
+      "eval_samples_per_second": 15.187,
+      "eval_steps_per_second": 1.901,
+      "eval_wer": 0.8924604382227632,
+      "step": 14500
+    },
+    {
+      "epoch": 8.41,
+      "learning_rate": 7.336062452399086e-05,
+      "loss": 0.0495,
+      "step": 15000
+    },
+    {
+      "epoch": 8.41,
+      "eval_loss": 0.16683323681354523,
+      "eval_runtime": 170.6381,
+      "eval_samples_per_second": 15.354,
+      "eval_steps_per_second": 1.922,
+      "eval_wer": 0.8496462264150944,
+      "step": 15000
+    },
+    {
+      "epoch": 8.69,
+      "learning_rate": 7.241051028179741e-05,
+      "loss": 0.0496,
+      "step": 15500
+    },
+    {
+      "epoch": 8.69,
+      "eval_loss": 0.1456364542245865,
+      "eval_runtime": 171.0658,
+      "eval_samples_per_second": 15.316,
+      "eval_steps_per_second": 1.917,
+      "eval_wer": 0.8635499087035909,
+      "step": 15500
+    },
+    {
+      "epoch": 8.97,
+      "learning_rate": 7.145849200304646e-05,
+      "loss": 0.0503,
+      "step": 16000
+    },
+    {
+      "epoch": 8.97,
+      "eval_loss": 0.14933466911315918,
+      "eval_runtime": 171.7717,
+      "eval_samples_per_second": 15.253,
+      "eval_steps_per_second": 1.91,
+      "eval_wer": 0.887572276323798,
+      "step": 16000
+    },
+    {
+      "epoch": 9.25,
+      "learning_rate": 7.05064737242955e-05,
+      "loss": 0.0454,
+      "step": 16500
+    },
+    {
+      "epoch": 9.25,
+      "eval_loss": 0.16774588823318481,
+      "eval_runtime": 172.0824,
+      "eval_samples_per_second": 15.225,
+      "eval_steps_per_second": 1.906,
+      "eval_wer": 0.8762553256238588,
+      "step": 16500
+    },
+    {
+      "epoch": 9.53,
+      "learning_rate": 6.955445544554455e-05,
+      "loss": 0.046,
+      "step": 17000
+    },
+    {
+      "epoch": 9.53,
+      "eval_loss": 0.15530605614185333,
+      "eval_runtime": 172.6241,
+      "eval_samples_per_second": 15.177,
+      "eval_steps_per_second": 1.9,
+      "eval_wer": 0.8600311929397444,
+      "step": 17000
+    },
+    {
+      "epoch": 9.81,
+      "learning_rate": 6.860243716679361e-05,
+      "loss": 0.0459,
+      "step": 17500
+    },
+    {
+      "epoch": 9.81,
+      "eval_loss": 0.16235464811325073,
+      "eval_runtime": 172.8904,
+      "eval_samples_per_second": 15.154,
+      "eval_steps_per_second": 1.897,
+      "eval_wer": 0.8851567255021302,
+      "step": 17500
+    },
+    {
+      "epoch": 10.09,
+      "learning_rate": 6.765041888804265e-05,
+      "loss": 0.0449,
+      "step": 18000
+    },
+    {
+      "epoch": 10.09,
+      "eval_loss": 0.17912352085113525,
+      "eval_runtime": 172.0805,
+      "eval_samples_per_second": 15.225,
+      "eval_steps_per_second": 1.906,
+      "eval_wer": 0.847915398660986,
+      "step": 18000
+    },
+    {
+      "epoch": 10.37,
+      "learning_rate": 6.66984006092917e-05,
+      "loss": 0.0415,
+      "step": 18500
+    },
+    {
+      "epoch": 10.37,
+      "eval_loss": 0.1881452053785324,
+      "eval_runtime": 172.0219,
+      "eval_samples_per_second": 15.231,
+      "eval_steps_per_second": 1.907,
+      "eval_wer": 0.8846051430310408,
+      "step": 18500
+    },
+    {
+      "epoch": 10.65,
+      "learning_rate": 6.574638233054075e-05,
+      "loss": 0.0416,
+      "step": 19000
+    },
+    {
+      "epoch": 10.65,
+      "eval_loss": 0.17328748106956482,
+      "eval_runtime": 172.4725,
+      "eval_samples_per_second": 15.191,
+      "eval_steps_per_second": 1.902,
+      "eval_wer": 0.8776057516737675,
+      "step": 19000
+    },
+    {
+      "epoch": 10.93,
+      "learning_rate": 6.47943640517898e-05,
+      "loss": 0.0431,
+      "step": 19500
+    },
+    {
+      "epoch": 10.93,
+      "eval_loss": 0.18211907148361206,
+      "eval_runtime": 172.9146,
+      "eval_samples_per_second": 15.152,
+      "eval_steps_per_second": 1.897,
+      "eval_wer": 0.8507874315276932,
+      "step": 19500
+    },
+    {
+      "epoch": 11.21,
+      "learning_rate": 6.384424980959634e-05,
+      "loss": 0.0406,
+      "step": 20000
+    },
+    {
+      "epoch": 11.21,
+      "eval_loss": 0.18406778573989868,
+      "eval_runtime": 173.76,
+      "eval_samples_per_second": 15.078,
+      "eval_steps_per_second": 1.888,
+      "eval_wer": 0.8517384357881923,
+      "step": 20000
+    },
+    {
+      "epoch": 11.49,
+      "learning_rate": 6.28941355674029e-05,
+      "loss": 0.0397,
+      "step": 20500
+    },
+    {
+      "epoch": 11.49,
+      "eval_loss": 0.20063810050487518,
+      "eval_runtime": 172.4336,
+      "eval_samples_per_second": 15.194,
+      "eval_steps_per_second": 1.902,
+      "eval_wer": 0.872850730371272,
+      "step": 20500
+    },
+    {
+      "epoch": 11.77,
+      "learning_rate": 6.194402132520945e-05,
+      "loss": 0.0398,
+      "step": 21000
+    },
+    {
+      "epoch": 11.77,
+      "eval_loss": 0.1665649265050888,
+      "eval_runtime": 170.9877,
+      "eval_samples_per_second": 15.323,
+      "eval_steps_per_second": 1.918,
+      "eval_wer": 0.8569309190505173,
+      "step": 21000
+    },
+    {
+      "epoch": 12.05,
+      "learning_rate": 6.099200304645849e-05,
+      "loss": 0.0407,
+      "step": 21500
+    },
+    {
+      "epoch": 12.05,
+      "eval_loss": 0.18828719854354858,
+      "eval_runtime": 172.0882,
+      "eval_samples_per_second": 15.225,
+      "eval_steps_per_second": 1.906,
+      "eval_wer": 0.8598600121728546,
+      "step": 21500
+    },
+    {
+      "epoch": 12.33,
+      "learning_rate": 6.003998476770754e-05,
+      "loss": 0.037,
+      "step": 22000
+    },
+    {
+      "epoch": 12.33,
+      "eval_loss": 0.16707730293273926,
+      "eval_runtime": 172.8578,
+      "eval_samples_per_second": 15.157,
+      "eval_steps_per_second": 1.898,
+      "eval_wer": 0.8588139074863055,
+      "step": 22000
+    },
+    {
+      "epoch": 12.61,
+      "learning_rate": 5.908987052551409e-05,
+      "loss": 0.0375,
+      "step": 22500
+    },
+    {
+      "epoch": 12.61,
+      "eval_loss": 0.17921198904514313,
+      "eval_runtime": 173.3898,
+      "eval_samples_per_second": 15.11,
+      "eval_steps_per_second": 1.892,
+      "eval_wer": 0.8597458916615947,
+      "step": 22500
+    },
+    {
+      "epoch": 12.89,
+      "learning_rate": 5.8137852246763134e-05,
+      "loss": 0.037,
+      "step": 23000
+    },
+    {
+      "epoch": 12.89,
+      "eval_loss": 0.18186964094638824,
+      "eval_runtime": 173.9272,
+      "eval_samples_per_second": 15.064,
+      "eval_steps_per_second": 1.886,
+      "eval_wer": 0.8751141205112599,
+      "step": 23000
+    },
+    {
+      "epoch": 13.17,
+      "learning_rate": 5.718583396801219e-05,
+      "loss": 0.0367,
+      "step": 23500
+    },
+    {
+      "epoch": 13.17,
+      "eval_loss": 0.22593411803245544,
+      "eval_runtime": 173.0314,
+      "eval_samples_per_second": 15.142,
+      "eval_steps_per_second": 1.896,
+      "eval_wer": 0.8539828058429701,
+      "step": 23500
+    },
+    {
+      "epoch": 13.45,
+      "learning_rate": 5.623381568926124e-05,
+      "loss": 0.0355,
+      "step": 24000
+    },
+    {
+      "epoch": 13.45,
+      "eval_loss": 0.19105392694473267,
+      "eval_runtime": 172.4407,
+      "eval_samples_per_second": 15.194,
+      "eval_steps_per_second": 1.902,
+      "eval_wer": 0.873915855143031,
+      "step": 24000
+    },
+    {
+      "epoch": 13.73,
+      "learning_rate": 5.5281797410510284e-05,
+      "loss": 0.0344,
+      "step": 24500
+    },
+    {
+      "epoch": 13.73,
+      "eval_loss": 0.31946560740470886,
+      "eval_runtime": 172.356,
+      "eval_samples_per_second": 15.201,
+      "eval_steps_per_second": 1.903,
+      "eval_wer": 0.8714812842361533,
+      "step": 24500
+    },
+    {
+      "epoch": 14.01,
+      "learning_rate": 5.432977913175933e-05,
+      "loss": 0.0354,
+      "step": 25000
+    },
+    {
+      "epoch": 14.01,
+      "eval_loss": 0.23475807905197144,
+      "eval_runtime": 173.688,
+      "eval_samples_per_second": 15.085,
+      "eval_steps_per_second": 1.888,
+      "eval_wer": 0.8856892878880097,
+      "step": 25000
+    },
+    {
+      "epoch": 14.29,
+      "learning_rate": 5.3377760853008385e-05,
+      "loss": 0.0327,
+      "step": 25500
+    },
+    {
+      "epoch": 14.29,
+      "eval_loss": 0.1936648041009903,
+      "eval_runtime": 173.1214,
+      "eval_samples_per_second": 15.134,
+      "eval_steps_per_second": 1.895,
+      "eval_wer": 0.8734974132684115,
+      "step": 25500
+    },
+    {
+      "epoch": 14.57,
+      "learning_rate": 5.242574257425743e-05,
+      "loss": 0.0318,
+      "step": 26000
+    },
+    {
+      "epoch": 14.57,
+      "eval_loss": 0.264340341091156,
+      "eval_runtime": 172.855,
+      "eval_samples_per_second": 15.157,
+      "eval_steps_per_second": 1.898,
+      "eval_wer": 0.8679055082166768,
+      "step": 26000
+    },
+    {
+      "epoch": 14.85,
+      "learning_rate": 5.147372429550648e-05,
+      "loss": 0.032,
+      "step": 26500
+    },
+    {
+      "epoch": 14.85,
+      "eval_loss": 0.39989423751831055,
+      "eval_runtime": 173.1827,
+      "eval_samples_per_second": 15.129,
+      "eval_steps_per_second": 1.894,
+      "eval_wer": 0.8897025258673159,
+      "step": 26500
+    },
+    {
+      "epoch": 15.13,
+      "learning_rate": 5.052170601675552e-05,
+      "loss": 0.0318,
+      "step": 27000
+    },
+    {
+      "epoch": 15.13,
+      "eval_loss": 0.17986007034778595,
+      "eval_runtime": 172.2454,
+      "eval_samples_per_second": 15.211,
+      "eval_steps_per_second": 1.904,
+      "eval_wer": 0.8881618989653074,
+      "step": 27000
+    },
+    {
+      "epoch": 15.41,
+      "learning_rate": 4.956968773800457e-05,
+      "loss": 0.0313,
+      "step": 27500
+    },
+    {
+      "epoch": 15.41,
+      "eval_loss": 0.198421448469162,
+      "eval_runtime": 172.7438,
+      "eval_samples_per_second": 15.167,
+      "eval_steps_per_second": 1.899,
+      "eval_wer": 0.8861647900182593,
+      "step": 27500
+    },
+    {
+      "epoch": 15.7,
+      "learning_rate": 4.861957349581112e-05,
+      "loss": 0.0307,
+      "step": 28000
+    },
+    {
+      "epoch": 15.7,
+      "eval_loss": 0.20344625413417816,
+      "eval_runtime": 173.6375,
+      "eval_samples_per_second": 15.089,
+      "eval_steps_per_second": 1.889,
+      "eval_wer": 0.8731550517346318,
+      "step": 28000
+    },
+    {
+      "epoch": 15.98,
+      "learning_rate": 4.766755521706017e-05,
+      "loss": 0.0302,
+      "step": 28500
+    },
+    {
+      "epoch": 15.98,
+      "eval_loss": 0.17505203187465668,
+      "eval_runtime": 173.3071,
+      "eval_samples_per_second": 15.118,
+      "eval_steps_per_second": 1.893,
+      "eval_wer": 0.8726224893487523,
+      "step": 28500
+    },
+    {
+      "epoch": 16.26,
+      "learning_rate": 4.671553693830922e-05,
+      "loss": 0.0293,
+      "step": 29000
+    },
+    {
+      "epoch": 16.26,
+      "eval_loss": 0.2021918147802353,
+      "eval_runtime": 173.0402,
+      "eval_samples_per_second": 15.141,
+      "eval_steps_per_second": 1.896,
+      "eval_wer": 0.8536404443091905,
+      "step": 29000
+    },
+    {
+      "epoch": 16.54,
+      "learning_rate": 4.576351865955826e-05,
+      "loss": 0.0284,
+      "step": 29500
+    },
+    {
+      "epoch": 16.54,
+      "eval_loss": 0.1741979867219925,
+      "eval_runtime": 173.6754,
+      "eval_samples_per_second": 15.086,
+      "eval_steps_per_second": 1.889,
+      "eval_wer": 0.8673158855751674,
+      "step": 29500
+    },
+    {
+      "epoch": 16.82,
+      "learning_rate": 4.4811500380807313e-05,
+      "loss": 0.0293,
+      "step": 30000
+    },
+    {
+      "epoch": 16.82,
+      "eval_loss": 0.24190114438533783,
+      "eval_runtime": 172.7419,
+      "eval_samples_per_second": 15.167,
+      "eval_steps_per_second": 1.899,
+      "eval_wer": 0.88540398660986,
+      "step": 30000
+    },
+    {
+      "epoch": 17.1,
+      "learning_rate": 4.385948210205636e-05,
+      "loss": 0.027,
+      "step": 30500
+    },
+    {
+      "epoch": 17.1,
+      "eval_loss": 0.2092837691307068,
+      "eval_runtime": 172.4386,
+      "eval_samples_per_second": 15.194,
+      "eval_steps_per_second": 1.902,
+      "eval_wer": 0.8659274193548387,
+      "step": 30500
+    },
+    {
+      "epoch": 17.38,
+      "learning_rate": 4.290746382330541e-05,
+      "loss": 0.0276,
+      "step": 31000
+    },
+    {
+      "epoch": 17.38,
+      "eval_loss": 0.18375042080879211,
+      "eval_runtime": 172.5864,
+      "eval_samples_per_second": 15.181,
+      "eval_steps_per_second": 1.9,
+      "eval_wer": 0.872945830797322,
+      "step": 31000
+    },
+    {
+      "epoch": 17.66,
+      "learning_rate": 4.195544554455446e-05,
+      "loss": 0.026,
+      "step": 31500
+    },
+    {
+      "epoch": 17.66,
+      "eval_loss": 0.18148663640022278,
+      "eval_runtime": 173.4358,
+      "eval_samples_per_second": 15.106,
+      "eval_steps_per_second": 1.891,
+      "eval_wer": 0.8676392270237371,
+      "step": 31500
+    },
+    {
+      "epoch": 17.94,
+      "learning_rate": 4.100342726580351e-05,
+      "loss": 0.0278,
+      "step": 32000
+    },
+    {
+      "epoch": 17.94,
+      "eval_loss": 0.18632376194000244,
+      "eval_runtime": 172.755,
+      "eval_samples_per_second": 15.166,
+      "eval_steps_per_second": 1.899,
+      "eval_wer": 0.8682098295800366,
+      "step": 32000
+    },
+    {
+      "epoch": 18.22,
+      "learning_rate": 4.005140898705255e-05,
+      "loss": 0.0257,
+      "step": 32500
+    },
+    {
+      "epoch": 18.22,
+      "eval_loss": 0.18216948211193085,
+      "eval_runtime": 172.6935,
+      "eval_samples_per_second": 15.171,
+      "eval_steps_per_second": 1.899,
+      "eval_wer": 0.8683429701765064,
+      "step": 32500
+    },
+    {
+      "epoch": 18.5,
+      "learning_rate": 3.90993907083016e-05,
+      "loss": 0.0257,
+      "step": 33000
+    },
+    {
+      "epoch": 18.5,
+      "eval_loss": 0.19133740663528442,
+      "eval_runtime": 171.6481,
+      "eval_samples_per_second": 15.264,
+      "eval_steps_per_second": 1.911,
+      "eval_wer": 0.8630744065733414,
+      "step": 33000
+    },
+    {
+      "epoch": 18.78,
+      "learning_rate": 3.814737242955065e-05,
+      "loss": 0.0252,
+      "step": 33500
+    },
+    {
+      "epoch": 18.78,
+      "eval_loss": 0.174552783370018,
+      "eval_runtime": 172.18,
+      "eval_samples_per_second": 15.217,
+      "eval_steps_per_second": 1.905,
+      "eval_wer": 0.8786708764455264,
+      "step": 33500
+    },
+    {
+      "epoch": 19.06,
+      "learning_rate": 3.71953541507997e-05,
+      "loss": 0.0244,
+      "step": 34000
+    },
+    {
+      "epoch": 19.06,
+      "eval_loss": 0.1861806958913803,
+      "eval_runtime": 173.107,
+      "eval_samples_per_second": 15.135,
+      "eval_steps_per_second": 1.895,
+      "eval_wer": 0.8616288800973828,
+      "step": 34000
+    },
+    {
+      "epoch": 19.34,
+      "learning_rate": 3.624904798172125e-05,
+      "loss": 0.0239,
+      "step": 34500
+    },
+    {
+      "epoch": 19.34,
+      "eval_loss": 0.19879654049873352,
+      "eval_runtime": 173.2557,
+      "eval_samples_per_second": 15.122,
+      "eval_steps_per_second": 1.893,
+      "eval_wer": 0.8602404138770542,
+      "step": 34500
+    },
+    {
+      "epoch": 19.62,
+      "learning_rate": 3.52970297029703e-05,
+      "loss": 0.0243,
+      "step": 35000
+    },
+    {
+      "epoch": 19.62,
+      "eval_loss": 0.19157561659812927,
+      "eval_runtime": 173.3754,
+      "eval_samples_per_second": 15.112,
+      "eval_steps_per_second": 1.892,
+      "eval_wer": 0.8565885575167377,
+      "step": 35000
+    },
+    {
+      "epoch": 19.9,
+      "learning_rate": 3.434501142421935e-05,
+      "loss": 0.0242,
+      "step": 35500
+    },
+    {
+      "epoch": 19.9,
+      "eval_loss": 0.21290895342826843,
+      "eval_runtime": 173.7119,
+      "eval_samples_per_second": 15.082,
+      "eval_steps_per_second": 1.888,
+      "eval_wer": 0.8637781497261108,
+      "step": 35500
+    },
+    {
+      "epoch": 20.18,
+      "learning_rate": 3.339299314546839e-05,
+      "loss": 0.0242,
+      "step": 36000
+    },
+    {
+      "epoch": 20.18,
+      "eval_loss": 0.1832270473241806,
+      "eval_runtime": 172.9999,
+      "eval_samples_per_second": 15.145,
+      "eval_steps_per_second": 1.896,
+      "eval_wer": 0.8728126902008521,
+      "step": 36000
+    },
+    {
+      "epoch": 20.46,
+      "learning_rate": 3.244097486671744e-05,
+      "loss": 0.0223,
+      "step": 36500
+    },
+    {
+      "epoch": 20.46,
+      "eval_loss": 0.16877047717571259,
+      "eval_runtime": 171.9283,
+      "eval_samples_per_second": 15.239,
+      "eval_steps_per_second": 1.908,
+      "eval_wer": 0.8582433049300061,
+      "step": 36500
+    },
+    {
+      "epoch": 20.74,
+      "learning_rate": 3.1488956587966486e-05,
+      "loss": 0.023,
+      "step": 37000
+    },
+    {
+      "epoch": 20.74,
+      "eval_loss": 0.19964033365249634,
+      "eval_runtime": 173.6406,
+      "eval_samples_per_second": 15.089,
+      "eval_steps_per_second": 1.889,
+      "eval_wer": 0.8681147291539866,
+      "step": 37000
+    },
+    {
+      "epoch": 21.02,
+      "learning_rate": 3.053693830921554e-05,
+      "loss": 0.0229,
+      "step": 37500
+    },
+    {
+      "epoch": 21.02,
+      "eval_loss": 0.2140882909297943,
+      "eval_runtime": 173.5521,
+      "eval_samples_per_second": 15.096,
+      "eval_steps_per_second": 1.89,
+      "eval_wer": 0.8751141205112599,
+      "step": 37500
+    },
+    {
+      "epoch": 21.3,
+      "learning_rate": 2.9584920030464587e-05,
+      "loss": 0.0217,
+      "step": 38000
+    },
+    {
+      "epoch": 21.3,
+      "eval_loss": 0.21021434664726257,
+      "eval_runtime": 172.4762,
+      "eval_samples_per_second": 15.191,
+      "eval_steps_per_second": 1.902,
+      "eval_wer": 0.8711199026171638,
+      "step": 38000
+    },
+    {
+      "epoch": 21.58,
+      "learning_rate": 2.8632901751713637e-05,
+      "loss": 0.0211,
+      "step": 38500
+    },
+    {
+      "epoch": 21.58,
+      "eval_loss": 0.2082085758447647,
+      "eval_runtime": 173.3781,
+      "eval_samples_per_second": 15.111,
+      "eval_steps_per_second": 1.892,
+      "eval_wer": 0.8795458003651856,
+      "step": 38500
+    },
+    {
+      "epoch": 21.86,
+      "learning_rate": 2.7682787509520187e-05,
+      "loss": 0.0216,
+      "step": 39000
+    },
+    {
+      "epoch": 21.86,
+      "eval_loss": 0.19715508818626404,
+      "eval_runtime": 172.5766,
+      "eval_samples_per_second": 15.182,
+      "eval_steps_per_second": 1.901,
+      "eval_wer": 0.8637020693852708,
+      "step": 39000
+    },
+    {
+      "epoch": 22.14,
+      "learning_rate": 2.673076923076923e-05,
+      "loss": 0.0213,
+      "step": 39500
+    },
+    {
+      "epoch": 22.14,
+      "eval_loss": 0.21034926176071167,
+      "eval_runtime": 173.6164,
+      "eval_samples_per_second": 15.091,
+      "eval_steps_per_second": 1.889,
+      "eval_wer": 0.8720899269628728,
+      "step": 39500
+    },
+    {
+      "epoch": 22.42,
+      "learning_rate": 2.577875095201828e-05,
+      "loss": 0.0201,
+      "step": 40000
+    },
+    {
+      "epoch": 22.42,
+      "eval_loss": 0.21576687693595886,
+      "eval_runtime": 173.7131,
+      "eval_samples_per_second": 15.082,
+      "eval_steps_per_second": 1.888,
+      "eval_wer": 0.8763884662203286,
+      "step": 40000
+    },
+    {
+      "epoch": 22.7,
+      "learning_rate": 2.4826732673267328e-05,
+      "loss": 0.0206,
+      "step": 40500
+    },
+    {
+      "epoch": 22.7,
+      "eval_loss": 0.21420465409755707,
+      "eval_runtime": 172.3252,
+      "eval_samples_per_second": 15.204,
+      "eval_steps_per_second": 1.903,
+      "eval_wer": 0.8615908399269628,
+      "step": 40500
+    },
+    {
+      "epoch": 22.98,
+      "learning_rate": 2.3874714394516375e-05,
+      "loss": 0.02,
+      "step": 41000
+    },
+    {
+      "epoch": 22.98,
+      "eval_loss": 0.21698887646198273,
+      "eval_runtime": 175.0748,
+      "eval_samples_per_second": 14.965,
+      "eval_steps_per_second": 1.873,
+      "eval_wer": 0.8692939744370055,
+      "step": 41000
+    },
+    {
+      "epoch": 23.26,
+      "learning_rate": 2.2922696115765425e-05,
+      "loss": 0.0199,
+      "step": 41500
+    },
+    {
+      "epoch": 23.26,
+      "eval_loss": 0.19081184267997742,
+      "eval_runtime": 174.2525,
+      "eval_samples_per_second": 15.036,
+      "eval_steps_per_second": 1.882,
+      "eval_wer": 0.8776247717589775,
+      "step": 41500
+    },
+    {
+      "epoch": 23.54,
+      "learning_rate": 2.1970677837014472e-05,
+      "loss": 0.0197,
+      "step": 42000
+    },
+    {
+      "epoch": 23.54,
+      "eval_loss": 0.22879697382450104,
+      "eval_runtime": 173.0989,
+      "eval_samples_per_second": 15.136,
+      "eval_steps_per_second": 1.895,
+      "eval_wer": 0.8709867620206938,
+      "step": 42000
+    },
+    {
+      "epoch": 23.82,
+      "learning_rate": 2.101865955826352e-05,
+      "loss": 0.0191,
+      "step": 42500
+    },
+    {
+      "epoch": 23.82,
+      "eval_loss": 0.20562587678432465,
+      "eval_runtime": 172.5196,
+      "eval_samples_per_second": 15.187,
+      "eval_steps_per_second": 1.901,
+      "eval_wer": 0.8727366098600122,
+      "step": 42500
+    },
+    {
+      "epoch": 24.1,
+      "learning_rate": 2.006664127951257e-05,
+      "loss": 0.0186,
+      "step": 43000
+    },
+    {
+      "epoch": 24.1,
+      "eval_loss": 0.23561741411685944,
+      "eval_runtime": 173.2932,
+      "eval_samples_per_second": 15.119,
+      "eval_steps_per_second": 1.893,
+      "eval_wer": 0.8775867315885575,
+      "step": 43000
+    },
+    {
+      "epoch": 24.38,
+      "learning_rate": 1.911652703731912e-05,
+      "loss": 0.0185,
+      "step": 43500
+    },
+    {
+      "epoch": 24.38,
+      "eval_loss": 0.25951194763183594,
+      "eval_runtime": 173.3272,
+      "eval_samples_per_second": 15.116,
+      "eval_steps_per_second": 1.892,
+      "eval_wer": 0.8748858794887401,
+      "step": 43500
+    },
+    {
+      "epoch": 24.66,
+      "learning_rate": 1.8166412795125666e-05,
+      "loss": 0.0185,
+      "step": 44000
+    },
+    {
+      "epoch": 24.66,
+      "eval_loss": 0.2548380196094513,
+      "eval_runtime": 172.782,
+      "eval_samples_per_second": 15.164,
+      "eval_steps_per_second": 1.898,
+      "eval_wer": 0.8635499087035909,
+      "step": 44000
+    },
+    {
+      "epoch": 24.94,
+      "learning_rate": 1.7214394516374716e-05,
+      "loss": 0.0183,
+      "step": 44500
+    },
+    {
+      "epoch": 24.94,
+      "eval_loss": 0.20978882908821106,
+      "eval_runtime": 173.1802,
+      "eval_samples_per_second": 15.129,
+      "eval_steps_per_second": 1.894,
+      "eval_wer": 0.8623516433353622,
+      "step": 44500
+    },
+    {
+      "epoch": 25.22,
+      "learning_rate": 1.6264280274181266e-05,
+      "loss": 0.0175,
+      "step": 45000
+    },
+    {
+      "epoch": 25.22,
+      "eval_loss": 0.1987256407737732,
+      "eval_runtime": 172.2969,
+      "eval_samples_per_second": 15.206,
+      "eval_steps_per_second": 1.904,
+      "eval_wer": 0.8696933962264151,
+      "step": 45000
+    },
+    {
+      "epoch": 25.5,
+      "learning_rate": 1.5312261995430313e-05,
+      "loss": 0.0175,
+      "step": 45500
+    },
+    {
+      "epoch": 25.5,
+      "eval_loss": 0.19228355586528778,
+      "eval_runtime": 173.0272,
+      "eval_samples_per_second": 15.142,
+      "eval_steps_per_second": 1.896,
+      "eval_wer": 0.8653758368837492,
+      "step": 45500
+    },
+    {
+      "epoch": 25.78,
+      "learning_rate": 1.4360243716679362e-05,
+      "loss": 0.0171,
+      "step": 46000
+    },
+    {
+      "epoch": 25.78,
+      "eval_loss": 0.18031327426433563,
+      "eval_runtime": 173.6134,
+      "eval_samples_per_second": 15.091,
+      "eval_steps_per_second": 1.889,
+      "eval_wer": 0.8679625684723068,
+      "step": 46000
+    },
+    {
+      "epoch": 26.07,
+      "learning_rate": 1.3408225437928409e-05,
+      "loss": 0.0167,
+      "step": 46500
+    },
+    {
+      "epoch": 26.07,
+      "eval_loss": 0.18257634341716766,
+      "eval_runtime": 173.628,
+      "eval_samples_per_second": 15.09,
+      "eval_steps_per_second": 1.889,
+      "eval_wer": 0.8620853621424224,
+      "step": 46500
+    },
+    {
+      "epoch": 26.35,
+      "learning_rate": 1.2456207159177456e-05,
+      "loss": 0.016,
+      "step": 47000
+    },
+    {
+      "epoch": 26.35,
+      "eval_loss": 0.18541069328784943,
+      "eval_runtime": 172.5876,
+      "eval_samples_per_second": 15.181,
+      "eval_steps_per_second": 1.9,
+      "eval_wer": 0.8629412659768716,
+      "step": 47000
+    },
+    {
+      "epoch": 26.63,
+      "learning_rate": 1.1504188880426504e-05,
+      "loss": 0.0162,
+      "step": 47500
+    },
+    {
+      "epoch": 26.63,
+      "eval_loss": 0.1826283484697342,
+      "eval_runtime": 173.6818,
+      "eval_samples_per_second": 15.085,
+      "eval_steps_per_second": 1.889,
+      "eval_wer": 0.8728126902008521,
+      "step": 47500
+    },
+    {
+      "epoch": 26.91,
+      "learning_rate": 1.0552170601675553e-05,
+      "loss": 0.0159,
+      "step": 48000
+    },
+    {
+      "epoch": 26.91,
+      "eval_loss": 0.18218345940113068,
+      "eval_runtime": 174.9608,
+      "eval_samples_per_second": 14.975,
+      "eval_steps_per_second": 1.875,
+      "eval_wer": 0.8637401095556908,
+      "step": 48000
+    },
+    {
+      "epoch": 27.19,
+      "learning_rate": 9.600152322924601e-06,
+      "loss": 0.0159,
+      "step": 48500
+    },
+    {
+      "epoch": 27.19,
+      "eval_loss": 0.19467805325984955,
+      "eval_runtime": 173.9602,
+      "eval_samples_per_second": 15.061,
+      "eval_steps_per_second": 1.885,
+      "eval_wer": 0.8611723980523432,
+      "step": 48500
+    },
+    {
+      "epoch": 27.47,
+      "learning_rate": 8.648134044173648e-06,
+      "loss": 0.0159,
+      "step": 49000
+    },
+    {
+      "epoch": 27.47,
+      "eval_loss": 0.19071811437606812,
+      "eval_runtime": 173.4216,
+      "eval_samples_per_second": 15.108,
+      "eval_steps_per_second": 1.891,
+      "eval_wer": 0.8624087035909921,
+      "step": 49000
+    },
+    {
+      "epoch": 27.75,
+      "learning_rate": 7.696115765422697e-06,
+      "loss": 0.0152,
+      "step": 49500
+    },
+    {
+      "epoch": 27.75,
+      "eval_loss": 0.19280757009983063,
+      "eval_runtime": 173.1959,
+      "eval_samples_per_second": 15.127,
+      "eval_steps_per_second": 1.894,
+      "eval_wer": 0.8612484783931832,
+      "step": 49500
+    },
+    {
+      "epoch": 28.03,
+      "learning_rate": 6.744097486671744e-06,
+      "loss": 0.0155,
+      "step": 50000
+    },
+    {
+      "epoch": 28.03,
+      "eval_loss": 0.1905270218849182,
+      "eval_runtime": 172.8869,
+      "eval_samples_per_second": 15.154,
+      "eval_steps_per_second": 1.897,
+      "eval_wer": 0.8642726719415703,
+      "step": 50000
+    },
+    {
+      "epoch": 28.31,
+      "learning_rate": 5.792079207920793e-06,
+      "loss": 0.0157,
+      "step": 50500
+    },
+    {
+      "epoch": 28.31,
+      "eval_loss": 0.18496514856815338,
+      "eval_runtime": 174.2609,
+      "eval_samples_per_second": 15.035,
+      "eval_steps_per_second": 1.882,
+      "eval_wer": 0.8687804321363359,
+      "step": 50500
+    },
+    {
+      "epoch": 28.59,
+      "learning_rate": 4.841964965727342e-06,
+      "loss": 0.0141,
+      "step": 51000
+    },
+    {
+      "epoch": 28.59,
+      "eval_loss": 0.19027549028396606,
+      "eval_runtime": 174.6402,
+      "eval_samples_per_second": 15.002,
+      "eval_steps_per_second": 1.878,
+      "eval_wer": 0.8673729458307973,
+      "step": 51000
+    },
+    {
+      "epoch": 28.87,
+      "learning_rate": 3.88994668697639e-06,
+      "loss": 0.0146,
+      "step": 51500
+    },
+    {
+      "epoch": 28.87,
+      "eval_loss": 0.1888495832681656,
+      "eval_runtime": 173.6727,
+      "eval_samples_per_second": 15.086,
+      "eval_steps_per_second": 1.889,
+      "eval_wer": 0.8696363359707852,
+      "step": 51500
+    },
+    {
+      "epoch": 29.15,
+      "learning_rate": 2.9379284082254382e-06,
+      "loss": 0.0141,
+      "step": 52000
+    },
+    {
+      "epoch": 29.15,
+      "eval_loss": 0.19334958493709564,
+      "eval_runtime": 174.9971,
+      "eval_samples_per_second": 14.972,
+      "eval_steps_per_second": 1.874,
+      "eval_wer": 0.8652617163724894,
+      "step": 52000
+    },
+    {
+      "epoch": 29.43,
+      "learning_rate": 1.985910129474486e-06,
+      "loss": 0.0145,
+      "step": 52500
+    },
+    {
+      "epoch": 29.43,
+      "eval_loss": 0.19555361568927765,
+      "eval_runtime": 173.8338,
+      "eval_samples_per_second": 15.072,
+      "eval_steps_per_second": 1.887,
+      "eval_wer": 0.8642346317711503,
+      "step": 52500
+    },
+    {
+      "epoch": 29.71,
+      "learning_rate": 1.033891850723534e-06,
+      "loss": 0.0143,
+      "step": 53000
+    },
+    {
+      "epoch": 29.71,
+      "eval_loss": 0.19510917365550995,
+      "eval_runtime": 173.0428,
+      "eval_samples_per_second": 15.141,
+      "eval_steps_per_second": 1.895,
+      "eval_wer": 0.8620283018867925,
+      "step": 53000
+    },
+    {
+      "epoch": 29.99,
+      "learning_rate": 8.377760853008378e-08,
+      "loss": 0.0148,
+      "step": 53500
+    },
+    {
+      "epoch": 29.99,
+      "eval_loss": 0.19494272768497467,
+      "eval_runtime": 173.493,
+      "eval_samples_per_second": 15.101,
+      "eval_steps_per_second": 1.891,
+      "eval_wer": 0.8613245587340231,
+      "step": 53500
+    }
+  ],
+  "max_steps": 53520,
+  "num_train_epochs": 30,
+  "total_flos": 9.958592660590779e+19,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a49dc6e3d3afe41e51c8be81b90710fab47c46b84e4147a98d6ef9aa1821e728
+size 3003