nmoyo45 commited on Nov 16, 2025

Commit

7e90f54

verified ·

1 Parent(s): 987465f

Upload folder using huggingface_hub

Browse files

Files changed (25) hide show

added_tokens.json +4 -0
checkpoint-9000/config.json +107 -0
checkpoint-9000/model.safetensors +3 -0
checkpoint-9000/optimizer.pt +3 -0
checkpoint-9000/preprocessor_config.json +9 -0
checkpoint-9000/rng_state.pth +3 -0
checkpoint-9000/scaler.pt +3 -0
checkpoint-9000/scheduler.pt +3 -0
checkpoint-9000/trainer_state.json +322 -0
checkpoint-9000/training_args.bin +3 -0
checkpoint-9380/config.json +107 -0
checkpoint-9380/model.safetensors +3 -0
checkpoint-9380/optimizer.pt +3 -0
checkpoint-9380/preprocessor_config.json +9 -0
checkpoint-9380/rng_state.pth +3 -0
checkpoint-9380/scaler.pt +3 -0
checkpoint-9380/scheduler.pt +3 -0
checkpoint-9380/trainer_state.json +322 -0
checkpoint-9380/training_args.bin +3 -0
config.json +107 -0
model.safetensors +3 -0
preprocessor_config.json +10 -0
special_tokens_map.json +6 -0
tokenizer_config.json +49 -0
vocab.json +31 -0

added_tokens.json ADDED Viewed

	@@ -0,0 +1,4 @@

+{
+  "</s>": 30,
+  "<s>": 29
+}

checkpoint-9000/config.json ADDED Viewed

	@@ -0,0 +1,107 @@

+{
+  "activation_dropout": 0.0,
+  "adapter_attn_dim": null,
+  "adapter_kernel_size": 3,
+  "adapter_stride": 2,
+  "add_adapter": false,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 768,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": true,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": true,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": true,
+  "dtype": "float32",
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "layer",
+  "feat_proj_dropout": 0.0,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.1,
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_prob": 0.05,
+  "model_type": "wav2vec2",
+  "num_adapter_layers": 3,
+  "num_attention_heads": 16,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 24,
+  "num_negatives": 100,
+  "output_hidden_size": 1024,
+  "pad_token_id": 28,
+  "proj_codevector_dim": 768,
+  "tdnn_dilation": [
+    1,
+    2,
+    3,
+    1,
+    1
+  ],
+  "tdnn_dim": [
+    512,
+    512,
+    512,
+    512,
+    1500
+  ],
+  "tdnn_kernel": [
+    5,
+    3,
+    3,
+    1,
+    1
+  ],
+  "transformers_version": "4.57.1",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 31,
+  "xvector_output_dim": 512
+}

checkpoint-9000/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8db5711c31e5f7ad116f5c3d180ae61193ce81bb987dd2345da0b1acfed838f7
+size 1261934580

checkpoint-9000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b41d6b1b35b8587b835e43e091aacac26d0288ea0ce7d3928afbc9b43f700d69
+size 2524125339

checkpoint-9000/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}

checkpoint-9000/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ab423d30467d2b97c43f53301849392e580c540cc194fb0f77c00cc58ae26e38
+size 14709

checkpoint-9000/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:29c4b3a2db27ec7adc685046699ff42abf833a0a0e3afa0ab1f8ae149ccb5902
+size 1383

checkpoint-9000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0e81ea76d57fb75982d9efccd8becd9b66781bedc91ada6e391446ff001eae96
+size 1465

checkpoint-9000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,322 @@

+{
+  "best_global_step": 9000,
+  "best_metric": 0.3495483628152051,
+  "best_model_checkpoint": "/content/drive/MyDrive/Model-Finetuning/wav2vec2/model/zu_wav2vec2/checkpoint-9000",
+  "epoch": 9.5952,
+  "eval_steps": 500,
+  "global_step": 9000,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.5333333333333333,
+      "grad_norm": 2.2490434646606445,
+      "learning_rate": 0.00029939999999999996,
+      "loss": 5.3513,
+      "step": 500
+    },
+    {
+      "epoch": 0.5333333333333333,
+      "eval_loss": 3.067410707473755,
+      "eval_runtime": 142.738,
+      "eval_samples_per_second": 21.018,
+      "eval_steps_per_second": 2.627,
+      "eval_wer": 1.0,
+      "step": 500
+    },
+    {
+      "epoch": 1.0661333333333334,
+      "grad_norm": 1.0280228853225708,
+      "learning_rate": 0.0002831418918918919,
+      "loss": 2.4793,
+      "step": 1000
+    },
+    {
+      "epoch": 1.0661333333333334,
+      "eval_loss": 1.1224186420440674,
+      "eval_runtime": 144.1294,
+      "eval_samples_per_second": 20.815,
+      "eval_steps_per_second": 2.602,
+      "eval_wer": 0.992002258185924,
+      "step": 1000
+    },
+    {
+      "epoch": 1.5994666666666668,
+      "grad_norm": 1.6041176319122314,
+      "learning_rate": 0.00026624999999999994,
+      "loss": 0.9637,
+      "step": 1500
+    },
+    {
+      "epoch": 1.5994666666666668,
+      "eval_loss": 0.6741820573806763,
+      "eval_runtime": 143.9596,
+      "eval_samples_per_second": 20.839,
+      "eval_steps_per_second": 2.605,
+      "eval_wer": 0.7161272111403839,
+      "step": 1500
+    },
+    {
+      "epoch": 2.1322666666666668,
+      "grad_norm": 1.4150700569152832,
+      "learning_rate": 0.00024935810810810806,
+      "loss": 0.717,
+      "step": 2000
+    },
+    {
+      "epoch": 2.1322666666666668,
+      "eval_loss": 0.5053547620773315,
+      "eval_runtime": 145.0264,
+      "eval_samples_per_second": 20.686,
+      "eval_steps_per_second": 2.586,
+      "eval_wer": 0.620530673692134,
+      "step": 2000
+    },
+    {
+      "epoch": 2.6656,
+      "grad_norm": 1.3749128580093384,
+      "learning_rate": 0.0002324662162162162,
+      "loss": 0.5979,
+      "step": 2500
+    },
+    {
+      "epoch": 2.6656,
+      "eval_loss": 0.4564489424228668,
+      "eval_runtime": 145.9072,
+      "eval_samples_per_second": 20.561,
+      "eval_steps_per_second": 2.57,
+      "eval_wer": 0.5550432818968761,
+      "step": 2500
+    },
+    {
+      "epoch": 3.1984,
+      "grad_norm": 1.1167936325073242,
+      "learning_rate": 0.00021557432432432432,
+      "loss": 0.5388,
+      "step": 3000
+    },
+    {
+      "epoch": 3.1984,
+      "eval_loss": 0.4222851097583771,
+      "eval_runtime": 146.8407,
+      "eval_samples_per_second": 20.43,
+      "eval_steps_per_second": 2.554,
+      "eval_wer": 0.5333082423786225,
+      "step": 3000
+    },
+    {
+      "epoch": 3.7317333333333336,
+      "grad_norm": 1.713294267654419,
+      "learning_rate": 0.00019868243243243244,
+      "loss": 0.4762,
+      "step": 3500
+    },
+    {
+      "epoch": 3.7317333333333336,
+      "eval_loss": 0.3905419409275055,
+      "eval_runtime": 146.5994,
+      "eval_samples_per_second": 20.464,
+      "eval_steps_per_second": 2.558,
+      "eval_wer": 0.4974595408355288,
+      "step": 3500
+    },
+    {
+      "epoch": 4.2645333333333335,
+      "grad_norm": 2.082676887512207,
+      "learning_rate": 0.0001817905405405405,
+      "loss": 0.4398,
+      "step": 4000
+    },
+    {
+      "epoch": 4.2645333333333335,
+      "eval_loss": 0.3778238892555237,
+      "eval_runtime": 145.863,
+      "eval_samples_per_second": 20.567,
+      "eval_steps_per_second": 2.571,
+      "eval_wer": 0.48692133985698155,
+      "step": 4000
+    },
+    {
+      "epoch": 4.797866666666667,
+      "grad_norm": 2.2089028358459473,
+      "learning_rate": 0.00016489864864864862,
+      "loss": 0.4098,
+      "step": 4500
+    },
+    {
+      "epoch": 4.797866666666667,
+      "eval_loss": 0.35478344559669495,
+      "eval_runtime": 146.045,
+      "eval_samples_per_second": 20.542,
+      "eval_steps_per_second": 2.568,
+      "eval_wer": 0.4574708317651487,
+      "step": 4500
+    },
+    {
+      "epoch": 5.330666666666667,
+      "grad_norm": 1.058657169342041,
+      "learning_rate": 0.00014800675675675674,
+      "loss": 0.3823,
+      "step": 5000
+    },
+    {
+      "epoch": 5.330666666666667,
+      "eval_loss": 0.3355245292186737,
+      "eval_runtime": 145.8678,
+      "eval_samples_per_second": 20.567,
+      "eval_steps_per_second": 2.571,
+      "eval_wer": 0.45079036507339104,
+      "step": 5000
+    },
+    {
+      "epoch": 5.864,
+      "grad_norm": 1.4570820331573486,
+      "learning_rate": 0.00013111486486486486,
+      "loss": 0.3513,
+      "step": 5500
+    },
+    {
+      "epoch": 5.864,
+      "eval_loss": 0.32364729046821594,
+      "eval_runtime": 147.2305,
+      "eval_samples_per_second": 20.376,
+      "eval_steps_per_second": 2.547,
+      "eval_wer": 0.4314076025592774,
+      "step": 5500
+    },
+    {
+      "epoch": 6.3968,
+      "grad_norm": 2.4523627758026123,
+      "learning_rate": 0.00011422297297297297,
+      "loss": 0.3111,
+      "step": 6000
+    },
+    {
+      "epoch": 6.3968,
+      "eval_loss": 0.3129761517047882,
+      "eval_runtime": 146.9224,
+      "eval_samples_per_second": 20.419,
+      "eval_steps_per_second": 2.552,
+      "eval_wer": 0.4113662024840045,
+      "step": 6000
+    },
+    {
+      "epoch": 6.930133333333333,
+      "grad_norm": 1.3307918310165405,
+      "learning_rate": 9.733108108108107e-05,
+      "loss": 0.3032,
+      "step": 6500
+    },
+    {
+      "epoch": 6.930133333333333,
+      "eval_loss": 0.301826536655426,
+      "eval_runtime": 147.6721,
+      "eval_samples_per_second": 20.315,
+      "eval_steps_per_second": 2.539,
+      "eval_wer": 0.4039330071509221,
+      "step": 6500
+    },
+    {
+      "epoch": 7.462933333333333,
+      "grad_norm": 1.828587532043457,
+      "learning_rate": 8.043918918918918e-05,
+      "loss": 0.2698,
+      "step": 7000
+    },
+    {
+      "epoch": 7.462933333333333,
+      "eval_loss": 0.29749611020088196,
+      "eval_runtime": 146.8529,
+      "eval_samples_per_second": 20.429,
+      "eval_steps_per_second": 2.554,
+      "eval_wer": 0.3873729770417764,
+      "step": 7000
+    },
+    {
+      "epoch": 7.996266666666667,
+      "grad_norm": 1.7805229425430298,
+      "learning_rate": 6.354729729729729e-05,
+      "loss": 0.2661,
+      "step": 7500
+    },
+    {
+      "epoch": 7.996266666666667,
+      "eval_loss": 0.2899162769317627,
+      "eval_runtime": 147.9735,
+      "eval_samples_per_second": 20.274,
+      "eval_steps_per_second": 2.534,
+      "eval_wer": 0.3744824990590892,
+      "step": 7500
+    },
+    {
+      "epoch": 8.529066666666667,
+      "grad_norm": 1.059174656867981,
+      "learning_rate": 4.66554054054054e-05,
+      "loss": 0.233,
+      "step": 8000
+    },
+    {
+      "epoch": 8.529066666666667,
+      "eval_loss": 0.2895633280277252,
+      "eval_runtime": 147.1645,
+      "eval_samples_per_second": 20.385,
+      "eval_steps_per_second": 2.548,
+      "eval_wer": 0.36356793375987956,
+      "step": 8000
+    },
+    {
+      "epoch": 9.061866666666667,
+      "grad_norm": 0.938797116279602,
+      "learning_rate": 2.976351351351351e-05,
+      "loss": 0.2336,
+      "step": 8500
+    },
+    {
+      "epoch": 9.061866666666667,
+      "eval_loss": 0.2831208407878876,
+      "eval_runtime": 147.624,
+      "eval_samples_per_second": 20.322,
+      "eval_steps_per_second": 2.54,
+      "eval_wer": 0.35641701166729395,
+      "step": 8500
+    },
+    {
+      "epoch": 9.5952,
+      "grad_norm": 6.92275333404541,
+      "learning_rate": 1.287162162162162e-05,
+      "loss": 0.2137,
+      "step": 9000
+    },
+    {
+      "epoch": 9.5952,
+      "eval_loss": 0.27855604887008667,
+      "eval_runtime": 146.2994,
+      "eval_samples_per_second": 20.506,
+      "eval_steps_per_second": 2.563,
+      "eval_wer": 0.3495483628152051,
+      "step": 9000
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 9380,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 10,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 2.0824055747211284e+19,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-9000/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c12d2489260fb1dce96735e9306c209e6bf050b06014d9d2a71fdd38ea6d3b18
+size 5905

checkpoint-9380/config.json ADDED Viewed

	@@ -0,0 +1,107 @@

+{
+  "activation_dropout": 0.0,
+  "adapter_attn_dim": null,
+  "adapter_kernel_size": 3,
+  "adapter_stride": 2,
+  "add_adapter": false,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 768,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": true,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": true,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": true,
+  "dtype": "float32",
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "layer",
+  "feat_proj_dropout": 0.0,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.1,
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_prob": 0.05,
+  "model_type": "wav2vec2",
+  "num_adapter_layers": 3,
+  "num_attention_heads": 16,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 24,
+  "num_negatives": 100,
+  "output_hidden_size": 1024,
+  "pad_token_id": 28,
+  "proj_codevector_dim": 768,
+  "tdnn_dilation": [
+    1,
+    2,
+    3,
+    1,
+    1
+  ],
+  "tdnn_dim": [
+    512,
+    512,
+    512,
+    512,
+    1500
+  ],
+  "tdnn_kernel": [
+    5,
+    3,
+    3,
+    1,
+    1
+  ],
+  "transformers_version": "4.57.1",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 31,
+  "xvector_output_dim": 512
+}

checkpoint-9380/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:aac87e9d106ee918dca48798d06dac102725c911256e9acb514d741cf8b67a14
+size 1261934580

checkpoint-9380/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e19e8cc902ae522249c74f84a0f30b48bb134885433cec7036183aa88dc9a243
+size 2524125339

checkpoint-9380/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}

checkpoint-9380/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2afd1ee849497350918429fff5988fbb283e8f5721c15d50bd3b2a09f7d49989
+size 14709

checkpoint-9380/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4c800a258cb6ea8d19d26cdcad02e64d16a436f29343297becbaa069b3f0418c
+size 1383

checkpoint-9380/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ce187e3f555b7fd7243a8f31396ec053a90fed362680018d8b2aa39fb391bb01
+size 1465

checkpoint-9380/trainer_state.json ADDED Viewed

	@@ -0,0 +1,322 @@

+{
+  "best_global_step": 9000,
+  "best_metric": 0.3495483628152051,
+  "best_model_checkpoint": "/content/drive/MyDrive/Model-Finetuning/wav2vec2/model/zu_wav2vec2/checkpoint-9000",
+  "epoch": 10.0,
+  "eval_steps": 500,
+  "global_step": 9380,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.5333333333333333,
+      "grad_norm": 2.2490434646606445,
+      "learning_rate": 0.00029939999999999996,
+      "loss": 5.3513,
+      "step": 500
+    },
+    {
+      "epoch": 0.5333333333333333,
+      "eval_loss": 3.067410707473755,
+      "eval_runtime": 142.738,
+      "eval_samples_per_second": 21.018,
+      "eval_steps_per_second": 2.627,
+      "eval_wer": 1.0,
+      "step": 500
+    },
+    {
+      "epoch": 1.0661333333333334,
+      "grad_norm": 1.0280228853225708,
+      "learning_rate": 0.0002831418918918919,
+      "loss": 2.4793,
+      "step": 1000
+    },
+    {
+      "epoch": 1.0661333333333334,
+      "eval_loss": 1.1224186420440674,
+      "eval_runtime": 144.1294,
+      "eval_samples_per_second": 20.815,
+      "eval_steps_per_second": 2.602,
+      "eval_wer": 0.992002258185924,
+      "step": 1000
+    },
+    {
+      "epoch": 1.5994666666666668,
+      "grad_norm": 1.6041176319122314,
+      "learning_rate": 0.00026624999999999994,
+      "loss": 0.9637,
+      "step": 1500
+    },
+    {
+      "epoch": 1.5994666666666668,
+      "eval_loss": 0.6741820573806763,
+      "eval_runtime": 143.9596,
+      "eval_samples_per_second": 20.839,
+      "eval_steps_per_second": 2.605,
+      "eval_wer": 0.7161272111403839,
+      "step": 1500
+    },
+    {
+      "epoch": 2.1322666666666668,
+      "grad_norm": 1.4150700569152832,
+      "learning_rate": 0.00024935810810810806,
+      "loss": 0.717,
+      "step": 2000
+    },
+    {
+      "epoch": 2.1322666666666668,
+      "eval_loss": 0.5053547620773315,
+      "eval_runtime": 145.0264,
+      "eval_samples_per_second": 20.686,
+      "eval_steps_per_second": 2.586,
+      "eval_wer": 0.620530673692134,
+      "step": 2000
+    },
+    {
+      "epoch": 2.6656,
+      "grad_norm": 1.3749128580093384,
+      "learning_rate": 0.0002324662162162162,
+      "loss": 0.5979,
+      "step": 2500
+    },
+    {
+      "epoch": 2.6656,
+      "eval_loss": 0.4564489424228668,
+      "eval_runtime": 145.9072,
+      "eval_samples_per_second": 20.561,
+      "eval_steps_per_second": 2.57,
+      "eval_wer": 0.5550432818968761,
+      "step": 2500
+    },
+    {
+      "epoch": 3.1984,
+      "grad_norm": 1.1167936325073242,
+      "learning_rate": 0.00021557432432432432,
+      "loss": 0.5388,
+      "step": 3000
+    },
+    {
+      "epoch": 3.1984,
+      "eval_loss": 0.4222851097583771,
+      "eval_runtime": 146.8407,
+      "eval_samples_per_second": 20.43,
+      "eval_steps_per_second": 2.554,
+      "eval_wer": 0.5333082423786225,
+      "step": 3000
+    },
+    {
+      "epoch": 3.7317333333333336,
+      "grad_norm": 1.713294267654419,
+      "learning_rate": 0.00019868243243243244,
+      "loss": 0.4762,
+      "step": 3500
+    },
+    {
+      "epoch": 3.7317333333333336,
+      "eval_loss": 0.3905419409275055,
+      "eval_runtime": 146.5994,
+      "eval_samples_per_second": 20.464,
+      "eval_steps_per_second": 2.558,
+      "eval_wer": 0.4974595408355288,
+      "step": 3500
+    },
+    {
+      "epoch": 4.2645333333333335,
+      "grad_norm": 2.082676887512207,
+      "learning_rate": 0.0001817905405405405,
+      "loss": 0.4398,
+      "step": 4000
+    },
+    {
+      "epoch": 4.2645333333333335,
+      "eval_loss": 0.3778238892555237,
+      "eval_runtime": 145.863,
+      "eval_samples_per_second": 20.567,
+      "eval_steps_per_second": 2.571,
+      "eval_wer": 0.48692133985698155,
+      "step": 4000
+    },
+    {
+      "epoch": 4.797866666666667,
+      "grad_norm": 2.2089028358459473,
+      "learning_rate": 0.00016489864864864862,
+      "loss": 0.4098,
+      "step": 4500
+    },
+    {
+      "epoch": 4.797866666666667,
+      "eval_loss": 0.35478344559669495,
+      "eval_runtime": 146.045,
+      "eval_samples_per_second": 20.542,
+      "eval_steps_per_second": 2.568,
+      "eval_wer": 0.4574708317651487,
+      "step": 4500
+    },
+    {
+      "epoch": 5.330666666666667,
+      "grad_norm": 1.058657169342041,
+      "learning_rate": 0.00014800675675675674,
+      "loss": 0.3823,
+      "step": 5000
+    },
+    {
+      "epoch": 5.330666666666667,
+      "eval_loss": 0.3355245292186737,
+      "eval_runtime": 145.8678,
+      "eval_samples_per_second": 20.567,
+      "eval_steps_per_second": 2.571,
+      "eval_wer": 0.45079036507339104,
+      "step": 5000
+    },
+    {
+      "epoch": 5.864,
+      "grad_norm": 1.4570820331573486,
+      "learning_rate": 0.00013111486486486486,
+      "loss": 0.3513,
+      "step": 5500
+    },
+    {
+      "epoch": 5.864,
+      "eval_loss": 0.32364729046821594,
+      "eval_runtime": 147.2305,
+      "eval_samples_per_second": 20.376,
+      "eval_steps_per_second": 2.547,
+      "eval_wer": 0.4314076025592774,
+      "step": 5500
+    },
+    {
+      "epoch": 6.3968,
+      "grad_norm": 2.4523627758026123,
+      "learning_rate": 0.00011422297297297297,
+      "loss": 0.3111,
+      "step": 6000
+    },
+    {
+      "epoch": 6.3968,
+      "eval_loss": 0.3129761517047882,
+      "eval_runtime": 146.9224,
+      "eval_samples_per_second": 20.419,
+      "eval_steps_per_second": 2.552,
+      "eval_wer": 0.4113662024840045,
+      "step": 6000
+    },
+    {
+      "epoch": 6.930133333333333,
+      "grad_norm": 1.3307918310165405,
+      "learning_rate": 9.733108108108107e-05,
+      "loss": 0.3032,
+      "step": 6500
+    },
+    {
+      "epoch": 6.930133333333333,
+      "eval_loss": 0.301826536655426,
+      "eval_runtime": 147.6721,
+      "eval_samples_per_second": 20.315,
+      "eval_steps_per_second": 2.539,
+      "eval_wer": 0.4039330071509221,
+      "step": 6500
+    },
+    {
+      "epoch": 7.462933333333333,
+      "grad_norm": 1.828587532043457,
+      "learning_rate": 8.043918918918918e-05,
+      "loss": 0.2698,
+      "step": 7000
+    },
+    {
+      "epoch": 7.462933333333333,
+      "eval_loss": 0.29749611020088196,
+      "eval_runtime": 146.8529,
+      "eval_samples_per_second": 20.429,
+      "eval_steps_per_second": 2.554,
+      "eval_wer": 0.3873729770417764,
+      "step": 7000
+    },
+    {
+      "epoch": 7.996266666666667,
+      "grad_norm": 1.7805229425430298,
+      "learning_rate": 6.354729729729729e-05,
+      "loss": 0.2661,
+      "step": 7500
+    },
+    {
+      "epoch": 7.996266666666667,
+      "eval_loss": 0.2899162769317627,
+      "eval_runtime": 147.9735,
+      "eval_samples_per_second": 20.274,
+      "eval_steps_per_second": 2.534,
+      "eval_wer": 0.3744824990590892,
+      "step": 7500
+    },
+    {
+      "epoch": 8.529066666666667,
+      "grad_norm": 1.059174656867981,
+      "learning_rate": 4.66554054054054e-05,
+      "loss": 0.233,
+      "step": 8000
+    },
+    {
+      "epoch": 8.529066666666667,
+      "eval_loss": 0.2895633280277252,
+      "eval_runtime": 147.1645,
+      "eval_samples_per_second": 20.385,
+      "eval_steps_per_second": 2.548,
+      "eval_wer": 0.36356793375987956,
+      "step": 8000
+    },
+    {
+      "epoch": 9.061866666666667,
+      "grad_norm": 0.938797116279602,
+      "learning_rate": 2.976351351351351e-05,
+      "loss": 0.2336,
+      "step": 8500
+    },
+    {
+      "epoch": 9.061866666666667,
+      "eval_loss": 0.2831208407878876,
+      "eval_runtime": 147.624,
+      "eval_samples_per_second": 20.322,
+      "eval_steps_per_second": 2.54,
+      "eval_wer": 0.35641701166729395,
+      "step": 8500
+    },
+    {
+      "epoch": 9.5952,
+      "grad_norm": 6.92275333404541,
+      "learning_rate": 1.287162162162162e-05,
+      "loss": 0.2137,
+      "step": 9000
+    },
+    {
+      "epoch": 9.5952,
+      "eval_loss": 0.27855604887008667,
+      "eval_runtime": 146.2994,
+      "eval_samples_per_second": 20.506,
+      "eval_steps_per_second": 2.563,
+      "eval_wer": 0.3495483628152051,
+      "step": 9000
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 9380,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 10,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 2.167851661799376e+19,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-9380/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c12d2489260fb1dce96735e9306c209e6bf050b06014d9d2a71fdd38ea6d3b18
+size 5905

config.json ADDED Viewed

	@@ -0,0 +1,107 @@

+{
+  "activation_dropout": 0.0,
+  "adapter_attn_dim": null,
+  "adapter_kernel_size": 3,
+  "adapter_stride": 2,
+  "add_adapter": false,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 768,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": true,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": true,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": true,
+  "dtype": "float32",
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "layer",
+  "feat_proj_dropout": 0.0,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.1,
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_prob": 0.05,
+  "model_type": "wav2vec2",
+  "num_adapter_layers": 3,
+  "num_attention_heads": 16,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 24,
+  "num_negatives": 100,
+  "output_hidden_size": 1024,
+  "pad_token_id": 28,
+  "proj_codevector_dim": 768,
+  "tdnn_dilation": [
+    1,
+    2,
+    3,
+    1,
+    1
+  ],
+  "tdnn_dim": [
+    512,
+    512,
+    512,
+    512,
+    1500
+  ],
+  "tdnn_kernel": [
+    5,
+    3,
+    3,
+    1,
+    1
+  ],
+  "transformers_version": "4.57.1",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 31,
+  "xvector_output_dim": 512
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8db5711c31e5f7ad116f5c3d180ae61193ce81bb987dd2345da0b1acfed838f7
+size 1261934580

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "processor_class": "Wav2Vec2Processor",
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "bos_token": "<s>",
+  "eos_token": "</s>",
+  "pad_token": "[PAD]",
+  "unk_token": "[UNK]"
+}

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,49 @@

+{
+  "added_tokens_decoder": {
+    "27": {
+      "content": "[UNK]",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": true,
+      "single_word": false,
+      "special": false
+    },
+    "28": {
+      "content": "[PAD]",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": true,
+      "single_word": false,
+      "special": false
+    },
+    "29": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "30": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": false,
+  "do_lower_case": false,
+  "eos_token": "</s>",
+  "extra_special_tokens": {},
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "[PAD]",
+  "processor_class": "Wav2Vec2Processor",
+  "replace_word_delimiter_char": " ",
+  "target_lang": null,
+  "tokenizer_class": "Wav2Vec2CTCTokenizer",
+  "unk_token": "[UNK]",
+  "word_delimiter_token": "|"
+}

vocab.json ADDED Viewed

	@@ -0,0 +1,31 @@

+{
+  "[PAD]": 28,
+  "[UNK]": 27,
+  "a": 1,
+  "b": 2,
+  "c": 3,
+  "d": 4,
+  "e": 5,
+  "f": 6,
+  "g": 7,
+  "h": 8,
+  "i": 9,
+  "j": 10,
+  "k": 11,
+  "l": 12,
+  "m": 13,
+  "n": 14,
+  "o": 15,
+  "p": 16,
+  "q": 17,
+  "r": 18,
+  "s": 19,
+  "t": 20,
+  "u": 21,
+  "v": 22,
+  "w": 23,
+  "x": 24,
+  "y": 25,
+  "z": 26,
+  "|": 0
+}