Upload folder using huggingface_hub

Browse files

Files changed (16) hide show

added_tokens.json +4 -0
checkpoint-9380/config.json +107 -0
checkpoint-9380/model.safetensors +3 -0
checkpoint-9380/optimizer.pt +3 -0
checkpoint-9380/preprocessor_config.json +9 -0
checkpoint-9380/rng_state.pth +3 -0
checkpoint-9380/scaler.pt +3 -0
checkpoint-9380/scheduler.pt +3 -0
checkpoint-9380/trainer_state.json +322 -0
checkpoint-9380/training_args.bin +3 -0
config.json +107 -0
model.safetensors +3 -0
preprocessor_config.json +10 -0
special_tokens_map.json +6 -0
tokenizer_config.json +49 -0
vocab.json +31 -0

added_tokens.json ADDED Viewed

	@@ -0,0 +1,4 @@

+{
+  "</s>": 30,
+  "<s>": 29
+}

checkpoint-9380/config.json ADDED Viewed

	@@ -0,0 +1,107 @@

+{
+  "activation_dropout": 0.0,
+  "adapter_attn_dim": null,
+  "adapter_kernel_size": 3,
+  "adapter_stride": 2,
+  "add_adapter": false,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 768,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": true,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": true,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": true,
+  "dtype": "float32",
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "layer",
+  "feat_proj_dropout": 0.0,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.1,
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_prob": 0.05,
+  "model_type": "wav2vec2",
+  "num_adapter_layers": 3,
+  "num_attention_heads": 16,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 24,
+  "num_negatives": 100,
+  "output_hidden_size": 1024,
+  "pad_token_id": 28,
+  "proj_codevector_dim": 768,
+  "tdnn_dilation": [
+    1,
+    2,
+    3,
+    1,
+    1
+  ],
+  "tdnn_dim": [
+    512,
+    512,
+    512,
+    512,
+    1500
+  ],
+  "tdnn_kernel": [
+    5,
+    3,
+    3,
+    1,
+    1
+  ],
+  "transformers_version": "4.57.1",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 31,
+  "xvector_output_dim": 512
+}

checkpoint-9380/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:81a39ed9b6ef1eff2fc65ad482d7d0f4ff912a15a453a4b09d001aabaa2fbdd3
+size 1261934580

checkpoint-9380/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9303733744e81732c20f7e22ccc64b19a07208c98a2306f01e9213f886a542e0
+size 2524125339

checkpoint-9380/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}

checkpoint-9380/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:efdd4b94c1e6ad8732d109aef85c971cb156d145bb6ae2654b14f21f32464824
+size 14709

checkpoint-9380/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ab71dceeceb379e73894555f0e2a4b12b34de46e52e7a0f458508e20186eb0a3
+size 1383

checkpoint-9380/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ce187e3f555b7fd7243a8f31396ec053a90fed362680018d8b2aa39fb391bb01
+size 1465

checkpoint-9380/trainer_state.json ADDED Viewed

	@@ -0,0 +1,322 @@

+{
+  "best_global_step": 9000,
+  "best_metric": 0.2908235294117647,
+  "best_model_checkpoint": "/content/drive/MyDrive/Model-Finetuning/wav2vec2/model/nbl_wav2vec2/checkpoint-9000",
+  "epoch": 10.0,
+  "eval_steps": 500,
+  "global_step": 9380,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.5333333333333333,
+      "grad_norm": 2.6857900619506836,
+      "learning_rate": 0.00029939999999999996,
+      "loss": 5.2283,
+      "step": 500
+    },
+    {
+      "epoch": 0.5333333333333333,
+      "eval_loss": 2.025707721710205,
+      "eval_runtime": 148.4202,
+      "eval_samples_per_second": 20.213,
+      "eval_steps_per_second": 2.527,
+      "eval_wer": 1.0111372549019608,
+      "step": 500
+    },
+    {
+      "epoch": 1.0661333333333334,
+      "grad_norm": 1.386874794960022,
+      "learning_rate": 0.0002831418918918919,
+      "loss": 0.9713,
+      "step": 1000
+    },
+    {
+      "epoch": 1.0661333333333334,
+      "eval_loss": 0.5391530394554138,
+      "eval_runtime": 148.3623,
+      "eval_samples_per_second": 20.221,
+      "eval_steps_per_second": 2.528,
+      "eval_wer": 0.6509019607843137,
+      "step": 1000
+    },
+    {
+      "epoch": 1.5994666666666668,
+      "grad_norm": 2.7049543857574463,
+      "learning_rate": 0.00026624999999999994,
+      "loss": 0.6379,
+      "step": 1500
+    },
+    {
+      "epoch": 1.5994666666666668,
+      "eval_loss": 0.42855554819107056,
+      "eval_runtime": 148.347,
+      "eval_samples_per_second": 20.223,
+      "eval_steps_per_second": 2.528,
+      "eval_wer": 0.5332549019607843,
+      "step": 1500
+    },
+    {
+      "epoch": 2.1322666666666668,
+      "grad_norm": 1.8714250326156616,
+      "learning_rate": 0.00024935810810810806,
+      "loss": 0.5595,
+      "step": 2000
+    },
+    {
+      "epoch": 2.1322666666666668,
+      "eval_loss": 0.39198794960975647,
+      "eval_runtime": 149.3713,
+      "eval_samples_per_second": 20.084,
+      "eval_steps_per_second": 2.511,
+      "eval_wer": 0.5109803921568628,
+      "step": 2000
+    },
+    {
+      "epoch": 2.6656,
+      "grad_norm": 1.8362187147140503,
+      "learning_rate": 0.0002324662162162162,
+      "loss": 0.4807,
+      "step": 2500
+    },
+    {
+      "epoch": 2.6656,
+      "eval_loss": 0.3563985228538513,
+      "eval_runtime": 149.1684,
+      "eval_samples_per_second": 20.112,
+      "eval_steps_per_second": 2.514,
+      "eval_wer": 0.46658823529411764,
+      "step": 2500
+    },
+    {
+      "epoch": 3.1984,
+      "grad_norm": 1.0880553722381592,
+      "learning_rate": 0.00021557432432432432,
+      "loss": 0.4404,
+      "step": 3000
+    },
+    {
+      "epoch": 3.1984,
+      "eval_loss": 0.3388464152812958,
+      "eval_runtime": 149.8437,
+      "eval_samples_per_second": 20.021,
+      "eval_steps_per_second": 2.503,
+      "eval_wer": 0.42486274509803923,
+      "step": 3000
+    },
+    {
+      "epoch": 3.7317333333333336,
+      "grad_norm": 10.404922485351562,
+      "learning_rate": 0.00019868243243243244,
+      "loss": 0.4022,
+      "step": 3500
+    },
+    {
+      "epoch": 3.7317333333333336,
+      "eval_loss": 0.3252636194229126,
+      "eval_runtime": 150.8413,
+      "eval_samples_per_second": 19.888,
+      "eval_steps_per_second": 2.486,
+      "eval_wer": 0.4043921568627451,
+      "step": 3500
+    },
+    {
+      "epoch": 4.2645333333333335,
+      "grad_norm": 4.443390846252441,
+      "learning_rate": 0.0001817905405405405,
+      "loss": 0.3754,
+      "step": 4000
+    },
+    {
+      "epoch": 4.2645333333333335,
+      "eval_loss": 0.3209179937839508,
+      "eval_runtime": 150.4901,
+      "eval_samples_per_second": 19.935,
+      "eval_steps_per_second": 2.492,
+      "eval_wer": 0.4051764705882353,
+      "step": 4000
+    },
+    {
+      "epoch": 4.797866666666667,
+      "grad_norm": 1.9804564714431763,
+      "learning_rate": 0.00016489864864864862,
+      "loss": 0.3379,
+      "step": 4500
+    },
+    {
+      "epoch": 4.797866666666667,
+      "eval_loss": 0.30479735136032104,
+      "eval_runtime": 149.6398,
+      "eval_samples_per_second": 20.048,
+      "eval_steps_per_second": 2.506,
+      "eval_wer": 0.3894901960784314,
+      "step": 4500
+    },
+    {
+      "epoch": 5.330666666666667,
+      "grad_norm": 1.1342227458953857,
+      "learning_rate": 0.00014800675675675674,
+      "loss": 0.3184,
+      "step": 5000
+    },
+    {
+      "epoch": 5.330666666666667,
+      "eval_loss": 0.28083688020706177,
+      "eval_runtime": 150.4194,
+      "eval_samples_per_second": 19.944,
+      "eval_steps_per_second": 2.493,
+      "eval_wer": 0.3618823529411765,
+      "step": 5000
+    },
+    {
+      "epoch": 5.864,
+      "grad_norm": 0.6732638478279114,
+      "learning_rate": 0.00013111486486486486,
+      "loss": 0.3003,
+      "step": 5500
+    },
+    {
+      "epoch": 5.864,
+      "eval_loss": 0.27100080251693726,
+      "eval_runtime": 150.5926,
+      "eval_samples_per_second": 19.921,
+      "eval_steps_per_second": 2.49,
+      "eval_wer": 0.3436078431372549,
+      "step": 5500
+    },
+    {
+      "epoch": 6.3968,
+      "grad_norm": 4.13991117477417,
+      "learning_rate": 0.00011422297297297297,
+      "loss": 0.264,
+      "step": 6000
+    },
+    {
+      "epoch": 6.3968,
+      "eval_loss": 0.264404833316803,
+      "eval_runtime": 151.1359,
+      "eval_samples_per_second": 19.85,
+      "eval_steps_per_second": 2.481,
+      "eval_wer": 0.33356862745098037,
+      "step": 6000
+    },
+    {
+      "epoch": 6.930133333333333,
+      "grad_norm": 3.0504963397979736,
+      "learning_rate": 9.733108108108107e-05,
+      "loss": 0.2574,
+      "step": 6500
+    },
+    {
+      "epoch": 6.930133333333333,
+      "eval_loss": 0.24905848503112793,
+      "eval_runtime": 151.2904,
+      "eval_samples_per_second": 19.829,
+      "eval_steps_per_second": 2.479,
+      "eval_wer": 0.3235294117647059,
+      "step": 6500
+    },
+    {
+      "epoch": 7.462933333333333,
+      "grad_norm": 1.2022693157196045,
+      "learning_rate": 8.043918918918918e-05,
+      "loss": 0.2319,
+      "step": 7000
+    },
+    {
+      "epoch": 7.462933333333333,
+      "eval_loss": 0.26013123989105225,
+      "eval_runtime": 150.0311,
+      "eval_samples_per_second": 19.996,
+      "eval_steps_per_second": 2.499,
+      "eval_wer": 0.31301960784313726,
+      "step": 7000
+    },
+    {
+      "epoch": 7.996266666666667,
+      "grad_norm": 0.9905935525894165,
+      "learning_rate": 6.354729729729729e-05,
+      "loss": 0.2194,
+      "step": 7500
+    },
+    {
+      "epoch": 7.996266666666667,
+      "eval_loss": 0.24855607748031616,
+      "eval_runtime": 151.4319,
+      "eval_samples_per_second": 19.811,
+      "eval_steps_per_second": 2.476,
+      "eval_wer": 0.3060392156862745,
+      "step": 7500
+    },
+    {
+      "epoch": 8.529066666666667,
+      "grad_norm": 1.2119730710983276,
+      "learning_rate": 4.66554054054054e-05,
+      "loss": 0.1958,
+      "step": 8000
+    },
+    {
+      "epoch": 8.529066666666667,
+      "eval_loss": 0.24899743497371674,
+      "eval_runtime": 151.042,
+      "eval_samples_per_second": 19.862,
+      "eval_steps_per_second": 2.483,
+      "eval_wer": 0.30227450980392156,
+      "step": 8000
+    },
+    {
+      "epoch": 9.061866666666667,
+      "grad_norm": 0.6335813999176025,
+      "learning_rate": 2.976351351351351e-05,
+      "loss": 0.1912,
+      "step": 8500
+    },
+    {
+      "epoch": 9.061866666666667,
+      "eval_loss": 0.23850028216838837,
+      "eval_runtime": 152.7072,
+      "eval_samples_per_second": 19.645,
+      "eval_steps_per_second": 2.456,
+      "eval_wer": 0.2931764705882353,
+      "step": 8500
+    },
+    {
+      "epoch": 9.5952,
+      "grad_norm": 2.9868931770324707,
+      "learning_rate": 1.287162162162162e-05,
+      "loss": 0.1749,
+      "step": 9000
+    },
+    {
+      "epoch": 9.5952,
+      "eval_loss": 0.2415107637643814,
+      "eval_runtime": 150.7897,
+      "eval_samples_per_second": 19.895,
+      "eval_steps_per_second": 2.487,
+      "eval_wer": 0.2908235294117647,
+      "step": 9000
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 9380,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 10,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 2.270554818805736e+19,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-9380/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b91ded7996d03b56dbf17d6ce4ee531269fb027966ed5de989ededffd5815f0b
+size 5905

config.json ADDED Viewed

	@@ -0,0 +1,107 @@

+{
+  "activation_dropout": 0.0,
+  "adapter_attn_dim": null,
+  "adapter_kernel_size": 3,
+  "adapter_stride": 2,
+  "add_adapter": false,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 768,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": true,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": true,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": true,
+  "dtype": "float32",
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "layer",
+  "feat_proj_dropout": 0.0,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.1,
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_prob": 0.05,
+  "model_type": "wav2vec2",
+  "num_adapter_layers": 3,
+  "num_attention_heads": 16,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 24,
+  "num_negatives": 100,
+  "output_hidden_size": 1024,
+  "pad_token_id": 28,
+  "proj_codevector_dim": 768,
+  "tdnn_dilation": [
+    1,
+    2,
+    3,
+    1,
+    1
+  ],
+  "tdnn_dim": [
+    512,
+    512,
+    512,
+    512,
+    1500
+  ],
+  "tdnn_kernel": [
+    5,
+    3,
+    3,
+    1,
+    1
+  ],
+  "transformers_version": "4.57.1",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 31,
+  "xvector_output_dim": 512
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:442e4ab7ae7b03e53ee3782d674b347fd8d036f2bc22a61c404784e59e1eeeea
+size 1261934580

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "processor_class": "Wav2Vec2Processor",
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "bos_token": "<s>",
+  "eos_token": "</s>",
+  "pad_token": "[PAD]",
+  "unk_token": "[UNK]"
+}

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,49 @@

+{
+  "added_tokens_decoder": {
+    "27": {
+      "content": "[UNK]",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": true,
+      "single_word": false,
+      "special": false
+    },
+    "28": {
+      "content": "[PAD]",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": true,
+      "single_word": false,
+      "special": false
+    },
+    "29": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "30": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": false,
+  "do_lower_case": false,
+  "eos_token": "</s>",
+  "extra_special_tokens": {},
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "[PAD]",
+  "processor_class": "Wav2Vec2Processor",
+  "replace_word_delimiter_char": " ",
+  "target_lang": null,
+  "tokenizer_class": "Wav2Vec2CTCTokenizer",
+  "unk_token": "[UNK]",
+  "word_delimiter_token": "|"
+}

vocab.json ADDED Viewed

	@@ -0,0 +1,31 @@

+{
+  "[PAD]": 28,
+  "[UNK]": 27,
+  "a": 1,
+  "b": 2,
+  "c": 3,
+  "d": 4,
+  "e": 5,
+  "f": 6,
+  "g": 7,
+  "h": 8,
+  "i": 9,
+  "j": 10,
+  "k": 11,
+  "l": 12,
+  "m": 13,
+  "n": 14,
+  "o": 15,
+  "p": 16,
+  "q": 17,
+  "r": 18,
+  "s": 19,
+  "t": 20,
+  "u": 21,
+  "v": 22,
+  "w": 23,
+  "x": 24,
+  "y": 25,
+  "z": 26,
+  "|": 0
+}