Upload 10 files

Browse files

Files changed (10) hide show

config.json +117 -0
optimizer.pt +3 -0
preprocessor_config.json +9 -0
pytorch_model.bin +3 -0
rng_state.pth +3 -0
scheduler.pt +3 -0
tokenizer_config.json +13 -0
trainer_state.json +250 -0
training_args.bin +3 -0
vocab.json +47 -0

config.json ADDED Viewed

	@@ -0,0 +1,117 @@

+{
+  "_name_or_path": "facebook/wav2vec2-large-xlsr-53",
+  "activation_dropout": 0.0,
+  "adapter_attn_dim": null,
+  "adapter_kernel_size": 3,
+  "adapter_stride": 2,
+  "add_adapter": false,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 768,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": true,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": true,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": true,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "layer",
+  "feat_proj_dropout": 0.0,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.0,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.0,
+  "mask_channel_length": 10,
+  "mask_channel_min_space": 1,
+  "mask_channel_other": 0.0,
+  "mask_channel_prob": 0.0,
+  "mask_channel_selection": "static",
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_min_space": 1,
+  "mask_time_other": 0.0,
+  "mask_time_prob": 0.05,
+  "mask_time_selection": "static",
+  "model_type": "wav2vec2",
+  "num_adapter_layers": 3,
+  "num_attention_heads": 16,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 24,
+  "num_negatives": 100,
+  "output_hidden_size": 1024,
+  "pad_token_id": 47,
+  "proj_codevector_dim": 768,
+  "tdnn_dilation": [
+    1,
+    2,
+    3,
+    1,
+    1
+  ],
+  "tdnn_dim": [
+    512,
+    512,
+    512,
+    512,
+    1500
+  ],
+  "tdnn_kernel": [
+    5,
+    3,
+    3,
+    1,
+    1
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.31.0",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 48,
+  "xvector_output_dim": 512
+}

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9e49423ae2e1ada2d0237448264e2851d694a1522153397ebca1c7a8fcb77f7b
+size 2524152954

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c0baecdd74d2098318ba696e9e4168e42662f34cc12f26cd5eadc7e2e058df33
+size 1262099178

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f8f9cd2939fe37009688536bfe6c7db25d67bd1130856ce64c5d602a85bd206c
+size 14308

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5a61b48b66b439ef7fba221aefabda921afbe29a5b5f7dc2733e5a0f31f9a106
+size 1064

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "do_lower_case": false,
+  "eos_token": "</s>",
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "[PAD]",
+  "replace_word_delimiter_char": " ",
+  "target_lang": null,
+  "tokenizer_class": "Wav2Vec2CTCTokenizer",
+  "unk_token": "[UNK]",
+  "word_delimiter_token": "|"
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,250 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 25.0,
+  "global_step": 1500,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_loss": 2.974224090576172,
+      "eval_runtime": 5.5654,
+      "eval_samples_per_second": 113.379,
+      "eval_steps_per_second": 14.195,
+      "eval_wer": 1.0,
+      "step": 60
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 2.769304037094116,
+      "eval_runtime": 5.1383,
+      "eval_samples_per_second": 122.802,
+      "eval_steps_per_second": 15.375,
+      "eval_wer": 0.99901655466317,
+      "step": 120
+    },
+    {
+      "epoch": 3.0,
+      "eval_loss": 1.608498215675354,
+      "eval_runtime": 5.1567,
+      "eval_samples_per_second": 122.366,
+      "eval_steps_per_second": 15.32,
+      "eval_wer": 0.929191935748238,
+      "step": 180
+    },
+    {
+      "epoch": 4.0,
+      "eval_loss": 1.4975178241729736,
+      "eval_runtime": 5.1972,
+      "eval_samples_per_second": 121.412,
+      "eval_steps_per_second": 15.201,
+      "eval_wer": 0.9142763481396492,
+      "step": 240
+    },
+    {
+      "epoch": 5.0,
+      "eval_loss": 1.4740536212921143,
+      "eval_runtime": 5.1873,
+      "eval_samples_per_second": 121.642,
+      "eval_steps_per_second": 15.229,
+      "eval_wer": 0.8701852155384363,
+      "step": 300
+    },
+    {
+      "epoch": 6.0,
+      "eval_loss": 1.5547226667404175,
+      "eval_runtime": 5.2242,
+      "eval_samples_per_second": 120.784,
+      "eval_steps_per_second": 15.122,
+      "eval_wer": 0.88264218980495,
+      "step": 360
+    },
+    {
+      "epoch": 7.0,
+      "eval_loss": 1.385581374168396,
+      "eval_runtime": 5.194,
+      "eval_samples_per_second": 121.486,
+      "eval_steps_per_second": 15.21,
+      "eval_wer": 0.8431404687756106,
+      "step": 420
+    },
+    {
+      "epoch": 8.0,
+      "eval_loss": 1.6811991930007935,
+      "eval_runtime": 5.2358,
+      "eval_samples_per_second": 120.516,
+      "eval_steps_per_second": 15.088,
+      "eval_wer": 0.8677266021963612,
+      "step": 480
+    },
+    {
+      "epoch": 8.33,
+      "learning_rate": 0.00021716666666666667,
+      "loss": 1.4916,
+      "step": 500
+    },
+    {
+      "epoch": 9.0,
+      "eval_loss": 1.651587724685669,
+      "eval_runtime": 5.1966,
+      "eval_samples_per_second": 121.426,
+      "eval_steps_per_second": 15.202,
+      "eval_wer": 0.8567447959350926,
+      "step": 540
+    },
+    {
+      "epoch": 10.0,
+      "eval_loss": 1.698971152305603,
+      "eval_runtime": 5.2046,
+      "eval_samples_per_second": 121.24,
+      "eval_steps_per_second": 15.179,
+      "eval_wer": 0.8611702999508277,
+      "step": 600
+    },
+    {
+      "epoch": 11.0,
+      "eval_loss": 1.6570122241973877,
+      "eval_runtime": 5.2467,
+      "eval_samples_per_second": 120.267,
+      "eval_steps_per_second": 15.057,
+      "eval_wer": 0.8464186198983773,
+      "step": 660
+    },
+    {
+      "epoch": 12.0,
+      "eval_loss": 1.7964118719100952,
+      "eval_runtime": 5.2019,
+      "eval_samples_per_second": 121.302,
+      "eval_steps_per_second": 15.187,
+      "eval_wer": 0.8636289132929028,
+      "step": 720
+    },
+    {
+      "epoch": 13.0,
+      "eval_loss": 1.72978937625885,
+      "eval_runtime": 5.2508,
+      "eval_samples_per_second": 120.172,
+      "eval_steps_per_second": 15.045,
+      "eval_wer": 0.8367480740862153,
+      "step": 780
+    },
+    {
+      "epoch": 14.0,
+      "eval_loss": 1.6711727380752563,
+      "eval_runtime": 5.2066,
+      "eval_samples_per_second": 121.192,
+      "eval_steps_per_second": 15.173,
+      "eval_wer": 0.8236354695951483,
+      "step": 840
+    },
+    {
+      "epoch": 15.0,
+      "eval_loss": 1.6306202411651611,
+      "eval_runtime": 5.2186,
+      "eval_samples_per_second": 120.913,
+      "eval_steps_per_second": 15.138,
+      "eval_wer": 0.8242910998197017,
+      "step": 900
+    },
+    {
+      "epoch": 16.0,
+      "eval_loss": 1.6020203828811646,
+      "eval_runtime": 5.2523,
+      "eval_samples_per_second": 120.138,
+      "eval_steps_per_second": 15.041,
+      "eval_wer": 0.812817570890018,
+      "step": 960
+    },
+    {
+      "epoch": 16.67,
+      "learning_rate": 0.00013383333333333332,
+      "loss": 0.1786,
+      "step": 1000
+    },
+    {
+      "epoch": 17.0,
+      "eval_loss": 1.7215255498886108,
+      "eval_runtime": 5.2057,
+      "eval_samples_per_second": 121.213,
+      "eval_steps_per_second": 15.176,
+      "eval_wer": 0.8308474020652352,
+      "step": 1020
+    },
+    {
+      "epoch": 18.0,
+      "eval_loss": 1.7741730213165283,
+      "eval_runtime": 5.2226,
+      "eval_samples_per_second": 120.821,
+      "eval_steps_per_second": 15.127,
+      "eval_wer": 0.8380593345353221,
+      "step": 1080
+    },
+    {
+      "epoch": 19.0,
+      "eval_loss": 1.7588073015213013,
+      "eval_runtime": 5.2348,
+      "eval_samples_per_second": 120.539,
+      "eval_steps_per_second": 15.091,
+      "eval_wer": 0.833633830519587,
+      "step": 1140
+    },
+    {
+      "epoch": 20.0,
+      "eval_loss": 1.7859772443771362,
+      "eval_runtime": 5.211,
+      "eval_samples_per_second": 121.089,
+      "eval_steps_per_second": 15.16,
+      "eval_wer": 0.8344533683002786,
+      "step": 1200
+    },
+    {
+      "epoch": 21.0,
+      "eval_loss": 1.8294274806976318,
+      "eval_runtime": 5.2508,
+      "eval_samples_per_second": 120.173,
+      "eval_steps_per_second": 15.045,
+      "eval_wer": 0.8367480740862153,
+      "step": 1260
+    },
+    {
+      "epoch": 22.0,
+      "eval_loss": 1.7776710987091064,
+      "eval_runtime": 5.2165,
+      "eval_samples_per_second": 120.962,
+      "eval_steps_per_second": 15.144,
+      "eval_wer": 0.8226520242583183,
+      "step": 1320
+    },
+    {
+      "epoch": 23.0,
+      "eval_loss": 1.8306204080581665,
+      "eval_runtime": 5.2033,
+      "eval_samples_per_second": 121.27,
+      "eval_steps_per_second": 15.183,
+      "eval_wer": 0.8290444189477135,
+      "step": 1380
+    },
+    {
+      "epoch": 24.0,
+      "eval_loss": 1.858679175376892,
+      "eval_runtime": 5.2509,
+      "eval_samples_per_second": 120.17,
+      "eval_steps_per_second": 15.045,
+      "eval_wer": 0.8247828224881167,
+      "step": 1440
+    },
+    {
+      "epoch": 25.0,
+      "learning_rate": 5.0499999999999994e-05,
+      "loss": 0.1062,
+      "step": 1500
+    }
+  ],
+  "max_steps": 1800,
+  "num_train_epochs": 30,
+  "total_flos": 5.842748350654745e+18,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fa648acdcbc8b36bbccaaa37950c762411d104e57f72f0874b9dc7143f51dc35
+size 4408

vocab.json ADDED Viewed

	@@ -0,0 +1,47 @@

+{
+  "\t": 0,
+  "&": 2,
+  "'": 3,
+  "/": 4,
+  "0": 5,
+  "1": 6,
+  "2": 7,
+  "4": 8,
+  "5": 9,
+  "7": 10,
+  "8": 11,
+  "9": 12,
+  "<": 13,
+  ">": 14,
+  "@": 15,
+  "^": 16,
+  "a": 17,
+  "c": 18,
+  "d": 19,
+  "e": 20,
+  "f": 21,
+  "g": 22,
+  "h": 23,
+  "i": 24,
+  "j": 25,
+  "k": 26,
+  "l": 27,
+  "m": 28,
+  "n": 29,
+  "o": 30,
+  "p": 31,
+  "q": 32,
+  "r": 33,
+  "s": 34,
+  "t": 35,
+  "u": 36,
+  "v": 37,
+  "w": 38,
+  "x": 39,
+  "y": 40,
+  "z": 41,
+  "|": 1,
+  "’": 42,
+  "！": 43,
+  "？": 44
+}