Upload Bengali

Browse files

Files changed (14) hide show

.ipynb_checkpoints/vocab-checkpoint.json +1 -0
checkpoint-10200/config.json +116 -0
checkpoint-10200/optimizer.pt +3 -0
checkpoint-10200/preprocessor_config.json +9 -0
checkpoint-10200/pytorch_model.bin +3 -0
checkpoint-10200/rng_state.pth +3 -0
checkpoint-10200/scaler.pt +3 -0
checkpoint-10200/scheduler.pt +3 -0
checkpoint-10200/trainer_state.json +560 -0
checkpoint-10200/training_args.bin +3 -0
config.json +116 -0
preprocessor_config.json +9 -0
pytorch_model.bin +3 -0
training_args.bin +3 -0

.ipynb_checkpoints/vocab-checkpoint.json ADDED Viewed

	@@ -0,0 +1 @@

+ {"৮": 0, "্": 1, "ফ": 2, "জ": 3, "ল": 4, "থ": 5, "৬": 6, "য": 7, "খ": 8, "উ": 9, "ূ": 10, "ং": 11, "ই": 12, "ড": 13, "প": 14, "১": 15, "ঠ": 16, "ও": 17, "গ": 18, "ী": 19, "৩": 20, "ঈ": 21, "ঝ": 22, "ৎ": 23, "ু": 24, "ৃ": 25, "ড়": 26, "এ": 27, "৯": 28, "ণ": 29, "ট": 30, "৭": 31, "ষ": 32, "ৗ": 33, "শ": 34, "দ": 35, "ত": 36, "ছ": 37, "ধ": 38, "ক": 39, "ঁ": 40, "ঋ": 41, "য়": 42, "ৰ": 43, "ব": 44, "র": 45, "ঊ": 46, "ঐ": 47, "৪": 48, "ো": 49, "ঞ": 50, "া": 51, "২": 52, "ম": 53, "আ": 54, "ঙ": 55, "ন": 56, "হ": 57, "ঢ়": 58, "ঢ": 59, "ৌ": 60, "চ": 61, "ি": 62, "ৈ": 63, "ঔ": 64, "ঘ": 65, " ": 66, "।": 67, "০": 68, "৫": 69, "স": 70, "়": 71, "ঃ": 72, "ে": 73, "অ": 74, "ভ": 75, "[UNK]": 76, "[PAD]": 77}

checkpoint-10200/config.json ADDED Viewed

	@@ -0,0 +1,116 @@

+{
+  "_name_or_path": "facebook/wav2vec2-large-xlsr-53",
+  "activation_dropout": 0.0,
+  "adapter_kernel_size": 3,
+  "adapter_stride": 2,
+  "add_adapter": false,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 768,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": true,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": false,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": true,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "layer",
+  "feat_proj_dropout": 0.1,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.1,
+  "mask_channel_length": 10,
+  "mask_channel_min_space": 1,
+  "mask_channel_other": 0.0,
+  "mask_channel_prob": 0.0,
+  "mask_channel_selection": "static",
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_min_space": 1,
+  "mask_time_other": 0.0,
+  "mask_time_prob": 0.075,
+  "mask_time_selection": "static",
+  "model_type": "wav2vec2",
+  "num_adapter_layers": 3,
+  "num_attention_heads": 16,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 24,
+  "num_negatives": 100,
+  "output_hidden_size": 1024,
+  "pad_token_id": 77,
+  "proj_codevector_dim": 768,
+  "tdnn_dilation": [
+    1,
+    2,
+    3,
+    1,
+    1
+  ],
+  "tdnn_dim": [
+    512,
+    512,
+    512,
+    512,
+    1500
+  ],
+  "tdnn_kernel": [
+    5,
+    3,
+    3,
+    1,
+    1
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.16.0.dev0",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 78,
+  "xvector_output_dim": 512
+}

checkpoint-10200/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c784b8e0d8f2080ccba1aef92751fbea5aca8c7851291bd1c8ca395e3ab7d37c
+size 2490698513

checkpoint-10200/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}

checkpoint-10200/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4bdd98ccfcd38a69a3ed23f8fb873cd4496b59dbde5e93d5e00f13684dae055d
+size 1262243441

checkpoint-10200/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e0ffb48e67ddff7084f538480bfbe92ea3254963a1057a6738573bb2fa14a11b
+size 14567

checkpoint-10200/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:973a8db7ec7e33e2e2060bd943fc5671ea12110c2893f93cd1939c729a014546
+size 559

checkpoint-10200/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:65076ff9eeb207a390d7d92cd39cd08e180ba6c2e65d9d5f4bbdcc2ab952a9c5
+size 623

checkpoint-10200/trainer_state.json ADDED Viewed

	@@ -0,0 +1,560 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 9.883506902397675,
+  "global_step": 10200,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.29,
+      "learning_rate": 0.00019520934761441092,
+      "loss": 7.3884,
+      "step": 300
+    },
+    {
+      "epoch": 0.29,
+      "eval_cer": 0.9996699598306373,
+      "eval_loss": 3.533357620239258,
+      "eval_runtime": 381.6147,
+      "eval_samples_per_second": 57.697,
+      "eval_steps_per_second": 7.214,
+      "eval_wer": 0.9997982352308189,
+      "step": 300
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 0.00018936708860759497,
+      "loss": 2.7914,
+      "step": 600
+    },
+    {
+      "epoch": 0.58,
+      "eval_cer": 0.3128259689501683,
+      "eval_loss": 1.0251679420471191,
+      "eval_runtime": 357.7393,
+      "eval_samples_per_second": 61.548,
+      "eval_steps_per_second": 7.696,
+      "eval_wer": 0.9026014204239751,
+      "step": 600
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 0.00018352482960077896,
+      "loss": 1.0845,
+      "step": 900
+    },
+    {
+      "epoch": 0.87,
+      "eval_cer": 0.23292367821083487,
+      "eval_loss": 0.6456783413887024,
+      "eval_runtime": 359.2262,
+      "eval_samples_per_second": 61.293,
+      "eval_steps_per_second": 7.664,
+      "eval_wer": 0.7633837296890132,
+      "step": 900
+    },
+    {
+      "epoch": 1.16,
+      "learning_rate": 0.000177682570593963,
+      "loss": 0.8596,
+      "step": 1200
+    },
+    {
+      "epoch": 1.16,
+      "eval_cer": 0.19856693084355662,
+      "eval_loss": 0.5056623816490173,
+      "eval_runtime": 356.2916,
+      "eval_samples_per_second": 61.798,
+      "eval_steps_per_second": 7.727,
+      "eval_wer": 0.7067685354567954,
+      "step": 1200
+    },
+    {
+      "epoch": 1.45,
+      "learning_rate": 0.00017184031158714704,
+      "loss": 0.764,
+      "step": 1500
+    },
+    {
+      "epoch": 1.45,
+      "eval_cer": 0.17508630984692217,
+      "eval_loss": 0.44483131170272827,
+      "eval_runtime": 356.1556,
+      "eval_samples_per_second": 61.821,
+      "eval_steps_per_second": 7.73,
+      "eval_wer": 0.6668191111589369,
+      "step": 1500
+    },
+    {
+      "epoch": 1.74,
+      "learning_rate": 0.00016599805258033109,
+      "loss": 0.6885,
+      "step": 1800
+    },
+    {
+      "epoch": 1.74,
+      "eval_cer": 0.16619476712626208,
+      "eval_loss": 0.39251354336738586,
+      "eval_runtime": 356.867,
+      "eval_samples_per_second": 61.698,
+      "eval_steps_per_second": 7.714,
+      "eval_wer": 0.6457010653179813,
+      "step": 1800
+    },
+    {
+      "epoch": 2.03,
+      "learning_rate": 0.0001601557935735151,
+      "loss": 0.6497,
+      "step": 2100
+    },
+    {
+      "epoch": 2.03,
+      "eval_cer": 0.1661144284008251,
+      "eval_loss": 0.3698385953903198,
+      "eval_runtime": 356.2072,
+      "eval_samples_per_second": 61.812,
+      "eval_steps_per_second": 7.729,
+      "eval_wer": 0.6270580006456472,
+      "step": 2100
+    },
+    {
+      "epoch": 2.33,
+      "learning_rate": 0.00015431353456669912,
+      "loss": 0.5945,
+      "step": 2400
+    },
+    {
+      "epoch": 2.33,
+      "eval_cer": 0.1486114428400825,
+      "eval_loss": 0.34724581241607666,
+      "eval_runtime": 358.2514,
+      "eval_samples_per_second": 61.46,
+      "eval_steps_per_second": 7.685,
+      "eval_wer": 0.610203916926719,
+      "step": 2400
+    },
+    {
+      "epoch": 2.62,
+      "learning_rate": 0.00014847127555988316,
+      "loss": 0.5678,
+      "step": 2700
+    },
+    {
+      "epoch": 2.62,
+      "eval_cer": 0.1441602431874932,
+      "eval_loss": 0.33363574743270874,
+      "eval_runtime": 358.3974,
+      "eval_samples_per_second": 61.435,
+      "eval_steps_per_second": 7.681,
+      "eval_wer": 0.5973716776068008,
+      "step": 2700
+    },
+    {
+      "epoch": 2.91,
+      "learning_rate": 0.0001426290165530672,
+      "loss": 0.5481,
+      "step": 3000
+    },
+    {
+      "epoch": 2.91,
+      "eval_cer": 0.14050157420475518,
+      "eval_loss": 0.3159181773662567,
+      "eval_runtime": 358.6283,
+      "eval_samples_per_second": 61.395,
+      "eval_steps_per_second": 7.676,
+      "eval_wer": 0.5890186161627031,
+      "step": 3000
+    },
+    {
+      "epoch": 3.2,
+      "learning_rate": 0.00013678675754625122,
+      "loss": 0.5168,
+      "step": 3300
+    },
+    {
+      "epoch": 3.2,
+      "eval_cer": 0.13693410053197264,
+      "eval_loss": 0.3075895607471466,
+      "eval_runtime": 357.1848,
+      "eval_samples_per_second": 61.643,
+      "eval_steps_per_second": 7.707,
+      "eval_wer": 0.5808404175185624,
+      "step": 3300
+    },
+    {
+      "epoch": 3.49,
+      "learning_rate": 0.00013094449853943524,
+      "loss": 0.4999,
+      "step": 3600
+    },
+    {
+      "epoch": 3.49,
+      "eval_cer": 0.13465204646618173,
+      "eval_loss": 0.29860812425613403,
+      "eval_runtime": 358.4693,
+      "eval_samples_per_second": 61.422,
+      "eval_steps_per_second": 7.68,
+      "eval_wer": 0.5744377488432153,
+      "step": 3600
+    },
+    {
+      "epoch": 3.78,
+      "learning_rate": 0.00012510223953261928,
+      "loss": 0.4848,
+      "step": 3900
+    },
+    {
+      "epoch": 3.78,
+      "eval_cer": 0.13505156877646293,
+      "eval_loss": 0.2938646674156189,
+      "eval_runtime": 358.234,
+      "eval_samples_per_second": 61.463,
+      "eval_steps_per_second": 7.685,
+      "eval_wer": 0.5665420208759281,
+      "step": 3900
+    },
+    {
+      "epoch": 4.07,
+      "learning_rate": 0.00011925998052580331,
+      "loss": 0.4677,
+      "step": 4200
+    },
+    {
+      "epoch": 4.07,
+      "eval_cer": 0.1289154272066008,
+      "eval_loss": 0.2809064984321594,
+      "eval_runtime": 356.7771,
+      "eval_samples_per_second": 61.714,
+      "eval_steps_per_second": 7.716,
+      "eval_wer": 0.5597358226622189,
+      "step": 4200
+    },
+    {
+      "epoch": 4.36,
+      "learning_rate": 0.00011341772151898735,
+      "loss": 0.4483,
+      "step": 4500
+    },
+    {
+      "epoch": 4.36,
+      "eval_cer": 0.12665508630984693,
+      "eval_loss": 0.27132293581962585,
+      "eval_runtime": 355.1486,
+      "eval_samples_per_second": 61.997,
+      "eval_steps_per_second": 7.752,
+      "eval_wer": 0.5531179382330786,
+      "step": 4500
+    },
+    {
+      "epoch": 4.65,
+      "learning_rate": 0.00010757546251217138,
+      "loss": 0.4358,
+      "step": 4800
+    },
+    {
+      "epoch": 4.65,
+      "eval_cer": 0.12472261426555206,
+      "eval_loss": 0.268148809671402,
+      "eval_runtime": 357.7053,
+      "eval_samples_per_second": 61.553,
+      "eval_steps_per_second": 7.696,
+      "eval_wer": 0.5454239750349725,
+      "step": 4800
+    },
+    {
+      "epoch": 4.94,
+      "learning_rate": 0.0001017332035053554,
+      "loss": 0.4271,
+      "step": 5100
+    },
+    {
+      "epoch": 4.94,
+      "eval_cer": 0.12406470524373032,
+      "eval_loss": 0.25914254784584045,
+      "eval_runtime": 355.8253,
+      "eval_samples_per_second": 61.879,
+      "eval_steps_per_second": 7.737,
+      "eval_wer": 0.5402318949747121,
+      "step": 5100
+    },
+    {
+      "epoch": 5.23,
+      "learning_rate": 9.589094449853944e-05,
+      "loss": 0.407,
+      "step": 5400
+    },
+    {
+      "epoch": 5.23,
+      "eval_cer": 0.12141786993811747,
+      "eval_loss": 0.25540652871131897,
+      "eval_runtime": 358.4634,
+      "eval_samples_per_second": 61.423,
+      "eval_steps_per_second": 7.68,
+      "eval_wer": 0.5377838157753148,
+      "step": 5400
+    },
+    {
+      "epoch": 5.52,
+      "learning_rate": 9.004868549172347e-05,
+      "loss": 0.3931,
+      "step": 5700
+    },
+    {
+      "epoch": 5.52,
+      "eval_cer": 0.12145695364238411,
+      "eval_loss": 0.25973308086395264,
+      "eval_runtime": 356.1836,
+      "eval_samples_per_second": 61.816,
+      "eval_steps_per_second": 7.729,
+      "eval_wer": 0.5346900893145379,
+      "step": 5700
+    },
+    {
+      "epoch": 5.81,
+      "learning_rate": 8.42064264849075e-05,
+      "loss": 0.3945,
+      "step": 6000
+    },
+    {
+      "epoch": 5.81,
+      "eval_cer": 0.11911627402019324,
+      "eval_loss": 0.2458212673664093,
+      "eval_runtime": 357.5762,
+      "eval_samples_per_second": 61.576,
+      "eval_steps_per_second": 7.699,
+      "eval_wer": 0.5292962444850963,
+      "step": 6000
+    },
+    {
+      "epoch": 6.1,
+      "learning_rate": 7.836416747809153e-05,
+      "loss": 0.3818,
+      "step": 6300
+    },
+    {
+      "epoch": 6.1,
+      "eval_cer": 0.12016936271848877,
+      "eval_loss": 0.24545489251613617,
+      "eval_runtime": 358.2815,
+      "eval_samples_per_second": 61.454,
+      "eval_steps_per_second": 7.684,
+      "eval_wer": 0.5279645970085011,
+      "step": 6300
+    },
+    {
+      "epoch": 6.4,
+      "learning_rate": 7.252190847127556e-05,
+      "loss": 0.3687,
+      "step": 6600
+    },
+    {
+      "epoch": 6.4,
+      "eval_cer": 0.1174161328845945,
+      "eval_loss": 0.24405910074710846,
+      "eval_runtime": 358.5525,
+      "eval_samples_per_second": 61.408,
+      "eval_steps_per_second": 7.678,
+      "eval_wer": 0.5244269880555257,
+      "step": 6600
+    },
+    {
+      "epoch": 6.69,
+      "learning_rate": 6.667964946445959e-05,
+      "loss": 0.3627,
+      "step": 6900
+    },
+    {
+      "epoch": 6.69,
+      "eval_cer": 0.1159483226576919,
+      "eval_loss": 0.23746837675571442,
+      "eval_runtime": 360.1336,
+      "eval_samples_per_second": 61.138,
+      "eval_steps_per_second": 7.644,
+      "eval_wer": 0.5213198106101367,
+      "step": 6900
+    },
+    {
+      "epoch": 6.98,
+      "learning_rate": 6.083739045764363e-05,
+      "loss": 0.3536,
+      "step": 7200
+    },
+    {
+      "epoch": 6.98,
+      "eval_cer": 0.11431114971230051,
+      "eval_loss": 0.23441533744335175,
+      "eval_runtime": 357.6113,
+      "eval_samples_per_second": 61.57,
+      "eval_steps_per_second": 7.698,
+      "eval_wer": 0.5191542020875928,
+      "step": 7200
+    },
+    {
+      "epoch": 7.27,
+      "learning_rate": 5.499513145082765e-05,
+      "loss": 0.3406,
+      "step": 7500
+    },
+    {
+      "epoch": 7.27,
+      "eval_cer": 0.11381391814135274,
+      "eval_loss": 0.23369348049163818,
+      "eval_runtime": 355.2971,
+      "eval_samples_per_second": 61.971,
+      "eval_steps_per_second": 7.748,
+      "eval_wer": 0.5165447110728505,
+      "step": 7500
+    },
+    {
+      "epoch": 7.56,
+      "learning_rate": 4.915287244401169e-05,
+      "loss": 0.3407,
+      "step": 7800
+    },
+    {
+      "epoch": 7.56,
+      "eval_cer": 0.11317989360547172,
+      "eval_loss": 0.23301520943641663,
+      "eval_runtime": 355.7639,
+      "eval_samples_per_second": 61.889,
+      "eval_steps_per_second": 7.738,
+      "eval_wer": 0.5148902399655655,
+      "step": 7800
+    },
+    {
+      "epoch": 7.85,
+      "learning_rate": 4.33300876338851e-05,
+      "loss": 0.3376,
+      "step": 8100
+    },
+    {
+      "epoch": 7.85,
+      "eval_cer": 0.11235913581587233,
+      "eval_loss": 0.22977174818515778,
+      "eval_runtime": 358.6159,
+      "eval_samples_per_second": 61.397,
+      "eval_steps_per_second": 7.677,
+      "eval_wer": 0.5103976111051329,
+      "step": 8100
+    },
+    {
+      "epoch": 8.14,
+      "learning_rate": 3.748782862706913e-05,
+      "loss": 0.3283,
+      "step": 8400
+    },
+    {
+      "epoch": 8.14,
+      "eval_cer": 0.11278905656280534,
+      "eval_loss": 0.22892726957798004,
+      "eval_runtime": 358.772,
+      "eval_samples_per_second": 61.37,
+      "eval_steps_per_second": 7.673,
+      "eval_wer": 0.5095501990745722,
+      "step": 8400
+    },
+    {
+      "epoch": 8.43,
+      "learning_rate": 3.1645569620253167e-05,
+      "loss": 0.3192,
+      "step": 8700
+    },
+    {
+      "epoch": 8.43,
+      "eval_cer": 0.11249375746390186,
+      "eval_loss": 0.22378800809383392,
+      "eval_runtime": 356.1078,
+      "eval_samples_per_second": 61.83,
+      "eval_steps_per_second": 7.731,
+      "eval_wer": 0.5087431399978478,
+      "step": 8700
+    },
+    {
+      "epoch": 8.72,
+      "learning_rate": 2.58033106134372e-05,
+      "loss": 0.3113,
+      "step": 9000
+    },
+    {
+      "epoch": 8.72,
+      "eval_cer": 0.11138638584301379,
+      "eval_loss": 0.2272792011499405,
+      "eval_runtime": 355.3786,
+      "eval_samples_per_second": 61.956,
+      "eval_steps_per_second": 7.747,
+      "eval_wer": 0.5062950607984504,
+      "step": 9000
+    },
+    {
+      "epoch": 9.01,
+      "learning_rate": 1.996105160662123e-05,
+      "loss": 0.314,
+      "step": 9300
+    },
+    {
+      "epoch": 9.01,
+      "eval_cer": 0.1103636955813701,
+      "eval_loss": 0.223616361618042,
+      "eval_runtime": 358.619,
+      "eval_samples_per_second": 61.397,
+      "eval_steps_per_second": 7.677,
+      "eval_wer": 0.5051786290756484,
+      "step": 9300
+    },
+    {
+      "epoch": 9.3,
+      "learning_rate": 1.411879259980526e-05,
+      "loss": 0.3049,
+      "step": 9600
+    },
+    {
+      "epoch": 9.3,
+      "eval_cer": 0.11000108565845185,
+      "eval_loss": 0.2234642207622528,
+      "eval_runtime": 358.9948,
+      "eval_samples_per_second": 61.332,
+      "eval_steps_per_second": 7.669,
+      "eval_wer": 0.5038738835682772,
+      "step": 9600
+    },
+    {
+      "epoch": 9.59,
+      "learning_rate": 8.27653359298929e-06,
+      "loss": 0.3028,
+      "step": 9900
+    },
+    {
+      "epoch": 9.59,
+      "eval_cer": 0.10983606557377049,
+      "eval_loss": 0.22289590537548065,
+      "eval_runtime": 356.6815,
+      "eval_samples_per_second": 61.73,
+      "eval_steps_per_second": 7.718,
+      "eval_wer": 0.5035510599375874,
+      "step": 9900
+    },
+    {
+      "epoch": 9.88,
+      "learning_rate": 2.4342745861733204e-06,
+      "loss": 0.3026,
+      "step": 10200
+    },
+    {
+      "epoch": 9.88,
+      "eval_cer": 0.10945825643252632,
+      "eval_loss": 0.22115875780582428,
+      "eval_runtime": 355.7805,
+      "eval_samples_per_second": 61.886,
+      "eval_steps_per_second": 7.738,
+      "eval_wer": 0.503295491229958,
+      "step": 10200
+    }
+  ],
+  "max_steps": 10320,
+  "num_train_epochs": 10,
+  "total_flos": 7.282334872342427e+19,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-10200/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d9ecf6e57275cb7acc55b94084f6c9d6d092c6f2fffe8083bf55c3c6f45893cd
+size 2991

config.json ADDED Viewed

	@@ -0,0 +1,116 @@

+{
+  "_name_or_path": "facebook/wav2vec2-large-xlsr-53",
+  "activation_dropout": 0.0,
+  "adapter_kernel_size": 3,
+  "adapter_stride": 2,
+  "add_adapter": false,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 768,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": true,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": false,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": true,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "layer",
+  "feat_proj_dropout": 0.1,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.1,
+  "mask_channel_length": 10,
+  "mask_channel_min_space": 1,
+  "mask_channel_other": 0.0,
+  "mask_channel_prob": 0.0,
+  "mask_channel_selection": "static",
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_min_space": 1,
+  "mask_time_other": 0.0,
+  "mask_time_prob": 0.075,
+  "mask_time_selection": "static",
+  "model_type": "wav2vec2",
+  "num_adapter_layers": 3,
+  "num_attention_heads": 16,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 24,
+  "num_negatives": 100,
+  "output_hidden_size": 1024,
+  "pad_token_id": 77,
+  "proj_codevector_dim": 768,
+  "tdnn_dilation": [
+    1,
+    2,
+    3,
+    1,
+    1
+  ],
+  "tdnn_dim": [
+    512,
+    512,
+    512,
+    512,
+    1500
+  ],
+  "tdnn_kernel": [
+    5,
+    3,
+    3,
+    1,
+    1
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.16.0.dev0",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 78,
+  "xvector_output_dim": 512
+}

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:40e64e5aa8962fa0dcac7a9bc6d6004dfe578eb4975b6c5aedfc64b95d5bfc6d
+size 1262243441

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d9ecf6e57275cb7acc55b94084f6c9d6d092c6f2fffe8083bf55c3c6f45893cd
+size 2991