Upload Bengali

Browse files

Files changed (9) hide show

checkpoint-10200/config.json +0 -116
checkpoint-10200/optimizer.pt +0 -3
checkpoint-10200/preprocessor_config.json +0 -9
checkpoint-10200/pytorch_model.bin +0 -3
checkpoint-10200/rng_state.pth +0 -3
checkpoint-10200/scaler.pt +0 -3
checkpoint-10200/scheduler.pt +0 -3
checkpoint-10200/trainer_state.json +0 -560
checkpoint-10200/training_args.bin +0 -3

checkpoint-10200/config.json DELETED Viewed

@@ -1,116 +0,0 @@
-{
-  "_name_or_path": "facebook/wav2vec2-large-xlsr-53",
-  "activation_dropout": 0.0,
-  "adapter_kernel_size": 3,
-  "adapter_stride": 2,
-  "add_adapter": false,
-  "apply_spec_augment": true,
-  "architectures": [
-    "Wav2Vec2ForCTC"
-  ],
-  "attention_dropout": 0.1,
-  "bos_token_id": 1,
-  "classifier_proj_size": 256,
-  "codevector_dim": 768,
-  "contrastive_logits_temperature": 0.1,
-  "conv_bias": true,
-  "conv_dim": [
-    512,
-    512,
-    512,
-    512,
-    512,
-    512,
-    512
-  ],
-  "conv_kernel": [
-    10,
-    3,
-    3,
-    3,
-    3,
-    2,
-    2
-  ],
-  "conv_stride": [
-    5,
-    2,
-    2,
-    2,
-    2,
-    2,
-    2
-  ],
-  "ctc_loss_reduction": "mean",
-  "ctc_zero_infinity": false,
-  "diversity_loss_weight": 0.1,
-  "do_stable_layer_norm": true,
-  "eos_token_id": 2,
-  "feat_extract_activation": "gelu",
-  "feat_extract_dropout": 0.0,
-  "feat_extract_norm": "layer",
-  "feat_proj_dropout": 0.1,
-  "feat_quantizer_dropout": 0.0,
-  "final_dropout": 0.0,
-  "gradient_checkpointing": false,
-  "hidden_act": "gelu",
-  "hidden_dropout": 0.1,
-  "hidden_size": 1024,
-  "initializer_range": 0.02,
-  "intermediate_size": 4096,
-  "layer_norm_eps": 1e-05,
-  "layerdrop": 0.1,
-  "mask_channel_length": 10,
-  "mask_channel_min_space": 1,
-  "mask_channel_other": 0.0,
-  "mask_channel_prob": 0.0,
-  "mask_channel_selection": "static",
-  "mask_feature_length": 10,
-  "mask_feature_min_masks": 0,
-  "mask_feature_prob": 0.0,
-  "mask_time_length": 10,
-  "mask_time_min_masks": 2,
-  "mask_time_min_space": 1,
-  "mask_time_other": 0.0,
-  "mask_time_prob": 0.075,
-  "mask_time_selection": "static",
-  "model_type": "wav2vec2",
-  "num_adapter_layers": 3,
-  "num_attention_heads": 16,
-  "num_codevector_groups": 2,
-  "num_codevectors_per_group": 320,
-  "num_conv_pos_embedding_groups": 16,
-  "num_conv_pos_embeddings": 128,
-  "num_feat_extract_layers": 7,
-  "num_hidden_layers": 24,
-  "num_negatives": 100,
-  "output_hidden_size": 1024,
-  "pad_token_id": 77,
-  "proj_codevector_dim": 768,
-  "tdnn_dilation": [
-    1,
-    2,
-    3,
-    1,
-    1
-  ],
-  "tdnn_dim": [
-    512,
-    512,
-    512,
-    512,
-    1500
-  ],
-  "tdnn_kernel": [
-    5,
-    3,
-    3,
-    1,
-    1
-  ],
-  "torch_dtype": "float32",
-  "transformers_version": "4.16.0.dev0",
-  "use_weighted_layer_sum": false,
-  "vocab_size": 78,
-  "xvector_output_dim": 512
-}

checkpoint-10200/optimizer.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:c784b8e0d8f2080ccba1aef92751fbea5aca8c7851291bd1c8ca395e3ab7d37c
-size 2490698513

checkpoint-10200/preprocessor_config.json DELETED Viewed

@@ -1,9 +0,0 @@
-{
-  "do_normalize": true,
-  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
-  "feature_size": 1,
-  "padding_side": "right",
-  "padding_value": 0.0,
-  "return_attention_mask": true,
-  "sampling_rate": 16000
-}

checkpoint-10200/pytorch_model.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:4bdd98ccfcd38a69a3ed23f8fb873cd4496b59dbde5e93d5e00f13684dae055d
-size 1262243441

checkpoint-10200/rng_state.pth DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:e0ffb48e67ddff7084f538480bfbe92ea3254963a1057a6738573bb2fa14a11b
-size 14567

checkpoint-10200/scaler.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:973a8db7ec7e33e2e2060bd943fc5671ea12110c2893f93cd1939c729a014546
-size 559

checkpoint-10200/scheduler.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:65076ff9eeb207a390d7d92cd39cd08e180ba6c2e65d9d5f4bbdcc2ab952a9c5
-size 623

checkpoint-10200/trainer_state.json DELETED Viewed

@@ -1,560 +0,0 @@
-{
-  "best_metric": null,
-  "best_model_checkpoint": null,
-  "epoch": 9.883506902397675,
-  "global_step": 10200,
-  "is_hyper_param_search": false,
-  "is_local_process_zero": true,
-  "is_world_process_zero": true,
-  "log_history": [
-    {
-      "epoch": 0.29,
-      "learning_rate": 0.00019520934761441092,
-      "loss": 7.3884,
-      "step": 300
-    },
-    {
-      "epoch": 0.29,
-      "eval_cer": 0.9996699598306373,
-      "eval_loss": 3.533357620239258,
-      "eval_runtime": 381.6147,
-      "eval_samples_per_second": 57.697,
-      "eval_steps_per_second": 7.214,
-      "eval_wer": 0.9997982352308189,
-      "step": 300
-    },
-    {
-      "epoch": 0.58,
-      "learning_rate": 0.00018936708860759497,
-      "loss": 2.7914,
-      "step": 600
-    },
-    {
-      "epoch": 0.58,
-      "eval_cer": 0.3128259689501683,
-      "eval_loss": 1.0251679420471191,
-      "eval_runtime": 357.7393,
-      "eval_samples_per_second": 61.548,
-      "eval_steps_per_second": 7.696,
-      "eval_wer": 0.9026014204239751,
-      "step": 600
-    },
-    {
-      "epoch": 0.87,
-      "learning_rate": 0.00018352482960077896,
-      "loss": 1.0845,
-      "step": 900
-    },
-    {
-      "epoch": 0.87,
-      "eval_cer": 0.23292367821083487,
-      "eval_loss": 0.6456783413887024,
-      "eval_runtime": 359.2262,
-      "eval_samples_per_second": 61.293,
-      "eval_steps_per_second": 7.664,
-      "eval_wer": 0.7633837296890132,
-      "step": 900
-    },
-    {
-      "epoch": 1.16,
-      "learning_rate": 0.000177682570593963,
-      "loss": 0.8596,
-      "step": 1200
-    },
-    {
-      "epoch": 1.16,
-      "eval_cer": 0.19856693084355662,
-      "eval_loss": 0.5056623816490173,
-      "eval_runtime": 356.2916,
-      "eval_samples_per_second": 61.798,
-      "eval_steps_per_second": 7.727,
-      "eval_wer": 0.7067685354567954,
-      "step": 1200
-    },
-    {
-      "epoch": 1.45,
-      "learning_rate": 0.00017184031158714704,
-      "loss": 0.764,
-      "step": 1500
-    },
-    {
-      "epoch": 1.45,
-      "eval_cer": 0.17508630984692217,
-      "eval_loss": 0.44483131170272827,
-      "eval_runtime": 356.1556,
-      "eval_samples_per_second": 61.821,
-      "eval_steps_per_second": 7.73,
-      "eval_wer": 0.6668191111589369,
-      "step": 1500
-    },
-    {
-      "epoch": 1.74,
-      "learning_rate": 0.00016599805258033109,
-      "loss": 0.6885,
-      "step": 1800
-    },
-    {
-      "epoch": 1.74,
-      "eval_cer": 0.16619476712626208,
-      "eval_loss": 0.39251354336738586,
-      "eval_runtime": 356.867,
-      "eval_samples_per_second": 61.698,
-      "eval_steps_per_second": 7.714,
-      "eval_wer": 0.6457010653179813,
-      "step": 1800
-    },
-    {
-      "epoch": 2.03,
-      "learning_rate": 0.0001601557935735151,
-      "loss": 0.6497,
-      "step": 2100
-    },
-    {
-      "epoch": 2.03,
-      "eval_cer": 0.1661144284008251,
-      "eval_loss": 0.3698385953903198,
-      "eval_runtime": 356.2072,
-      "eval_samples_per_second": 61.812,
-      "eval_steps_per_second": 7.729,
-      "eval_wer": 0.6270580006456472,
-      "step": 2100
-    },
-    {
-      "epoch": 2.33,
-      "learning_rate": 0.00015431353456669912,
-      "loss": 0.5945,
-      "step": 2400
-    },
-    {
-      "epoch": 2.33,
-      "eval_cer": 0.1486114428400825,
-      "eval_loss": 0.34724581241607666,
-      "eval_runtime": 358.2514,
-      "eval_samples_per_second": 61.46,
-      "eval_steps_per_second": 7.685,
-      "eval_wer": 0.610203916926719,
-      "step": 2400
-    },
-    {
-      "epoch": 2.62,
-      "learning_rate": 0.00014847127555988316,
-      "loss": 0.5678,
-      "step": 2700
-    },
-    {
-      "epoch": 2.62,
-      "eval_cer": 0.1441602431874932,
-      "eval_loss": 0.33363574743270874,
-      "eval_runtime": 358.3974,
-      "eval_samples_per_second": 61.435,
-      "eval_steps_per_second": 7.681,
-      "eval_wer": 0.5973716776068008,
-      "step": 2700
-    },
-    {
-      "epoch": 2.91,
-      "learning_rate": 0.0001426290165530672,
-      "loss": 0.5481,
-      "step": 3000
-    },
-    {
-      "epoch": 2.91,
-      "eval_cer": 0.14050157420475518,
-      "eval_loss": 0.3159181773662567,
-      "eval_runtime": 358.6283,
-      "eval_samples_per_second": 61.395,
-      "eval_steps_per_second": 7.676,
-      "eval_wer": 0.5890186161627031,
-      "step": 3000
-    },
-    {
-      "epoch": 3.2,
-      "learning_rate": 0.00013678675754625122,
-      "loss": 0.5168,
-      "step": 3300
-    },
-    {
-      "epoch": 3.2,
-      "eval_cer": 0.13693410053197264,
-      "eval_loss": 0.3075895607471466,
-      "eval_runtime": 357.1848,
-      "eval_samples_per_second": 61.643,
-      "eval_steps_per_second": 7.707,
-      "eval_wer": 0.5808404175185624,
-      "step": 3300
-    },
-    {
-      "epoch": 3.49,
-      "learning_rate": 0.00013094449853943524,
-      "loss": 0.4999,
-      "step": 3600
-    },
-    {
-      "epoch": 3.49,
-      "eval_cer": 0.13465204646618173,
-      "eval_loss": 0.29860812425613403,
-      "eval_runtime": 358.4693,
-      "eval_samples_per_second": 61.422,
-      "eval_steps_per_second": 7.68,
-      "eval_wer": 0.5744377488432153,
-      "step": 3600
-    },
-    {
-      "epoch": 3.78,
-      "learning_rate": 0.00012510223953261928,
-      "loss": 0.4848,
-      "step": 3900
-    },
-    {
-      "epoch": 3.78,
-      "eval_cer": 0.13505156877646293,
-      "eval_loss": 0.2938646674156189,
-      "eval_runtime": 358.234,
-      "eval_samples_per_second": 61.463,
-      "eval_steps_per_second": 7.685,
-      "eval_wer": 0.5665420208759281,
-      "step": 3900
-    },
-    {
-      "epoch": 4.07,
-      "learning_rate": 0.00011925998052580331,
-      "loss": 0.4677,
-      "step": 4200
-    },
-    {
-      "epoch": 4.07,
-      "eval_cer": 0.1289154272066008,
-      "eval_loss": 0.2809064984321594,
-      "eval_runtime": 356.7771,
-      "eval_samples_per_second": 61.714,
-      "eval_steps_per_second": 7.716,
-      "eval_wer": 0.5597358226622189,
-      "step": 4200
-    },
-    {
-      "epoch": 4.36,
-      "learning_rate": 0.00011341772151898735,
-      "loss": 0.4483,
-      "step": 4500
-    },
-    {
-      "epoch": 4.36,
-      "eval_cer": 0.12665508630984693,
-      "eval_loss": 0.27132293581962585,
-      "eval_runtime": 355.1486,
-      "eval_samples_per_second": 61.997,
-      "eval_steps_per_second": 7.752,
-      "eval_wer": 0.5531179382330786,
-      "step": 4500
-    },
-    {
-      "epoch": 4.65,
-      "learning_rate": 0.00010757546251217138,
-      "loss": 0.4358,
-      "step": 4800
-    },
-    {
-      "epoch": 4.65,
-      "eval_cer": 0.12472261426555206,
-      "eval_loss": 0.268148809671402,
-      "eval_runtime": 357.7053,
-      "eval_samples_per_second": 61.553,
-      "eval_steps_per_second": 7.696,
-      "eval_wer": 0.5454239750349725,
-      "step": 4800
-    },
-    {
-      "epoch": 4.94,
-      "learning_rate": 0.0001017332035053554,
-      "loss": 0.4271,
-      "step": 5100
-    },
-    {
-      "epoch": 4.94,
-      "eval_cer": 0.12406470524373032,
-      "eval_loss": 0.25914254784584045,
-      "eval_runtime": 355.8253,
-      "eval_samples_per_second": 61.879,
-      "eval_steps_per_second": 7.737,
-      "eval_wer": 0.5402318949747121,
-      "step": 5100
-    },
-    {
-      "epoch": 5.23,
-      "learning_rate": 9.589094449853944e-05,
-      "loss": 0.407,
-      "step": 5400
-    },
-    {
-      "epoch": 5.23,
-      "eval_cer": 0.12141786993811747,
-      "eval_loss": 0.25540652871131897,
-      "eval_runtime": 358.4634,
-      "eval_samples_per_second": 61.423,
-      "eval_steps_per_second": 7.68,
-      "eval_wer": 0.5377838157753148,
-      "step": 5400
-    },
-    {
-      "epoch": 5.52,
-      "learning_rate": 9.004868549172347e-05,
-      "loss": 0.3931,
-      "step": 5700
-    },
-    {
-      "epoch": 5.52,
-      "eval_cer": 0.12145695364238411,
-      "eval_loss": 0.25973308086395264,
-      "eval_runtime": 356.1836,
-      "eval_samples_per_second": 61.816,
-      "eval_steps_per_second": 7.729,
-      "eval_wer": 0.5346900893145379,
-      "step": 5700
-    },
-    {
-      "epoch": 5.81,
-      "learning_rate": 8.42064264849075e-05,
-      "loss": 0.3945,
-      "step": 6000
-    },
-    {
-      "epoch": 5.81,
-      "eval_cer": 0.11911627402019324,
-      "eval_loss": 0.2458212673664093,
-      "eval_runtime": 357.5762,
-      "eval_samples_per_second": 61.576,
-      "eval_steps_per_second": 7.699,
-      "eval_wer": 0.5292962444850963,
-      "step": 6000
-    },
-    {
-      "epoch": 6.1,
-      "learning_rate": 7.836416747809153e-05,
-      "loss": 0.3818,
-      "step": 6300
-    },
-    {
-      "epoch": 6.1,
-      "eval_cer": 0.12016936271848877,
-      "eval_loss": 0.24545489251613617,
-      "eval_runtime": 358.2815,
-      "eval_samples_per_second": 61.454,
-      "eval_steps_per_second": 7.684,
-      "eval_wer": 0.5279645970085011,
-      "step": 6300
-    },
-    {
-      "epoch": 6.4,
-      "learning_rate": 7.252190847127556e-05,
-      "loss": 0.3687,
-      "step": 6600
-    },
-    {
-      "epoch": 6.4,
-      "eval_cer": 0.1174161328845945,
-      "eval_loss": 0.24405910074710846,
-      "eval_runtime": 358.5525,
-      "eval_samples_per_second": 61.408,
-      "eval_steps_per_second": 7.678,
-      "eval_wer": 0.5244269880555257,
-      "step": 6600
-    },
-    {
-      "epoch": 6.69,
-      "learning_rate": 6.667964946445959e-05,
-      "loss": 0.3627,
-      "step": 6900
-    },
-    {
-      "epoch": 6.69,
-      "eval_cer": 0.1159483226576919,
-      "eval_loss": 0.23746837675571442,
-      "eval_runtime": 360.1336,
-      "eval_samples_per_second": 61.138,
-      "eval_steps_per_second": 7.644,
-      "eval_wer": 0.5213198106101367,
-      "step": 6900
-    },
-    {
-      "epoch": 6.98,
-      "learning_rate": 6.083739045764363e-05,
-      "loss": 0.3536,
-      "step": 7200
-    },
-    {
-      "epoch": 6.98,
-      "eval_cer": 0.11431114971230051,
-      "eval_loss": 0.23441533744335175,
-      "eval_runtime": 357.6113,
-      "eval_samples_per_second": 61.57,
-      "eval_steps_per_second": 7.698,
-      "eval_wer": 0.5191542020875928,
-      "step": 7200
-    },
-    {
-      "epoch": 7.27,
-      "learning_rate": 5.499513145082765e-05,
-      "loss": 0.3406,
-      "step": 7500
-    },
-    {
-      "epoch": 7.27,
-      "eval_cer": 0.11381391814135274,
-      "eval_loss": 0.23369348049163818,
-      "eval_runtime": 355.2971,
-      "eval_samples_per_second": 61.971,
-      "eval_steps_per_second": 7.748,
-      "eval_wer": 0.5165447110728505,
-      "step": 7500
-    },
-    {
-      "epoch": 7.56,
-      "learning_rate": 4.915287244401169e-05,
-      "loss": 0.3407,
-      "step": 7800
-    },
-    {
-      "epoch": 7.56,
-      "eval_cer": 0.11317989360547172,
-      "eval_loss": 0.23301520943641663,
-      "eval_runtime": 355.7639,
-      "eval_samples_per_second": 61.889,
-      "eval_steps_per_second": 7.738,
-      "eval_wer": 0.5148902399655655,
-      "step": 7800
-    },
-    {
-      "epoch": 7.85,
-      "learning_rate": 4.33300876338851e-05,
-      "loss": 0.3376,
-      "step": 8100
-    },
-    {
-      "epoch": 7.85,
-      "eval_cer": 0.11235913581587233,
-      "eval_loss": 0.22977174818515778,
-      "eval_runtime": 358.6159,
-      "eval_samples_per_second": 61.397,
-      "eval_steps_per_second": 7.677,
-      "eval_wer": 0.5103976111051329,
-      "step": 8100
-    },
-    {
-      "epoch": 8.14,
-      "learning_rate": 3.748782862706913e-05,
-      "loss": 0.3283,
-      "step": 8400
-    },
-    {
-      "epoch": 8.14,
-      "eval_cer": 0.11278905656280534,
-      "eval_loss": 0.22892726957798004,
-      "eval_runtime": 358.772,
-      "eval_samples_per_second": 61.37,
-      "eval_steps_per_second": 7.673,
-      "eval_wer": 0.5095501990745722,
-      "step": 8400
-    },
-    {
-      "epoch": 8.43,
-      "learning_rate": 3.1645569620253167e-05,
-      "loss": 0.3192,
-      "step": 8700
-    },
-    {
-      "epoch": 8.43,
-      "eval_cer": 0.11249375746390186,
-      "eval_loss": 0.22378800809383392,
-      "eval_runtime": 356.1078,
-      "eval_samples_per_second": 61.83,
-      "eval_steps_per_second": 7.731,
-      "eval_wer": 0.5087431399978478,
-      "step": 8700
-    },
-    {
-      "epoch": 8.72,
-      "learning_rate": 2.58033106134372e-05,
-      "loss": 0.3113,
-      "step": 9000
-    },
-    {
-      "epoch": 8.72,
-      "eval_cer": 0.11138638584301379,
-      "eval_loss": 0.2272792011499405,
-      "eval_runtime": 355.3786,
-      "eval_samples_per_second": 61.956,
-      "eval_steps_per_second": 7.747,
-      "eval_wer": 0.5062950607984504,
-      "step": 9000
-    },
-    {
-      "epoch": 9.01,
-      "learning_rate": 1.996105160662123e-05,
-      "loss": 0.314,
-      "step": 9300
-    },
-    {
-      "epoch": 9.01,
-      "eval_cer": 0.1103636955813701,
-      "eval_loss": 0.223616361618042,
-      "eval_runtime": 358.619,
-      "eval_samples_per_second": 61.397,
-      "eval_steps_per_second": 7.677,
-      "eval_wer": 0.5051786290756484,
-      "step": 9300
-    },
-    {
-      "epoch": 9.3,
-      "learning_rate": 1.411879259980526e-05,
-      "loss": 0.3049,
-      "step": 9600
-    },
-    {
-      "epoch": 9.3,
-      "eval_cer": 0.11000108565845185,
-      "eval_loss": 0.2234642207622528,
-      "eval_runtime": 358.9948,
-      "eval_samples_per_second": 61.332,
-      "eval_steps_per_second": 7.669,
-      "eval_wer": 0.5038738835682772,
-      "step": 9600
-    },
-    {
-      "epoch": 9.59,
-      "learning_rate": 8.27653359298929e-06,
-      "loss": 0.3028,
-      "step": 9900
-    },
-    {
-      "epoch": 9.59,
-      "eval_cer": 0.10983606557377049,
-      "eval_loss": 0.22289590537548065,
-      "eval_runtime": 356.6815,
-      "eval_samples_per_second": 61.73,
-      "eval_steps_per_second": 7.718,
-      "eval_wer": 0.5035510599375874,
-      "step": 9900
-    },
-    {
-      "epoch": 9.88,
-      "learning_rate": 2.4342745861733204e-06,
-      "loss": 0.3026,
-      "step": 10200
-    },
-    {
-      "epoch": 9.88,
-      "eval_cer": 0.10945825643252632,
-      "eval_loss": 0.22115875780582428,
-      "eval_runtime": 355.7805,
-      "eval_samples_per_second": 61.886,
-      "eval_steps_per_second": 7.738,
-      "eval_wer": 0.503295491229958,
-      "step": 10200
-    }
-  ],
-  "max_steps": 10320,
-  "num_train_epochs": 10,
-  "total_flos": 7.282334872342427e+19,
-  "trial_name": null,
-  "trial_params": null
-}

checkpoint-10200/training_args.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:d9ecf6e57275cb7acc55b94084f6c9d6d092c6f2fffe8083bf55c3c6f45893cd
-size 2991