Upload folder using huggingface_hub
Browse files- added_tokens.json +2 -2
- all_results.json +8 -0
- checkpoint-2400/added_tokens.json +4 -0
- checkpoint-2400/config.json +116 -0
- checkpoint-2400/model.safetensors +3 -0
- checkpoint-2400/optimizer.pt +3 -0
- checkpoint-2400/rng_state.pth +3 -0
- checkpoint-2400/scaler.pt +3 -0
- checkpoint-2400/scheduler.pt +3 -0
- checkpoint-2400/special_tokens_map.json +6 -0
- checkpoint-2400/tokenizer_config.json +49 -0
- checkpoint-2400/trainer_state.json +326 -0
- checkpoint-2400/training_args.bin +3 -0
- checkpoint-2400/vocab.json +61 -0
- checkpoint-2940/added_tokens.json +4 -0
- checkpoint-2940/config.json +116 -0
- checkpoint-2940/model.safetensors +3 -0
- checkpoint-2940/optimizer.pt +3 -0
- checkpoint-2940/rng_state.pth +3 -0
- checkpoint-2940/scaler.pt +3 -0
- checkpoint-2940/scheduler.pt +3 -0
- checkpoint-2940/special_tokens_map.json +6 -0
- checkpoint-2940/tokenizer_config.json +49 -0
- checkpoint-2940/trainer_state.json +379 -0
- checkpoint-2940/training_args.bin +3 -0
- checkpoint-2940/vocab.json +61 -0
- eval_results.json +8 -0
- final/added_tokens.json +4 -0
- final/config.json +116 -0
- final/model.safetensors +3 -0
- final/preprocessor_config.json +10 -0
- final/special_tokens_map.json +6 -0
- final/tokenizer_config.json +49 -0
- final/training_args.bin +3 -0
- final/vocab.json +61 -0
- logs/events.out.tfevents.1763220599.82016ece2133.48.0 +3 -0
- logs/events.out.tfevents.1763236211.82016ece2133.48.1 +3 -0
- preprocessor_config.json +6 -7
- test_predictions.csv +451 -0
- tokenizer_config.json +5 -5
- train_results.json +8 -0
- trainer_state.json +388 -0
- validation_predictions.csv +166 -0
- vocab.json +58 -56
added_tokens.json
CHANGED
|
@@ -1,4 +1,4 @@
|
|
| 1 |
{
|
| 2 |
-
"</s>":
|
| 3 |
-
"<s>":
|
| 4 |
}
|
|
|
|
| 1 |
{
|
| 2 |
+
"</s>": 60,
|
| 3 |
+
"<s>": 59
|
| 4 |
}
|
all_results.json
ADDED
|
@@ -0,0 +1,8 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"epoch": 30.0,
|
| 3 |
+
"total_flos": 1.8456230162149265e+19,
|
| 4 |
+
"train_loss": 3.165084928395797,
|
| 5 |
+
"train_runtime": 15598.205,
|
| 6 |
+
"train_samples_per_second": 6.024,
|
| 7 |
+
"train_steps_per_second": 0.188
|
| 8 |
+
}
|
checkpoint-2400/added_tokens.json
ADDED
|
@@ -0,0 +1,4 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"</s>": 60,
|
| 3 |
+
"<s>": 59
|
| 4 |
+
}
|
checkpoint-2400/config.json
ADDED
|
@@ -0,0 +1,116 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"activation_dropout": 0.0,
|
| 3 |
+
"adapter_attn_dim": null,
|
| 4 |
+
"adapter_kernel_size": 3,
|
| 5 |
+
"adapter_stride": 2,
|
| 6 |
+
"add_adapter": false,
|
| 7 |
+
"apply_spec_augment": true,
|
| 8 |
+
"architectures": [
|
| 9 |
+
"Wav2Vec2ForCTC"
|
| 10 |
+
],
|
| 11 |
+
"attention_dropout": 0.1,
|
| 12 |
+
"bos_token_id": 1,
|
| 13 |
+
"classifier_proj_size": 256,
|
| 14 |
+
"codevector_dim": 768,
|
| 15 |
+
"contrastive_logits_temperature": 0.1,
|
| 16 |
+
"conv_bias": true,
|
| 17 |
+
"conv_dim": [
|
| 18 |
+
512,
|
| 19 |
+
512,
|
| 20 |
+
512,
|
| 21 |
+
512,
|
| 22 |
+
512,
|
| 23 |
+
512,
|
| 24 |
+
512
|
| 25 |
+
],
|
| 26 |
+
"conv_kernel": [
|
| 27 |
+
10,
|
| 28 |
+
3,
|
| 29 |
+
3,
|
| 30 |
+
3,
|
| 31 |
+
3,
|
| 32 |
+
2,
|
| 33 |
+
2
|
| 34 |
+
],
|
| 35 |
+
"conv_stride": [
|
| 36 |
+
5,
|
| 37 |
+
2,
|
| 38 |
+
2,
|
| 39 |
+
2,
|
| 40 |
+
2,
|
| 41 |
+
2,
|
| 42 |
+
2
|
| 43 |
+
],
|
| 44 |
+
"ctc_loss_reduction": "mean",
|
| 45 |
+
"ctc_zero_infinity": true,
|
| 46 |
+
"diversity_loss_weight": 0.1,
|
| 47 |
+
"do_stable_layer_norm": true,
|
| 48 |
+
"eos_token_id": 2,
|
| 49 |
+
"feat_extract_activation": "gelu",
|
| 50 |
+
"feat_extract_dropout": 0.0,
|
| 51 |
+
"feat_extract_norm": "layer",
|
| 52 |
+
"feat_proj_dropout": 0.0,
|
| 53 |
+
"feat_quantizer_dropout": 0.0,
|
| 54 |
+
"final_dropout": 0.0,
|
| 55 |
+
"gradient_checkpointing": false,
|
| 56 |
+
"hidden_act": "gelu",
|
| 57 |
+
"hidden_dropout": 0.1,
|
| 58 |
+
"hidden_size": 1024,
|
| 59 |
+
"initializer_range": 0.02,
|
| 60 |
+
"intermediate_size": 4096,
|
| 61 |
+
"layer_norm_eps": 1e-05,
|
| 62 |
+
"layerdrop": 0.1,
|
| 63 |
+
"mask_channel_length": 10,
|
| 64 |
+
"mask_channel_min_space": 1,
|
| 65 |
+
"mask_channel_other": 0.0,
|
| 66 |
+
"mask_channel_prob": 0.0,
|
| 67 |
+
"mask_channel_selection": "static",
|
| 68 |
+
"mask_feature_length": 10,
|
| 69 |
+
"mask_feature_min_masks": 0,
|
| 70 |
+
"mask_feature_prob": 0.0,
|
| 71 |
+
"mask_time_length": 10,
|
| 72 |
+
"mask_time_min_masks": 2,
|
| 73 |
+
"mask_time_min_space": 1,
|
| 74 |
+
"mask_time_other": 0.0,
|
| 75 |
+
"mask_time_prob": 0.05,
|
| 76 |
+
"mask_time_selection": "static",
|
| 77 |
+
"model_type": "wav2vec2",
|
| 78 |
+
"num_adapter_layers": 3,
|
| 79 |
+
"num_attention_heads": 16,
|
| 80 |
+
"num_codevector_groups": 2,
|
| 81 |
+
"num_codevectors_per_group": 320,
|
| 82 |
+
"num_conv_pos_embedding_groups": 16,
|
| 83 |
+
"num_conv_pos_embeddings": 128,
|
| 84 |
+
"num_feat_extract_layers": 7,
|
| 85 |
+
"num_hidden_layers": 24,
|
| 86 |
+
"num_negatives": 100,
|
| 87 |
+
"output_hidden_size": 1024,
|
| 88 |
+
"pad_token_id": 58,
|
| 89 |
+
"proj_codevector_dim": 768,
|
| 90 |
+
"tdnn_dilation": [
|
| 91 |
+
1,
|
| 92 |
+
2,
|
| 93 |
+
3,
|
| 94 |
+
1,
|
| 95 |
+
1
|
| 96 |
+
],
|
| 97 |
+
"tdnn_dim": [
|
| 98 |
+
512,
|
| 99 |
+
512,
|
| 100 |
+
512,
|
| 101 |
+
512,
|
| 102 |
+
1500
|
| 103 |
+
],
|
| 104 |
+
"tdnn_kernel": [
|
| 105 |
+
5,
|
| 106 |
+
3,
|
| 107 |
+
3,
|
| 108 |
+
1,
|
| 109 |
+
1
|
| 110 |
+
],
|
| 111 |
+
"torch_dtype": "float32",
|
| 112 |
+
"transformers_version": "4.53.3",
|
| 113 |
+
"use_weighted_layer_sum": false,
|
| 114 |
+
"vocab_size": 61,
|
| 115 |
+
"xvector_output_dim": 512
|
| 116 |
+
}
|
checkpoint-2400/model.safetensors
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:264e4755a760a77e0a606971d1459cf26b45dd31d131c07b4b31457052e18994
|
| 3 |
+
size 1262057580
|
checkpoint-2400/optimizer.pt
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:beaae8a8d6b6207637e0f1467667c2dfee224beaac19e94cfb5610b225ff8d43
|
| 3 |
+
size 2524364810
|
checkpoint-2400/rng_state.pth
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:83ef17bce6b2143fb0655ed21d4fba0777f1b9a60505f478b0a72e04a1ebe517
|
| 3 |
+
size 14244
|
checkpoint-2400/scaler.pt
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:b30172cf14f5dbe00280d63e36224a9f28dc7a0e8b38a74ceb5eb284e84da363
|
| 3 |
+
size 988
|
checkpoint-2400/scheduler.pt
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:c743b180ea234670f01ea4681a29d6c856288a44e87414a23de09ed255b2dc93
|
| 3 |
+
size 1064
|
checkpoint-2400/special_tokens_map.json
ADDED
|
@@ -0,0 +1,6 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"bos_token": "<s>",
|
| 3 |
+
"eos_token": "</s>",
|
| 4 |
+
"pad_token": "[PAD]",
|
| 5 |
+
"unk_token": "[UNK]"
|
| 6 |
+
}
|
checkpoint-2400/tokenizer_config.json
ADDED
|
@@ -0,0 +1,49 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"added_tokens_decoder": {
|
| 3 |
+
"57": {
|
| 4 |
+
"content": "[UNK]",
|
| 5 |
+
"lstrip": true,
|
| 6 |
+
"normalized": false,
|
| 7 |
+
"rstrip": true,
|
| 8 |
+
"single_word": false,
|
| 9 |
+
"special": false
|
| 10 |
+
},
|
| 11 |
+
"58": {
|
| 12 |
+
"content": "[PAD]",
|
| 13 |
+
"lstrip": true,
|
| 14 |
+
"normalized": false,
|
| 15 |
+
"rstrip": true,
|
| 16 |
+
"single_word": false,
|
| 17 |
+
"special": false
|
| 18 |
+
},
|
| 19 |
+
"59": {
|
| 20 |
+
"content": "<s>",
|
| 21 |
+
"lstrip": false,
|
| 22 |
+
"normalized": false,
|
| 23 |
+
"rstrip": false,
|
| 24 |
+
"single_word": false,
|
| 25 |
+
"special": true
|
| 26 |
+
},
|
| 27 |
+
"60": {
|
| 28 |
+
"content": "</s>",
|
| 29 |
+
"lstrip": false,
|
| 30 |
+
"normalized": false,
|
| 31 |
+
"rstrip": false,
|
| 32 |
+
"single_word": false,
|
| 33 |
+
"special": true
|
| 34 |
+
}
|
| 35 |
+
},
|
| 36 |
+
"bos_token": "<s>",
|
| 37 |
+
"clean_up_tokenization_spaces": false,
|
| 38 |
+
"do_lower_case": false,
|
| 39 |
+
"eos_token": "</s>",
|
| 40 |
+
"extra_special_tokens": {},
|
| 41 |
+
"model_max_length": 1000000000000000019884624838656,
|
| 42 |
+
"pad_token": "[PAD]",
|
| 43 |
+
"processor_class": "Wav2Vec2Processor",
|
| 44 |
+
"replace_word_delimiter_char": " ",
|
| 45 |
+
"target_lang": null,
|
| 46 |
+
"tokenizer_class": "Wav2Vec2CTCTokenizer",
|
| 47 |
+
"unk_token": "[UNK]",
|
| 48 |
+
"word_delimiter_token": "|"
|
| 49 |
+
}
|
checkpoint-2400/trainer_state.json
ADDED
|
@@ -0,0 +1,326 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"best_global_step": 2400,
|
| 3 |
+
"best_metric": 0.6047297297297297,
|
| 4 |
+
"best_model_checkpoint": "/kaggle/working/wav2vec2-bengali-finetuned/checkpoint-2400",
|
| 5 |
+
"epoch": 24.489795918367346,
|
| 6 |
+
"eval_steps": 200,
|
| 7 |
+
"global_step": 2400,
|
| 8 |
+
"is_hyper_param_search": false,
|
| 9 |
+
"is_local_process_zero": true,
|
| 10 |
+
"is_world_process_zero": true,
|
| 11 |
+
"log_history": [
|
| 12 |
+
{
|
| 13 |
+
"epoch": 0.01020408163265306,
|
| 14 |
+
"grad_norm": 1263584.0,
|
| 15 |
+
"learning_rate": 0.0,
|
| 16 |
+
"loss": 25.6736,
|
| 17 |
+
"step": 1
|
| 18 |
+
},
|
| 19 |
+
{
|
| 20 |
+
"epoch": 1.0204081632653061,
|
| 21 |
+
"grad_norm": 3843419.25,
|
| 22 |
+
"learning_rate": 9.900000000000002e-06,
|
| 23 |
+
"loss": 23.811,
|
| 24 |
+
"step": 100
|
| 25 |
+
},
|
| 26 |
+
{
|
| 27 |
+
"epoch": 2.0408163265306123,
|
| 28 |
+
"grad_norm": 1233849.75,
|
| 29 |
+
"learning_rate": 1.9900000000000003e-05,
|
| 30 |
+
"loss": 13.9598,
|
| 31 |
+
"step": 200
|
| 32 |
+
},
|
| 33 |
+
{
|
| 34 |
+
"epoch": 2.0408163265306123,
|
| 35 |
+
"eval_loss": 5.328553199768066,
|
| 36 |
+
"eval_runtime": 11.0357,
|
| 37 |
+
"eval_samples_per_second": 14.951,
|
| 38 |
+
"eval_steps_per_second": 1.903,
|
| 39 |
+
"eval_wer": 1.0,
|
| 40 |
+
"step": 200
|
| 41 |
+
},
|
| 42 |
+
{
|
| 43 |
+
"epoch": 3.061224489795918,
|
| 44 |
+
"grad_norm": 101215.4375,
|
| 45 |
+
"learning_rate": 2.9900000000000002e-05,
|
| 46 |
+
"loss": 4.6042,
|
| 47 |
+
"step": 300
|
| 48 |
+
},
|
| 49 |
+
{
|
| 50 |
+
"epoch": 4.081632653061225,
|
| 51 |
+
"grad_norm": 204473.296875,
|
| 52 |
+
"learning_rate": 3.99e-05,
|
| 53 |
+
"loss": 3.5131,
|
| 54 |
+
"step": 400
|
| 55 |
+
},
|
| 56 |
+
{
|
| 57 |
+
"epoch": 4.081632653061225,
|
| 58 |
+
"eval_loss": 3.380544900894165,
|
| 59 |
+
"eval_runtime": 10.5068,
|
| 60 |
+
"eval_samples_per_second": 15.704,
|
| 61 |
+
"eval_steps_per_second": 1.999,
|
| 62 |
+
"eval_wer": 1.0,
|
| 63 |
+
"step": 400
|
| 64 |
+
},
|
| 65 |
+
{
|
| 66 |
+
"epoch": 5.1020408163265305,
|
| 67 |
+
"grad_norm": 106750.3828125,
|
| 68 |
+
"learning_rate": 4.99e-05,
|
| 69 |
+
"loss": 3.2448,
|
| 70 |
+
"step": 500
|
| 71 |
+
},
|
| 72 |
+
{
|
| 73 |
+
"epoch": 6.122448979591836,
|
| 74 |
+
"grad_norm": 56899.28125,
|
| 75 |
+
"learning_rate": 4.7971311475409835e-05,
|
| 76 |
+
"loss": 2.9613,
|
| 77 |
+
"step": 600
|
| 78 |
+
},
|
| 79 |
+
{
|
| 80 |
+
"epoch": 6.122448979591836,
|
| 81 |
+
"eval_loss": 2.839696168899536,
|
| 82 |
+
"eval_runtime": 10.5616,
|
| 83 |
+
"eval_samples_per_second": 15.623,
|
| 84 |
+
"eval_steps_per_second": 1.988,
|
| 85 |
+
"eval_wer": 1.0,
|
| 86 |
+
"step": 600
|
| 87 |
+
},
|
| 88 |
+
{
|
| 89 |
+
"epoch": 7.142857142857143,
|
| 90 |
+
"grad_norm": 155864.65625,
|
| 91 |
+
"learning_rate": 4.5922131147540986e-05,
|
| 92 |
+
"loss": 2.8199,
|
| 93 |
+
"step": 700
|
| 94 |
+
},
|
| 95 |
+
{
|
| 96 |
+
"epoch": 8.16326530612245,
|
| 97 |
+
"grad_norm": 75451.0546875,
|
| 98 |
+
"learning_rate": 4.387295081967213e-05,
|
| 99 |
+
"loss": 2.7197,
|
| 100 |
+
"step": 800
|
| 101 |
+
},
|
| 102 |
+
{
|
| 103 |
+
"epoch": 8.16326530612245,
|
| 104 |
+
"eval_loss": 2.606015920639038,
|
| 105 |
+
"eval_runtime": 10.535,
|
| 106 |
+
"eval_samples_per_second": 15.662,
|
| 107 |
+
"eval_steps_per_second": 1.993,
|
| 108 |
+
"eval_wer": 0.8457207207207207,
|
| 109 |
+
"step": 800
|
| 110 |
+
},
|
| 111 |
+
{
|
| 112 |
+
"epoch": 9.183673469387756,
|
| 113 |
+
"grad_norm": 76782.7421875,
|
| 114 |
+
"learning_rate": 4.182377049180328e-05,
|
| 115 |
+
"loss": 2.6389,
|
| 116 |
+
"step": 900
|
| 117 |
+
},
|
| 118 |
+
{
|
| 119 |
+
"epoch": 10.204081632653061,
|
| 120 |
+
"grad_norm": 64796.6171875,
|
| 121 |
+
"learning_rate": 3.977459016393443e-05,
|
| 122 |
+
"loss": 2.5596,
|
| 123 |
+
"step": 1000
|
| 124 |
+
},
|
| 125 |
+
{
|
| 126 |
+
"epoch": 10.204081632653061,
|
| 127 |
+
"eval_loss": 2.4175667762756348,
|
| 128 |
+
"eval_runtime": 10.5336,
|
| 129 |
+
"eval_samples_per_second": 15.664,
|
| 130 |
+
"eval_steps_per_second": 1.994,
|
| 131 |
+
"eval_wer": 0.7815315315315315,
|
| 132 |
+
"step": 1000
|
| 133 |
+
},
|
| 134 |
+
{
|
| 135 |
+
"epoch": 11.224489795918368,
|
| 136 |
+
"grad_norm": 147111.484375,
|
| 137 |
+
"learning_rate": 3.772540983606558e-05,
|
| 138 |
+
"loss": 2.4538,
|
| 139 |
+
"step": 1100
|
| 140 |
+
},
|
| 141 |
+
{
|
| 142 |
+
"epoch": 12.244897959183673,
|
| 143 |
+
"grad_norm": 91618.7890625,
|
| 144 |
+
"learning_rate": 3.5676229508196724e-05,
|
| 145 |
+
"loss": 2.3313,
|
| 146 |
+
"step": 1200
|
| 147 |
+
},
|
| 148 |
+
{
|
| 149 |
+
"epoch": 12.244897959183673,
|
| 150 |
+
"eval_loss": 2.050769805908203,
|
| 151 |
+
"eval_runtime": 10.5394,
|
| 152 |
+
"eval_samples_per_second": 15.656,
|
| 153 |
+
"eval_steps_per_second": 1.993,
|
| 154 |
+
"eval_wer": 0.7792792792792793,
|
| 155 |
+
"step": 1200
|
| 156 |
+
},
|
| 157 |
+
{
|
| 158 |
+
"epoch": 13.26530612244898,
|
| 159 |
+
"grad_norm": 135995.46875,
|
| 160 |
+
"learning_rate": 3.362704918032787e-05,
|
| 161 |
+
"loss": 2.1482,
|
| 162 |
+
"step": 1300
|
| 163 |
+
},
|
| 164 |
+
{
|
| 165 |
+
"epoch": 14.285714285714286,
|
| 166 |
+
"grad_norm": 91693.046875,
|
| 167 |
+
"learning_rate": 3.157786885245902e-05,
|
| 168 |
+
"loss": 1.9715,
|
| 169 |
+
"step": 1400
|
| 170 |
+
},
|
| 171 |
+
{
|
| 172 |
+
"epoch": 14.285714285714286,
|
| 173 |
+
"eval_loss": 1.6378555297851562,
|
| 174 |
+
"eval_runtime": 10.5414,
|
| 175 |
+
"eval_samples_per_second": 15.653,
|
| 176 |
+
"eval_steps_per_second": 1.992,
|
| 177 |
+
"eval_wer": 0.7894144144144144,
|
| 178 |
+
"step": 1400
|
| 179 |
+
},
|
| 180 |
+
{
|
| 181 |
+
"epoch": 15.306122448979592,
|
| 182 |
+
"grad_norm": 106778.4609375,
|
| 183 |
+
"learning_rate": 2.9528688524590165e-05,
|
| 184 |
+
"loss": 1.8192,
|
| 185 |
+
"step": 1500
|
| 186 |
+
},
|
| 187 |
+
{
|
| 188 |
+
"epoch": 16.3265306122449,
|
| 189 |
+
"grad_norm": 93321.4921875,
|
| 190 |
+
"learning_rate": 2.7479508196721317e-05,
|
| 191 |
+
"loss": 1.706,
|
| 192 |
+
"step": 1600
|
| 193 |
+
},
|
| 194 |
+
{
|
| 195 |
+
"epoch": 16.3265306122449,
|
| 196 |
+
"eval_loss": 1.3998359441757202,
|
| 197 |
+
"eval_runtime": 10.5682,
|
| 198 |
+
"eval_samples_per_second": 15.613,
|
| 199 |
+
"eval_steps_per_second": 1.987,
|
| 200 |
+
"eval_wer": 0.7263513513513513,
|
| 201 |
+
"step": 1600
|
| 202 |
+
},
|
| 203 |
+
{
|
| 204 |
+
"epoch": 17.346938775510203,
|
| 205 |
+
"grad_norm": 111310.1328125,
|
| 206 |
+
"learning_rate": 2.5430327868852462e-05,
|
| 207 |
+
"loss": 1.5935,
|
| 208 |
+
"step": 1700
|
| 209 |
+
},
|
| 210 |
+
{
|
| 211 |
+
"epoch": 18.367346938775512,
|
| 212 |
+
"grad_norm": 131049.40625,
|
| 213 |
+
"learning_rate": 2.338114754098361e-05,
|
| 214 |
+
"loss": 1.5412,
|
| 215 |
+
"step": 1800
|
| 216 |
+
},
|
| 217 |
+
{
|
| 218 |
+
"epoch": 18.367346938775512,
|
| 219 |
+
"eval_loss": 1.2491974830627441,
|
| 220 |
+
"eval_runtime": 10.5527,
|
| 221 |
+
"eval_samples_per_second": 15.636,
|
| 222 |
+
"eval_steps_per_second": 1.99,
|
| 223 |
+
"eval_wer": 0.6722972972972973,
|
| 224 |
+
"step": 1800
|
| 225 |
+
},
|
| 226 |
+
{
|
| 227 |
+
"epoch": 19.387755102040817,
|
| 228 |
+
"grad_norm": 150843.8125,
|
| 229 |
+
"learning_rate": 2.1331967213114755e-05,
|
| 230 |
+
"loss": 1.4727,
|
| 231 |
+
"step": 1900
|
| 232 |
+
},
|
| 233 |
+
{
|
| 234 |
+
"epoch": 20.408163265306122,
|
| 235 |
+
"grad_norm": 124916.6015625,
|
| 236 |
+
"learning_rate": 1.9282786885245903e-05,
|
| 237 |
+
"loss": 1.4023,
|
| 238 |
+
"step": 2000
|
| 239 |
+
},
|
| 240 |
+
{
|
| 241 |
+
"epoch": 20.408163265306122,
|
| 242 |
+
"eval_loss": 1.138938546180725,
|
| 243 |
+
"eval_runtime": 10.5847,
|
| 244 |
+
"eval_samples_per_second": 15.589,
|
| 245 |
+
"eval_steps_per_second": 1.984,
|
| 246 |
+
"eval_wer": 0.6317567567567568,
|
| 247 |
+
"step": 2000
|
| 248 |
+
},
|
| 249 |
+
{
|
| 250 |
+
"epoch": 21.428571428571427,
|
| 251 |
+
"grad_norm": 260327.703125,
|
| 252 |
+
"learning_rate": 1.7233606557377048e-05,
|
| 253 |
+
"loss": 1.3585,
|
| 254 |
+
"step": 2100
|
| 255 |
+
},
|
| 256 |
+
{
|
| 257 |
+
"epoch": 22.448979591836736,
|
| 258 |
+
"grad_norm": 156561.15625,
|
| 259 |
+
"learning_rate": 1.5184426229508198e-05,
|
| 260 |
+
"loss": 1.3188,
|
| 261 |
+
"step": 2200
|
| 262 |
+
},
|
| 263 |
+
{
|
| 264 |
+
"epoch": 22.448979591836736,
|
| 265 |
+
"eval_loss": 1.0857497453689575,
|
| 266 |
+
"eval_runtime": 10.5312,
|
| 267 |
+
"eval_samples_per_second": 15.668,
|
| 268 |
+
"eval_steps_per_second": 1.994,
|
| 269 |
+
"eval_wer": 0.6148648648648649,
|
| 270 |
+
"step": 2200
|
| 271 |
+
},
|
| 272 |
+
{
|
| 273 |
+
"epoch": 23.46938775510204,
|
| 274 |
+
"grad_norm": 137688.609375,
|
| 275 |
+
"learning_rate": 1.3135245901639346e-05,
|
| 276 |
+
"loss": 1.2872,
|
| 277 |
+
"step": 2300
|
| 278 |
+
},
|
| 279 |
+
{
|
| 280 |
+
"epoch": 24.489795918367346,
|
| 281 |
+
"grad_norm": 149320.140625,
|
| 282 |
+
"learning_rate": 1.1086065573770492e-05,
|
| 283 |
+
"loss": 1.2707,
|
| 284 |
+
"step": 2400
|
| 285 |
+
},
|
| 286 |
+
{
|
| 287 |
+
"epoch": 24.489795918367346,
|
| 288 |
+
"eval_loss": 1.035390019416809,
|
| 289 |
+
"eval_runtime": 10.5453,
|
| 290 |
+
"eval_samples_per_second": 15.647,
|
| 291 |
+
"eval_steps_per_second": 1.991,
|
| 292 |
+
"eval_wer": 0.6047297297297297,
|
| 293 |
+
"step": 2400
|
| 294 |
+
}
|
| 295 |
+
],
|
| 296 |
+
"logging_steps": 100,
|
| 297 |
+
"max_steps": 2940,
|
| 298 |
+
"num_input_tokens_seen": 0,
|
| 299 |
+
"num_train_epochs": 30,
|
| 300 |
+
"save_steps": 400,
|
| 301 |
+
"stateful_callbacks": {
|
| 302 |
+
"EarlyStoppingCallback": {
|
| 303 |
+
"args": {
|
| 304 |
+
"early_stopping_patience": 5,
|
| 305 |
+
"early_stopping_threshold": 0.01
|
| 306 |
+
},
|
| 307 |
+
"attributes": {
|
| 308 |
+
"early_stopping_patience_counter": 0
|
| 309 |
+
}
|
| 310 |
+
},
|
| 311 |
+
"TrainerControl": {
|
| 312 |
+
"args": {
|
| 313 |
+
"should_epoch_stop": false,
|
| 314 |
+
"should_evaluate": false,
|
| 315 |
+
"should_log": false,
|
| 316 |
+
"should_save": true,
|
| 317 |
+
"should_training_stop": false
|
| 318 |
+
},
|
| 319 |
+
"attributes": {}
|
| 320 |
+
}
|
| 321 |
+
},
|
| 322 |
+
"total_flos": 1.507065962959162e+19,
|
| 323 |
+
"train_batch_size": 8,
|
| 324 |
+
"trial_name": null,
|
| 325 |
+
"trial_params": null
|
| 326 |
+
}
|
checkpoint-2400/training_args.bin
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:1ea3cd97018cf5d55f387775c77a86a9b6a707724b0ec654334ad12d0720841d
|
| 3 |
+
size 5368
|
checkpoint-2400/vocab.json
ADDED
|
@@ -0,0 +1,61 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
",": 1,
|
| 3 |
+
"?": 2,
|
| 4 |
+
"[PAD]": 58,
|
| 5 |
+
"[UNK]": 57,
|
| 6 |
+
"|": 0,
|
| 7 |
+
"।": 3,
|
| 8 |
+
"ঁ": 4,
|
| 9 |
+
"ং": 5,
|
| 10 |
+
"অ": 6,
|
| 11 |
+
"আ": 7,
|
| 12 |
+
"ই": 8,
|
| 13 |
+
"উ": 9,
|
| 14 |
+
"এ": 10,
|
| 15 |
+
"ও": 11,
|
| 16 |
+
"ক": 12,
|
| 17 |
+
"খ": 13,
|
| 18 |
+
"গ": 14,
|
| 19 |
+
"ঘ": 15,
|
| 20 |
+
"ঙ": 16,
|
| 21 |
+
"চ": 17,
|
| 22 |
+
"ছ": 18,
|
| 23 |
+
"জ": 19,
|
| 24 |
+
"ঝ": 20,
|
| 25 |
+
"ঞ": 21,
|
| 26 |
+
"ট": 22,
|
| 27 |
+
"ঠ": 23,
|
| 28 |
+
"ড": 24,
|
| 29 |
+
"ঢ": 25,
|
| 30 |
+
"ণ": 26,
|
| 31 |
+
"ত": 27,
|
| 32 |
+
"থ": 28,
|
| 33 |
+
"দ": 29,
|
| 34 |
+
"ধ": 30,
|
| 35 |
+
"ন": 31,
|
| 36 |
+
"প": 32,
|
| 37 |
+
"ফ": 33,
|
| 38 |
+
"ব": 34,
|
| 39 |
+
"ভ": 35,
|
| 40 |
+
"ম": 36,
|
| 41 |
+
"য": 37,
|
| 42 |
+
"র": 38,
|
| 43 |
+
"ল": 39,
|
| 44 |
+
"শ": 40,
|
| 45 |
+
"ষ": 41,
|
| 46 |
+
"স": 42,
|
| 47 |
+
"হ": 43,
|
| 48 |
+
"়": 44,
|
| 49 |
+
"া": 45,
|
| 50 |
+
"ি": 46,
|
| 51 |
+
"ী": 47,
|
| 52 |
+
"ু": 48,
|
| 53 |
+
"ূ": 49,
|
| 54 |
+
"ৃ": 50,
|
| 55 |
+
"ে": 51,
|
| 56 |
+
"ৈ": 52,
|
| 57 |
+
"ো": 53,
|
| 58 |
+
"ৌ": 54,
|
| 59 |
+
"্": 55,
|
| 60 |
+
"ৎ": 56
|
| 61 |
+
}
|
checkpoint-2940/added_tokens.json
ADDED
|
@@ -0,0 +1,4 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"</s>": 60,
|
| 3 |
+
"<s>": 59
|
| 4 |
+
}
|
checkpoint-2940/config.json
ADDED
|
@@ -0,0 +1,116 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"activation_dropout": 0.0,
|
| 3 |
+
"adapter_attn_dim": null,
|
| 4 |
+
"adapter_kernel_size": 3,
|
| 5 |
+
"adapter_stride": 2,
|
| 6 |
+
"add_adapter": false,
|
| 7 |
+
"apply_spec_augment": true,
|
| 8 |
+
"architectures": [
|
| 9 |
+
"Wav2Vec2ForCTC"
|
| 10 |
+
],
|
| 11 |
+
"attention_dropout": 0.1,
|
| 12 |
+
"bos_token_id": 1,
|
| 13 |
+
"classifier_proj_size": 256,
|
| 14 |
+
"codevector_dim": 768,
|
| 15 |
+
"contrastive_logits_temperature": 0.1,
|
| 16 |
+
"conv_bias": true,
|
| 17 |
+
"conv_dim": [
|
| 18 |
+
512,
|
| 19 |
+
512,
|
| 20 |
+
512,
|
| 21 |
+
512,
|
| 22 |
+
512,
|
| 23 |
+
512,
|
| 24 |
+
512
|
| 25 |
+
],
|
| 26 |
+
"conv_kernel": [
|
| 27 |
+
10,
|
| 28 |
+
3,
|
| 29 |
+
3,
|
| 30 |
+
3,
|
| 31 |
+
3,
|
| 32 |
+
2,
|
| 33 |
+
2
|
| 34 |
+
],
|
| 35 |
+
"conv_stride": [
|
| 36 |
+
5,
|
| 37 |
+
2,
|
| 38 |
+
2,
|
| 39 |
+
2,
|
| 40 |
+
2,
|
| 41 |
+
2,
|
| 42 |
+
2
|
| 43 |
+
],
|
| 44 |
+
"ctc_loss_reduction": "mean",
|
| 45 |
+
"ctc_zero_infinity": true,
|
| 46 |
+
"diversity_loss_weight": 0.1,
|
| 47 |
+
"do_stable_layer_norm": true,
|
| 48 |
+
"eos_token_id": 2,
|
| 49 |
+
"feat_extract_activation": "gelu",
|
| 50 |
+
"feat_extract_dropout": 0.0,
|
| 51 |
+
"feat_extract_norm": "layer",
|
| 52 |
+
"feat_proj_dropout": 0.0,
|
| 53 |
+
"feat_quantizer_dropout": 0.0,
|
| 54 |
+
"final_dropout": 0.0,
|
| 55 |
+
"gradient_checkpointing": false,
|
| 56 |
+
"hidden_act": "gelu",
|
| 57 |
+
"hidden_dropout": 0.1,
|
| 58 |
+
"hidden_size": 1024,
|
| 59 |
+
"initializer_range": 0.02,
|
| 60 |
+
"intermediate_size": 4096,
|
| 61 |
+
"layer_norm_eps": 1e-05,
|
| 62 |
+
"layerdrop": 0.1,
|
| 63 |
+
"mask_channel_length": 10,
|
| 64 |
+
"mask_channel_min_space": 1,
|
| 65 |
+
"mask_channel_other": 0.0,
|
| 66 |
+
"mask_channel_prob": 0.0,
|
| 67 |
+
"mask_channel_selection": "static",
|
| 68 |
+
"mask_feature_length": 10,
|
| 69 |
+
"mask_feature_min_masks": 0,
|
| 70 |
+
"mask_feature_prob": 0.0,
|
| 71 |
+
"mask_time_length": 10,
|
| 72 |
+
"mask_time_min_masks": 2,
|
| 73 |
+
"mask_time_min_space": 1,
|
| 74 |
+
"mask_time_other": 0.0,
|
| 75 |
+
"mask_time_prob": 0.05,
|
| 76 |
+
"mask_time_selection": "static",
|
| 77 |
+
"model_type": "wav2vec2",
|
| 78 |
+
"num_adapter_layers": 3,
|
| 79 |
+
"num_attention_heads": 16,
|
| 80 |
+
"num_codevector_groups": 2,
|
| 81 |
+
"num_codevectors_per_group": 320,
|
| 82 |
+
"num_conv_pos_embedding_groups": 16,
|
| 83 |
+
"num_conv_pos_embeddings": 128,
|
| 84 |
+
"num_feat_extract_layers": 7,
|
| 85 |
+
"num_hidden_layers": 24,
|
| 86 |
+
"num_negatives": 100,
|
| 87 |
+
"output_hidden_size": 1024,
|
| 88 |
+
"pad_token_id": 58,
|
| 89 |
+
"proj_codevector_dim": 768,
|
| 90 |
+
"tdnn_dilation": [
|
| 91 |
+
1,
|
| 92 |
+
2,
|
| 93 |
+
3,
|
| 94 |
+
1,
|
| 95 |
+
1
|
| 96 |
+
],
|
| 97 |
+
"tdnn_dim": [
|
| 98 |
+
512,
|
| 99 |
+
512,
|
| 100 |
+
512,
|
| 101 |
+
512,
|
| 102 |
+
1500
|
| 103 |
+
],
|
| 104 |
+
"tdnn_kernel": [
|
| 105 |
+
5,
|
| 106 |
+
3,
|
| 107 |
+
3,
|
| 108 |
+
1,
|
| 109 |
+
1
|
| 110 |
+
],
|
| 111 |
+
"torch_dtype": "float32",
|
| 112 |
+
"transformers_version": "4.53.3",
|
| 113 |
+
"use_weighted_layer_sum": false,
|
| 114 |
+
"vocab_size": 61,
|
| 115 |
+
"xvector_output_dim": 512
|
| 116 |
+
}
|
checkpoint-2940/model.safetensors
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:5a1981c2eb99d226b99d73b65d3755aaaea884a6167496e0a194086df6b00d43
|
| 3 |
+
size 1262057580
|
checkpoint-2940/optimizer.pt
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:0787f8012ece5770e78932246931b91bc55aad1c61f0ecd2cca63c9d45a85a60
|
| 3 |
+
size 2524364810
|
checkpoint-2940/rng_state.pth
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:f984aa0169e6137f948c4ec773408f870872f6296b194da8d4296935351264b2
|
| 3 |
+
size 14308
|
checkpoint-2940/scaler.pt
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:b30172cf14f5dbe00280d63e36224a9f28dc7a0e8b38a74ceb5eb284e84da363
|
| 3 |
+
size 988
|
checkpoint-2940/scheduler.pt
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:153aa1bd4efd262a7030faf5e62634c3aff1e7187d5df057cfa035c209999a64
|
| 3 |
+
size 1064
|
checkpoint-2940/special_tokens_map.json
ADDED
|
@@ -0,0 +1,6 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"bos_token": "<s>",
|
| 3 |
+
"eos_token": "</s>",
|
| 4 |
+
"pad_token": "[PAD]",
|
| 5 |
+
"unk_token": "[UNK]"
|
| 6 |
+
}
|
checkpoint-2940/tokenizer_config.json
ADDED
|
@@ -0,0 +1,49 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"added_tokens_decoder": {
|
| 3 |
+
"57": {
|
| 4 |
+
"content": "[UNK]",
|
| 5 |
+
"lstrip": true,
|
| 6 |
+
"normalized": false,
|
| 7 |
+
"rstrip": true,
|
| 8 |
+
"single_word": false,
|
| 9 |
+
"special": false
|
| 10 |
+
},
|
| 11 |
+
"58": {
|
| 12 |
+
"content": "[PAD]",
|
| 13 |
+
"lstrip": true,
|
| 14 |
+
"normalized": false,
|
| 15 |
+
"rstrip": true,
|
| 16 |
+
"single_word": false,
|
| 17 |
+
"special": false
|
| 18 |
+
},
|
| 19 |
+
"59": {
|
| 20 |
+
"content": "<s>",
|
| 21 |
+
"lstrip": false,
|
| 22 |
+
"normalized": false,
|
| 23 |
+
"rstrip": false,
|
| 24 |
+
"single_word": false,
|
| 25 |
+
"special": true
|
| 26 |
+
},
|
| 27 |
+
"60": {
|
| 28 |
+
"content": "</s>",
|
| 29 |
+
"lstrip": false,
|
| 30 |
+
"normalized": false,
|
| 31 |
+
"rstrip": false,
|
| 32 |
+
"single_word": false,
|
| 33 |
+
"special": true
|
| 34 |
+
}
|
| 35 |
+
},
|
| 36 |
+
"bos_token": "<s>",
|
| 37 |
+
"clean_up_tokenization_spaces": false,
|
| 38 |
+
"do_lower_case": false,
|
| 39 |
+
"eos_token": "</s>",
|
| 40 |
+
"extra_special_tokens": {},
|
| 41 |
+
"model_max_length": 1000000000000000019884624838656,
|
| 42 |
+
"pad_token": "[PAD]",
|
| 43 |
+
"processor_class": "Wav2Vec2Processor",
|
| 44 |
+
"replace_word_delimiter_char": " ",
|
| 45 |
+
"target_lang": null,
|
| 46 |
+
"tokenizer_class": "Wav2Vec2CTCTokenizer",
|
| 47 |
+
"unk_token": "[UNK]",
|
| 48 |
+
"word_delimiter_token": "|"
|
| 49 |
+
}
|
checkpoint-2940/trainer_state.json
ADDED
|
@@ -0,0 +1,379 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"best_global_step": 2600,
|
| 3 |
+
"best_metric": 0.5833333333333334,
|
| 4 |
+
"best_model_checkpoint": "/kaggle/working/wav2vec2-bengali-finetuned/checkpoint-2400",
|
| 5 |
+
"epoch": 30.0,
|
| 6 |
+
"eval_steps": 200,
|
| 7 |
+
"global_step": 2940,
|
| 8 |
+
"is_hyper_param_search": false,
|
| 9 |
+
"is_local_process_zero": true,
|
| 10 |
+
"is_world_process_zero": true,
|
| 11 |
+
"log_history": [
|
| 12 |
+
{
|
| 13 |
+
"epoch": 0.01020408163265306,
|
| 14 |
+
"grad_norm": 1263584.0,
|
| 15 |
+
"learning_rate": 0.0,
|
| 16 |
+
"loss": 25.6736,
|
| 17 |
+
"step": 1
|
| 18 |
+
},
|
| 19 |
+
{
|
| 20 |
+
"epoch": 1.0204081632653061,
|
| 21 |
+
"grad_norm": 3843419.25,
|
| 22 |
+
"learning_rate": 9.900000000000002e-06,
|
| 23 |
+
"loss": 23.811,
|
| 24 |
+
"step": 100
|
| 25 |
+
},
|
| 26 |
+
{
|
| 27 |
+
"epoch": 2.0408163265306123,
|
| 28 |
+
"grad_norm": 1233849.75,
|
| 29 |
+
"learning_rate": 1.9900000000000003e-05,
|
| 30 |
+
"loss": 13.9598,
|
| 31 |
+
"step": 200
|
| 32 |
+
},
|
| 33 |
+
{
|
| 34 |
+
"epoch": 2.0408163265306123,
|
| 35 |
+
"eval_loss": 5.328553199768066,
|
| 36 |
+
"eval_runtime": 11.0357,
|
| 37 |
+
"eval_samples_per_second": 14.951,
|
| 38 |
+
"eval_steps_per_second": 1.903,
|
| 39 |
+
"eval_wer": 1.0,
|
| 40 |
+
"step": 200
|
| 41 |
+
},
|
| 42 |
+
{
|
| 43 |
+
"epoch": 3.061224489795918,
|
| 44 |
+
"grad_norm": 101215.4375,
|
| 45 |
+
"learning_rate": 2.9900000000000002e-05,
|
| 46 |
+
"loss": 4.6042,
|
| 47 |
+
"step": 300
|
| 48 |
+
},
|
| 49 |
+
{
|
| 50 |
+
"epoch": 4.081632653061225,
|
| 51 |
+
"grad_norm": 204473.296875,
|
| 52 |
+
"learning_rate": 3.99e-05,
|
| 53 |
+
"loss": 3.5131,
|
| 54 |
+
"step": 400
|
| 55 |
+
},
|
| 56 |
+
{
|
| 57 |
+
"epoch": 4.081632653061225,
|
| 58 |
+
"eval_loss": 3.380544900894165,
|
| 59 |
+
"eval_runtime": 10.5068,
|
| 60 |
+
"eval_samples_per_second": 15.704,
|
| 61 |
+
"eval_steps_per_second": 1.999,
|
| 62 |
+
"eval_wer": 1.0,
|
| 63 |
+
"step": 400
|
| 64 |
+
},
|
| 65 |
+
{
|
| 66 |
+
"epoch": 5.1020408163265305,
|
| 67 |
+
"grad_norm": 106750.3828125,
|
| 68 |
+
"learning_rate": 4.99e-05,
|
| 69 |
+
"loss": 3.2448,
|
| 70 |
+
"step": 500
|
| 71 |
+
},
|
| 72 |
+
{
|
| 73 |
+
"epoch": 6.122448979591836,
|
| 74 |
+
"grad_norm": 56899.28125,
|
| 75 |
+
"learning_rate": 4.7971311475409835e-05,
|
| 76 |
+
"loss": 2.9613,
|
| 77 |
+
"step": 600
|
| 78 |
+
},
|
| 79 |
+
{
|
| 80 |
+
"epoch": 6.122448979591836,
|
| 81 |
+
"eval_loss": 2.839696168899536,
|
| 82 |
+
"eval_runtime": 10.5616,
|
| 83 |
+
"eval_samples_per_second": 15.623,
|
| 84 |
+
"eval_steps_per_second": 1.988,
|
| 85 |
+
"eval_wer": 1.0,
|
| 86 |
+
"step": 600
|
| 87 |
+
},
|
| 88 |
+
{
|
| 89 |
+
"epoch": 7.142857142857143,
|
| 90 |
+
"grad_norm": 155864.65625,
|
| 91 |
+
"learning_rate": 4.5922131147540986e-05,
|
| 92 |
+
"loss": 2.8199,
|
| 93 |
+
"step": 700
|
| 94 |
+
},
|
| 95 |
+
{
|
| 96 |
+
"epoch": 8.16326530612245,
|
| 97 |
+
"grad_norm": 75451.0546875,
|
| 98 |
+
"learning_rate": 4.387295081967213e-05,
|
| 99 |
+
"loss": 2.7197,
|
| 100 |
+
"step": 800
|
| 101 |
+
},
|
| 102 |
+
{
|
| 103 |
+
"epoch": 8.16326530612245,
|
| 104 |
+
"eval_loss": 2.606015920639038,
|
| 105 |
+
"eval_runtime": 10.535,
|
| 106 |
+
"eval_samples_per_second": 15.662,
|
| 107 |
+
"eval_steps_per_second": 1.993,
|
| 108 |
+
"eval_wer": 0.8457207207207207,
|
| 109 |
+
"step": 800
|
| 110 |
+
},
|
| 111 |
+
{
|
| 112 |
+
"epoch": 9.183673469387756,
|
| 113 |
+
"grad_norm": 76782.7421875,
|
| 114 |
+
"learning_rate": 4.182377049180328e-05,
|
| 115 |
+
"loss": 2.6389,
|
| 116 |
+
"step": 900
|
| 117 |
+
},
|
| 118 |
+
{
|
| 119 |
+
"epoch": 10.204081632653061,
|
| 120 |
+
"grad_norm": 64796.6171875,
|
| 121 |
+
"learning_rate": 3.977459016393443e-05,
|
| 122 |
+
"loss": 2.5596,
|
| 123 |
+
"step": 1000
|
| 124 |
+
},
|
| 125 |
+
{
|
| 126 |
+
"epoch": 10.204081632653061,
|
| 127 |
+
"eval_loss": 2.4175667762756348,
|
| 128 |
+
"eval_runtime": 10.5336,
|
| 129 |
+
"eval_samples_per_second": 15.664,
|
| 130 |
+
"eval_steps_per_second": 1.994,
|
| 131 |
+
"eval_wer": 0.7815315315315315,
|
| 132 |
+
"step": 1000
|
| 133 |
+
},
|
| 134 |
+
{
|
| 135 |
+
"epoch": 11.224489795918368,
|
| 136 |
+
"grad_norm": 147111.484375,
|
| 137 |
+
"learning_rate": 3.772540983606558e-05,
|
| 138 |
+
"loss": 2.4538,
|
| 139 |
+
"step": 1100
|
| 140 |
+
},
|
| 141 |
+
{
|
| 142 |
+
"epoch": 12.244897959183673,
|
| 143 |
+
"grad_norm": 91618.7890625,
|
| 144 |
+
"learning_rate": 3.5676229508196724e-05,
|
| 145 |
+
"loss": 2.3313,
|
| 146 |
+
"step": 1200
|
| 147 |
+
},
|
| 148 |
+
{
|
| 149 |
+
"epoch": 12.244897959183673,
|
| 150 |
+
"eval_loss": 2.050769805908203,
|
| 151 |
+
"eval_runtime": 10.5394,
|
| 152 |
+
"eval_samples_per_second": 15.656,
|
| 153 |
+
"eval_steps_per_second": 1.993,
|
| 154 |
+
"eval_wer": 0.7792792792792793,
|
| 155 |
+
"step": 1200
|
| 156 |
+
},
|
| 157 |
+
{
|
| 158 |
+
"epoch": 13.26530612244898,
|
| 159 |
+
"grad_norm": 135995.46875,
|
| 160 |
+
"learning_rate": 3.362704918032787e-05,
|
| 161 |
+
"loss": 2.1482,
|
| 162 |
+
"step": 1300
|
| 163 |
+
},
|
| 164 |
+
{
|
| 165 |
+
"epoch": 14.285714285714286,
|
| 166 |
+
"grad_norm": 91693.046875,
|
| 167 |
+
"learning_rate": 3.157786885245902e-05,
|
| 168 |
+
"loss": 1.9715,
|
| 169 |
+
"step": 1400
|
| 170 |
+
},
|
| 171 |
+
{
|
| 172 |
+
"epoch": 14.285714285714286,
|
| 173 |
+
"eval_loss": 1.6378555297851562,
|
| 174 |
+
"eval_runtime": 10.5414,
|
| 175 |
+
"eval_samples_per_second": 15.653,
|
| 176 |
+
"eval_steps_per_second": 1.992,
|
| 177 |
+
"eval_wer": 0.7894144144144144,
|
| 178 |
+
"step": 1400
|
| 179 |
+
},
|
| 180 |
+
{
|
| 181 |
+
"epoch": 15.306122448979592,
|
| 182 |
+
"grad_norm": 106778.4609375,
|
| 183 |
+
"learning_rate": 2.9528688524590165e-05,
|
| 184 |
+
"loss": 1.8192,
|
| 185 |
+
"step": 1500
|
| 186 |
+
},
|
| 187 |
+
{
|
| 188 |
+
"epoch": 16.3265306122449,
|
| 189 |
+
"grad_norm": 93321.4921875,
|
| 190 |
+
"learning_rate": 2.7479508196721317e-05,
|
| 191 |
+
"loss": 1.706,
|
| 192 |
+
"step": 1600
|
| 193 |
+
},
|
| 194 |
+
{
|
| 195 |
+
"epoch": 16.3265306122449,
|
| 196 |
+
"eval_loss": 1.3998359441757202,
|
| 197 |
+
"eval_runtime": 10.5682,
|
| 198 |
+
"eval_samples_per_second": 15.613,
|
| 199 |
+
"eval_steps_per_second": 1.987,
|
| 200 |
+
"eval_wer": 0.7263513513513513,
|
| 201 |
+
"step": 1600
|
| 202 |
+
},
|
| 203 |
+
{
|
| 204 |
+
"epoch": 17.346938775510203,
|
| 205 |
+
"grad_norm": 111310.1328125,
|
| 206 |
+
"learning_rate": 2.5430327868852462e-05,
|
| 207 |
+
"loss": 1.5935,
|
| 208 |
+
"step": 1700
|
| 209 |
+
},
|
| 210 |
+
{
|
| 211 |
+
"epoch": 18.367346938775512,
|
| 212 |
+
"grad_norm": 131049.40625,
|
| 213 |
+
"learning_rate": 2.338114754098361e-05,
|
| 214 |
+
"loss": 1.5412,
|
| 215 |
+
"step": 1800
|
| 216 |
+
},
|
| 217 |
+
{
|
| 218 |
+
"epoch": 18.367346938775512,
|
| 219 |
+
"eval_loss": 1.2491974830627441,
|
| 220 |
+
"eval_runtime": 10.5527,
|
| 221 |
+
"eval_samples_per_second": 15.636,
|
| 222 |
+
"eval_steps_per_second": 1.99,
|
| 223 |
+
"eval_wer": 0.6722972972972973,
|
| 224 |
+
"step": 1800
|
| 225 |
+
},
|
| 226 |
+
{
|
| 227 |
+
"epoch": 19.387755102040817,
|
| 228 |
+
"grad_norm": 150843.8125,
|
| 229 |
+
"learning_rate": 2.1331967213114755e-05,
|
| 230 |
+
"loss": 1.4727,
|
| 231 |
+
"step": 1900
|
| 232 |
+
},
|
| 233 |
+
{
|
| 234 |
+
"epoch": 20.408163265306122,
|
| 235 |
+
"grad_norm": 124916.6015625,
|
| 236 |
+
"learning_rate": 1.9282786885245903e-05,
|
| 237 |
+
"loss": 1.4023,
|
| 238 |
+
"step": 2000
|
| 239 |
+
},
|
| 240 |
+
{
|
| 241 |
+
"epoch": 20.408163265306122,
|
| 242 |
+
"eval_loss": 1.138938546180725,
|
| 243 |
+
"eval_runtime": 10.5847,
|
| 244 |
+
"eval_samples_per_second": 15.589,
|
| 245 |
+
"eval_steps_per_second": 1.984,
|
| 246 |
+
"eval_wer": 0.6317567567567568,
|
| 247 |
+
"step": 2000
|
| 248 |
+
},
|
| 249 |
+
{
|
| 250 |
+
"epoch": 21.428571428571427,
|
| 251 |
+
"grad_norm": 260327.703125,
|
| 252 |
+
"learning_rate": 1.7233606557377048e-05,
|
| 253 |
+
"loss": 1.3585,
|
| 254 |
+
"step": 2100
|
| 255 |
+
},
|
| 256 |
+
{
|
| 257 |
+
"epoch": 22.448979591836736,
|
| 258 |
+
"grad_norm": 156561.15625,
|
| 259 |
+
"learning_rate": 1.5184426229508198e-05,
|
| 260 |
+
"loss": 1.3188,
|
| 261 |
+
"step": 2200
|
| 262 |
+
},
|
| 263 |
+
{
|
| 264 |
+
"epoch": 22.448979591836736,
|
| 265 |
+
"eval_loss": 1.0857497453689575,
|
| 266 |
+
"eval_runtime": 10.5312,
|
| 267 |
+
"eval_samples_per_second": 15.668,
|
| 268 |
+
"eval_steps_per_second": 1.994,
|
| 269 |
+
"eval_wer": 0.6148648648648649,
|
| 270 |
+
"step": 2200
|
| 271 |
+
},
|
| 272 |
+
{
|
| 273 |
+
"epoch": 23.46938775510204,
|
| 274 |
+
"grad_norm": 137688.609375,
|
| 275 |
+
"learning_rate": 1.3135245901639346e-05,
|
| 276 |
+
"loss": 1.2872,
|
| 277 |
+
"step": 2300
|
| 278 |
+
},
|
| 279 |
+
{
|
| 280 |
+
"epoch": 24.489795918367346,
|
| 281 |
+
"grad_norm": 149320.140625,
|
| 282 |
+
"learning_rate": 1.1086065573770492e-05,
|
| 283 |
+
"loss": 1.2707,
|
| 284 |
+
"step": 2400
|
| 285 |
+
},
|
| 286 |
+
{
|
| 287 |
+
"epoch": 24.489795918367346,
|
| 288 |
+
"eval_loss": 1.035390019416809,
|
| 289 |
+
"eval_runtime": 10.5453,
|
| 290 |
+
"eval_samples_per_second": 15.647,
|
| 291 |
+
"eval_steps_per_second": 1.991,
|
| 292 |
+
"eval_wer": 0.6047297297297297,
|
| 293 |
+
"step": 2400
|
| 294 |
+
},
|
| 295 |
+
{
|
| 296 |
+
"epoch": 25.510204081632654,
|
| 297 |
+
"grad_norm": 160687.875,
|
| 298 |
+
"learning_rate": 9.036885245901639e-06,
|
| 299 |
+
"loss": 1.2261,
|
| 300 |
+
"step": 2500
|
| 301 |
+
},
|
| 302 |
+
{
|
| 303 |
+
"epoch": 26.53061224489796,
|
| 304 |
+
"grad_norm": 175958.0625,
|
| 305 |
+
"learning_rate": 6.987704918032788e-06,
|
| 306 |
+
"loss": 1.222,
|
| 307 |
+
"step": 2600
|
| 308 |
+
},
|
| 309 |
+
{
|
| 310 |
+
"epoch": 26.53061224489796,
|
| 311 |
+
"eval_loss": 1.011266827583313,
|
| 312 |
+
"eval_runtime": 10.5487,
|
| 313 |
+
"eval_samples_per_second": 15.642,
|
| 314 |
+
"eval_steps_per_second": 1.991,
|
| 315 |
+
"eval_wer": 0.5833333333333334,
|
| 316 |
+
"step": 2600
|
| 317 |
+
},
|
| 318 |
+
{
|
| 319 |
+
"epoch": 27.551020408163264,
|
| 320 |
+
"grad_norm": 129829.171875,
|
| 321 |
+
"learning_rate": 4.938524590163935e-06,
|
| 322 |
+
"loss": 1.2061,
|
| 323 |
+
"step": 2700
|
| 324 |
+
},
|
| 325 |
+
{
|
| 326 |
+
"epoch": 28.571428571428573,
|
| 327 |
+
"grad_norm": 180224.375,
|
| 328 |
+
"learning_rate": 2.8893442622950824e-06,
|
| 329 |
+
"loss": 1.2084,
|
| 330 |
+
"step": 2800
|
| 331 |
+
},
|
| 332 |
+
{
|
| 333 |
+
"epoch": 28.571428571428573,
|
| 334 |
+
"eval_loss": 0.9903889298439026,
|
| 335 |
+
"eval_runtime": 10.5794,
|
| 336 |
+
"eval_samples_per_second": 15.596,
|
| 337 |
+
"eval_steps_per_second": 1.985,
|
| 338 |
+
"eval_wer": 0.5833333333333334,
|
| 339 |
+
"step": 2800
|
| 340 |
+
},
|
| 341 |
+
{
|
| 342 |
+
"epoch": 29.591836734693878,
|
| 343 |
+
"grad_norm": 153736.046875,
|
| 344 |
+
"learning_rate": 8.401639344262295e-07,
|
| 345 |
+
"loss": 1.1881,
|
| 346 |
+
"step": 2900
|
| 347 |
+
}
|
| 348 |
+
],
|
| 349 |
+
"logging_steps": 100,
|
| 350 |
+
"max_steps": 2940,
|
| 351 |
+
"num_input_tokens_seen": 0,
|
| 352 |
+
"num_train_epochs": 30,
|
| 353 |
+
"save_steps": 400,
|
| 354 |
+
"stateful_callbacks": {
|
| 355 |
+
"EarlyStoppingCallback": {
|
| 356 |
+
"args": {
|
| 357 |
+
"early_stopping_patience": 5,
|
| 358 |
+
"early_stopping_threshold": 0.01
|
| 359 |
+
},
|
| 360 |
+
"attributes": {
|
| 361 |
+
"early_stopping_patience_counter": 1
|
| 362 |
+
}
|
| 363 |
+
},
|
| 364 |
+
"TrainerControl": {
|
| 365 |
+
"args": {
|
| 366 |
+
"should_epoch_stop": false,
|
| 367 |
+
"should_evaluate": false,
|
| 368 |
+
"should_log": false,
|
| 369 |
+
"should_save": true,
|
| 370 |
+
"should_training_stop": true
|
| 371 |
+
},
|
| 372 |
+
"attributes": {}
|
| 373 |
+
}
|
| 374 |
+
},
|
| 375 |
+
"total_flos": 1.8456230162149265e+19,
|
| 376 |
+
"train_batch_size": 8,
|
| 377 |
+
"trial_name": null,
|
| 378 |
+
"trial_params": null
|
| 379 |
+
}
|
checkpoint-2940/training_args.bin
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:1ea3cd97018cf5d55f387775c77a86a9b6a707724b0ec654334ad12d0720841d
|
| 3 |
+
size 5368
|
checkpoint-2940/vocab.json
ADDED
|
@@ -0,0 +1,61 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
",": 1,
|
| 3 |
+
"?": 2,
|
| 4 |
+
"[PAD]": 58,
|
| 5 |
+
"[UNK]": 57,
|
| 6 |
+
"|": 0,
|
| 7 |
+
"।": 3,
|
| 8 |
+
"ঁ": 4,
|
| 9 |
+
"ং": 5,
|
| 10 |
+
"অ": 6,
|
| 11 |
+
"আ": 7,
|
| 12 |
+
"ই": 8,
|
| 13 |
+
"উ": 9,
|
| 14 |
+
"এ": 10,
|
| 15 |
+
"ও": 11,
|
| 16 |
+
"ক": 12,
|
| 17 |
+
"খ": 13,
|
| 18 |
+
"গ": 14,
|
| 19 |
+
"ঘ": 15,
|
| 20 |
+
"ঙ": 16,
|
| 21 |
+
"চ": 17,
|
| 22 |
+
"ছ": 18,
|
| 23 |
+
"জ": 19,
|
| 24 |
+
"ঝ": 20,
|
| 25 |
+
"ঞ": 21,
|
| 26 |
+
"ট": 22,
|
| 27 |
+
"ঠ": 23,
|
| 28 |
+
"ড": 24,
|
| 29 |
+
"ঢ": 25,
|
| 30 |
+
"ণ": 26,
|
| 31 |
+
"ত": 27,
|
| 32 |
+
"থ": 28,
|
| 33 |
+
"দ": 29,
|
| 34 |
+
"ধ": 30,
|
| 35 |
+
"ন": 31,
|
| 36 |
+
"প": 32,
|
| 37 |
+
"ফ": 33,
|
| 38 |
+
"ব": 34,
|
| 39 |
+
"ভ": 35,
|
| 40 |
+
"ম": 36,
|
| 41 |
+
"য": 37,
|
| 42 |
+
"র": 38,
|
| 43 |
+
"ল": 39,
|
| 44 |
+
"শ": 40,
|
| 45 |
+
"ষ": 41,
|
| 46 |
+
"স": 42,
|
| 47 |
+
"হ": 43,
|
| 48 |
+
"়": 44,
|
| 49 |
+
"া": 45,
|
| 50 |
+
"ি": 46,
|
| 51 |
+
"ী": 47,
|
| 52 |
+
"ু": 48,
|
| 53 |
+
"ূ": 49,
|
| 54 |
+
"ৃ": 50,
|
| 55 |
+
"ে": 51,
|
| 56 |
+
"ৈ": 52,
|
| 57 |
+
"ো": 53,
|
| 58 |
+
"ৌ": 54,
|
| 59 |
+
"্": 55,
|
| 60 |
+
"ৎ": 56
|
| 61 |
+
}
|
eval_results.json
ADDED
|
@@ -0,0 +1,8 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"eval_loss": 1.035390019416809,
|
| 3 |
+
"eval_wer": 0.6047297297297297,
|
| 4 |
+
"eval_runtime": 10.6448,
|
| 5 |
+
"eval_samples_per_second": 15.5,
|
| 6 |
+
"eval_steps_per_second": 1.973,
|
| 7 |
+
"epoch": 30.0
|
| 8 |
+
}
|
final/added_tokens.json
ADDED
|
@@ -0,0 +1,4 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"</s>": 60,
|
| 3 |
+
"<s>": 59
|
| 4 |
+
}
|
final/config.json
ADDED
|
@@ -0,0 +1,116 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"activation_dropout": 0.0,
|
| 3 |
+
"adapter_attn_dim": null,
|
| 4 |
+
"adapter_kernel_size": 3,
|
| 5 |
+
"adapter_stride": 2,
|
| 6 |
+
"add_adapter": false,
|
| 7 |
+
"apply_spec_augment": true,
|
| 8 |
+
"architectures": [
|
| 9 |
+
"Wav2Vec2ForCTC"
|
| 10 |
+
],
|
| 11 |
+
"attention_dropout": 0.1,
|
| 12 |
+
"bos_token_id": 1,
|
| 13 |
+
"classifier_proj_size": 256,
|
| 14 |
+
"codevector_dim": 768,
|
| 15 |
+
"contrastive_logits_temperature": 0.1,
|
| 16 |
+
"conv_bias": true,
|
| 17 |
+
"conv_dim": [
|
| 18 |
+
512,
|
| 19 |
+
512,
|
| 20 |
+
512,
|
| 21 |
+
512,
|
| 22 |
+
512,
|
| 23 |
+
512,
|
| 24 |
+
512
|
| 25 |
+
],
|
| 26 |
+
"conv_kernel": [
|
| 27 |
+
10,
|
| 28 |
+
3,
|
| 29 |
+
3,
|
| 30 |
+
3,
|
| 31 |
+
3,
|
| 32 |
+
2,
|
| 33 |
+
2
|
| 34 |
+
],
|
| 35 |
+
"conv_stride": [
|
| 36 |
+
5,
|
| 37 |
+
2,
|
| 38 |
+
2,
|
| 39 |
+
2,
|
| 40 |
+
2,
|
| 41 |
+
2,
|
| 42 |
+
2
|
| 43 |
+
],
|
| 44 |
+
"ctc_loss_reduction": "mean",
|
| 45 |
+
"ctc_zero_infinity": true,
|
| 46 |
+
"diversity_loss_weight": 0.1,
|
| 47 |
+
"do_stable_layer_norm": true,
|
| 48 |
+
"eos_token_id": 2,
|
| 49 |
+
"feat_extract_activation": "gelu",
|
| 50 |
+
"feat_extract_dropout": 0.0,
|
| 51 |
+
"feat_extract_norm": "layer",
|
| 52 |
+
"feat_proj_dropout": 0.0,
|
| 53 |
+
"feat_quantizer_dropout": 0.0,
|
| 54 |
+
"final_dropout": 0.0,
|
| 55 |
+
"gradient_checkpointing": false,
|
| 56 |
+
"hidden_act": "gelu",
|
| 57 |
+
"hidden_dropout": 0.1,
|
| 58 |
+
"hidden_size": 1024,
|
| 59 |
+
"initializer_range": 0.02,
|
| 60 |
+
"intermediate_size": 4096,
|
| 61 |
+
"layer_norm_eps": 1e-05,
|
| 62 |
+
"layerdrop": 0.1,
|
| 63 |
+
"mask_channel_length": 10,
|
| 64 |
+
"mask_channel_min_space": 1,
|
| 65 |
+
"mask_channel_other": 0.0,
|
| 66 |
+
"mask_channel_prob": 0.0,
|
| 67 |
+
"mask_channel_selection": "static",
|
| 68 |
+
"mask_feature_length": 10,
|
| 69 |
+
"mask_feature_min_masks": 0,
|
| 70 |
+
"mask_feature_prob": 0.0,
|
| 71 |
+
"mask_time_length": 10,
|
| 72 |
+
"mask_time_min_masks": 2,
|
| 73 |
+
"mask_time_min_space": 1,
|
| 74 |
+
"mask_time_other": 0.0,
|
| 75 |
+
"mask_time_prob": 0.05,
|
| 76 |
+
"mask_time_selection": "static",
|
| 77 |
+
"model_type": "wav2vec2",
|
| 78 |
+
"num_adapter_layers": 3,
|
| 79 |
+
"num_attention_heads": 16,
|
| 80 |
+
"num_codevector_groups": 2,
|
| 81 |
+
"num_codevectors_per_group": 320,
|
| 82 |
+
"num_conv_pos_embedding_groups": 16,
|
| 83 |
+
"num_conv_pos_embeddings": 128,
|
| 84 |
+
"num_feat_extract_layers": 7,
|
| 85 |
+
"num_hidden_layers": 24,
|
| 86 |
+
"num_negatives": 100,
|
| 87 |
+
"output_hidden_size": 1024,
|
| 88 |
+
"pad_token_id": 58,
|
| 89 |
+
"proj_codevector_dim": 768,
|
| 90 |
+
"tdnn_dilation": [
|
| 91 |
+
1,
|
| 92 |
+
2,
|
| 93 |
+
3,
|
| 94 |
+
1,
|
| 95 |
+
1
|
| 96 |
+
],
|
| 97 |
+
"tdnn_dim": [
|
| 98 |
+
512,
|
| 99 |
+
512,
|
| 100 |
+
512,
|
| 101 |
+
512,
|
| 102 |
+
1500
|
| 103 |
+
],
|
| 104 |
+
"tdnn_kernel": [
|
| 105 |
+
5,
|
| 106 |
+
3,
|
| 107 |
+
3,
|
| 108 |
+
1,
|
| 109 |
+
1
|
| 110 |
+
],
|
| 111 |
+
"torch_dtype": "float32",
|
| 112 |
+
"transformers_version": "4.53.3",
|
| 113 |
+
"use_weighted_layer_sum": false,
|
| 114 |
+
"vocab_size": 61,
|
| 115 |
+
"xvector_output_dim": 512
|
| 116 |
+
}
|
final/model.safetensors
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:264e4755a760a77e0a606971d1459cf26b45dd31d131c07b4b31457052e18994
|
| 3 |
+
size 1262057580
|
final/preprocessor_config.json
ADDED
|
@@ -0,0 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"do_normalize": true,
|
| 3 |
+
"feature_extractor_type": "Wav2Vec2FeatureExtractor",
|
| 4 |
+
"feature_size": 1,
|
| 5 |
+
"padding_side": "right",
|
| 6 |
+
"padding_value": 0.0,
|
| 7 |
+
"processor_class": "Wav2Vec2Processor",
|
| 8 |
+
"return_attention_mask": true,
|
| 9 |
+
"sampling_rate": 16000
|
| 10 |
+
}
|
final/special_tokens_map.json
ADDED
|
@@ -0,0 +1,6 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"bos_token": "<s>",
|
| 3 |
+
"eos_token": "</s>",
|
| 4 |
+
"pad_token": "[PAD]",
|
| 5 |
+
"unk_token": "[UNK]"
|
| 6 |
+
}
|
final/tokenizer_config.json
ADDED
|
@@ -0,0 +1,49 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"added_tokens_decoder": {
|
| 3 |
+
"57": {
|
| 4 |
+
"content": "[UNK]",
|
| 5 |
+
"lstrip": true,
|
| 6 |
+
"normalized": false,
|
| 7 |
+
"rstrip": true,
|
| 8 |
+
"single_word": false,
|
| 9 |
+
"special": false
|
| 10 |
+
},
|
| 11 |
+
"58": {
|
| 12 |
+
"content": "[PAD]",
|
| 13 |
+
"lstrip": true,
|
| 14 |
+
"normalized": false,
|
| 15 |
+
"rstrip": true,
|
| 16 |
+
"single_word": false,
|
| 17 |
+
"special": false
|
| 18 |
+
},
|
| 19 |
+
"59": {
|
| 20 |
+
"content": "<s>",
|
| 21 |
+
"lstrip": false,
|
| 22 |
+
"normalized": false,
|
| 23 |
+
"rstrip": false,
|
| 24 |
+
"single_word": false,
|
| 25 |
+
"special": true
|
| 26 |
+
},
|
| 27 |
+
"60": {
|
| 28 |
+
"content": "</s>",
|
| 29 |
+
"lstrip": false,
|
| 30 |
+
"normalized": false,
|
| 31 |
+
"rstrip": false,
|
| 32 |
+
"single_word": false,
|
| 33 |
+
"special": true
|
| 34 |
+
}
|
| 35 |
+
},
|
| 36 |
+
"bos_token": "<s>",
|
| 37 |
+
"clean_up_tokenization_spaces": false,
|
| 38 |
+
"do_lower_case": false,
|
| 39 |
+
"eos_token": "</s>",
|
| 40 |
+
"extra_special_tokens": {},
|
| 41 |
+
"model_max_length": 1000000000000000019884624838656,
|
| 42 |
+
"pad_token": "[PAD]",
|
| 43 |
+
"processor_class": "Wav2Vec2Processor",
|
| 44 |
+
"replace_word_delimiter_char": " ",
|
| 45 |
+
"target_lang": null,
|
| 46 |
+
"tokenizer_class": "Wav2Vec2CTCTokenizer",
|
| 47 |
+
"unk_token": "[UNK]",
|
| 48 |
+
"word_delimiter_token": "|"
|
| 49 |
+
}
|
final/training_args.bin
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:1ea3cd97018cf5d55f387775c77a86a9b6a707724b0ec654334ad12d0720841d
|
| 3 |
+
size 5368
|
final/vocab.json
ADDED
|
@@ -0,0 +1,61 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
",": 1,
|
| 3 |
+
"?": 2,
|
| 4 |
+
"[PAD]": 58,
|
| 5 |
+
"[UNK]": 57,
|
| 6 |
+
"|": 0,
|
| 7 |
+
"।": 3,
|
| 8 |
+
"ঁ": 4,
|
| 9 |
+
"ং": 5,
|
| 10 |
+
"অ": 6,
|
| 11 |
+
"আ": 7,
|
| 12 |
+
"ই": 8,
|
| 13 |
+
"উ": 9,
|
| 14 |
+
"এ": 10,
|
| 15 |
+
"ও": 11,
|
| 16 |
+
"ক": 12,
|
| 17 |
+
"খ": 13,
|
| 18 |
+
"গ": 14,
|
| 19 |
+
"ঘ": 15,
|
| 20 |
+
"ঙ": 16,
|
| 21 |
+
"চ": 17,
|
| 22 |
+
"ছ": 18,
|
| 23 |
+
"জ": 19,
|
| 24 |
+
"ঝ": 20,
|
| 25 |
+
"ঞ": 21,
|
| 26 |
+
"ট": 22,
|
| 27 |
+
"ঠ": 23,
|
| 28 |
+
"ড": 24,
|
| 29 |
+
"ঢ": 25,
|
| 30 |
+
"ণ": 26,
|
| 31 |
+
"ত": 27,
|
| 32 |
+
"থ": 28,
|
| 33 |
+
"দ": 29,
|
| 34 |
+
"ধ": 30,
|
| 35 |
+
"ন": 31,
|
| 36 |
+
"প": 32,
|
| 37 |
+
"ফ": 33,
|
| 38 |
+
"ব": 34,
|
| 39 |
+
"ভ": 35,
|
| 40 |
+
"ম": 36,
|
| 41 |
+
"য": 37,
|
| 42 |
+
"র": 38,
|
| 43 |
+
"ল": 39,
|
| 44 |
+
"শ": 40,
|
| 45 |
+
"ষ": 41,
|
| 46 |
+
"স": 42,
|
| 47 |
+
"হ": 43,
|
| 48 |
+
"়": 44,
|
| 49 |
+
"া": 45,
|
| 50 |
+
"ি": 46,
|
| 51 |
+
"ী": 47,
|
| 52 |
+
"ু": 48,
|
| 53 |
+
"ূ": 49,
|
| 54 |
+
"ৃ": 50,
|
| 55 |
+
"ে": 51,
|
| 56 |
+
"ৈ": 52,
|
| 57 |
+
"ো": 53,
|
| 58 |
+
"ৌ": 54,
|
| 59 |
+
"্": 55,
|
| 60 |
+
"ৎ": 56
|
| 61 |
+
}
|
logs/events.out.tfevents.1763220599.82016ece2133.48.0
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:7ff7c589fa1c79f1cd2bda23093b461d8a5f48a5daccc1df284fab8dbea61196
|
| 3 |
+
size 17794
|
logs/events.out.tfevents.1763236211.82016ece2133.48.1
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:cff2e938ed89409eaaf1e176a48fd2a09b548d32f2721192777a802ad950737f
|
| 3 |
+
size 406
|
preprocessor_config.json
CHANGED
|
@@ -1,11 +1,10 @@
|
|
| 1 |
{
|
| 2 |
-
"
|
| 3 |
-
"
|
| 4 |
-
"
|
| 5 |
"padding_side": "right",
|
| 6 |
-
"padding_value":
|
| 7 |
-
"processor_class": "
|
| 8 |
"return_attention_mask": true,
|
| 9 |
-
"sampling_rate": 16000
|
| 10 |
-
"stride": 2
|
| 11 |
}
|
|
|
|
| 1 |
{
|
| 2 |
+
"do_normalize": true,
|
| 3 |
+
"feature_extractor_type": "Wav2Vec2FeatureExtractor",
|
| 4 |
+
"feature_size": 1,
|
| 5 |
"padding_side": "right",
|
| 6 |
+
"padding_value": 0.0,
|
| 7 |
+
"processor_class": "Wav2Vec2Processor",
|
| 8 |
"return_attention_mask": true,
|
| 9 |
+
"sampling_rate": 16000
|
|
|
|
| 10 |
}
|
test_predictions.csv
ADDED
|
@@ -0,0 +1,451 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
audio,text
|
| 2 |
+
test_001.wav,তুমি কি খালতাবে?
|
| 3 |
+
test_002.wav,তুমি কি আমাকে কলমরা দেবে?
|
| 4 |
+
test_003.wav,আজকেদুরে রাস্তায় পানি জমছিল।
|
| 5 |
+
test_004.wav,আজ সকালে পটা বিস্টি নামছিল।
|
| 6 |
+
test_005.wav,তুমি কি পড়়ে তুবে?
|
| 7 |
+
test_006.wav,তুমি কি প্দ রবে?
|
| 8 |
+
test_007.wav,আজকে দাগা় মে়গ জমেছে।
|
| 9 |
+
test_008.wav,আমর ছো্ট বই স্কুলে যাে।
|
| 10 |
+
test_009.wav,আমি গান নেখ আেছি।
|
| 11 |
+
test_010.wav,তুমি কি আজ ব্দুর সযে দেকা করেছো?
|
| 12 |
+
test_011.wav,আমুপুরেন নাস্তা স্তে ব্দু করছে।
|
| 13 |
+
test_012.wav,আমি আজ নতুন জুতা কিনেছি।
|
| 14 |
+
test_013.wav,তুমি কি আজ আভিসে যাবে?
|
| 15 |
+
test_014.wav,আমি সকালের নাস্তা ভিম খে়েছি।
|
| 16 |
+
test_015.wav,আজকেদুরে যরি রাস্্তা ভিছিল।
|
| 17 |
+
test_016.wav,আমি বিকেলে আাটে যাে চাই।
|
| 18 |
+
test_017.wav,আমি াগে স্কুলে আজ বিশা নুস্া গবে।
|
| 19 |
+
test_018.wav,আমি বাজার থেে আমনেছি।
|
| 20 |
+
test_019.wav,তুমি কি কনো কবিতা লিখেছো?
|
| 21 |
+
test_020.wav,আমি নতুন পনে লাথে চারজার কিনেছি।
|
| 22 |
+
test_021.wav,তুমি কি আগামকালল ডাকায যাছো?
|
| 23 |
+
test_022.wav,আজ বিকেলে আমরা একসাে গলপ কবে।
|
| 24 |
+
test_023.wav,আমি দুরে গলপ লিখেছি।
|
| 25 |
+
test_024.wav,তুমি কি দুত কাছো?
|
| 26 |
+
test_025.wav,আমি সকালের নাস্তা হিসাবে দুত খেয়েছি।
|
| 27 |
+
test_026.wav,তুমি কি বাত খেযেছো?
|
| 28 |
+
test_027.wav,তুমি কি কভির সাথে বিস্কুট খাবে?
|
| 29 |
+
test_028.wav,তুমি কি নতুন কিতা পড়তে যাো?
|
| 30 |
+
test_029.wav,আজ বিকেলে সবজির দাম পতে়ছে।
|
| 31 |
+
test_030.wav,আমা সুট বাই স্কুলে যাে।
|
| 32 |
+
test_031.wav,তুমি কি পু ্ানেছো?
|
| 33 |
+
test_032.wav,তুমি কি পানি খেযযে ছো?
|
| 34 |
+
test_033.wav,আমি বই লেখতে বেছি।
|
| 35 |
+
test_034.wav,আজ েরাকতে বিস্ি আবে।
|
| 36 |
+
test_035.wav,আজ ে আকাসে রত পডেছে।
|
| 37 |
+
test_036.wav,আমি সকালের নাস্তা গকরতে যাছি।
|
| 38 |
+
test_037.wav,তুমি কি প্রপিতি স্দা যজা মকছো?
|
| 39 |
+
test_038.wav,আমি বিকেলে চা খেতে বেছিাম।
|
| 40 |
+
test_039.wav,তুমি কি এখন বযস্ত আছো?
|
| 41 |
+
test_040.wav,তুমি কি গান শুনাকবো?
|
| 42 |
+
test_041.wav,আজকে জা গরম ছিল।
|
| 43 |
+
test_042.wav,তুমি কি আমাকে সাযজয করবে?
|
| 44 |
+
test_043.wav,আজ দুরে খাতের ভল্লাগখছে।
|
| 45 |
+
test_044.wav,আজকেদুরে য বিস্ি হ়েছে।
|
| 46 |
+
test_045.wav,আমি আজ মাখকের সাথে আনা করেছি।
|
| 47 |
+
test_046.wav,আজ সকালে রাস্তাযয নক কাদে হছে।
|
| 48 |
+
test_047.wav,তুমি কি হাটে যাবে?
|
| 49 |
+
test_048.wav,আজ েসকালে সর্যটা ুনক শু্দ।
|
| 50 |
+
test_049.wav,তুমি কি এ চা খেবে?
|
| 51 |
+
test_050.wav,আজ েদুরে কবদে বি্টি হেছিল।
|
| 52 |
+
test_051.wav,তুমি কি নোন নদর ারে গি়েছো?
|
| 53 |
+
test_052.wav,আমি বিকেলে খটতে যাই।
|
| 54 |
+
test_053.wav,আজ রাতে আমার টিভি দেখেছে।
|
| 55 |
+
test_054.wav,তুমি কি বলে গলকা াকে় যাযছো?
|
| 56 |
+
test_055.wav,আজ ে স্কুলে না্টা কেছে।
|
| 57 |
+
test_056.wav,আজ বিকেলে আমেরা শুরু সগে লবে।
|
| 58 |
+
test_057.wav,তুমি কি আচা কাছো?
|
| 59 |
+
test_058.wav,আমি নতুন মোবাইল কিেছি।
|
| 60 |
+
test_059.wav,আমি মার ব্দুতের সাথে খেলছি।
|
| 61 |
+
test_060.wav,আজ সকালে সটাযত করানে পানিসছিল।
|
| 62 |
+
test_061.wav,আমি আ বাজার একতে পল কিেছি।
|
| 63 |
+
test_062.wav,আজকে স্কুলে ক্রিটা নু্টান হ়েছে।
|
| 64 |
+
test_063.wav,আজ বিকেলে ক্লাসে পরক্া নেযা হযেছে।
|
| 65 |
+
test_064.wav,আমি পাজারে দিস্কুত গিযছি।
|
| 66 |
+
test_065.wav,তুমি কি আ ছবি দেখতে যাবে?
|
| 67 |
+
test_066.wav,আজ আমার খুব বালো লা গিেছে।
|
| 68 |
+
test_067.wav,আজ স্কুলে খেলা হেছে।
|
| 69 |
+
test_068.wav,আজ আকাসে মে জামে আছে।
|
| 70 |
+
test_069.wav,আজকেরদালে লে গর প ববে।
|
| 71 |
+
test_070.wav,তুমি কি এখনো চান খেতে চাো?
|
| 72 |
+
test_071.wav,আজ াতে পডনিমা হইবে।
|
| 73 |
+
test_072.wav,আজ বিকেলে রাস্তাযয নেক জামেছিল।
|
| 74 |
+
test_073.wav,আমি সকালের নাস্তা করে স্কুলে গ়েছি।
|
| 75 |
+
test_074.wav,তুমি কি ক্লাসে গিযেছো?
|
| 76 |
+
test_075.wav,আজ সকলে বাতাস্া় খা্াদা গিললেছে।
|
| 77 |
+
test_076.wav,আুমি আি কনো হাটায সরিনেছিম।
|
| 78 |
+
test_077.wav,তুমি কি আজ ছিবি দেখতে যাবে?
|
| 79 |
+
test_078.wav,আজ রাতেে চাদুরছে।
|
| 80 |
+
test_079.wav,আজ বিকেলে করিকে খেলা শেশো।
|
| 81 |
+
test_080.wav,আজ রাতে পারা যালো।
|
| 82 |
+
test_081.wav,আমি মাকে রান্া সাজ পরেছি।
|
| 83 |
+
test_082.wav,আজ আমার খুব ভালো লাগে।
|
| 84 |
+
test_083.wav,আমি দুরে খা শিশি লিখেছি।
|
| 85 |
+
test_084.wav,তুমি কি গান বাজাো?
|
| 86 |
+
test_085.wav,আমর গলপ নতে ভললাগে।
|
| 87 |
+
test_086.wav,তুমি কি এখন পা দানো?
|
| 88 |
+
test_087.wav,আমি নতুন পের যারজার কিনেছি।
|
| 89 |
+
test_088.wav,আজ ে মাটে খেলা ুনেছে।
|
| 90 |
+
test_089.wav,তুমি কি আজ নতু কাপ করছো?
|
| 91 |
+
test_090.wav,আমি নতুন গান শুনেছি।
|
| 92 |
+
test_091.wav,আমি সকাালে খবে পরেছি।
|
| 93 |
+
test_092.wav,তুমি কি ভাত খেছো?
|
| 94 |
+
test_093.wav,আজ রাতে সবাই একসয খাযা শে্ কর আছে।
|
| 95 |
+
test_094.wav,আজ বাজারে মাছছে দাম নে।
|
| 96 |
+
test_095.wav,তুমি কি মোবাইল চাজ দিযছো?
|
| 97 |
+
test_096.wav,তুমি কি আজা ুটবল খেলবে?
|
| 98 |
+
test_097.wav,আজকাসে আজ বাসজ করে আল।
|
| 99 |
+
test_098.wav,আজকে আলোচনায শিলপলা গরু্ বািল।
|
| 100 |
+
test_099.wav,আমি বাজার থেকে আম কিননেছি।
|
| 101 |
+
test_100.wav,তুমি কি আজ স্কুলে ুপশিত পেছো?
|
| 102 |
+
test_101.wav,আজকেরেোদে গরমটা শনিদছে।
|
| 103 |
+
test_102.wav,আমি হাতেে ুরজ দেখেছি।
|
| 104 |
+
test_103.wav,আজকেরর বায আহায খাচা় শমন।
|
| 105 |
+
test_104.wav,আজ রাতে আকাসে তারাজ লম পরছে।
|
| 106 |
+
test_105.wav,আমি দুে দুত খেয়েছি।
|
| 107 |
+
test_106.wav,তুমি কি গান কবে যানো?
|
| 108 |
+
test_107.wav,তুমি কি আজ ব্ু সথযে দেকা করেছো?
|
| 109 |
+
test_108.wav,আমি সকালে চিটি লিখেছি।
|
| 110 |
+
test_109.wav,আমি া ছটে বাই স্কুলে যাছি।
|
| 111 |
+
test_110.wav,আজ রাস্তার মাদে ভিেছে।
|
| 112 |
+
test_111.wav,আজ বিকেলে রাস্তা হনে গযছিল।
|
| 113 |
+
test_112.wav,আজকে প্রতিবেদনে অনতির ক াকবে।
|
| 114 |
+
test_113.wav,আজ েদুরে গরম ডেছে।
|
| 115 |
+
test_114.wav,আমিগ গরামে বাতাস খুবি শা্তই।
|
| 116 |
+
test_115.wav,তুমি কি আমাকে পানি দেতে পাবে?
|
| 117 |
+
test_116.wav,আমি জমা বনেক ভালল লাখছি।
|
| 118 |
+
test_117.wav,আমি নতুন বই দোকান দেখেছি।
|
| 119 |
+
test_118.wav,আজ াতে শাটা বাতাস সাবে।
|
| 120 |
+
test_119.wav,তুমি কি গাইগাসে পবে?
|
| 121 |
+
test_120.wav,আমি গান শুনতে ভালোবাি।
|
| 122 |
+
test_121.wav,আকাসে আজ মে জমে আছে।
|
| 123 |
+
test_122.wav,তুমি কি এখন আমাকে ডাখতে পারবে?
|
| 124 |
+
test_123.wav,আজ কবাই সি্যান্ নাম হ়েছে।
|
| 125 |
+
test_124.wav,আজকে রাতে চাটা আকারে গল।
|
| 126 |
+
test_125.wav,আজকেরাস্তায খবে যানজ ভেছে।
|
| 127 |
+
test_126.wav,আজ বিকেলে রাস্তা ম ভিজে গেছে।
|
| 128 |
+
test_127.wav,আমারে স্কুলে তজ ব় অনুস্ান আছি।
|
| 129 |
+
test_128.wav,আকাসে আজ ���ে জমিে আছে।
|
| 130 |
+
test_129.wav,তুমি কি খ কসাথে গলপ করেছো?
|
| 131 |
+
test_130.wav,তুমি কি গান শুনছো?
|
| 132 |
+
test_131.wav,আজ বিকেলে কলাস পরক্টা নেয খাবে।
|
| 133 |
+
test_132.wav,আমি সকালে দুত খেয়েছি।
|
| 134 |
+
test_133.wav,আজ রাস্তায় অনেক যানবহুন আছে।
|
| 135 |
+
test_134.wav,আমি হা তেে নতুন ব্দু পেছি।
|
| 136 |
+
test_135.wav,আমি সকালে হাটা খুব আনদ পাছি।
|
| 137 |
+
test_136.wav,আমি দুরে বা যা খে়েছি।
|
| 138 |
+
test_137.wav,আজ েসকালে পাখেরা গান গাইেছিল।
|
| 139 |
+
test_138.wav,আজ তিস ক্লাসে দলো ছনাহে।
|
| 140 |
+
test_139.wav,আমার গরামের বাতা শে শিত।
|
| 141 |
+
test_140.wav,আমি নাস্তা বাদে প়ে পযা দেখা করেছি।
|
| 142 |
+
test_141.wav,আজ বিকেলে রাস্তায় দুরগরনা গেছে।
|
| 143 |
+
test_142.wav,তুমি কি আজ খিসে যাবে?
|
| 144 |
+
test_143.wav,আমি ব্দুর পরে সথে খেলা খেলেছি।
|
| 145 |
+
test_144.wav,আমরা সবাই একসাথে হাটতে চাছি।
|
| 146 |
+
test_145.wav,আজকেরাস্তায় বদ গা়য আছে।
|
| 147 |
+
test_146.wav,আজ সকালে পানিতে সরক্টা ভিযা বে।
|
| 148 |
+
test_147.wav,আজকে ক্লাছে সময় বস্তি যছিল।
|
| 149 |
+
test_148.wav,তুমি কি আমাকে পানি দিতে পারবে?
|
| 150 |
+
test_149.wav,তুমি কি আগাললকা আতে পাবে?
|
| 151 |
+
test_150.wav,আজ বিকেলে মাটে বাারে খেলতানেখ সবাই হাসে নিখছিল।
|
| 152 |
+
test_151.wav,আমি আজ বাজারতে খল কিনেছি।
|
| 153 |
+
test_152.wav,আমি বই প়তে ভালোবাসি।
|
| 154 |
+
test_153.wav,আমি নতুন গান শুনতে চা।
|
| 155 |
+
test_154.wav,তুমি কি খনো গরামে গি নদর পাছো?
|
| 156 |
+
test_155.wav,আমি বিকেলে ব্দুদে সাথে গলপ করেছি।
|
| 157 |
+
test_156.wav,তুমি কি বই প়গসেছো?
|
| 158 |
+
test_157.wav,তুমি কি বই াররবে?
|
| 159 |
+
test_158.wav,তুমি কি িটিযা পড়ে পেেছো?
|
| 160 |
+
test_159.wav,আজ বিকেলে রাস্তায ে ভিছিল।
|
| 161 |
+
test_160.wav,তুমি কি কনো পাহা়ে গিেছো?
|
| 162 |
+
test_161.wav,আমি কি চালে খতে যাো।
|
| 163 |
+
test_162.wav,আজ সকালে রাস্তাযযহ দু বডানা করছে।
|
| 164 |
+
test_163.wav,আমরা সবাই মাটখে খেলতে যাছি।
|
| 165 |
+
test_164.wav,তুমি কি আমাকে বই়ের দোকানে লিে যাবে?
|
| 166 |
+
test_165.wav,আমি সকালে দু খেগেছি।
|
| 167 |
+
test_166.wav,আমি ব্দুরে সাথে খেলা খেলেছি।
|
| 168 |
+
test_167.wav,আজ বিকেলে কলাসে পরক্া নেমা খবে।
|
| 169 |
+
test_168.wav,আমি সপজরে নাস্তা খেি।
|
| 170 |
+
test_169.wav,আজ েসকালে সবাই দেরিতে আখেছে।
|
| 171 |
+
test_170.wav,আমি দুরে গলপলে খাছাম।
|
| 172 |
+
test_171.wav,তুমি কি মাকে কলমটা দেবে?
|
| 173 |
+
test_172.wav,আমি সকালের নাস্ত ভিছে ভুদিম খে়েছিলাম।
|
| 174 |
+
test_173.wav,তুমি কি আমাকে কলমটা দেবে?
|
| 175 |
+
test_174.wav,আমি খায় শনির প বই প়েছি।
|
| 176 |
+
test_175.wav,আমি াতেনি মাছতে খেতে লালোাম।
|
| 177 |
+
test_176.wav,তুমি কি বই়যের দোকানে গিেছলো?
|
| 178 |
+
test_177.wav,আমি বিকযাকার নাস্তা খেতে ভুলে গেছি।
|
| 179 |
+
test_178.wav,আজকেরদুরে ভাত খেয়েছে।
|
| 180 |
+
test_179.wav,আজ সকালে ব্্িতিরাস্তা পুরে বভিজেেছে।
|
| 181 |
+
test_180.wav,তুমি কি বই আনবে?
|
| 182 |
+
test_181.wav,তুমি কি লিবসান দেখেছো?
|
| 183 |
+
test_182.wav,তুমি কি গান কল দাো?
|
| 184 |
+
test_183.wav,আমি আখকতা গলপে বই লিখেছি।
|
| 185 |
+
test_184.wav,আমি দুররে মাছ খেয়েছি।
|
| 186 |
+
test_185.wav,আমি দুরে খরনা যির খনেছি।
|
| 187 |
+
test_186.wav,আজকের আকাসে সযামে বিসে যাছে।
|
| 188 |
+
test_187.wav,আমজাটেস্তা ে ব্দু কর দে।
|
| 189 |
+
test_188.wav,তজ জাটে ্ত�� ্টে ব্দকরে দাে।
|
| 190 |
+
test_189.wav,আজ সকালে ময স্কুলে দেরি করেছে।
|
| 191 |
+
test_190.wav,আজ জাতটে শ্টা হববে।
|
| 192 |
+
test_191.wav,আজকেদুরে অ গরম ছিল।
|
| 193 |
+
test_192.wav,তুমি কি আমাকে কলমটা দেবে?
|
| 194 |
+
test_193.wav,আমি সকালে নাস্তা খেতে বুলেগিছনশিটে পাি।
|
| 195 |
+
test_194.wav,আজ তিআস ক্লাসে মকতি যর্া শখনো।
|
| 196 |
+
test_195.wav,আমি আজ বাজার থেকে খল কিনেছি।
|
| 197 |
+
test_196.wav,আজ বাজারে আনজে দাম বেেছি।
|
| 198 |
+
test_197.wav,তুমি কি আজ বই কিননেছো?
|
| 199 |
+
test_198.wav,তুমি কি আজ মাক দেক আসছো?
|
| 200 |
+
test_199.wav,আমি দুরে খল খে়ে খুযি ়েছি।
|
| 201 |
+
test_200.wav,আজকে আসমা ভাগে ডাকাবে।
|
| 202 |
+
test_201.wav,আজ সকালে আমি বাজারে গি়েছিলাম।
|
| 203 |
+
test_202.wav,আজ েসকালে সুরযটাে সু্দর আিল।
|
| 204 |
+
test_203.wav,আজ দুরে স্কুলে ভি়ে।
|
| 205 |
+
test_204.wav,তুমি কি ডা শুনেছো?
|
| 206 |
+
test_205.wav,আজ ে বাতা শিন্া গালাগে।
|
| 207 |
+
test_206.wav,তুমি কি আমাকে কলমরা দেতছে?
|
| 208 |
+
test_207.wav,আমি গ্রনতাগরে বইো প্রব্দ লিখেছি।
|
| 209 |
+
test_208.wav,আমটা বাে তর গলপ করেছি।
|
| 210 |
+
test_209.wav,আমি বাজার থেকে কলা আনেছি।
|
| 211 |
+
test_210.wav,তুমি কি আমাছজ খেযেছো?
|
| 212 |
+
test_211.wav,আজ মারে খুব ভালো লাখছে।
|
| 213 |
+
test_212.wav,আমি নতুন মোবাইল কিনতে যাতে চাি।
|
| 214 |
+
test_213.wav,আমি গলপপ খনা আসেছিলাম।
|
| 215 |
+
test_214.wav,তুমি কি মোবাইলে চারজে দেবে?
|
| 216 |
+
test_215.wav,আমাটকে পলেরা করিকেট খেলছে।
|
| 217 |
+
test_216.wav,আমি গান লিখতে বইেছি।
|
| 218 |
+
test_217.wav,আমি আ গলপে বই লিখেছি।
|
| 219 |
+
test_218.wav,আমসজ সজম সাাল না পেেছি।
|
| 220 |
+
test_219.wav,আমি আজ নতুন জুতা কিনেছি।
|
| 221 |
+
test_220.wav,তুমিকি এন চা খেতে চাো?
|
| 222 |
+
test_221.wav,তুমি কি আজ টিবি দেখেছো?
|
| 223 |
+
test_222.wav,আমি নতুন বই কনেছি।
|
| 224 |
+
test_223.wav,আজ বিকেলে রাস্তায নে জাম যাছে।
|
| 225 |
+
test_224.wav,আজ আমারেরে স্কুল ব্দবে।
|
| 226 |
+
test_225.wav,তুমি কি এখন আমাকে দেখতে আবে?
|
| 227 |
+
test_226.wav,আজকেদুপুরে বিসশি গছল।
|
| 228 |
+
test_227.wav,আজ রাস্তায় দুর্না গরেছে।
|
| 229 |
+
test_228.wav,আজকেরাআকাস পরিস্কার ছিল।
|
| 230 |
+
test_229.wav,তুমি কি মোবাইলা চারজা দেবে?
|
| 231 |
+
test_230.wav,আজ রাস্তায় যানব শ্দর খেছে।
|
| 232 |
+
test_231.wav,আজকে খাযলে ডালের াত আছে।
|
| 233 |
+
test_232.wav,আজ মাদের কলাসে সিক্ক আেননছে।
|
| 234 |
+
test_233.wav,আজকের আকাস মেগ্লা আছিল।
|
| 235 |
+
test_234.wav,তুমি কি বাইরে যাতে চাো?
|
| 236 |
+
test_235.wav,তুরটপানিতে রাস্তা কেলে বিে গছে?
|
| 237 |
+
test_236.wav,তুমি কি আবই ুমে চেছলো?
|
| 238 |
+
test_237.wav,তুমি কি খনো খায়যা শে করোনো?
|
| 239 |
+
test_238.wav,আমি খাযাদ বই পড খকি খেছি।
|
| 240 |
+
test_239.wav,আমি ব্ুদে সাথে খেরা খেলেছি।
|
| 241 |
+
test_240.wav,আজ সকালে আমি বাজারে গিযেছিলাম।
|
| 242 |
+
test_241.wav,আজ সকালে র্টি হরাসতা ভিজা গেছে।
|
| 243 |
+
test_242.wav,তুমি কি বাসায় আকা ছিলেআছো?
|
| 244 |
+
test_243.wav,তুমি কি পই়েখন ত আমােবে?
|
| 245 |
+
test_244.wav,তুমি কি খাতা়র সময় দু বান করো?
|
| 246 |
+
test_245.wav,আজ েসকালে ম বিস্ি পডরেছে।
|
| 247 |
+
test_246.wav,তুমি কি সমদর ডায দেখেছো?
|
| 248 |
+
test_247.wav,আমি সকালা কলা স গিেছিলাম।
|
| 249 |
+
test_248.wav,আমি আজ নতুন জামা করেছি।
|
| 250 |
+
test_249.wav,আজ ে স্কুলে পরিক্টায হয়েছে।
|
| 251 |
+
test_250.wav,আজ বাজারে দাম প��ররেছে।
|
| 252 |
+
test_251.wav,আজ বিকেলে সবজি দাম ভে়েছে।
|
| 253 |
+
test_252.wav,আজ েসকালে মেক পড়েছে।
|
| 254 |
+
test_253.wav,আমি নতুন মোবাই নিতে চাছি।
|
| 255 |
+
test_254.wav,আজ েসকলে আটা মাটে খেলছিল।
|
| 256 |
+
test_255.wav,তুমি কি নতুন বই পড়তে় যাো?
|
| 257 |
+
test_256.wav,তুমি কি এখনোে বই প়বে?
|
| 258 |
+
test_257.wav,তুমি কি হাসতায চিযো?
|
| 259 |
+
test_258.wav,তুমি কি কনো পাাড়ে গিেছো?
|
| 260 |
+
test_259.wav,তুমি কি চিটিটা পড়়েনত পাবে?
|
| 261 |
+
test_260.wav,আজ বিকেেলে খমরা খাতে যাবো।
|
| 262 |
+
test_261.wav,তুমি কি এখনি শু যাছো?
|
| 263 |
+
test_262.wav,তুমি কি এখনো গুময তেেছো?
|
| 264 |
+
test_263.wav,আমি বই পড়তে প়তে গান শুনছিলাম।
|
| 265 |
+
test_264.wav,তুমি কি প্রিতি স্দর জাম মকো?
|
| 266 |
+
test_265.wav,আজ ক্লাসে নতুন পা শখাছে।
|
| 267 |
+
test_266.wav,আজকেরদুরে খেভি গরম ছিল।
|
| 268 |
+
test_267.wav,আজকেরাস্তায় যাম ছিল।
|
| 269 |
+
test_268.wav,আমি আজজ মালে সাদে রান েছি।
|
| 270 |
+
test_269.wav,আমি সকালে আমিে বাজারে দি়েছিাম।
|
| 271 |
+
test_270.wav,আজ মাগে দিনা ছিল।
|
| 272 |
+
test_271.wav,আজ বিকেলে কলাসে পরিক্শিনেমা হবে।
|
| 273 |
+
test_272.wav,আমি এখন টিভিতে খবর দেখেছি।
|
| 274 |
+
test_273.wav,আমি আজ নতুন জামা প়েছি।
|
| 275 |
+
test_274.wav,আজ প্রতিবেদন শু্তুনর কতা ছে।
|
| 276 |
+
test_275.wav,আজকেরাস্তায় যত যাম হেছে।
|
| 277 |
+
test_276.wav,আমি দুররে ভাত খে়েছি।
|
| 278 |
+
test_277.wav,তুমি কি গা শুনো দাো?
|
| 279 |
+
test_278.wav,আজকে রইদে শনা গরম াগে।
|
| 280 |
+
test_279.wav,তুমি কি কখনো পাা়ে গিেছো?
|
| 281 |
+
test_280.wav,আজ েআাটে ম্া ভিে।
|
| 282 |
+
test_281.wav,আমি নতু গান শুনেছি।
|
| 283 |
+
test_282.wav,আজ দুরে বভ্টি হেছে।
|
| 284 |
+
test_283.wav,তুমি কি এখনো গান শুননডো?
|
| 285 |
+
test_284.wav,আমি মা গরাননাত সাযয করেছিম।
|
| 286 |
+
test_285.wav,তুমি কি খবই পডরেছো?
|
| 287 |
+
test_286.wav,তুমি কি কলম দেবে?
|
| 288 |
+
test_287.wav,আমরা সবাই আকসাথে হাটতে যাখছি।
|
| 289 |
+
test_288.wav,তুমি কি কখনো কবিতা লিখেছো?
|
| 290 |
+
test_289.wav,আজ সকালে রাস্তাযকটা দুর না করছে।
|
| 291 |
+
test_290.wav,আমরা কলা ক্সাথে সিনেমা দেখবে।
|
| 292 |
+
test_291.wav,আমি দুরে খলে রস খে়েছি।
|
| 293 |
+
test_292.wav,তুমি কি এ খুমছো?
|
| 294 |
+
test_293.wav,আজ রদু গরম পরেছে।
|
| 295 |
+
test_294.wav,তুমি কি এখখনো স্ ি়েছো?
|
| 296 |
+
test_295.wav,আজ বিকেলে ক্লাসে পরক্টা নেযা খবে।
|
| 297 |
+
test_296.wav,আজ জাতে থারা পডেছে।
|
| 298 |
+
test_297.wav,তুমি কি মোবাইটা চাজে বসযেছো?
|
| 299 |
+
test_298.wav,তুমি কি বাসাকা চাো?
|
| 300 |
+
test_299.wav,আজ েসকালে বাজারে গেছিলম।
|
| 301 |
+
test_300.wav,তুমি কি কখখন নদর ারে গিেছলো?
|
| 302 |
+
test_301.wav,তুমি কি এখন চা খেতে চাো?
|
| 303 |
+
test_302.wav,আজ রাস্তায় মা যান জট েছে।
|
| 304 |
+
test_303.wav,আমি সকালে হাটতেম গিযেছিলাম।
|
| 305 |
+
test_304.wav,আমি হাতেে নতুন বন্দু পাছি।
|
| 306 |
+
test_305.wav,আমি দুরে বই পড়়ে সময় কাটা খেছি।
|
| 307 |
+
test_306.wav,আমরা সবাই একসাথে হাটে তাযাছি।
|
| 308 |
+
test_307.wav,আজ সকালে আমি বাজারে গি়েছিলম।
|
| 309 |
+
test_308.wav,আজ বিকেলে স়টায ম যাম যছিল।
|
| 310 |
+
test_309.wav,তুমি কি ন পাহারে গিযেছিলো?
|
| 311 |
+
test_310.wav,তুমি কি নতুবইম পড়তে চাো?
|
| 312 |
+
test_311.wav,আজ্্কর পানিতে রাস্তা ভিজে গিেছে।
|
| 313 |
+
test_312.wav,তুমি কি খনন কবিতা লিখেছো?
|
| 314 |
+
test_313.wav,আজকে রাইতে যলম করছে।
|
| 315 |
+
test_314.wav,আজকে খাব���রে দাল পাতে।
|
| 316 |
+
test_315.wav,তুমি কি আমাকে নতুন বই আনবে?
|
| 317 |
+
test_316.wav,তুমি কি পকরে সাতযে বিস্কুট খাবে?
|
| 318 |
+
test_317.wav,আমি দুরে চা খে়য়েি।
|
| 319 |
+
test_318.wav,তুমি কি আ সিনেমা দেখতে যাবে?
|
| 320 |
+
test_319.wav,তুমি কি নতুন গান শুনছো?
|
| 321 |
+
test_320.wav,আমি আ নতুন মোবাইল কিনতে যাছি।
|
| 322 |
+
test_321.wav,আজ েসকালে ম বাজারে গিশেছিল।
|
| 323 |
+
test_322.wav,আজরির পানিতে হাটা ভিজে গেছে।
|
| 324 |
+
test_323.wav,আমাটদে যজালাললিকে খেললো েছি।
|
| 325 |
+
test_324.wav,তুমি কি পুটবল কেলা খেলেছো?
|
| 326 |
+
test_325.wav,তুমি কি কাকের াকাজা বছো?
|
| 327 |
+
test_326.wav,আমি নতুন জামা পডরেছি।
|
| 328 |
+
test_327.wav,আজ আমরে ক্লাসে চাট েছিে।
|
| 329 |
+
test_328.wav,তুমি কি পরক্া পস্ুতিনিা যাছো?
|
| 330 |
+
test_329.wav,আমি াটা গলপে বম লিখেছি।
|
| 331 |
+
test_330.wav,তুমি কি খায়দে শেস করেছো?
|
| 332 |
+
test_331.wav,আজ রাতে তিতির গর যনয খাবাবে।
|
| 333 |
+
test_332.wav,আজ েসকালে সবাই দেরিতে আছিল।
|
| 334 |
+
test_333.wav,তুমি কি মাকে পানি দেতা পা়বে?
|
| 335 |
+
test_334.wav,আমি আজজ দুটে মাছ খে়েছি।
|
| 336 |
+
test_335.wav,তুমি কি বই়ের দোকানে কিেছিলো?
|
| 337 |
+
test_336.wav,আমি এখ টিভিে খব দেখছি।
|
| 338 |
+
test_337.wav,আজ েসকালে সবাই দেরিত আখেছে।
|
| 339 |
+
test_338.wav,তুমি কি নতুন বই পড়ে চাো?
|
| 340 |
+
test_339.wav,তুমি কি বাইিতে আকবে?
|
| 341 |
+
test_340.wav,তুমিকি কবি সাথে বিস্কু খাবে?
|
| 342 |
+
test_341.wav,তুমি কি কখন টিন পরম করছো?
|
| 343 |
+
test_342.wav,আমি নতুন মোবাইল কিনতে যাছি।
|
| 344 |
+
test_343.wav,আমি নতুন খদে চাজার কিনেছি।
|
| 345 |
+
test_344.wav,তুমি কি মাকে পানি দিতে পাবে?
|
| 346 |
+
test_345.wav,আজ বাজারে গিযযেিম।
|
| 347 |
+
test_346.wav,আজ সকালে রাস্তায় দুরটনা কছে।
|
| 348 |
+
test_347.wav,আমি বিকলে বই পড়েছি।
|
| 349 |
+
test_348.wav,তুমি কি বই়র দোকানে গি়েছো?
|
| 350 |
+
test_349.wav,আজ বাোলে ক্লাসে পরক্া নাা বে।
|
| 351 |
+
test_350.wav,তুমি কি গলপদে বই পড়তে ভালোবাসো?
|
| 352 |
+
test_351.wav,আজকে গাটায শেযে আম হেছে।
|
| 353 |
+
test_352.wav,তুমি কি ছিটিটা পড়়ে শুনাবে?
|
| 354 |
+
test_353.wav,তুমি কি এখখন আমাকে দেখতে আবে?
|
| 355 |
+
test_354.wav,আমরা সবাই একসাথে হাটতে যাছি।
|
| 356 |
+
test_355.wav,আমি সকালের নাস্তা সলেগযে দুদ খে়েছিাম।
|
| 357 |
+
test_356.wav,তুমি কি রাাটে যাবে?
|
| 358 |
+
test_357.wav,তজদজারট আস্ত স্্ে ব্দ করে দাে।
|
| 359 |
+
test_358.wav,তুমি কি আমাক কমনাটে দেবে?
|
| 360 |
+
test_359.wav,আজ ে রাস্তায় যাম ছে।
|
| 361 |
+
test_360.wav,আমি দুরে গান শুতে বেছিলাম।
|
| 362 |
+
test_361.wav,আজ বিকেলে ম বাজারে গি়েছিলম।
|
| 363 |
+
test_362.wav,আমি দুরে বন্দুদরা রাদে খেলেছি।
|
| 364 |
+
test_363.wav,তুমি কি নতুন প্রকলবই শুরু করেছো?
|
| 365 |
+
test_364.wav,আমি বইয়ে দোান গিয়েছলাম।
|
| 366 |
+
test_365.wav,আজ বিকেলে ক্লাসে পর্ানেবে।
|
| 367 |
+
test_366.wav,আমি টিভিতি খবর দেখতে পরছ্ কি।
|
| 368 |
+
test_367.wav,আমরা সবাই মাটে খেলতে যাছি।
|
| 369 |
+
test_368.wav,আমি সকালে সবি দিলনেছি।
|
| 370 |
+
test_369.wav,তুমি কি নতুন বই পডিতে চাো?
|
| 371 |
+
test_370.wav,আমি সকালে খব পডরেছি।
|
| 372 |
+
test_371.wav,আমি বিকেলে ব্দুতে সাদে গলপ করেছি।
|
| 373 |
+
test_372.wav,আজ আলো চানায পটিবেসরক্ারুপাবে।
|
| 374 |
+
test_373.wav,আজ বিকেলে মো শুু পাবে।
|
| 375 |
+
test_374.wav,আমি আজ বাজার থেকে পল কিননেছি।
|
| 376 |
+
test_375.wav,আমি বই পড়তে পরছ্দ কি।
|
| 377 |
+
test_376.wav,আমছরটবাই স্কুলে যাে।
|
| 378 |
+
test_377.wav,তুমি কি মোবাইলে সছবি তুলতে ভালোবাবে?
|
| 379 |
+
test_378.wav,আমি সকালে গ্তে দরি করে পেছি।
|
| 380 |
+
test_379.wav,আজ দুরলে গরম পড়েছিল।
|
| 381 |
+
test_380.wav,আমি নতুন মোবাল কিনিতে যাছি।
|
| 382 |
+
test_381.wav,আমারে স্কুলে স্ ব় অনু্্ান আেছি।
|
| 383 |
+
test_382.wav,তুমি কি এখখন চা খেযবে?
|
| 384 |
+
test_383.wav,তুমি কি আজ গান ুনতা বইেছো?
|
| 385 |
+
test_384.wav,আজকে আবাহহনক্শানডাে।
|
| 386 |
+
test_385.wav,তুমি কি সিনেমা দেখেছো?
|
| 387 |
+
test_386.wav,আজকে খাবারে ডযাল ভাত ছে।
|
| 388 |
+
test_387.wav,আমি সকালালে নাস্তা খেতে বইলেগেছি।
|
| 389 |
+
test_388.wav,আজকেরদুরে গর পরচছ্া গরমছিল।
|
| 390 |
+
test_389.wav,আমি পরব্দ লখা বাকা মনছি।
|
| 391 |
+
test_390.wav,আমি দুরে মাছ দ়ে ভাত খেেছি।
|
| 392 |
+
test_391.wav,আজ েসকালে রাস্তয খছিন রেছে।
|
| 393 |
+
test_392.wav,আমি নতুন মোবাইলে শসাজার কিনেছি।
|
| 394 |
+
test_393.wav,তুমি কি ছবি তুননেছো?
|
| 395 |
+
test_394.wav,আমি ব্দুতে সাথে খেলা খেলসম।
|
| 396 |
+
test_395.wav,তুমি কি মোবাইলিন শারজে দেবে?
|
| 397 |
+
test_396.wav,আমদজারে স্তে আস্ে ব্করে দাে।
|
| 398 |
+
test_397.wav,আমি টিভিত খবর যাতে পছ্ কি।
|
| 399 |
+
test_398.wav,আমি সকালে নতুন জামা প়ে বাইেেছিলাম।
|
| 400 |
+
test_399.wav,তমি কিনতুন কা়র কিনেছি?
|
| 401 |
+
test_400.wav,আমি দুপর পলে পায খ়েছি।
|
| 402 |
+
test_401.wav,আজগতাাজে আটা পরি ব নদর হা়ে বইেছিলম।
|
| 403 |
+
test_402.wav,আমবা় বিসিবিতালে ্ুটে চাল প়ি।
|
| 404 |
+
test_403.wav,তুমি কি গদেসে মতিযুদর দ যানছো?
|
| 405 |
+
test_404.wav,আমতা সক্রবে বলে আ দাদেরতেেছে।
|
| 406 |
+
test_405.wav,আমসিতেসা গ্রামের মাটে সরিচে ভুপে।
|
| 407 |
+
test_406.wav,আমি্ ছোরব পতিদিন বাগানে পকুলে য নি।
|
| 408 |
+
test_407.wav,তুমি কি নো পাহা়ে া় বডরম করেছো?
|
| 409 |
+
test_408.wav,আমগতমাশে আ্রা কজবাজারে সমুদর দেখতে গিেছিলম।
|
| 410 |
+
test_409.wav,আমিরমা়ে পতিদিন ব়ে গমে শটিন আমাজারি।
|
| 411 |
+
test_410.wav,আজবালে জ বস্টি দেতে মার শনেক বাললাে।
|
| 412 |
+
test_411.wav,তুমি কি বি্করননি মিত পর্ কলি সবলেতাো?
|
| 413 |
+
test_412.wav,আমরাবাপরতি সতাআতে রে পাে মিকছে।
|
| 414 |
+
test_413.wav,তুমি লেবসে বা নতুন জামা পে মলেযছে।
|
| 415 |
+
test_414.wav,আমাপ্র মাসটা সতিদিন ক্লাসে ভালোরে য।
|
| 416 |
+
test_415.wav,তুমি কি রাত আকাসে তারা দেখতে পন্দ কো?
|
| 417 |
+
test_416.wav,আম্দাা পতিদিন ভাজে ভার্দা বই চা খেে।
|
| 418 |
+
test_417.wav,আমবতালরাতে আমিকা সু্ সপন দেখেছিলম।
|
| 419 |
+
test_418.wav,তুমি কি জাননিবা্লে বাসা ােসবদেো?
|
| 420 |
+
test_419.wav,আজতেবাজা শি্ল আ্রানা বাতে যাে।
|
| 421 |
+
test_420.wav,আমি ব্দু খুব বালা গিতে বাজাতে যাই।
|
| 422 |
+
test_421.wav,তুমি কি সুরযত সময় আকাসের্া্ করেছো?
|
| 423 |
+
test_422.wav,আমি নানিচটালে রুবতা গলপ শুনি।
|
| 424 |
+
test_423.wav,আজগতসতা আ্রা দাত ব় শনু্্া খাতাবিতর কেছি।
|
| 425 |
+
test_424.wav,তুমি কি পরিবে় ্রকটা প্ত বুছো?
|
| 426 |
+
test_425.wav,আমি মামাজ দ্া পিশ জে চা করি।
|
| 427 |
+
test_426.wav,তুমি কি আনমিত লারতেকে বই পড়ো?
|
| 428 |
+
test_427.wav,আমে শিকট্া সবস আর স্াকে শিে।
|
| 429 |
+
test_428.wav,আজাে আমরা নকাদি নদর পডরেগিেছিলম।
|
| 430 |
+
test_429.wav,তুমি কি গনো খা়া লাখে শুজর দেখেছো?
|
| 431 |
+
test_430.wav,আমরজাসে থবিদেসে খা মাছজমাজ আস ুরি।
|
| 432 |
+
test_431.wav,তুমি কি ন প্রকরযনে ক্ি প্ম করেছো?
|
| 433 |
+
test_432.wav,আমসকব সা্াে পরতিন জক বযম কে।
|
| 434 |
+
test_433.wav,আজকরবচার আমরা স্দর বনে বাকতা চে্টা করছিল।
|
| 435 |
+
test_434.wav,তুমি কি বালে সাতে পনো লিখকে নানজাো?
|
| 436 |
+
test_435.wav,আমার খেলনেক বালোাসলরে আরস্দে যা বাবে।
|
| 437 |
+
test_436.wav,তুমি কি নোকর সিক্া যিম সবজি করত পুনো?
|
| 438 |
+
test_437.wav,আমিদেব্দুরমল আমরা পরতিমাে া বিক্র প করমসসিকে।
|
| 439 |
+
test_438.wav,আজকাগা আমরে চাদে বসি পমা যা দেখছিলম।
|
| 440 |
+
test_439.wav,তুমি কি জনোরবি্দর নাক নব পর শেরবছিলো?
|
| 441 |
+
test_440.wav,আমিরবই নেজ দাকতে আ ্রামে মােে সবাকে।
|
| 442 |
+
test_441.wav,তুমি কি খালাদলনমিতকরে শ শুস্ত কো?
|
| 443 |
+
test_442.wav,আমিপ্রতিবশি খজ ব়া মােজিনি সা় সানকি।
|
| 444 |
+
test_443.wav,আমগতমাসিন আমরা যাতে করে গিেছিলাম।
|
| 445 |
+
test_444.wav,তুমি কি বাতে পারেজে পরজিকটেআমাজে ব্র পাটে দেছো?
|
| 446 |
+
test_445.wav,আমিবই পরতিন সকারকাে দরা ি।
|
| 447 |
+
test_446.wav,তুমি কি খনোতপতসিস্তা পরমকরো তি সমপকগিযু যনছো?
|
| 448 |
+
test_447.wav,আমি াে বাে খুব স্দর আার বস াসে করই।
|
| 449 |
+
test_448.wav,আমগতালকাগলাখে কটা সা্িদি কন্টান েছিল।
|
| 450 |
+
test_449.wav,তুমি কি তুরবুলেে শিক্ানে সম্াআকে যাে াো?
|
| 451 |
+
test_450.wav,আজ সাস্তেবাইবিদেশে পাা স্কুলা শিেছে।
|
tokenizer_config.json
CHANGED
|
@@ -1,6 +1,6 @@
|
|
| 1 |
{
|
| 2 |
"added_tokens_decoder": {
|
| 3 |
-
"
|
| 4 |
"content": "[UNK]",
|
| 5 |
"lstrip": true,
|
| 6 |
"normalized": false,
|
|
@@ -8,7 +8,7 @@
|
|
| 8 |
"single_word": false,
|
| 9 |
"special": false
|
| 10 |
},
|
| 11 |
-
"
|
| 12 |
"content": "[PAD]",
|
| 13 |
"lstrip": true,
|
| 14 |
"normalized": false,
|
|
@@ -16,7 +16,7 @@
|
|
| 16 |
"single_word": false,
|
| 17 |
"special": false
|
| 18 |
},
|
| 19 |
-
"
|
| 20 |
"content": "<s>",
|
| 21 |
"lstrip": false,
|
| 22 |
"normalized": false,
|
|
@@ -24,7 +24,7 @@
|
|
| 24 |
"single_word": false,
|
| 25 |
"special": true
|
| 26 |
},
|
| 27 |
-
"
|
| 28 |
"content": "</s>",
|
| 29 |
"lstrip": false,
|
| 30 |
"normalized": false,
|
|
@@ -40,7 +40,7 @@
|
|
| 40 |
"extra_special_tokens": {},
|
| 41 |
"model_max_length": 1000000000000000019884624838656,
|
| 42 |
"pad_token": "[PAD]",
|
| 43 |
-
"processor_class": "
|
| 44 |
"replace_word_delimiter_char": " ",
|
| 45 |
"target_lang": null,
|
| 46 |
"tokenizer_class": "Wav2Vec2CTCTokenizer",
|
|
|
|
| 1 |
{
|
| 2 |
"added_tokens_decoder": {
|
| 3 |
+
"57": {
|
| 4 |
"content": "[UNK]",
|
| 5 |
"lstrip": true,
|
| 6 |
"normalized": false,
|
|
|
|
| 8 |
"single_word": false,
|
| 9 |
"special": false
|
| 10 |
},
|
| 11 |
+
"58": {
|
| 12 |
"content": "[PAD]",
|
| 13 |
"lstrip": true,
|
| 14 |
"normalized": false,
|
|
|
|
| 16 |
"single_word": false,
|
| 17 |
"special": false
|
| 18 |
},
|
| 19 |
+
"59": {
|
| 20 |
"content": "<s>",
|
| 21 |
"lstrip": false,
|
| 22 |
"normalized": false,
|
|
|
|
| 24 |
"single_word": false,
|
| 25 |
"special": true
|
| 26 |
},
|
| 27 |
+
"60": {
|
| 28 |
"content": "</s>",
|
| 29 |
"lstrip": false,
|
| 30 |
"normalized": false,
|
|
|
|
| 40 |
"extra_special_tokens": {},
|
| 41 |
"model_max_length": 1000000000000000019884624838656,
|
| 42 |
"pad_token": "[PAD]",
|
| 43 |
+
"processor_class": "Wav2Vec2Processor",
|
| 44 |
"replace_word_delimiter_char": " ",
|
| 45 |
"target_lang": null,
|
| 46 |
"tokenizer_class": "Wav2Vec2CTCTokenizer",
|
train_results.json
ADDED
|
@@ -0,0 +1,8 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"epoch": 30.0,
|
| 3 |
+
"total_flos": 1.8456230162149265e+19,
|
| 4 |
+
"train_loss": 3.165084928395797,
|
| 5 |
+
"train_runtime": 15598.205,
|
| 6 |
+
"train_samples_per_second": 6.024,
|
| 7 |
+
"train_steps_per_second": 0.188
|
| 8 |
+
}
|
trainer_state.json
ADDED
|
@@ -0,0 +1,388 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"best_global_step": 2600,
|
| 3 |
+
"best_metric": 0.5833333333333334,
|
| 4 |
+
"best_model_checkpoint": "/kaggle/working/wav2vec2-bengali-finetuned/checkpoint-2400",
|
| 5 |
+
"epoch": 30.0,
|
| 6 |
+
"eval_steps": 200,
|
| 7 |
+
"global_step": 2940,
|
| 8 |
+
"is_hyper_param_search": false,
|
| 9 |
+
"is_local_process_zero": true,
|
| 10 |
+
"is_world_process_zero": true,
|
| 11 |
+
"log_history": [
|
| 12 |
+
{
|
| 13 |
+
"epoch": 0.01020408163265306,
|
| 14 |
+
"grad_norm": 1263584.0,
|
| 15 |
+
"learning_rate": 0.0,
|
| 16 |
+
"loss": 25.6736,
|
| 17 |
+
"step": 1
|
| 18 |
+
},
|
| 19 |
+
{
|
| 20 |
+
"epoch": 1.0204081632653061,
|
| 21 |
+
"grad_norm": 3843419.25,
|
| 22 |
+
"learning_rate": 9.900000000000002e-06,
|
| 23 |
+
"loss": 23.811,
|
| 24 |
+
"step": 100
|
| 25 |
+
},
|
| 26 |
+
{
|
| 27 |
+
"epoch": 2.0408163265306123,
|
| 28 |
+
"grad_norm": 1233849.75,
|
| 29 |
+
"learning_rate": 1.9900000000000003e-05,
|
| 30 |
+
"loss": 13.9598,
|
| 31 |
+
"step": 200
|
| 32 |
+
},
|
| 33 |
+
{
|
| 34 |
+
"epoch": 2.0408163265306123,
|
| 35 |
+
"eval_loss": 5.328553199768066,
|
| 36 |
+
"eval_runtime": 11.0357,
|
| 37 |
+
"eval_samples_per_second": 14.951,
|
| 38 |
+
"eval_steps_per_second": 1.903,
|
| 39 |
+
"eval_wer": 1.0,
|
| 40 |
+
"step": 200
|
| 41 |
+
},
|
| 42 |
+
{
|
| 43 |
+
"epoch": 3.061224489795918,
|
| 44 |
+
"grad_norm": 101215.4375,
|
| 45 |
+
"learning_rate": 2.9900000000000002e-05,
|
| 46 |
+
"loss": 4.6042,
|
| 47 |
+
"step": 300
|
| 48 |
+
},
|
| 49 |
+
{
|
| 50 |
+
"epoch": 4.081632653061225,
|
| 51 |
+
"grad_norm": 204473.296875,
|
| 52 |
+
"learning_rate": 3.99e-05,
|
| 53 |
+
"loss": 3.5131,
|
| 54 |
+
"step": 400
|
| 55 |
+
},
|
| 56 |
+
{
|
| 57 |
+
"epoch": 4.081632653061225,
|
| 58 |
+
"eval_loss": 3.380544900894165,
|
| 59 |
+
"eval_runtime": 10.5068,
|
| 60 |
+
"eval_samples_per_second": 15.704,
|
| 61 |
+
"eval_steps_per_second": 1.999,
|
| 62 |
+
"eval_wer": 1.0,
|
| 63 |
+
"step": 400
|
| 64 |
+
},
|
| 65 |
+
{
|
| 66 |
+
"epoch": 5.1020408163265305,
|
| 67 |
+
"grad_norm": 106750.3828125,
|
| 68 |
+
"learning_rate": 4.99e-05,
|
| 69 |
+
"loss": 3.2448,
|
| 70 |
+
"step": 500
|
| 71 |
+
},
|
| 72 |
+
{
|
| 73 |
+
"epoch": 6.122448979591836,
|
| 74 |
+
"grad_norm": 56899.28125,
|
| 75 |
+
"learning_rate": 4.7971311475409835e-05,
|
| 76 |
+
"loss": 2.9613,
|
| 77 |
+
"step": 600
|
| 78 |
+
},
|
| 79 |
+
{
|
| 80 |
+
"epoch": 6.122448979591836,
|
| 81 |
+
"eval_loss": 2.839696168899536,
|
| 82 |
+
"eval_runtime": 10.5616,
|
| 83 |
+
"eval_samples_per_second": 15.623,
|
| 84 |
+
"eval_steps_per_second": 1.988,
|
| 85 |
+
"eval_wer": 1.0,
|
| 86 |
+
"step": 600
|
| 87 |
+
},
|
| 88 |
+
{
|
| 89 |
+
"epoch": 7.142857142857143,
|
| 90 |
+
"grad_norm": 155864.65625,
|
| 91 |
+
"learning_rate": 4.5922131147540986e-05,
|
| 92 |
+
"loss": 2.8199,
|
| 93 |
+
"step": 700
|
| 94 |
+
},
|
| 95 |
+
{
|
| 96 |
+
"epoch": 8.16326530612245,
|
| 97 |
+
"grad_norm": 75451.0546875,
|
| 98 |
+
"learning_rate": 4.387295081967213e-05,
|
| 99 |
+
"loss": 2.7197,
|
| 100 |
+
"step": 800
|
| 101 |
+
},
|
| 102 |
+
{
|
| 103 |
+
"epoch": 8.16326530612245,
|
| 104 |
+
"eval_loss": 2.606015920639038,
|
| 105 |
+
"eval_runtime": 10.535,
|
| 106 |
+
"eval_samples_per_second": 15.662,
|
| 107 |
+
"eval_steps_per_second": 1.993,
|
| 108 |
+
"eval_wer": 0.8457207207207207,
|
| 109 |
+
"step": 800
|
| 110 |
+
},
|
| 111 |
+
{
|
| 112 |
+
"epoch": 9.183673469387756,
|
| 113 |
+
"grad_norm": 76782.7421875,
|
| 114 |
+
"learning_rate": 4.182377049180328e-05,
|
| 115 |
+
"loss": 2.6389,
|
| 116 |
+
"step": 900
|
| 117 |
+
},
|
| 118 |
+
{
|
| 119 |
+
"epoch": 10.204081632653061,
|
| 120 |
+
"grad_norm": 64796.6171875,
|
| 121 |
+
"learning_rate": 3.977459016393443e-05,
|
| 122 |
+
"loss": 2.5596,
|
| 123 |
+
"step": 1000
|
| 124 |
+
},
|
| 125 |
+
{
|
| 126 |
+
"epoch": 10.204081632653061,
|
| 127 |
+
"eval_loss": 2.4175667762756348,
|
| 128 |
+
"eval_runtime": 10.5336,
|
| 129 |
+
"eval_samples_per_second": 15.664,
|
| 130 |
+
"eval_steps_per_second": 1.994,
|
| 131 |
+
"eval_wer": 0.7815315315315315,
|
| 132 |
+
"step": 1000
|
| 133 |
+
},
|
| 134 |
+
{
|
| 135 |
+
"epoch": 11.224489795918368,
|
| 136 |
+
"grad_norm": 147111.484375,
|
| 137 |
+
"learning_rate": 3.772540983606558e-05,
|
| 138 |
+
"loss": 2.4538,
|
| 139 |
+
"step": 1100
|
| 140 |
+
},
|
| 141 |
+
{
|
| 142 |
+
"epoch": 12.244897959183673,
|
| 143 |
+
"grad_norm": 91618.7890625,
|
| 144 |
+
"learning_rate": 3.5676229508196724e-05,
|
| 145 |
+
"loss": 2.3313,
|
| 146 |
+
"step": 1200
|
| 147 |
+
},
|
| 148 |
+
{
|
| 149 |
+
"epoch": 12.244897959183673,
|
| 150 |
+
"eval_loss": 2.050769805908203,
|
| 151 |
+
"eval_runtime": 10.5394,
|
| 152 |
+
"eval_samples_per_second": 15.656,
|
| 153 |
+
"eval_steps_per_second": 1.993,
|
| 154 |
+
"eval_wer": 0.7792792792792793,
|
| 155 |
+
"step": 1200
|
| 156 |
+
},
|
| 157 |
+
{
|
| 158 |
+
"epoch": 13.26530612244898,
|
| 159 |
+
"grad_norm": 135995.46875,
|
| 160 |
+
"learning_rate": 3.362704918032787e-05,
|
| 161 |
+
"loss": 2.1482,
|
| 162 |
+
"step": 1300
|
| 163 |
+
},
|
| 164 |
+
{
|
| 165 |
+
"epoch": 14.285714285714286,
|
| 166 |
+
"grad_norm": 91693.046875,
|
| 167 |
+
"learning_rate": 3.157786885245902e-05,
|
| 168 |
+
"loss": 1.9715,
|
| 169 |
+
"step": 1400
|
| 170 |
+
},
|
| 171 |
+
{
|
| 172 |
+
"epoch": 14.285714285714286,
|
| 173 |
+
"eval_loss": 1.6378555297851562,
|
| 174 |
+
"eval_runtime": 10.5414,
|
| 175 |
+
"eval_samples_per_second": 15.653,
|
| 176 |
+
"eval_steps_per_second": 1.992,
|
| 177 |
+
"eval_wer": 0.7894144144144144,
|
| 178 |
+
"step": 1400
|
| 179 |
+
},
|
| 180 |
+
{
|
| 181 |
+
"epoch": 15.306122448979592,
|
| 182 |
+
"grad_norm": 106778.4609375,
|
| 183 |
+
"learning_rate": 2.9528688524590165e-05,
|
| 184 |
+
"loss": 1.8192,
|
| 185 |
+
"step": 1500
|
| 186 |
+
},
|
| 187 |
+
{
|
| 188 |
+
"epoch": 16.3265306122449,
|
| 189 |
+
"grad_norm": 93321.4921875,
|
| 190 |
+
"learning_rate": 2.7479508196721317e-05,
|
| 191 |
+
"loss": 1.706,
|
| 192 |
+
"step": 1600
|
| 193 |
+
},
|
| 194 |
+
{
|
| 195 |
+
"epoch": 16.3265306122449,
|
| 196 |
+
"eval_loss": 1.3998359441757202,
|
| 197 |
+
"eval_runtime": 10.5682,
|
| 198 |
+
"eval_samples_per_second": 15.613,
|
| 199 |
+
"eval_steps_per_second": 1.987,
|
| 200 |
+
"eval_wer": 0.7263513513513513,
|
| 201 |
+
"step": 1600
|
| 202 |
+
},
|
| 203 |
+
{
|
| 204 |
+
"epoch": 17.346938775510203,
|
| 205 |
+
"grad_norm": 111310.1328125,
|
| 206 |
+
"learning_rate": 2.5430327868852462e-05,
|
| 207 |
+
"loss": 1.5935,
|
| 208 |
+
"step": 1700
|
| 209 |
+
},
|
| 210 |
+
{
|
| 211 |
+
"epoch": 18.367346938775512,
|
| 212 |
+
"grad_norm": 131049.40625,
|
| 213 |
+
"learning_rate": 2.338114754098361e-05,
|
| 214 |
+
"loss": 1.5412,
|
| 215 |
+
"step": 1800
|
| 216 |
+
},
|
| 217 |
+
{
|
| 218 |
+
"epoch": 18.367346938775512,
|
| 219 |
+
"eval_loss": 1.2491974830627441,
|
| 220 |
+
"eval_runtime": 10.5527,
|
| 221 |
+
"eval_samples_per_second": 15.636,
|
| 222 |
+
"eval_steps_per_second": 1.99,
|
| 223 |
+
"eval_wer": 0.6722972972972973,
|
| 224 |
+
"step": 1800
|
| 225 |
+
},
|
| 226 |
+
{
|
| 227 |
+
"epoch": 19.387755102040817,
|
| 228 |
+
"grad_norm": 150843.8125,
|
| 229 |
+
"learning_rate": 2.1331967213114755e-05,
|
| 230 |
+
"loss": 1.4727,
|
| 231 |
+
"step": 1900
|
| 232 |
+
},
|
| 233 |
+
{
|
| 234 |
+
"epoch": 20.408163265306122,
|
| 235 |
+
"grad_norm": 124916.6015625,
|
| 236 |
+
"learning_rate": 1.9282786885245903e-05,
|
| 237 |
+
"loss": 1.4023,
|
| 238 |
+
"step": 2000
|
| 239 |
+
},
|
| 240 |
+
{
|
| 241 |
+
"epoch": 20.408163265306122,
|
| 242 |
+
"eval_loss": 1.138938546180725,
|
| 243 |
+
"eval_runtime": 10.5847,
|
| 244 |
+
"eval_samples_per_second": 15.589,
|
| 245 |
+
"eval_steps_per_second": 1.984,
|
| 246 |
+
"eval_wer": 0.6317567567567568,
|
| 247 |
+
"step": 2000
|
| 248 |
+
},
|
| 249 |
+
{
|
| 250 |
+
"epoch": 21.428571428571427,
|
| 251 |
+
"grad_norm": 260327.703125,
|
| 252 |
+
"learning_rate": 1.7233606557377048e-05,
|
| 253 |
+
"loss": 1.3585,
|
| 254 |
+
"step": 2100
|
| 255 |
+
},
|
| 256 |
+
{
|
| 257 |
+
"epoch": 22.448979591836736,
|
| 258 |
+
"grad_norm": 156561.15625,
|
| 259 |
+
"learning_rate": 1.5184426229508198e-05,
|
| 260 |
+
"loss": 1.3188,
|
| 261 |
+
"step": 2200
|
| 262 |
+
},
|
| 263 |
+
{
|
| 264 |
+
"epoch": 22.448979591836736,
|
| 265 |
+
"eval_loss": 1.0857497453689575,
|
| 266 |
+
"eval_runtime": 10.5312,
|
| 267 |
+
"eval_samples_per_second": 15.668,
|
| 268 |
+
"eval_steps_per_second": 1.994,
|
| 269 |
+
"eval_wer": 0.6148648648648649,
|
| 270 |
+
"step": 2200
|
| 271 |
+
},
|
| 272 |
+
{
|
| 273 |
+
"epoch": 23.46938775510204,
|
| 274 |
+
"grad_norm": 137688.609375,
|
| 275 |
+
"learning_rate": 1.3135245901639346e-05,
|
| 276 |
+
"loss": 1.2872,
|
| 277 |
+
"step": 2300
|
| 278 |
+
},
|
| 279 |
+
{
|
| 280 |
+
"epoch": 24.489795918367346,
|
| 281 |
+
"grad_norm": 149320.140625,
|
| 282 |
+
"learning_rate": 1.1086065573770492e-05,
|
| 283 |
+
"loss": 1.2707,
|
| 284 |
+
"step": 2400
|
| 285 |
+
},
|
| 286 |
+
{
|
| 287 |
+
"epoch": 24.489795918367346,
|
| 288 |
+
"eval_loss": 1.035390019416809,
|
| 289 |
+
"eval_runtime": 10.5453,
|
| 290 |
+
"eval_samples_per_second": 15.647,
|
| 291 |
+
"eval_steps_per_second": 1.991,
|
| 292 |
+
"eval_wer": 0.6047297297297297,
|
| 293 |
+
"step": 2400
|
| 294 |
+
},
|
| 295 |
+
{
|
| 296 |
+
"epoch": 25.510204081632654,
|
| 297 |
+
"grad_norm": 160687.875,
|
| 298 |
+
"learning_rate": 9.036885245901639e-06,
|
| 299 |
+
"loss": 1.2261,
|
| 300 |
+
"step": 2500
|
| 301 |
+
},
|
| 302 |
+
{
|
| 303 |
+
"epoch": 26.53061224489796,
|
| 304 |
+
"grad_norm": 175958.0625,
|
| 305 |
+
"learning_rate": 6.987704918032788e-06,
|
| 306 |
+
"loss": 1.222,
|
| 307 |
+
"step": 2600
|
| 308 |
+
},
|
| 309 |
+
{
|
| 310 |
+
"epoch": 26.53061224489796,
|
| 311 |
+
"eval_loss": 1.011266827583313,
|
| 312 |
+
"eval_runtime": 10.5487,
|
| 313 |
+
"eval_samples_per_second": 15.642,
|
| 314 |
+
"eval_steps_per_second": 1.991,
|
| 315 |
+
"eval_wer": 0.5833333333333334,
|
| 316 |
+
"step": 2600
|
| 317 |
+
},
|
| 318 |
+
{
|
| 319 |
+
"epoch": 27.551020408163264,
|
| 320 |
+
"grad_norm": 129829.171875,
|
| 321 |
+
"learning_rate": 4.938524590163935e-06,
|
| 322 |
+
"loss": 1.2061,
|
| 323 |
+
"step": 2700
|
| 324 |
+
},
|
| 325 |
+
{
|
| 326 |
+
"epoch": 28.571428571428573,
|
| 327 |
+
"grad_norm": 180224.375,
|
| 328 |
+
"learning_rate": 2.8893442622950824e-06,
|
| 329 |
+
"loss": 1.2084,
|
| 330 |
+
"step": 2800
|
| 331 |
+
},
|
| 332 |
+
{
|
| 333 |
+
"epoch": 28.571428571428573,
|
| 334 |
+
"eval_loss": 0.9903889298439026,
|
| 335 |
+
"eval_runtime": 10.5794,
|
| 336 |
+
"eval_samples_per_second": 15.596,
|
| 337 |
+
"eval_steps_per_second": 1.985,
|
| 338 |
+
"eval_wer": 0.5833333333333334,
|
| 339 |
+
"step": 2800
|
| 340 |
+
},
|
| 341 |
+
{
|
| 342 |
+
"epoch": 29.591836734693878,
|
| 343 |
+
"grad_norm": 153736.046875,
|
| 344 |
+
"learning_rate": 8.401639344262295e-07,
|
| 345 |
+
"loss": 1.1881,
|
| 346 |
+
"step": 2900
|
| 347 |
+
},
|
| 348 |
+
{
|
| 349 |
+
"epoch": 30.0,
|
| 350 |
+
"step": 2940,
|
| 351 |
+
"total_flos": 1.8456230162149265e+19,
|
| 352 |
+
"train_loss": 3.165084928395797,
|
| 353 |
+
"train_runtime": 15598.205,
|
| 354 |
+
"train_samples_per_second": 6.024,
|
| 355 |
+
"train_steps_per_second": 0.188
|
| 356 |
+
}
|
| 357 |
+
],
|
| 358 |
+
"logging_steps": 100,
|
| 359 |
+
"max_steps": 2940,
|
| 360 |
+
"num_input_tokens_seen": 0,
|
| 361 |
+
"num_train_epochs": 30,
|
| 362 |
+
"save_steps": 400,
|
| 363 |
+
"stateful_callbacks": {
|
| 364 |
+
"EarlyStoppingCallback": {
|
| 365 |
+
"args": {
|
| 366 |
+
"early_stopping_patience": 5,
|
| 367 |
+
"early_stopping_threshold": 0.01
|
| 368 |
+
},
|
| 369 |
+
"attributes": {
|
| 370 |
+
"early_stopping_patience_counter": 1
|
| 371 |
+
}
|
| 372 |
+
},
|
| 373 |
+
"TrainerControl": {
|
| 374 |
+
"args": {
|
| 375 |
+
"should_epoch_stop": false,
|
| 376 |
+
"should_evaluate": false,
|
| 377 |
+
"should_log": false,
|
| 378 |
+
"should_save": true,
|
| 379 |
+
"should_training_stop": true
|
| 380 |
+
},
|
| 381 |
+
"attributes": {}
|
| 382 |
+
}
|
| 383 |
+
},
|
| 384 |
+
"total_flos": 1.8456230162149265e+19,
|
| 385 |
+
"train_batch_size": 8,
|
| 386 |
+
"trial_name": null,
|
| 387 |
+
"trial_params": null
|
| 388 |
+
}
|
validation_predictions.csv
ADDED
|
@@ -0,0 +1,166 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
audio,true_text,pred_text
|
| 2 |
+
female_mymensingh_244.wav,আজ সকালে আমি স্কুলে দেরি করেছি।,আজ সকালেমি স্কুলে দেরি করেছে।
|
| 3 |
+
female_mymensingh_333.wav,আজ ইতিহাস ক্লাসে আলোচনা হলো।,আজ তিখাসকলা সালে শনা হো।
|
| 4 |
+
female_rangpur_42.wav,তুমি কি বাসায় একা আছো?,তুমি কি মা পাড ছো?
|
| 5 |
+
male_dhaka_8.wav,আজ বিকেলে ক্লাসে পরীক্ষা নেওয়া হবে।,আজ বিকেলে ক্লাসছে পরিক্ানেয হবে।
|
| 6 |
+
male_bhola_210.wav,আজ স্কুলে ক্রীড়া অনুষ্ঠান হয়েছে।,আজ েজে স্কুলে রালা হসাছে।
|
| 7 |
+
female_lakshmipur_34.wav,আজ বাজারে মাছের দাম অনেক।,আজ বাজারে মাছছে দাম দেেছে।
|
| 8 |
+
female_sylhet_124.wav,আজ সকালে রাস্তায় অনেক কাদা হয়েছে।,আজ সকালে রাস্তায পনেক খাদা হয়েছে।
|
| 9 |
+
female_mymensingh_94.wav,আজকের রোদে বাইরে বের হওয়া কঠিন ছিল।,আজকেরোদে বাইরে যাযা পরশিন আছিল।
|
| 10 |
+
male_chittagong_259.wav,আমি চা খেতে খেতে বই পড়েছি।,আমি চান হাতে হাতে বই পডরেছি।
|
| 11 |
+
female_rangpur_20.wav,তুমি কি আগামীকাল ঢাকায় যাচ্ছো?,তুমি কি গামলল থাকা যাবে?
|
| 12 |
+
female_sylhet_85.wav,"আজ বিকেলে মাঠে বাচ্চারা খেলছিল, সবাই হাসছিল।",আজ বিকেলে মাটে পরতাতে খেলাতছসবা সািল।
|
| 13 |
+
male_bhola_65.wav,আজ স্কুলে ক্রীড়া প্রতিযোগিতা হয়েছে।,আজ ে আম্র স্কুলে খেতা আছে।
|
| 14 |
+
female_mymensingh_313.wav,আমি দুপুরে ফল খেয়েছি।,আমি দুররে খল খেয়েছি।
|
| 15 |
+
male_pabna_174.wav,আজ সকালে হঠাৎ করে বৃষ্টি নেমেছিল।,আজ সকালে া রে বি্টি আমছিল।
|
| 16 |
+
female_sylhet_41.wav,আজকের খাবারে ডাল ভাত আছে।,আজকে খানিত যাল তাছে।
|
| 17 |
+
female_chittagong_226.wav,আমি সকালের নাস্তা খেতে ভুলেছি।,আমি সকালে নাস্তা খেতে ুলে গেছি।
|
| 18 |
+
male_pabna_8.wav,আজ বিকেলে ক্লাসে পরীক্ষা নেওয়া হবে।,আজ বিকেলে ক্লাসে পরিক্টা লিে খবে।
|
| 19 |
+
male_barisal_34.wav,আজ বাজারে মাছের দাম অনেক।,আজ বাজারে মাছের দামে খতের ভে।
|
| 20 |
+
female_lakshmipur_45.wav,আজকের সকালে অনেক বৃষ্টি পড়েছে।,আজ সকালে হনেক বি্টি ভেছে।
|
| 21 |
+
male_dhaka_45.wav,আজকের সকালে অনেক বৃষ্টি পড়েছে।,আজ েসকালে অনাক বি্টি পড়েছিল।
|
| 22 |
+
male_bhola_146.wav,আমি নতুন গান শুনে আনন্দ পেয়েছি।,আমি নতুন গান শুযে আনদ পেেছি।
|
| 23 |
+
female_mymensingh_306.wav,আজ দুপুরে প্রচণ্ড গরম পড়েছে।,আজ দুরে অ্া গরম প়েছল।
|
| 24 |
+
female_chittagong_291.wav,আজ সকালে হঠাৎ বৃষ্টি নামলো।,আজ সকালে আতেকটে যান নআবে।
|
| 25 |
+
male_bogura_110.wav,আমি দুপুরে ভাত মাছ খেতে ভালোবাসি।,আমি দুরে ভাত না খেতে খব ভালোবি।
|
| 26 |
+
male_mymensingh_36.wav,তুমি কি এখন চা খেতে চাও?,তুমি কি এখন চা খেতে াো?
|
| 27 |
+
male_rangpur_170.wav,তুমি কি এখন চা বানাতে পারবে?,তুমি কি এখা চাভ্ত পরবে?
|
| 28 |
+
female_lakshmipur_102.wav,তুমি কি বাসায় একা ছিলে আজ?,তুমি কি বাসা থ় একলা আছিো।
|
| 29 |
+
male_rangpur_335.wav,তুমি কি প্রয়োজনীয় তথ্য সংগ্রহ করেছো?,তুমি কি জবিত্থা স্র করেছো?
|
| 30 |
+
male_jhenaidah_31.wav,আজ আমাদের ক্লা���ে শিক্ষক আসেননি।,আমি আমাদের কলাজে সিক্ কাসেে।
|
| 31 |
+
female_mymensingh_362.wav,তুমি কি গণিতের সূত্র মুখস্থ করেছো?,তুমি কি এখক শু্র পস্ত করেছো?
|
| 32 |
+
male_kushtia_18.wav,তুমি কি চিঠিটা পড়ে শুনাবে?,তুমি কি িিটা পড়়ে শুনাবে?
|
| 33 |
+
male_rangpur_133.wav,আজকের আবহাওয়া সত্যিই সুন্দর ছিল।,আজকেররে আবা়হ়য়া সু্দ ছিল।
|
| 34 |
+
male_jhenaidah_1.wav,আজ সকালে আমি বাজারে গিয়েছিলাম।,আজ সকালে আমি বাজারে গিয়েছিাম।
|
| 35 |
+
female_chittagong_210.wav,আজ স্কুলে ক্রীড়া অনুষ্ঠান হয়েছে।,আজ স্কুলে ্াদলয নু্া হে।
|
| 36 |
+
male_dhaka_103.wav,আজ বাজারে সবজির দাম বেড়েছে।,আজকেবাজারে সববজি দাম পেেছে।
|
| 37 |
+
female_mymensingh_160.wav,আমি সকালের হাঁটায় খুব আনন্দ পেয়েছি।,আমি সকালে াটা আন্দ পেেছি।
|
| 38 |
+
male_chittagong_156.wav,আজকের সকালে সূর্যটা সুন্দর ছিল।,আজ সকালে সরযা বে স্দরছিল।
|
| 39 |
+
male_jessore_6.wav,তুমি কি আমাকে পানি দিতে পারো?,তুমি কি আমাকে পানি দিতে পাবে?
|
| 40 |
+
male_bhola_192.wav,আজ রাতে সবাই একসাথে খাওয়া শেষ করেছে।,আজ রাতে সবাই একসাথে খেয়েছে।
|
| 41 |
+
male_comilla_28.wav,তুমি কি কখনো পাহাড়ে গিয়েছো?,তুমি কি এখখনো প হাড়ে গিয়েছিলো?
|
| 42 |
+
male_rangpur_207.wav,আজ রাস্তায় প্রচুর ভিড় জমেছে।,আজ রাস্তায ম ভি দোন ল।
|
| 43 |
+
male_rangpur_290.wav,তুমি কি এখনো কাজ করোনি?,তুমি কি এখন কাজ কেিছো?
|
| 44 |
+
male_rangpur_123.wav,তুমি কি এখন মোবাইল ব্যবহার করছো?,তুমি কি এখ মোবাইলল ভবপ কছো?
|
| 45 |
+
male_pabna_103.wav,আজ বাজারে সবজির দাম বেড়েছে।,আজ বাজারে সবজির দাম ভেছে।
|
| 46 |
+
male_brahmanbaria_73.wav,তুমি কি এখন খেতে বসবে?,তুমি কি এখন খেতে বইবে?
|
| 47 |
+
male_lakshmipur_326.wav,তুমি কি গ্রন্থাগারের বই এনেছো?,তুমি কি াে বই আনেছো?
|
| 48 |
+
male_rangpur_358.wav,আমি ক্রীড়া অনুশীলন করে সুস্থ থাকি।,আমি করযে শনুশল কে সু্্ত আছি।
|
| 49 |
+
female_mymensingh_151.wav,আমি সকালের নাস্তা করে স্কুলে গিয়েছি।,আমি সকালে নুল খেযে স্কুলে গেছি।
|
| 50 |
+
male_bhola_197.wav,তুমি কি মোবাইলের চার্জ শেষ করে ফেলেছো?,তুমি কি মোবাইলে চার শেস কুরে লিেছো?
|
| 51 |
+
male_noakhali_39.wav,তুমি কি এখনই বই পড়বে?,তুমি কি এখন বই প়বে?
|
| 52 |
+
male_rangpur_251.wav,তুমি কি এখনো কাজ শেষ করোনি?,তুমি কি এখনো কাজ শেসষ করনেো?
|
| 53 |
+
female_chittagong_228.wav,আজ রাতে সবাই গান গাইলো।,আজ রাতে বরগনে গান গাছে।
|
| 54 |
+
male_brahmanbaria_114.wav,তুমি কি প্রতিদিন সকালে হাঁটতে যাও?,তুমি কি প্রতিদিনসা নটতা যাো?
|
| 55 |
+
male_bhola_120.wav,তুমি কি আগামীকাল স্কুলে আসবে?,তুমি কি আগামিকালে স্কুলে আবে?
|
| 56 |
+
female_lakshmipur_20.wav,তুমি কি আগামীকাল ঢাকায় যাচ্ছো?,তুমি কি আ কাে ডাতা যাবে?
|
| 57 |
+
male_rangpur_222.wav,আজ সকালে সূর্য ধীরে উঠছিল।,আজ েসকালে সুযে আস্তা শু নেখছিল।
|
| 58 |
+
male_lakshmipur_259.wav,আমি চা খেতে খেতে বই পড়েছি।,আমি সচা খেতে খেতে বই পডেছি।
|
| 59 |
+
male_bogura_66.wav,আমি দুপুরে ভাত খেয়েছি।,আমি দুরে খাত খে়েছি।
|
| 60 |
+
male_dhaka_39.wav,তুমি কি এখনই বই পড়বে?,তুমি কি এখনো বই পড়বে?
|
| 61 |
+
male_rajshahi_16.wav,বৃষ্টির পানিতে রাস্তা ভিজে গেছে।,আমরটি পানিতে রাস্তা প়া ভিজা গছে।
|
| 62 |
+
male_rajshahi_83.wav,আমি সকালে ঘুম থেকে দেরি করে উঠেছি।,আমি সকালে খন থেকে দেরিকরে ডেছি।
|
| 63 |
+
male_sylhet_183.wav,আজ বিকেলে রাস্তায় প্রচুর যানজট হয়েছে।,আজ বিকেলে রাস্তায পরশ যানজ ডেছিল।
|
| 64 |
+
female_chittagong_295.wav,আমি দুপুরে ফলের রস খেয়েছি।,আমি দুে পলের শায়ছি।
|
| 65 |
+
male_brahmanbaria_110.wav,আমি দুপুরে ভাত মাছ খেতে ভালোবাসি।,আমি দুরে বা মাছ ছেতে বলোপি।
|
| 66 |
+
male_noakhali_24.wav,আমি খাওয়ার পর বই পড়েছি।,আমি খানা খ বই পরেেছি।
|
| 67 |
+
male_feni_14.wav,আমি সকালের নাস্তা খেতে ভুলে গেছি।,আম সকালের নাস্তা খেতে ভুলে গেছি।
|
| 68 |
+
male_dhaka_118.wav,আজকের দুপুরে প্রচণ্ড বৃষ্টি হয়েছে।,আজকেরদুপু়ে পরশ্দ ব্টি খয়েছে।
|
| 69 |
+
male_lakshmipur_310.wav,আমি হাঁটতে গিয়ে দৃশ্য দেখেছি।,আমি মাটতে যায় দরিপ্ দেখেছি।
|
| 70 |
+
male_natore_52.wav,তুমি কি আজ ফুটবল খেলবে?,তুমি কি আজ শুবল খেলবে?
|
| 71 |
+
male_chittagong_146.wav,আমি নতুন গান শুনে আনন্দ পেয়েছি।,আমি নতুন গানবিরে বতন ন্দ পাি।
|
| 72 |
+
male_bhola_61.wav,তুমি কি গান শোনার সময় নাচো?,তুমি কি গান শনোযা সময নাছো?
|
| 73 |
+
female_mymensingh_214.wav,আমি দুপুরে এক গ্লাস দুধ খেয়েছি।,আমি দুররেগলে নুত খেয়েছি।
|
| 74 |
+
male_natore_27.wav,আমরা সবাই একসাথে গল্প করছি।,আমরা সবাই একসাথে গলপ কেছি।
|
| 75 |
+
male_jhenaidah_141.wav,তুমি কি কখনো সমুদ্র দেখেছো?,তুমি কি কখনো সমুদ দেখেছো?
|
| 76 |
+
male_jhenaidah_147.wav,তুমি কি আমাকে একটা গল্প বলবে?,তুমি কি আমাকে াতা গলপ কলো?
|
| 77 |
+
male_jhenaidah_199.wav,আমি সকালের নাস্তা করে কাজ করতে বসেছিলাম।,আমি সকালের নাস্তা করে কাস করতে বসছিলাম।
|
| 78 |
+
female_chittagong_224.wav,তুমি কি কখনো পাহাড়ে উঠেছো?,তুমি কি এনো সময় যাত যছো?
|
| 79 |
+
male_sylhet_245.wav,তুমি কি আমাকে ফোনটা দেখাবে?,তুমি কি আমকে মোবাইট দেখাবে?
|
| 80 |
+
female_chittagong_363.wav,আজকের পরীক্ষায় জটিল প্রশ্ন ছিল।,আজ ে পরক্্ায় যসটিল পস্ন ছিল।
|
| 81 |
+
male_sylhet_313.wav,আমি দুপুরে ফল খেয়েছি।,আজ দুরে পল খেয়েছি।
|
| 82 |
+
female_lakshmipur_282.wav,আজ দুপুরে বৃষ্টিতে রাস্তা ভিজলো।,আজ দুরে র বি্িতে রাস্তা ভিজে গেছল।
|
| 83 |
+
male_sylhet_200.wav,তুমি কি নতুন সিনেমা দেখতে চাও?,তুমি কি নদু সিনেমা দেখতে চাো?
|
| 84 |
+
male_comilla_1.wav,আজ সকালে আমি বাজারে গিয়েছিলাম।,আজ সকালে আমি বাজারে গি়েছিলাম।
|
| 85 |
+
male_jhenaidah_282.wav,আজ দুপুরে বৃষ্টিতে রাস্তা ভিজলো।,আজ েদুরে বি্িতিে রাস্তা ভিযিল।
|
| 86 |
+
male_chittagong_87.wav,তুমি কি গরমে ক্লান্ত হয়ে গিয়েছো?,তুমি কি গরমে করনে গিেছো?
|
| 87 |
+
female_mymensingh_132.wav,তুমি কি এখনো বই পড়ে যাচ্ছো?,তুমি কি এখখ বই পড়়ে যাছো?
|
| 88 |
+
female_lakshmipur_394.wav,আমি প্রতিদি��� নতুন শব্দ মুখস্থ করি।,আমি পতিদিন নতুন স্া শুকস্্ কি।
|
| 89 |
+
female_sylhet_278.wav,তুমি কি টিভি দেখছিলে?,তুমি কি টিভি দেখেছিলো?
|
| 90 |
+
male_natore_8.wav,আজ বিকেলে ক্লাসে পরীক্ষা নেওয়া হবে।,আজ বিকেলে ক্লাসে পরক্টা নিযা হবে।
|
| 91 |
+
male_lakshmipur_218.wav,তুমি কি বাজারে সবজি কিনবে?,তুমি কি বাজারে সজ কিিককিনেছো?
|
| 92 |
+
male_bogura_22.wav,তুমি কি গান গাইতে জানো?,তুমি কি গান গাতের পাবে?
|
| 93 |
+
male_sylhet_196.wav,আমি দুপুরে ফলের রস খেতে ভালোবাসি।,আমি দুরে পলে রস খেতে ভালোপাি।
|
| 94 |
+
male_mymensingh_38.wav,আমি নতুন গান শুনতে চাই।,আমি নতু গান শুনতে চ।
|
| 95 |
+
male_lakshmipur_319.wav,আমি দুপুরে মাছ ভাত খেয়েছি।,আমি দুরে মাছ াত খে়েছি।
|
| 96 |
+
female_rangpur_24.wav,আমি খাওয়ার পর বই পড়েছি।,আমি খা়য় প বই পড়ছিাম।
|
| 97 |
+
male_rangpur_254.wav,তুমি কি গল্পের বই আনবে?,তুমি কি গলপে বই আনবে?
|
| 98 |
+
male_jhenaidah_236.wav,তুমি কি মোবাইলে গান শুনছিলে?,তুমি কি মোবাইলে গান শুনছো?
|
| 99 |
+
male_kushtia_46.wav,আমি একটা গল্পের বই লিখছি।,আমি কটা গলপর বই লিখেছি।
|
| 100 |
+
male_jhenaidah_107.wav,আমি স্কুলে নতুন শিক্ষক দেখেছি।,আমি স্কুলে নতুন শা দেখেছি।
|
| 101 |
+
male_pabna_128.wav,আমি নতুন জামা পরে বাজারে গিয়েছিলাম।,আমি নতুন জামা পডে বাজারে গিেছিলাম।
|
| 102 |
+
male_pabna_97.wav,আজকের ক্লাসে সবাই উপস্থিত ছিল।,আজকেরর কলাসে সবাই পস্থিতছিল।
|
| 103 |
+
male_chittagong_39.wav,তুমি কি এখনই বই পড়বে?,তুমি কি মতকতা প়ে বো?
|
| 104 |
+
female_chittagong_95.wav,আমি সকালের নাস্তা হিসেবে রুটি খেয়েছি।,আমি সকজারে নাস্তা রুটি খাছি।
|
| 105 |
+
male_chittagong_243.wav,আজ সকালে আমি বাজারে গিয়েছিলাম।,আজ সকালে আমি বাজারে গিয়েছিল।
|
| 106 |
+
male_jhenaidah_119.wav,আমি নতুন একটা বই পড়তে বসেছি।,আমি নতুন া বই পড়তে বেছি।
|
| 107 |
+
male_comilla_40.wav,আমরা সবাই মাঠে খেলতে যাচ্ছি।,আমরা সবালে মাটে খেলে তে যাছি।
|
| 108 |
+
female_chittagong_101.wav,আমি দুপুরে বন্ধুদের সাথে গল্প করেছি।,আমি দুে বন্ুে্া গলপ করেছি।
|
| 109 |
+
male_lakshmipur_255.wav,আজ বিকেলে মাঠে ফুটবল খেলা।,আজ বিকলে মাটে পুবল খেছে।
|
| 110 |
+
male_noakhali_5.wav,দরজাটা ধীরে ধীরে বন্ধ করে দাও।,আজপরান আাস্তা সতে লাগাে।
|
| 111 |
+
male_bhola_74.wav,আজ বিকেলে আমরা একসাথে গল্প করবো।,আজ বিকেলে আমরা একসাতে আরটা দেবে।
|
| 112 |
+
female_lakshmipur_390.wav,আজ ক্লাসে নতুন পাঠ শেখানো।,আজকে ক্লাসে নতুন পা শিখেছে।
|
| 113 |
+
female_barisal_19.wav,আমাদের গ্রামের বাতাস খুব শীতল।,আমিক গ্রামে খাযা খব শাটে।
|
| 114 |
+
male_natore_36.wav,তুমি কি এখন চা খেতে চাও?,তুমি কি এখন চা খেতে চাো?
|
| 115 |
+
male_jhenaidah_98.wav,আমি নতুন ফোনের চার্জার কিনেছি।,আমি নতুন প্ট চাররজারর কিনেছি।
|
| 116 |
+
male_kushtia_29.wav,আমি আজ নতুন জামা পরেছি।,আমি আজ নতুন ামা পডরেছি।
|
| 117 |
+
male_brahmanbaria_112.wav,আজকের আকাশে সাদা মেঘ ভেসে যাচ্ছে।,আজকেআকাসে সা্যামিে বাশা যাতেল।
|
| 118 |
+
female_mymensingh_351.wav,আ��� সভায় নতুন নিয়ম ঘোষণা।,আজকসবায়় নতু নিযম শন আবে।
|
| 119 |
+
female_mymensingh_353.wav,তুমি কি তথ্যপ্রযুক্তি পছন্দ করো?,তুমি কি পিটারা প্রজুকতি পছ্দ করোো?
|
| 120 |
+
male_sylhet_213.wav,আজ রাতে আমরা গান শুনবো।,আজকেরাতে আমরা গান শুনবো।
|
| 121 |
+
female_chittagong_347.wav,তুমি কি গবেষণাপত্র পড়ে জ্ঞান বাড়িয়েছো?,তুমি কি গবসনা পড়ত পডগন বা়ােছো?
|
| 122 |
+
male_jhenaidah_164.wav,তুমি কি আমাকে বইয়ের দোকানে নিয়ে যাবে?,তুমি কি আমাকে বই় দোকানে নিযে যাবে?
|
| 123 |
+
male_chittagong_47.wav,তুমি কি মোবাইলটা চার্জে দেবে?,তুমি কি মোবাইলে বে চাজ দেবে?
|
| 124 |
+
male_sylhet_305.wav,তুমি কি আমাকে কলম দেবে?,তুমি কি আআমাকে কলম দেবে?
|
| 125 |
+
male_pabna_70.wav,তুমি কি আজ নতুন জামা পরেছো?,তুমি কি আজ নতুন জামা প়ে াো?
|
| 126 |
+
male_jhenaidah_54.wav,আমি সকালের নাস্তা করতে যাচ্ছি।,আমি সকালের নাস্তা করতে যাছি।
|
| 127 |
+
female_lakshmipur_235.wav,আমি হাঁটতে গিয়ে নতুন বন্ধু পেয়েছি।,আমি হাটতে যায়ে নতুন ব্দু খেযেছি।
|
| 128 |
+
female_mymensingh_354.wav,আজ প্রতিবেদনে উন্নতির কথা বলা।,আজ প্রতিবেদনে বালোবাকা ল।
|
| 129 |
+
male_mymensingh_60.wav,আমি বই পড়তে ভালোবাসি।,আমি বই পড়তে ালোবাসি।
|
| 130 |
+
male_bhola_18.wav,তুমি কি চিঠিটা পড়ে শুনাবে?,তুমি কি চিটিটা প়়ে শুনাবে?
|
| 131 |
+
male_jhenaidah_114.wav,তুমি কি প্রতিদিন সকালে হাঁটতে যাও?,তুমি কি প্রতিদিন সকালে পা়তে যাো?
|
| 132 |
+
female_mymensingh_203.wav,তুমি কি বাইরে যেতে চাও?,তুমি কি বাই়ে যাতে চাো?
|
| 133 |
+
male_feni_68.wav,আজ রাস্তায় অনেক যানবাহন আছে।,আজকরাস্তায়় নক যান ভান আছে।
|
| 134 |
+
male_rangpur_147.wav,তুমি কি আমাকে একটা গল্প বলবে?,তুমি কি মাকেখকান গলপ পবে?
|
| 135 |
+
male_rangpur_398.wav,তুমি কি বিজ্ঞান প্রতিযোগিতায় যাবে?,তুমি কি বি্ান পরতিদেগিতে যাবে?
|
| 136 |
+
male_khulna_20.wav,তুমি কি আগামীকাল ঢাকায় যাচ্ছো?,তুমি কি আগামিকা্টাকাযে যাছো?
|
| 137 |
+
female_lakshmipur_277.wav,আমি দুপুরে মাছ ভাত খেয়েছি।,আমি দুরে মাছ বাত খে়েছি।
|
| 138 |
+
male_rangpur_304.wav,আমি সকালে বাজারে গিয়েছিলাম।,আমি সকালে বাজারে গি়েছিাম।
|
| 139 |
+
male_sylhet_168.wav,আজ রাতে অতিথিরা আমাদের বাসায় আসবে।,আজ রাতে কতিদিরা আমরাবসায আখবে।
|
| 140 |
+
male_sylhet_156.wav,আজকের সকালে সূর্যটা সুন্দর ছিল।,আজকেসকালে সিযে শুন্দর ছিল।
|
| 141 |
+
male_rajshahi_35.wav,আমার ছোট ভাই স্কুলে যাচ্ছে।,আমমা সট ভায় স্কুলে যাছে।
|
| 142 |
+
male_sylhet_346.wav,আমি নথি সঠিকভাবে জমা দিয়েছি।,আমি নতি সটিক বই জমা দেছি।
|
| 143 |
+
female_lakshmipur_147.wav,তুমি কি আমাকে একটা গল্প বলবে?,তুমি কি আমাকে ক্া গল শকবে?
|
| 144 |
+
male_brahmanbaria_76.wav,তুমি কি আজ অফিসে যাবে?,তুমি কি আজ বপিসশে যাবে?
|
| 145 |
+
male_natore_69.wav,আমি দুপুরে বন্ধুদের সাথে খেলেছি।,আমি তিতারে ব্ু প্তদে সাথে খেলেছি।
|
| 146 |
+
male_pabna_71.wav,আজকের সকালে আকাশ পরিষ্কার ছিল।,আজকেসকালে আকাস পরি্ছিল।
|
| 147 |
+
male_pabna_15.wav,তুমি কি আজ সিনেমা দেখতে যাবে?,তুমি কি আজ ছবি দেখতে যাবে?
|
| 148 |
+
male_feni_32.wav,আমি এখন টিভিতে খবর দেখছি।,আমি খন টিভিত খব চােছি।
|
| 149 |
+
male_bogura_95.wav,আমি সকালের নাস্তা হিসেবে রুটি খেয়েছি।,আমি সকালের নাস্তা ভশেবে রুটি খেছি।
|
| 150 |
+
male_chittagong_70.wav,তুমি কি আজ নতুন জামা পরেছো?,তুমি কি সাজ্্র পড়তে খরেছো?
|
| 151 |
+
male_chittagong_23.wav,মাঠে ছেলেরা ক্রিকেট খেলছে।,আম মারর দিক করিকেট খেলে।
|
| 152 |
+
female_lakshmipur_177.wav,আজ রাতে আমরা সবাই একসাথে খেতে বসবো।,আজকেরাতে আমরা সবাই একসাতে ভা খেে।
|
| 153 |
+
female_lakshmipur_40.wav,আমরা সবাই মাঠে খেলতে যাচ্ছি।,আমরা বা মাটে খেলতে যাছি।
|
| 154 |
+
female_mymensingh_294.wav,আজ রাতে আমরা গান শুনেছি।,আজ রাতে আমরা গান শুনেছি।
|
| 155 |
+
male_mymensingh_24.wav,আমি খাওয়ার পর বই পড়েছি।,আমি খা়নে প়ে বই প়েছি।
|
| 156 |
+
male_jhenaidah_58.wav,তুমি কি নতুন গান শুনেছো?,তুমি কি নতুন গান শুনেছো?
|
| 157 |
+
female_lakshmipur_114.wav,তুমি কি প্রতিদিন সকালে হাঁটতে যাও?,তুমি কি পতিদিন পালে াটতে যাে?
|
| 158 |
+
female_mymensingh_208.wav,আমি দুপুরে বন্ধুদের সাথে খেলেছি।,আমি দুররে ব্দুদে সাদে খেলেছি।
|
| 159 |
+
male_rajshahi_4.wav,আমি বন্ধুদের সাথে খেলা খেলেছি।,আমি ব্দুদে সাথে খেলা খেললেছি।
|
| 160 |
+
male_jessore_9.wav,আমি নতুন মোবাইল কিনতে যাচ্ছি।,আমি নতুন নল আলি খতে দাখছি।
|
| 161 |
+
female_lakshmipur_168.wav,আজ রাতে অতিথিরা আমাদের বাসায় আসবে।,আজকেরাতে মান আম্ে বাসায আবে।
|
| 162 |
+
female_rangpur_63.wav,আমি বাজার থেকে আম কিনেছি।,তমি পা চেকে আম কিন আনেছি।
|
| 163 |
+
male_bogura_4.wav,আমি বন্ধুদের সাথে খেলা খেলেছি।,আমি ব্দুদের সাদে খেলা খেলেসছি।
|
| 164 |
+
female_chittagong_191.wav,তুমি কি আমাকে গল্পের বইটা দেবে?,তুমি কি আমাকে কলপে বে দেবে?
|
| 165 |
+
male_sylhet_307.wav,আমি দুপুরে চা খেয়েছি।,আমি দুরে চা খেয়েছি।
|
| 166 |
+
female_sylhet_48.wav,আমরা কাল একসাথে সিনেমা দেখবো।,আমরা খাল একসাদে সিনেমা দেখবি।
|
vocab.json
CHANGED
|
@@ -1,59 +1,61 @@
|
|
| 1 |
{
|
| 2 |
-
"
|
| 3 |
-
"
|
|
|
|
|
|
|
| 4 |
"|": 0,
|
| 5 |
-
"।":
|
| 6 |
-
"ঁ":
|
| 7 |
-
"ং":
|
| 8 |
-
"অ":
|
| 9 |
-
"আ":
|
| 10 |
-
"ই":
|
| 11 |
-
"উ":
|
| 12 |
-
"এ":
|
| 13 |
-
"ও":
|
| 14 |
-
"ক":
|
| 15 |
-
"খ":
|
| 16 |
-
"গ":
|
| 17 |
-
"ঘ":
|
| 18 |
-
"ঙ":
|
| 19 |
-
"চ":
|
| 20 |
-
"ছ":
|
| 21 |
-
"জ":
|
| 22 |
-
"ঝ":
|
| 23 |
-
"ঞ":
|
| 24 |
-
"ট":
|
| 25 |
-
"ঠ":
|
| 26 |
-
"ড":
|
| 27 |
-
"ঢ":
|
| 28 |
-
"ণ":
|
| 29 |
-
"ত":
|
| 30 |
-
"থ":
|
| 31 |
-
"দ":
|
| 32 |
-
"ধ":
|
| 33 |
-
"ন":
|
| 34 |
-
"প":
|
| 35 |
-
"ফ":
|
| 36 |
-
"ব":
|
| 37 |
-
"ভ":
|
| 38 |
-
"ম":
|
| 39 |
-
"য":
|
| 40 |
-
"র":
|
| 41 |
-
"ল":
|
| 42 |
-
"শ":
|
| 43 |
-
"ষ":
|
| 44 |
-
"স":
|
| 45 |
-
"হ":
|
| 46 |
-
"়":
|
| 47 |
-
"া":
|
| 48 |
-
"ি":
|
| 49 |
-
"ী":
|
| 50 |
-
"ু":
|
| 51 |
-
"ূ":
|
| 52 |
-
"ৃ":
|
| 53 |
-
"ে":
|
| 54 |
-
"ৈ":
|
| 55 |
-
"ো":
|
| 56 |
-
"ৌ":
|
| 57 |
-
"্":
|
| 58 |
-
"ৎ":
|
| 59 |
}
|
|
|
|
| 1 |
{
|
| 2 |
+
",": 1,
|
| 3 |
+
"?": 2,
|
| 4 |
+
"[PAD]": 58,
|
| 5 |
+
"[UNK]": 57,
|
| 6 |
"|": 0,
|
| 7 |
+
"।": 3,
|
| 8 |
+
"ঁ": 4,
|
| 9 |
+
"ং": 5,
|
| 10 |
+
"অ": 6,
|
| 11 |
+
"আ": 7,
|
| 12 |
+
"ই": 8,
|
| 13 |
+
"উ": 9,
|
| 14 |
+
"এ": 10,
|
| 15 |
+
"ও": 11,
|
| 16 |
+
"ক": 12,
|
| 17 |
+
"খ": 13,
|
| 18 |
+
"গ": 14,
|
| 19 |
+
"ঘ": 15,
|
| 20 |
+
"ঙ": 16,
|
| 21 |
+
"চ": 17,
|
| 22 |
+
"ছ": 18,
|
| 23 |
+
"জ": 19,
|
| 24 |
+
"ঝ": 20,
|
| 25 |
+
"ঞ": 21,
|
| 26 |
+
"ট": 22,
|
| 27 |
+
"ঠ": 23,
|
| 28 |
+
"ড": 24,
|
| 29 |
+
"ঢ": 25,
|
| 30 |
+
"ণ": 26,
|
| 31 |
+
"ত": 27,
|
| 32 |
+
"থ": 28,
|
| 33 |
+
"দ": 29,
|
| 34 |
+
"ধ": 30,
|
| 35 |
+
"ন": 31,
|
| 36 |
+
"প": 32,
|
| 37 |
+
"ফ": 33,
|
| 38 |
+
"ব": 34,
|
| 39 |
+
"ভ": 35,
|
| 40 |
+
"ম": 36,
|
| 41 |
+
"য": 37,
|
| 42 |
+
"র": 38,
|
| 43 |
+
"ল": 39,
|
| 44 |
+
"শ": 40,
|
| 45 |
+
"ষ": 41,
|
| 46 |
+
"স": 42,
|
| 47 |
+
"হ": 43,
|
| 48 |
+
"়": 44,
|
| 49 |
+
"া": 45,
|
| 50 |
+
"ি": 46,
|
| 51 |
+
"ী": 47,
|
| 52 |
+
"ু": 48,
|
| 53 |
+
"ূ": 49,
|
| 54 |
+
"ৃ": 50,
|
| 55 |
+
"ে": 51,
|
| 56 |
+
"ৈ": 52,
|
| 57 |
+
"ো": 53,
|
| 58 |
+
"ৌ": 54,
|
| 59 |
+
"্": 55,
|
| 60 |
+
"ৎ": 56
|
| 61 |
}
|