Somik033 commited on
Commit
51ce3db
·
verified ·
1 Parent(s): 92c753c

Upload folder using huggingface_hub

Browse files
Files changed (44) hide show
  1. added_tokens.json +2 -2
  2. all_results.json +8 -0
  3. checkpoint-2400/added_tokens.json +4 -0
  4. checkpoint-2400/config.json +116 -0
  5. checkpoint-2400/model.safetensors +3 -0
  6. checkpoint-2400/optimizer.pt +3 -0
  7. checkpoint-2400/rng_state.pth +3 -0
  8. checkpoint-2400/scaler.pt +3 -0
  9. checkpoint-2400/scheduler.pt +3 -0
  10. checkpoint-2400/special_tokens_map.json +6 -0
  11. checkpoint-2400/tokenizer_config.json +49 -0
  12. checkpoint-2400/trainer_state.json +326 -0
  13. checkpoint-2400/training_args.bin +3 -0
  14. checkpoint-2400/vocab.json +61 -0
  15. checkpoint-2940/added_tokens.json +4 -0
  16. checkpoint-2940/config.json +116 -0
  17. checkpoint-2940/model.safetensors +3 -0
  18. checkpoint-2940/optimizer.pt +3 -0
  19. checkpoint-2940/rng_state.pth +3 -0
  20. checkpoint-2940/scaler.pt +3 -0
  21. checkpoint-2940/scheduler.pt +3 -0
  22. checkpoint-2940/special_tokens_map.json +6 -0
  23. checkpoint-2940/tokenizer_config.json +49 -0
  24. checkpoint-2940/trainer_state.json +379 -0
  25. checkpoint-2940/training_args.bin +3 -0
  26. checkpoint-2940/vocab.json +61 -0
  27. eval_results.json +8 -0
  28. final/added_tokens.json +4 -0
  29. final/config.json +116 -0
  30. final/model.safetensors +3 -0
  31. final/preprocessor_config.json +10 -0
  32. final/special_tokens_map.json +6 -0
  33. final/tokenizer_config.json +49 -0
  34. final/training_args.bin +3 -0
  35. final/vocab.json +61 -0
  36. logs/events.out.tfevents.1763220599.82016ece2133.48.0 +3 -0
  37. logs/events.out.tfevents.1763236211.82016ece2133.48.1 +3 -0
  38. preprocessor_config.json +6 -7
  39. test_predictions.csv +451 -0
  40. tokenizer_config.json +5 -5
  41. train_results.json +8 -0
  42. trainer_state.json +388 -0
  43. validation_predictions.csv +166 -0
  44. vocab.json +58 -56
added_tokens.json CHANGED
@@ -1,4 +1,4 @@
1
  {
2
- "</s>": 58,
3
- "<s>": 57
4
  }
 
1
  {
2
+ "</s>": 60,
3
+ "<s>": 59
4
  }
all_results.json ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "epoch": 30.0,
3
+ "total_flos": 1.8456230162149265e+19,
4
+ "train_loss": 3.165084928395797,
5
+ "train_runtime": 15598.205,
6
+ "train_samples_per_second": 6.024,
7
+ "train_steps_per_second": 0.188
8
+ }
checkpoint-2400/added_tokens.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "</s>": 60,
3
+ "<s>": 59
4
+ }
checkpoint-2400/config.json ADDED
@@ -0,0 +1,116 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "activation_dropout": 0.0,
3
+ "adapter_attn_dim": null,
4
+ "adapter_kernel_size": 3,
5
+ "adapter_stride": 2,
6
+ "add_adapter": false,
7
+ "apply_spec_augment": true,
8
+ "architectures": [
9
+ "Wav2Vec2ForCTC"
10
+ ],
11
+ "attention_dropout": 0.1,
12
+ "bos_token_id": 1,
13
+ "classifier_proj_size": 256,
14
+ "codevector_dim": 768,
15
+ "contrastive_logits_temperature": 0.1,
16
+ "conv_bias": true,
17
+ "conv_dim": [
18
+ 512,
19
+ 512,
20
+ 512,
21
+ 512,
22
+ 512,
23
+ 512,
24
+ 512
25
+ ],
26
+ "conv_kernel": [
27
+ 10,
28
+ 3,
29
+ 3,
30
+ 3,
31
+ 3,
32
+ 2,
33
+ 2
34
+ ],
35
+ "conv_stride": [
36
+ 5,
37
+ 2,
38
+ 2,
39
+ 2,
40
+ 2,
41
+ 2,
42
+ 2
43
+ ],
44
+ "ctc_loss_reduction": "mean",
45
+ "ctc_zero_infinity": true,
46
+ "diversity_loss_weight": 0.1,
47
+ "do_stable_layer_norm": true,
48
+ "eos_token_id": 2,
49
+ "feat_extract_activation": "gelu",
50
+ "feat_extract_dropout": 0.0,
51
+ "feat_extract_norm": "layer",
52
+ "feat_proj_dropout": 0.0,
53
+ "feat_quantizer_dropout": 0.0,
54
+ "final_dropout": 0.0,
55
+ "gradient_checkpointing": false,
56
+ "hidden_act": "gelu",
57
+ "hidden_dropout": 0.1,
58
+ "hidden_size": 1024,
59
+ "initializer_range": 0.02,
60
+ "intermediate_size": 4096,
61
+ "layer_norm_eps": 1e-05,
62
+ "layerdrop": 0.1,
63
+ "mask_channel_length": 10,
64
+ "mask_channel_min_space": 1,
65
+ "mask_channel_other": 0.0,
66
+ "mask_channel_prob": 0.0,
67
+ "mask_channel_selection": "static",
68
+ "mask_feature_length": 10,
69
+ "mask_feature_min_masks": 0,
70
+ "mask_feature_prob": 0.0,
71
+ "mask_time_length": 10,
72
+ "mask_time_min_masks": 2,
73
+ "mask_time_min_space": 1,
74
+ "mask_time_other": 0.0,
75
+ "mask_time_prob": 0.05,
76
+ "mask_time_selection": "static",
77
+ "model_type": "wav2vec2",
78
+ "num_adapter_layers": 3,
79
+ "num_attention_heads": 16,
80
+ "num_codevector_groups": 2,
81
+ "num_codevectors_per_group": 320,
82
+ "num_conv_pos_embedding_groups": 16,
83
+ "num_conv_pos_embeddings": 128,
84
+ "num_feat_extract_layers": 7,
85
+ "num_hidden_layers": 24,
86
+ "num_negatives": 100,
87
+ "output_hidden_size": 1024,
88
+ "pad_token_id": 58,
89
+ "proj_codevector_dim": 768,
90
+ "tdnn_dilation": [
91
+ 1,
92
+ 2,
93
+ 3,
94
+ 1,
95
+ 1
96
+ ],
97
+ "tdnn_dim": [
98
+ 512,
99
+ 512,
100
+ 512,
101
+ 512,
102
+ 1500
103
+ ],
104
+ "tdnn_kernel": [
105
+ 5,
106
+ 3,
107
+ 3,
108
+ 1,
109
+ 1
110
+ ],
111
+ "torch_dtype": "float32",
112
+ "transformers_version": "4.53.3",
113
+ "use_weighted_layer_sum": false,
114
+ "vocab_size": 61,
115
+ "xvector_output_dim": 512
116
+ }
checkpoint-2400/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:264e4755a760a77e0a606971d1459cf26b45dd31d131c07b4b31457052e18994
3
+ size 1262057580
checkpoint-2400/optimizer.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:beaae8a8d6b6207637e0f1467667c2dfee224beaac19e94cfb5610b225ff8d43
3
+ size 2524364810
checkpoint-2400/rng_state.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:83ef17bce6b2143fb0655ed21d4fba0777f1b9a60505f478b0a72e04a1ebe517
3
+ size 14244
checkpoint-2400/scaler.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:b30172cf14f5dbe00280d63e36224a9f28dc7a0e8b38a74ceb5eb284e84da363
3
+ size 988
checkpoint-2400/scheduler.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:c743b180ea234670f01ea4681a29d6c856288a44e87414a23de09ed255b2dc93
3
+ size 1064
checkpoint-2400/special_tokens_map.json ADDED
@@ -0,0 +1,6 @@
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": "<s>",
3
+ "eos_token": "</s>",
4
+ "pad_token": "[PAD]",
5
+ "unk_token": "[UNK]"
6
+ }
checkpoint-2400/tokenizer_config.json ADDED
@@ -0,0 +1,49 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "57": {
4
+ "content": "[UNK]",
5
+ "lstrip": true,
6
+ "normalized": false,
7
+ "rstrip": true,
8
+ "single_word": false,
9
+ "special": false
10
+ },
11
+ "58": {
12
+ "content": "[PAD]",
13
+ "lstrip": true,
14
+ "normalized": false,
15
+ "rstrip": true,
16
+ "single_word": false,
17
+ "special": false
18
+ },
19
+ "59": {
20
+ "content": "<s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "60": {
28
+ "content": "</s>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ }
35
+ },
36
+ "bos_token": "<s>",
37
+ "clean_up_tokenization_spaces": false,
38
+ "do_lower_case": false,
39
+ "eos_token": "</s>",
40
+ "extra_special_tokens": {},
41
+ "model_max_length": 1000000000000000019884624838656,
42
+ "pad_token": "[PAD]",
43
+ "processor_class": "Wav2Vec2Processor",
44
+ "replace_word_delimiter_char": " ",
45
+ "target_lang": null,
46
+ "tokenizer_class": "Wav2Vec2CTCTokenizer",
47
+ "unk_token": "[UNK]",
48
+ "word_delimiter_token": "|"
49
+ }
checkpoint-2400/trainer_state.json ADDED
@@ -0,0 +1,326 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "best_global_step": 2400,
3
+ "best_metric": 0.6047297297297297,
4
+ "best_model_checkpoint": "/kaggle/working/wav2vec2-bengali-finetuned/checkpoint-2400",
5
+ "epoch": 24.489795918367346,
6
+ "eval_steps": 200,
7
+ "global_step": 2400,
8
+ "is_hyper_param_search": false,
9
+ "is_local_process_zero": true,
10
+ "is_world_process_zero": true,
11
+ "log_history": [
12
+ {
13
+ "epoch": 0.01020408163265306,
14
+ "grad_norm": 1263584.0,
15
+ "learning_rate": 0.0,
16
+ "loss": 25.6736,
17
+ "step": 1
18
+ },
19
+ {
20
+ "epoch": 1.0204081632653061,
21
+ "grad_norm": 3843419.25,
22
+ "learning_rate": 9.900000000000002e-06,
23
+ "loss": 23.811,
24
+ "step": 100
25
+ },
26
+ {
27
+ "epoch": 2.0408163265306123,
28
+ "grad_norm": 1233849.75,
29
+ "learning_rate": 1.9900000000000003e-05,
30
+ "loss": 13.9598,
31
+ "step": 200
32
+ },
33
+ {
34
+ "epoch": 2.0408163265306123,
35
+ "eval_loss": 5.328553199768066,
36
+ "eval_runtime": 11.0357,
37
+ "eval_samples_per_second": 14.951,
38
+ "eval_steps_per_second": 1.903,
39
+ "eval_wer": 1.0,
40
+ "step": 200
41
+ },
42
+ {
43
+ "epoch": 3.061224489795918,
44
+ "grad_norm": 101215.4375,
45
+ "learning_rate": 2.9900000000000002e-05,
46
+ "loss": 4.6042,
47
+ "step": 300
48
+ },
49
+ {
50
+ "epoch": 4.081632653061225,
51
+ "grad_norm": 204473.296875,
52
+ "learning_rate": 3.99e-05,
53
+ "loss": 3.5131,
54
+ "step": 400
55
+ },
56
+ {
57
+ "epoch": 4.081632653061225,
58
+ "eval_loss": 3.380544900894165,
59
+ "eval_runtime": 10.5068,
60
+ "eval_samples_per_second": 15.704,
61
+ "eval_steps_per_second": 1.999,
62
+ "eval_wer": 1.0,
63
+ "step": 400
64
+ },
65
+ {
66
+ "epoch": 5.1020408163265305,
67
+ "grad_norm": 106750.3828125,
68
+ "learning_rate": 4.99e-05,
69
+ "loss": 3.2448,
70
+ "step": 500
71
+ },
72
+ {
73
+ "epoch": 6.122448979591836,
74
+ "grad_norm": 56899.28125,
75
+ "learning_rate": 4.7971311475409835e-05,
76
+ "loss": 2.9613,
77
+ "step": 600
78
+ },
79
+ {
80
+ "epoch": 6.122448979591836,
81
+ "eval_loss": 2.839696168899536,
82
+ "eval_runtime": 10.5616,
83
+ "eval_samples_per_second": 15.623,
84
+ "eval_steps_per_second": 1.988,
85
+ "eval_wer": 1.0,
86
+ "step": 600
87
+ },
88
+ {
89
+ "epoch": 7.142857142857143,
90
+ "grad_norm": 155864.65625,
91
+ "learning_rate": 4.5922131147540986e-05,
92
+ "loss": 2.8199,
93
+ "step": 700
94
+ },
95
+ {
96
+ "epoch": 8.16326530612245,
97
+ "grad_norm": 75451.0546875,
98
+ "learning_rate": 4.387295081967213e-05,
99
+ "loss": 2.7197,
100
+ "step": 800
101
+ },
102
+ {
103
+ "epoch": 8.16326530612245,
104
+ "eval_loss": 2.606015920639038,
105
+ "eval_runtime": 10.535,
106
+ "eval_samples_per_second": 15.662,
107
+ "eval_steps_per_second": 1.993,
108
+ "eval_wer": 0.8457207207207207,
109
+ "step": 800
110
+ },
111
+ {
112
+ "epoch": 9.183673469387756,
113
+ "grad_norm": 76782.7421875,
114
+ "learning_rate": 4.182377049180328e-05,
115
+ "loss": 2.6389,
116
+ "step": 900
117
+ },
118
+ {
119
+ "epoch": 10.204081632653061,
120
+ "grad_norm": 64796.6171875,
121
+ "learning_rate": 3.977459016393443e-05,
122
+ "loss": 2.5596,
123
+ "step": 1000
124
+ },
125
+ {
126
+ "epoch": 10.204081632653061,
127
+ "eval_loss": 2.4175667762756348,
128
+ "eval_runtime": 10.5336,
129
+ "eval_samples_per_second": 15.664,
130
+ "eval_steps_per_second": 1.994,
131
+ "eval_wer": 0.7815315315315315,
132
+ "step": 1000
133
+ },
134
+ {
135
+ "epoch": 11.224489795918368,
136
+ "grad_norm": 147111.484375,
137
+ "learning_rate": 3.772540983606558e-05,
138
+ "loss": 2.4538,
139
+ "step": 1100
140
+ },
141
+ {
142
+ "epoch": 12.244897959183673,
143
+ "grad_norm": 91618.7890625,
144
+ "learning_rate": 3.5676229508196724e-05,
145
+ "loss": 2.3313,
146
+ "step": 1200
147
+ },
148
+ {
149
+ "epoch": 12.244897959183673,
150
+ "eval_loss": 2.050769805908203,
151
+ "eval_runtime": 10.5394,
152
+ "eval_samples_per_second": 15.656,
153
+ "eval_steps_per_second": 1.993,
154
+ "eval_wer": 0.7792792792792793,
155
+ "step": 1200
156
+ },
157
+ {
158
+ "epoch": 13.26530612244898,
159
+ "grad_norm": 135995.46875,
160
+ "learning_rate": 3.362704918032787e-05,
161
+ "loss": 2.1482,
162
+ "step": 1300
163
+ },
164
+ {
165
+ "epoch": 14.285714285714286,
166
+ "grad_norm": 91693.046875,
167
+ "learning_rate": 3.157786885245902e-05,
168
+ "loss": 1.9715,
169
+ "step": 1400
170
+ },
171
+ {
172
+ "epoch": 14.285714285714286,
173
+ "eval_loss": 1.6378555297851562,
174
+ "eval_runtime": 10.5414,
175
+ "eval_samples_per_second": 15.653,
176
+ "eval_steps_per_second": 1.992,
177
+ "eval_wer": 0.7894144144144144,
178
+ "step": 1400
179
+ },
180
+ {
181
+ "epoch": 15.306122448979592,
182
+ "grad_norm": 106778.4609375,
183
+ "learning_rate": 2.9528688524590165e-05,
184
+ "loss": 1.8192,
185
+ "step": 1500
186
+ },
187
+ {
188
+ "epoch": 16.3265306122449,
189
+ "grad_norm": 93321.4921875,
190
+ "learning_rate": 2.7479508196721317e-05,
191
+ "loss": 1.706,
192
+ "step": 1600
193
+ },
194
+ {
195
+ "epoch": 16.3265306122449,
196
+ "eval_loss": 1.3998359441757202,
197
+ "eval_runtime": 10.5682,
198
+ "eval_samples_per_second": 15.613,
199
+ "eval_steps_per_second": 1.987,
200
+ "eval_wer": 0.7263513513513513,
201
+ "step": 1600
202
+ },
203
+ {
204
+ "epoch": 17.346938775510203,
205
+ "grad_norm": 111310.1328125,
206
+ "learning_rate": 2.5430327868852462e-05,
207
+ "loss": 1.5935,
208
+ "step": 1700
209
+ },
210
+ {
211
+ "epoch": 18.367346938775512,
212
+ "grad_norm": 131049.40625,
213
+ "learning_rate": 2.338114754098361e-05,
214
+ "loss": 1.5412,
215
+ "step": 1800
216
+ },
217
+ {
218
+ "epoch": 18.367346938775512,
219
+ "eval_loss": 1.2491974830627441,
220
+ "eval_runtime": 10.5527,
221
+ "eval_samples_per_second": 15.636,
222
+ "eval_steps_per_second": 1.99,
223
+ "eval_wer": 0.6722972972972973,
224
+ "step": 1800
225
+ },
226
+ {
227
+ "epoch": 19.387755102040817,
228
+ "grad_norm": 150843.8125,
229
+ "learning_rate": 2.1331967213114755e-05,
230
+ "loss": 1.4727,
231
+ "step": 1900
232
+ },
233
+ {
234
+ "epoch": 20.408163265306122,
235
+ "grad_norm": 124916.6015625,
236
+ "learning_rate": 1.9282786885245903e-05,
237
+ "loss": 1.4023,
238
+ "step": 2000
239
+ },
240
+ {
241
+ "epoch": 20.408163265306122,
242
+ "eval_loss": 1.138938546180725,
243
+ "eval_runtime": 10.5847,
244
+ "eval_samples_per_second": 15.589,
245
+ "eval_steps_per_second": 1.984,
246
+ "eval_wer": 0.6317567567567568,
247
+ "step": 2000
248
+ },
249
+ {
250
+ "epoch": 21.428571428571427,
251
+ "grad_norm": 260327.703125,
252
+ "learning_rate": 1.7233606557377048e-05,
253
+ "loss": 1.3585,
254
+ "step": 2100
255
+ },
256
+ {
257
+ "epoch": 22.448979591836736,
258
+ "grad_norm": 156561.15625,
259
+ "learning_rate": 1.5184426229508198e-05,
260
+ "loss": 1.3188,
261
+ "step": 2200
262
+ },
263
+ {
264
+ "epoch": 22.448979591836736,
265
+ "eval_loss": 1.0857497453689575,
266
+ "eval_runtime": 10.5312,
267
+ "eval_samples_per_second": 15.668,
268
+ "eval_steps_per_second": 1.994,
269
+ "eval_wer": 0.6148648648648649,
270
+ "step": 2200
271
+ },
272
+ {
273
+ "epoch": 23.46938775510204,
274
+ "grad_norm": 137688.609375,
275
+ "learning_rate": 1.3135245901639346e-05,
276
+ "loss": 1.2872,
277
+ "step": 2300
278
+ },
279
+ {
280
+ "epoch": 24.489795918367346,
281
+ "grad_norm": 149320.140625,
282
+ "learning_rate": 1.1086065573770492e-05,
283
+ "loss": 1.2707,
284
+ "step": 2400
285
+ },
286
+ {
287
+ "epoch": 24.489795918367346,
288
+ "eval_loss": 1.035390019416809,
289
+ "eval_runtime": 10.5453,
290
+ "eval_samples_per_second": 15.647,
291
+ "eval_steps_per_second": 1.991,
292
+ "eval_wer": 0.6047297297297297,
293
+ "step": 2400
294
+ }
295
+ ],
296
+ "logging_steps": 100,
297
+ "max_steps": 2940,
298
+ "num_input_tokens_seen": 0,
299
+ "num_train_epochs": 30,
300
+ "save_steps": 400,
301
+ "stateful_callbacks": {
302
+ "EarlyStoppingCallback": {
303
+ "args": {
304
+ "early_stopping_patience": 5,
305
+ "early_stopping_threshold": 0.01
306
+ },
307
+ "attributes": {
308
+ "early_stopping_patience_counter": 0
309
+ }
310
+ },
311
+ "TrainerControl": {
312
+ "args": {
313
+ "should_epoch_stop": false,
314
+ "should_evaluate": false,
315
+ "should_log": false,
316
+ "should_save": true,
317
+ "should_training_stop": false
318
+ },
319
+ "attributes": {}
320
+ }
321
+ },
322
+ "total_flos": 1.507065962959162e+19,
323
+ "train_batch_size": 8,
324
+ "trial_name": null,
325
+ "trial_params": null
326
+ }
checkpoint-2400/training_args.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:1ea3cd97018cf5d55f387775c77a86a9b6a707724b0ec654334ad12d0720841d
3
+ size 5368
checkpoint-2400/vocab.json ADDED
@@ -0,0 +1,61 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ ",": 1,
3
+ "?": 2,
4
+ "[PAD]": 58,
5
+ "[UNK]": 57,
6
+ "|": 0,
7
+ "।": 3,
8
+ "ঁ": 4,
9
+ "ং": 5,
10
+ "অ": 6,
11
+ "আ": 7,
12
+ "ই": 8,
13
+ "উ": 9,
14
+ "এ": 10,
15
+ "ও": 11,
16
+ "ক": 12,
17
+ "খ": 13,
18
+ "গ": 14,
19
+ "ঘ": 15,
20
+ "ঙ": 16,
21
+ "চ": 17,
22
+ "ছ": 18,
23
+ "জ": 19,
24
+ "ঝ": 20,
25
+ "ঞ": 21,
26
+ "ট": 22,
27
+ "ঠ": 23,
28
+ "ড": 24,
29
+ "ঢ": 25,
30
+ "ণ": 26,
31
+ "ত": 27,
32
+ "থ": 28,
33
+ "দ": 29,
34
+ "ধ": 30,
35
+ "ন": 31,
36
+ "প": 32,
37
+ "ফ": 33,
38
+ "ব": 34,
39
+ "ভ": 35,
40
+ "ম": 36,
41
+ "য": 37,
42
+ "র": 38,
43
+ "ল": 39,
44
+ "শ": 40,
45
+ "ষ": 41,
46
+ "স": 42,
47
+ "হ": 43,
48
+ "়": 44,
49
+ "া": 45,
50
+ "ি": 46,
51
+ "ী": 47,
52
+ "ু": 48,
53
+ "ূ": 49,
54
+ "ৃ": 50,
55
+ "ে": 51,
56
+ "ৈ": 52,
57
+ "ো": 53,
58
+ "ৌ": 54,
59
+ "্": 55,
60
+ "ৎ": 56
61
+ }
checkpoint-2940/added_tokens.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "</s>": 60,
3
+ "<s>": 59
4
+ }
checkpoint-2940/config.json ADDED
@@ -0,0 +1,116 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "activation_dropout": 0.0,
3
+ "adapter_attn_dim": null,
4
+ "adapter_kernel_size": 3,
5
+ "adapter_stride": 2,
6
+ "add_adapter": false,
7
+ "apply_spec_augment": true,
8
+ "architectures": [
9
+ "Wav2Vec2ForCTC"
10
+ ],
11
+ "attention_dropout": 0.1,
12
+ "bos_token_id": 1,
13
+ "classifier_proj_size": 256,
14
+ "codevector_dim": 768,
15
+ "contrastive_logits_temperature": 0.1,
16
+ "conv_bias": true,
17
+ "conv_dim": [
18
+ 512,
19
+ 512,
20
+ 512,
21
+ 512,
22
+ 512,
23
+ 512,
24
+ 512
25
+ ],
26
+ "conv_kernel": [
27
+ 10,
28
+ 3,
29
+ 3,
30
+ 3,
31
+ 3,
32
+ 2,
33
+ 2
34
+ ],
35
+ "conv_stride": [
36
+ 5,
37
+ 2,
38
+ 2,
39
+ 2,
40
+ 2,
41
+ 2,
42
+ 2
43
+ ],
44
+ "ctc_loss_reduction": "mean",
45
+ "ctc_zero_infinity": true,
46
+ "diversity_loss_weight": 0.1,
47
+ "do_stable_layer_norm": true,
48
+ "eos_token_id": 2,
49
+ "feat_extract_activation": "gelu",
50
+ "feat_extract_dropout": 0.0,
51
+ "feat_extract_norm": "layer",
52
+ "feat_proj_dropout": 0.0,
53
+ "feat_quantizer_dropout": 0.0,
54
+ "final_dropout": 0.0,
55
+ "gradient_checkpointing": false,
56
+ "hidden_act": "gelu",
57
+ "hidden_dropout": 0.1,
58
+ "hidden_size": 1024,
59
+ "initializer_range": 0.02,
60
+ "intermediate_size": 4096,
61
+ "layer_norm_eps": 1e-05,
62
+ "layerdrop": 0.1,
63
+ "mask_channel_length": 10,
64
+ "mask_channel_min_space": 1,
65
+ "mask_channel_other": 0.0,
66
+ "mask_channel_prob": 0.0,
67
+ "mask_channel_selection": "static",
68
+ "mask_feature_length": 10,
69
+ "mask_feature_min_masks": 0,
70
+ "mask_feature_prob": 0.0,
71
+ "mask_time_length": 10,
72
+ "mask_time_min_masks": 2,
73
+ "mask_time_min_space": 1,
74
+ "mask_time_other": 0.0,
75
+ "mask_time_prob": 0.05,
76
+ "mask_time_selection": "static",
77
+ "model_type": "wav2vec2",
78
+ "num_adapter_layers": 3,
79
+ "num_attention_heads": 16,
80
+ "num_codevector_groups": 2,
81
+ "num_codevectors_per_group": 320,
82
+ "num_conv_pos_embedding_groups": 16,
83
+ "num_conv_pos_embeddings": 128,
84
+ "num_feat_extract_layers": 7,
85
+ "num_hidden_layers": 24,
86
+ "num_negatives": 100,
87
+ "output_hidden_size": 1024,
88
+ "pad_token_id": 58,
89
+ "proj_codevector_dim": 768,
90
+ "tdnn_dilation": [
91
+ 1,
92
+ 2,
93
+ 3,
94
+ 1,
95
+ 1
96
+ ],
97
+ "tdnn_dim": [
98
+ 512,
99
+ 512,
100
+ 512,
101
+ 512,
102
+ 1500
103
+ ],
104
+ "tdnn_kernel": [
105
+ 5,
106
+ 3,
107
+ 3,
108
+ 1,
109
+ 1
110
+ ],
111
+ "torch_dtype": "float32",
112
+ "transformers_version": "4.53.3",
113
+ "use_weighted_layer_sum": false,
114
+ "vocab_size": 61,
115
+ "xvector_output_dim": 512
116
+ }
checkpoint-2940/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:5a1981c2eb99d226b99d73b65d3755aaaea884a6167496e0a194086df6b00d43
3
+ size 1262057580
checkpoint-2940/optimizer.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:0787f8012ece5770e78932246931b91bc55aad1c61f0ecd2cca63c9d45a85a60
3
+ size 2524364810
checkpoint-2940/rng_state.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:f984aa0169e6137f948c4ec773408f870872f6296b194da8d4296935351264b2
3
+ size 14308
checkpoint-2940/scaler.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:b30172cf14f5dbe00280d63e36224a9f28dc7a0e8b38a74ceb5eb284e84da363
3
+ size 988
checkpoint-2940/scheduler.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:153aa1bd4efd262a7030faf5e62634c3aff1e7187d5df057cfa035c209999a64
3
+ size 1064
checkpoint-2940/special_tokens_map.json ADDED
@@ -0,0 +1,6 @@
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": "<s>",
3
+ "eos_token": "</s>",
4
+ "pad_token": "[PAD]",
5
+ "unk_token": "[UNK]"
6
+ }
checkpoint-2940/tokenizer_config.json ADDED
@@ -0,0 +1,49 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "57": {
4
+ "content": "[UNK]",
5
+ "lstrip": true,
6
+ "normalized": false,
7
+ "rstrip": true,
8
+ "single_word": false,
9
+ "special": false
10
+ },
11
+ "58": {
12
+ "content": "[PAD]",
13
+ "lstrip": true,
14
+ "normalized": false,
15
+ "rstrip": true,
16
+ "single_word": false,
17
+ "special": false
18
+ },
19
+ "59": {
20
+ "content": "<s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "60": {
28
+ "content": "</s>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ }
35
+ },
36
+ "bos_token": "<s>",
37
+ "clean_up_tokenization_spaces": false,
38
+ "do_lower_case": false,
39
+ "eos_token": "</s>",
40
+ "extra_special_tokens": {},
41
+ "model_max_length": 1000000000000000019884624838656,
42
+ "pad_token": "[PAD]",
43
+ "processor_class": "Wav2Vec2Processor",
44
+ "replace_word_delimiter_char": " ",
45
+ "target_lang": null,
46
+ "tokenizer_class": "Wav2Vec2CTCTokenizer",
47
+ "unk_token": "[UNK]",
48
+ "word_delimiter_token": "|"
49
+ }
checkpoint-2940/trainer_state.json ADDED
@@ -0,0 +1,379 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "best_global_step": 2600,
3
+ "best_metric": 0.5833333333333334,
4
+ "best_model_checkpoint": "/kaggle/working/wav2vec2-bengali-finetuned/checkpoint-2400",
5
+ "epoch": 30.0,
6
+ "eval_steps": 200,
7
+ "global_step": 2940,
8
+ "is_hyper_param_search": false,
9
+ "is_local_process_zero": true,
10
+ "is_world_process_zero": true,
11
+ "log_history": [
12
+ {
13
+ "epoch": 0.01020408163265306,
14
+ "grad_norm": 1263584.0,
15
+ "learning_rate": 0.0,
16
+ "loss": 25.6736,
17
+ "step": 1
18
+ },
19
+ {
20
+ "epoch": 1.0204081632653061,
21
+ "grad_norm": 3843419.25,
22
+ "learning_rate": 9.900000000000002e-06,
23
+ "loss": 23.811,
24
+ "step": 100
25
+ },
26
+ {
27
+ "epoch": 2.0408163265306123,
28
+ "grad_norm": 1233849.75,
29
+ "learning_rate": 1.9900000000000003e-05,
30
+ "loss": 13.9598,
31
+ "step": 200
32
+ },
33
+ {
34
+ "epoch": 2.0408163265306123,
35
+ "eval_loss": 5.328553199768066,
36
+ "eval_runtime": 11.0357,
37
+ "eval_samples_per_second": 14.951,
38
+ "eval_steps_per_second": 1.903,
39
+ "eval_wer": 1.0,
40
+ "step": 200
41
+ },
42
+ {
43
+ "epoch": 3.061224489795918,
44
+ "grad_norm": 101215.4375,
45
+ "learning_rate": 2.9900000000000002e-05,
46
+ "loss": 4.6042,
47
+ "step": 300
48
+ },
49
+ {
50
+ "epoch": 4.081632653061225,
51
+ "grad_norm": 204473.296875,
52
+ "learning_rate": 3.99e-05,
53
+ "loss": 3.5131,
54
+ "step": 400
55
+ },
56
+ {
57
+ "epoch": 4.081632653061225,
58
+ "eval_loss": 3.380544900894165,
59
+ "eval_runtime": 10.5068,
60
+ "eval_samples_per_second": 15.704,
61
+ "eval_steps_per_second": 1.999,
62
+ "eval_wer": 1.0,
63
+ "step": 400
64
+ },
65
+ {
66
+ "epoch": 5.1020408163265305,
67
+ "grad_norm": 106750.3828125,
68
+ "learning_rate": 4.99e-05,
69
+ "loss": 3.2448,
70
+ "step": 500
71
+ },
72
+ {
73
+ "epoch": 6.122448979591836,
74
+ "grad_norm": 56899.28125,
75
+ "learning_rate": 4.7971311475409835e-05,
76
+ "loss": 2.9613,
77
+ "step": 600
78
+ },
79
+ {
80
+ "epoch": 6.122448979591836,
81
+ "eval_loss": 2.839696168899536,
82
+ "eval_runtime": 10.5616,
83
+ "eval_samples_per_second": 15.623,
84
+ "eval_steps_per_second": 1.988,
85
+ "eval_wer": 1.0,
86
+ "step": 600
87
+ },
88
+ {
89
+ "epoch": 7.142857142857143,
90
+ "grad_norm": 155864.65625,
91
+ "learning_rate": 4.5922131147540986e-05,
92
+ "loss": 2.8199,
93
+ "step": 700
94
+ },
95
+ {
96
+ "epoch": 8.16326530612245,
97
+ "grad_norm": 75451.0546875,
98
+ "learning_rate": 4.387295081967213e-05,
99
+ "loss": 2.7197,
100
+ "step": 800
101
+ },
102
+ {
103
+ "epoch": 8.16326530612245,
104
+ "eval_loss": 2.606015920639038,
105
+ "eval_runtime": 10.535,
106
+ "eval_samples_per_second": 15.662,
107
+ "eval_steps_per_second": 1.993,
108
+ "eval_wer": 0.8457207207207207,
109
+ "step": 800
110
+ },
111
+ {
112
+ "epoch": 9.183673469387756,
113
+ "grad_norm": 76782.7421875,
114
+ "learning_rate": 4.182377049180328e-05,
115
+ "loss": 2.6389,
116
+ "step": 900
117
+ },
118
+ {
119
+ "epoch": 10.204081632653061,
120
+ "grad_norm": 64796.6171875,
121
+ "learning_rate": 3.977459016393443e-05,
122
+ "loss": 2.5596,
123
+ "step": 1000
124
+ },
125
+ {
126
+ "epoch": 10.204081632653061,
127
+ "eval_loss": 2.4175667762756348,
128
+ "eval_runtime": 10.5336,
129
+ "eval_samples_per_second": 15.664,
130
+ "eval_steps_per_second": 1.994,
131
+ "eval_wer": 0.7815315315315315,
132
+ "step": 1000
133
+ },
134
+ {
135
+ "epoch": 11.224489795918368,
136
+ "grad_norm": 147111.484375,
137
+ "learning_rate": 3.772540983606558e-05,
138
+ "loss": 2.4538,
139
+ "step": 1100
140
+ },
141
+ {
142
+ "epoch": 12.244897959183673,
143
+ "grad_norm": 91618.7890625,
144
+ "learning_rate": 3.5676229508196724e-05,
145
+ "loss": 2.3313,
146
+ "step": 1200
147
+ },
148
+ {
149
+ "epoch": 12.244897959183673,
150
+ "eval_loss": 2.050769805908203,
151
+ "eval_runtime": 10.5394,
152
+ "eval_samples_per_second": 15.656,
153
+ "eval_steps_per_second": 1.993,
154
+ "eval_wer": 0.7792792792792793,
155
+ "step": 1200
156
+ },
157
+ {
158
+ "epoch": 13.26530612244898,
159
+ "grad_norm": 135995.46875,
160
+ "learning_rate": 3.362704918032787e-05,
161
+ "loss": 2.1482,
162
+ "step": 1300
163
+ },
164
+ {
165
+ "epoch": 14.285714285714286,
166
+ "grad_norm": 91693.046875,
167
+ "learning_rate": 3.157786885245902e-05,
168
+ "loss": 1.9715,
169
+ "step": 1400
170
+ },
171
+ {
172
+ "epoch": 14.285714285714286,
173
+ "eval_loss": 1.6378555297851562,
174
+ "eval_runtime": 10.5414,
175
+ "eval_samples_per_second": 15.653,
176
+ "eval_steps_per_second": 1.992,
177
+ "eval_wer": 0.7894144144144144,
178
+ "step": 1400
179
+ },
180
+ {
181
+ "epoch": 15.306122448979592,
182
+ "grad_norm": 106778.4609375,
183
+ "learning_rate": 2.9528688524590165e-05,
184
+ "loss": 1.8192,
185
+ "step": 1500
186
+ },
187
+ {
188
+ "epoch": 16.3265306122449,
189
+ "grad_norm": 93321.4921875,
190
+ "learning_rate": 2.7479508196721317e-05,
191
+ "loss": 1.706,
192
+ "step": 1600
193
+ },
194
+ {
195
+ "epoch": 16.3265306122449,
196
+ "eval_loss": 1.3998359441757202,
197
+ "eval_runtime": 10.5682,
198
+ "eval_samples_per_second": 15.613,
199
+ "eval_steps_per_second": 1.987,
200
+ "eval_wer": 0.7263513513513513,
201
+ "step": 1600
202
+ },
203
+ {
204
+ "epoch": 17.346938775510203,
205
+ "grad_norm": 111310.1328125,
206
+ "learning_rate": 2.5430327868852462e-05,
207
+ "loss": 1.5935,
208
+ "step": 1700
209
+ },
210
+ {
211
+ "epoch": 18.367346938775512,
212
+ "grad_norm": 131049.40625,
213
+ "learning_rate": 2.338114754098361e-05,
214
+ "loss": 1.5412,
215
+ "step": 1800
216
+ },
217
+ {
218
+ "epoch": 18.367346938775512,
219
+ "eval_loss": 1.2491974830627441,
220
+ "eval_runtime": 10.5527,
221
+ "eval_samples_per_second": 15.636,
222
+ "eval_steps_per_second": 1.99,
223
+ "eval_wer": 0.6722972972972973,
224
+ "step": 1800
225
+ },
226
+ {
227
+ "epoch": 19.387755102040817,
228
+ "grad_norm": 150843.8125,
229
+ "learning_rate": 2.1331967213114755e-05,
230
+ "loss": 1.4727,
231
+ "step": 1900
232
+ },
233
+ {
234
+ "epoch": 20.408163265306122,
235
+ "grad_norm": 124916.6015625,
236
+ "learning_rate": 1.9282786885245903e-05,
237
+ "loss": 1.4023,
238
+ "step": 2000
239
+ },
240
+ {
241
+ "epoch": 20.408163265306122,
242
+ "eval_loss": 1.138938546180725,
243
+ "eval_runtime": 10.5847,
244
+ "eval_samples_per_second": 15.589,
245
+ "eval_steps_per_second": 1.984,
246
+ "eval_wer": 0.6317567567567568,
247
+ "step": 2000
248
+ },
249
+ {
250
+ "epoch": 21.428571428571427,
251
+ "grad_norm": 260327.703125,
252
+ "learning_rate": 1.7233606557377048e-05,
253
+ "loss": 1.3585,
254
+ "step": 2100
255
+ },
256
+ {
257
+ "epoch": 22.448979591836736,
258
+ "grad_norm": 156561.15625,
259
+ "learning_rate": 1.5184426229508198e-05,
260
+ "loss": 1.3188,
261
+ "step": 2200
262
+ },
263
+ {
264
+ "epoch": 22.448979591836736,
265
+ "eval_loss": 1.0857497453689575,
266
+ "eval_runtime": 10.5312,
267
+ "eval_samples_per_second": 15.668,
268
+ "eval_steps_per_second": 1.994,
269
+ "eval_wer": 0.6148648648648649,
270
+ "step": 2200
271
+ },
272
+ {
273
+ "epoch": 23.46938775510204,
274
+ "grad_norm": 137688.609375,
275
+ "learning_rate": 1.3135245901639346e-05,
276
+ "loss": 1.2872,
277
+ "step": 2300
278
+ },
279
+ {
280
+ "epoch": 24.489795918367346,
281
+ "grad_norm": 149320.140625,
282
+ "learning_rate": 1.1086065573770492e-05,
283
+ "loss": 1.2707,
284
+ "step": 2400
285
+ },
286
+ {
287
+ "epoch": 24.489795918367346,
288
+ "eval_loss": 1.035390019416809,
289
+ "eval_runtime": 10.5453,
290
+ "eval_samples_per_second": 15.647,
291
+ "eval_steps_per_second": 1.991,
292
+ "eval_wer": 0.6047297297297297,
293
+ "step": 2400
294
+ },
295
+ {
296
+ "epoch": 25.510204081632654,
297
+ "grad_norm": 160687.875,
298
+ "learning_rate": 9.036885245901639e-06,
299
+ "loss": 1.2261,
300
+ "step": 2500
301
+ },
302
+ {
303
+ "epoch": 26.53061224489796,
304
+ "grad_norm": 175958.0625,
305
+ "learning_rate": 6.987704918032788e-06,
306
+ "loss": 1.222,
307
+ "step": 2600
308
+ },
309
+ {
310
+ "epoch": 26.53061224489796,
311
+ "eval_loss": 1.011266827583313,
312
+ "eval_runtime": 10.5487,
313
+ "eval_samples_per_second": 15.642,
314
+ "eval_steps_per_second": 1.991,
315
+ "eval_wer": 0.5833333333333334,
316
+ "step": 2600
317
+ },
318
+ {
319
+ "epoch": 27.551020408163264,
320
+ "grad_norm": 129829.171875,
321
+ "learning_rate": 4.938524590163935e-06,
322
+ "loss": 1.2061,
323
+ "step": 2700
324
+ },
325
+ {
326
+ "epoch": 28.571428571428573,
327
+ "grad_norm": 180224.375,
328
+ "learning_rate": 2.8893442622950824e-06,
329
+ "loss": 1.2084,
330
+ "step": 2800
331
+ },
332
+ {
333
+ "epoch": 28.571428571428573,
334
+ "eval_loss": 0.9903889298439026,
335
+ "eval_runtime": 10.5794,
336
+ "eval_samples_per_second": 15.596,
337
+ "eval_steps_per_second": 1.985,
338
+ "eval_wer": 0.5833333333333334,
339
+ "step": 2800
340
+ },
341
+ {
342
+ "epoch": 29.591836734693878,
343
+ "grad_norm": 153736.046875,
344
+ "learning_rate": 8.401639344262295e-07,
345
+ "loss": 1.1881,
346
+ "step": 2900
347
+ }
348
+ ],
349
+ "logging_steps": 100,
350
+ "max_steps": 2940,
351
+ "num_input_tokens_seen": 0,
352
+ "num_train_epochs": 30,
353
+ "save_steps": 400,
354
+ "stateful_callbacks": {
355
+ "EarlyStoppingCallback": {
356
+ "args": {
357
+ "early_stopping_patience": 5,
358
+ "early_stopping_threshold": 0.01
359
+ },
360
+ "attributes": {
361
+ "early_stopping_patience_counter": 1
362
+ }
363
+ },
364
+ "TrainerControl": {
365
+ "args": {
366
+ "should_epoch_stop": false,
367
+ "should_evaluate": false,
368
+ "should_log": false,
369
+ "should_save": true,
370
+ "should_training_stop": true
371
+ },
372
+ "attributes": {}
373
+ }
374
+ },
375
+ "total_flos": 1.8456230162149265e+19,
376
+ "train_batch_size": 8,
377
+ "trial_name": null,
378
+ "trial_params": null
379
+ }
checkpoint-2940/training_args.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:1ea3cd97018cf5d55f387775c77a86a9b6a707724b0ec654334ad12d0720841d
3
+ size 5368
checkpoint-2940/vocab.json ADDED
@@ -0,0 +1,61 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ ",": 1,
3
+ "?": 2,
4
+ "[PAD]": 58,
5
+ "[UNK]": 57,
6
+ "|": 0,
7
+ "।": 3,
8
+ "ঁ": 4,
9
+ "ং": 5,
10
+ "অ": 6,
11
+ "আ": 7,
12
+ "ই": 8,
13
+ "উ": 9,
14
+ "এ": 10,
15
+ "ও": 11,
16
+ "ক": 12,
17
+ "খ": 13,
18
+ "গ": 14,
19
+ "ঘ": 15,
20
+ "ঙ": 16,
21
+ "চ": 17,
22
+ "ছ": 18,
23
+ "জ": 19,
24
+ "ঝ": 20,
25
+ "ঞ": 21,
26
+ "ট": 22,
27
+ "ঠ": 23,
28
+ "ড": 24,
29
+ "ঢ": 25,
30
+ "ণ": 26,
31
+ "ত": 27,
32
+ "থ": 28,
33
+ "দ": 29,
34
+ "ধ": 30,
35
+ "ন": 31,
36
+ "প": 32,
37
+ "ফ": 33,
38
+ "ব": 34,
39
+ "ভ": 35,
40
+ "ম": 36,
41
+ "য": 37,
42
+ "র": 38,
43
+ "ল": 39,
44
+ "শ": 40,
45
+ "ষ": 41,
46
+ "স": 42,
47
+ "হ": 43,
48
+ "়": 44,
49
+ "া": 45,
50
+ "ি": 46,
51
+ "ী": 47,
52
+ "ু": 48,
53
+ "ূ": 49,
54
+ "ৃ": 50,
55
+ "ে": 51,
56
+ "ৈ": 52,
57
+ "ো": 53,
58
+ "ৌ": 54,
59
+ "্": 55,
60
+ "ৎ": 56
61
+ }
eval_results.json ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "eval_loss": 1.035390019416809,
3
+ "eval_wer": 0.6047297297297297,
4
+ "eval_runtime": 10.6448,
5
+ "eval_samples_per_second": 15.5,
6
+ "eval_steps_per_second": 1.973,
7
+ "epoch": 30.0
8
+ }
final/added_tokens.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "</s>": 60,
3
+ "<s>": 59
4
+ }
final/config.json ADDED
@@ -0,0 +1,116 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "activation_dropout": 0.0,
3
+ "adapter_attn_dim": null,
4
+ "adapter_kernel_size": 3,
5
+ "adapter_stride": 2,
6
+ "add_adapter": false,
7
+ "apply_spec_augment": true,
8
+ "architectures": [
9
+ "Wav2Vec2ForCTC"
10
+ ],
11
+ "attention_dropout": 0.1,
12
+ "bos_token_id": 1,
13
+ "classifier_proj_size": 256,
14
+ "codevector_dim": 768,
15
+ "contrastive_logits_temperature": 0.1,
16
+ "conv_bias": true,
17
+ "conv_dim": [
18
+ 512,
19
+ 512,
20
+ 512,
21
+ 512,
22
+ 512,
23
+ 512,
24
+ 512
25
+ ],
26
+ "conv_kernel": [
27
+ 10,
28
+ 3,
29
+ 3,
30
+ 3,
31
+ 3,
32
+ 2,
33
+ 2
34
+ ],
35
+ "conv_stride": [
36
+ 5,
37
+ 2,
38
+ 2,
39
+ 2,
40
+ 2,
41
+ 2,
42
+ 2
43
+ ],
44
+ "ctc_loss_reduction": "mean",
45
+ "ctc_zero_infinity": true,
46
+ "diversity_loss_weight": 0.1,
47
+ "do_stable_layer_norm": true,
48
+ "eos_token_id": 2,
49
+ "feat_extract_activation": "gelu",
50
+ "feat_extract_dropout": 0.0,
51
+ "feat_extract_norm": "layer",
52
+ "feat_proj_dropout": 0.0,
53
+ "feat_quantizer_dropout": 0.0,
54
+ "final_dropout": 0.0,
55
+ "gradient_checkpointing": false,
56
+ "hidden_act": "gelu",
57
+ "hidden_dropout": 0.1,
58
+ "hidden_size": 1024,
59
+ "initializer_range": 0.02,
60
+ "intermediate_size": 4096,
61
+ "layer_norm_eps": 1e-05,
62
+ "layerdrop": 0.1,
63
+ "mask_channel_length": 10,
64
+ "mask_channel_min_space": 1,
65
+ "mask_channel_other": 0.0,
66
+ "mask_channel_prob": 0.0,
67
+ "mask_channel_selection": "static",
68
+ "mask_feature_length": 10,
69
+ "mask_feature_min_masks": 0,
70
+ "mask_feature_prob": 0.0,
71
+ "mask_time_length": 10,
72
+ "mask_time_min_masks": 2,
73
+ "mask_time_min_space": 1,
74
+ "mask_time_other": 0.0,
75
+ "mask_time_prob": 0.05,
76
+ "mask_time_selection": "static",
77
+ "model_type": "wav2vec2",
78
+ "num_adapter_layers": 3,
79
+ "num_attention_heads": 16,
80
+ "num_codevector_groups": 2,
81
+ "num_codevectors_per_group": 320,
82
+ "num_conv_pos_embedding_groups": 16,
83
+ "num_conv_pos_embeddings": 128,
84
+ "num_feat_extract_layers": 7,
85
+ "num_hidden_layers": 24,
86
+ "num_negatives": 100,
87
+ "output_hidden_size": 1024,
88
+ "pad_token_id": 58,
89
+ "proj_codevector_dim": 768,
90
+ "tdnn_dilation": [
91
+ 1,
92
+ 2,
93
+ 3,
94
+ 1,
95
+ 1
96
+ ],
97
+ "tdnn_dim": [
98
+ 512,
99
+ 512,
100
+ 512,
101
+ 512,
102
+ 1500
103
+ ],
104
+ "tdnn_kernel": [
105
+ 5,
106
+ 3,
107
+ 3,
108
+ 1,
109
+ 1
110
+ ],
111
+ "torch_dtype": "float32",
112
+ "transformers_version": "4.53.3",
113
+ "use_weighted_layer_sum": false,
114
+ "vocab_size": 61,
115
+ "xvector_output_dim": 512
116
+ }
final/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:264e4755a760a77e0a606971d1459cf26b45dd31d131c07b4b31457052e18994
3
+ size 1262057580
final/preprocessor_config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "do_normalize": true,
3
+ "feature_extractor_type": "Wav2Vec2FeatureExtractor",
4
+ "feature_size": 1,
5
+ "padding_side": "right",
6
+ "padding_value": 0.0,
7
+ "processor_class": "Wav2Vec2Processor",
8
+ "return_attention_mask": true,
9
+ "sampling_rate": 16000
10
+ }
final/special_tokens_map.json ADDED
@@ -0,0 +1,6 @@
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": "<s>",
3
+ "eos_token": "</s>",
4
+ "pad_token": "[PAD]",
5
+ "unk_token": "[UNK]"
6
+ }
final/tokenizer_config.json ADDED
@@ -0,0 +1,49 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "57": {
4
+ "content": "[UNK]",
5
+ "lstrip": true,
6
+ "normalized": false,
7
+ "rstrip": true,
8
+ "single_word": false,
9
+ "special": false
10
+ },
11
+ "58": {
12
+ "content": "[PAD]",
13
+ "lstrip": true,
14
+ "normalized": false,
15
+ "rstrip": true,
16
+ "single_word": false,
17
+ "special": false
18
+ },
19
+ "59": {
20
+ "content": "<s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "60": {
28
+ "content": "</s>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ }
35
+ },
36
+ "bos_token": "<s>",
37
+ "clean_up_tokenization_spaces": false,
38
+ "do_lower_case": false,
39
+ "eos_token": "</s>",
40
+ "extra_special_tokens": {},
41
+ "model_max_length": 1000000000000000019884624838656,
42
+ "pad_token": "[PAD]",
43
+ "processor_class": "Wav2Vec2Processor",
44
+ "replace_word_delimiter_char": " ",
45
+ "target_lang": null,
46
+ "tokenizer_class": "Wav2Vec2CTCTokenizer",
47
+ "unk_token": "[UNK]",
48
+ "word_delimiter_token": "|"
49
+ }
final/training_args.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:1ea3cd97018cf5d55f387775c77a86a9b6a707724b0ec654334ad12d0720841d
3
+ size 5368
final/vocab.json ADDED
@@ -0,0 +1,61 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ ",": 1,
3
+ "?": 2,
4
+ "[PAD]": 58,
5
+ "[UNK]": 57,
6
+ "|": 0,
7
+ "।": 3,
8
+ "ঁ": 4,
9
+ "ং": 5,
10
+ "অ": 6,
11
+ "আ": 7,
12
+ "ই": 8,
13
+ "উ": 9,
14
+ "এ": 10,
15
+ "ও": 11,
16
+ "ক": 12,
17
+ "খ": 13,
18
+ "গ": 14,
19
+ "ঘ": 15,
20
+ "ঙ": 16,
21
+ "চ": 17,
22
+ "ছ": 18,
23
+ "জ": 19,
24
+ "ঝ": 20,
25
+ "ঞ": 21,
26
+ "ট": 22,
27
+ "ঠ": 23,
28
+ "ড": 24,
29
+ "ঢ": 25,
30
+ "ণ": 26,
31
+ "ত": 27,
32
+ "থ": 28,
33
+ "দ": 29,
34
+ "ধ": 30,
35
+ "ন": 31,
36
+ "প": 32,
37
+ "ফ": 33,
38
+ "ব": 34,
39
+ "ভ": 35,
40
+ "ম": 36,
41
+ "য": 37,
42
+ "র": 38,
43
+ "ল": 39,
44
+ "শ": 40,
45
+ "ষ": 41,
46
+ "স": 42,
47
+ "হ": 43,
48
+ "়": 44,
49
+ "া": 45,
50
+ "ি": 46,
51
+ "ী": 47,
52
+ "ু": 48,
53
+ "ূ": 49,
54
+ "ৃ": 50,
55
+ "ে": 51,
56
+ "ৈ": 52,
57
+ "ো": 53,
58
+ "ৌ": 54,
59
+ "্": 55,
60
+ "ৎ": 56
61
+ }
logs/events.out.tfevents.1763220599.82016ece2133.48.0 ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:7ff7c589fa1c79f1cd2bda23093b461d8a5f48a5daccc1df284fab8dbea61196
3
+ size 17794
logs/events.out.tfevents.1763236211.82016ece2133.48.1 ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cff2e938ed89409eaaf1e176a48fd2a09b548d32f2721192777a802ad950737f
3
+ size 406
preprocessor_config.json CHANGED
@@ -1,11 +1,10 @@
1
  {
2
- "feature_extractor_type": "SeamlessM4TFeatureExtractor",
3
- "feature_size": 80,
4
- "num_mel_bins": 80,
5
  "padding_side": "right",
6
- "padding_value": 1,
7
- "processor_class": "Wav2Vec2BertProcessor",
8
  "return_attention_mask": true,
9
- "sampling_rate": 16000,
10
- "stride": 2
11
  }
 
1
  {
2
+ "do_normalize": true,
3
+ "feature_extractor_type": "Wav2Vec2FeatureExtractor",
4
+ "feature_size": 1,
5
  "padding_side": "right",
6
+ "padding_value": 0.0,
7
+ "processor_class": "Wav2Vec2Processor",
8
  "return_attention_mask": true,
9
+ "sampling_rate": 16000
 
10
  }
test_predictions.csv ADDED
@@ -0,0 +1,451 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ audio,text
2
+ test_001.wav,তুমি কি খালতাবে?
3
+ test_002.wav,তুমি কি আমাকে কলমরা দেবে?
4
+ test_003.wav,আজকেদুরে রাস্তায় পানি জমছিল।
5
+ test_004.wav,আজ সকালে পটা বিস্টি নামছিল।
6
+ test_005.wav,তুমি কি পড়়ে তুবে?
7
+ test_006.wav,তুমি কি প্দ রবে?
8
+ test_007.wav,আজকে দাগা় মে়গ জমেছে।
9
+ test_008.wav,আমর ছো্ট বই স্কুলে যাে।
10
+ test_009.wav,আমি গান নেখ আেছি।
11
+ test_010.wav,তুমি কি আজ ব্দুর সযে দেকা করেছো?
12
+ test_011.wav,আমুপুরেন নাস্তা স্তে ব্দু করছে।
13
+ test_012.wav,আমি আজ নতুন জুতা কিনেছি।
14
+ test_013.wav,তুমি কি আজ আভিসে যাবে?
15
+ test_014.wav,আমি সকালের নাস্তা ভিম খে়েছি।
16
+ test_015.wav,আজকেদুরে যরি রাস্্তা ভিছিল।
17
+ test_016.wav,আমি বিকেলে আাটে যাে চাই।
18
+ test_017.wav,আমি াগে স্কুলে আজ বিশা নুস্া গবে।
19
+ test_018.wav,আমি বাজার থেে আমনেছি।
20
+ test_019.wav,তুমি কি কনো কবিতা লিখেছো?
21
+ test_020.wav,আমি নতুন পনে লাথে চারজার কিনেছি।
22
+ test_021.wav,তুমি কি আগামকালল ডাকায যাছো?
23
+ test_022.wav,আজ বিকেলে আমরা একসাে গলপ কবে।
24
+ test_023.wav,আমি দুরে গলপ লিখেছি।
25
+ test_024.wav,তুমি কি দুত কাছো?
26
+ test_025.wav,আমি সকালের নাস্তা হিসাবে দুত খেয়েছি।
27
+ test_026.wav,তুমি কি বাত খেযেছো?
28
+ test_027.wav,তুমি কি কভির সাথে বিস্কুট খাবে?
29
+ test_028.wav,তুমি কি নতুন কিতা পড়তে যাো?
30
+ test_029.wav,আজ বিকেলে সবজির দাম পতে়ছে।
31
+ test_030.wav,আমা সুট বাই স্কুলে যাে।
32
+ test_031.wav,তুমি কি পু ্ানেছো?
33
+ test_032.wav,তুমি কি পানি খেযযে ছো?
34
+ test_033.wav,আমি বই লেখতে বেছি।
35
+ test_034.wav,আজ েরাকতে বিস্ি আবে।
36
+ test_035.wav,আজ ে আকাসে রত পডেছে।
37
+ test_036.wav,আমি সকালের নাস্তা গকরতে যাছি।
38
+ test_037.wav,তুমি কি প্রপিতি স্দা যজা মকছো?
39
+ test_038.wav,আমি বিকেলে চা খেতে বেছিাম।
40
+ test_039.wav,তুমি কি এখন বযস্ত আছো?
41
+ test_040.wav,তুমি কি গান শুনাকবো?
42
+ test_041.wav,আজকে জা গরম ছিল।
43
+ test_042.wav,তুমি কি আমাকে সাযজয করবে?
44
+ test_043.wav,আজ দুরে খাতের ভল্লাগখছে।
45
+ test_044.wav,আজকেদুরে য বিস্ি হ়েছে।
46
+ test_045.wav,আমি আজ মাখকের সাথে আনা করেছি।
47
+ test_046.wav,আজ সকালে রাস্তাযয নক কাদে হছে।
48
+ test_047.wav,তুমি কি হাটে যাবে?
49
+ test_048.wav,আজ েসকালে সর্যটা ুনক শু্দ।
50
+ test_049.wav,তুমি কি এ চা খেবে?
51
+ test_050.wav,আজ েদুরে কবদে বি্টি হেছিল।
52
+ test_051.wav,তুমি কি নোন নদর ারে গি়েছো?
53
+ test_052.wav,আমি বিকেলে খটতে যাই।
54
+ test_053.wav,আজ রাতে আমার টিভি দেখেছে।
55
+ test_054.wav,তুমি কি বলে গলকা াকে় যাযছো?
56
+ test_055.wav,আজ ে স্কুলে না্টা কেছে।
57
+ test_056.wav,আজ বিকেলে আমেরা শুরু সগে লবে।
58
+ test_057.wav,তুমি কি আচা কাছো?
59
+ test_058.wav,আমি নতুন মোবাইল কিেছি।
60
+ test_059.wav,আমি মার ব্দুতের সাথে খেলছি।
61
+ test_060.wav,আজ সকালে সটাযত করানে পানিসছিল।
62
+ test_061.wav,আমি আ বাজার একতে পল কিেছি।
63
+ test_062.wav,আজকে স্কুলে ক্রিটা নু্টান হ়েছে।
64
+ test_063.wav,আজ বিকেলে ক্লাসে পরক্া নেযা হযেছে।
65
+ test_064.wav,আমি পাজারে দিস্কুত গিযছি।
66
+ test_065.wav,তুমি কি আ ছবি দেখতে যাবে?
67
+ test_066.wav,আজ আমার খুব বালো লা গিেছে।
68
+ test_067.wav,আজ স্কুলে খেলা হেছে।
69
+ test_068.wav,আজ আকাসে মে জামে আছে।
70
+ test_069.wav,আজকেরদালে লে গর প ববে।
71
+ test_070.wav,তুমি কি এখনো চান খেতে চাো?
72
+ test_071.wav,আজ াতে পডনিমা হইবে।
73
+ test_072.wav,আজ বিকেলে রাস্তাযয নেক জামেছিল।
74
+ test_073.wav,আমি সকালের নাস্তা করে স্কুলে গ়েছি।
75
+ test_074.wav,তুমি কি ক্লাসে গিযেছো?
76
+ test_075.wav,আজ সকলে বাতাস্া় খা্াদা গিললেছে।
77
+ test_076.wav,আুমি আি কনো হাটায সরিনেছিম।
78
+ test_077.wav,তুমি কি আজ ছিবি দেখতে যাবে?
79
+ test_078.wav,আজ রাতেে চাদুরছে।
80
+ test_079.wav,আজ বিকেলে করিকে খেলা শেশো।
81
+ test_080.wav,আজ রাতে পারা যালো।
82
+ test_081.wav,আমি মাকে রান্া সাজ পরেছি।
83
+ test_082.wav,আজ আমার খুব ভালো লাগে।
84
+ test_083.wav,আমি দুরে খা শিশি লিখেছি।
85
+ test_084.wav,তুমি কি গান বাজাো?
86
+ test_085.wav,আমর গলপ নতে ভললাগে।
87
+ test_086.wav,তুমি কি এখন পা দানো?
88
+ test_087.wav,আমি নতুন পের যারজার কিনেছি।
89
+ test_088.wav,আজ ে মাটে খেলা ুনেছে।
90
+ test_089.wav,তুমি কি আজ নতু কাপ করছো?
91
+ test_090.wav,আমি নতুন গান শুনেছি।
92
+ test_091.wav,আমি সকাালে খবে পরেছি।
93
+ test_092.wav,তুমি কি ভাত খেছো?
94
+ test_093.wav,আজ রাতে সবাই একসয খাযা শে্ কর আছে।
95
+ test_094.wav,আজ বাজারে মাছছে দাম নে।
96
+ test_095.wav,তুমি কি মোবাইল চাজ দিযছো?
97
+ test_096.wav,তুমি কি আজা ুটবল খেলবে?
98
+ test_097.wav,আজকাসে আজ বাসজ করে আল।
99
+ test_098.wav,আজকে আলোচনায শিলপলা গরু্ বািল।
100
+ test_099.wav,আমি বাজার থেকে আম কিননেছি।
101
+ test_100.wav,তুমি কি আজ স্কুলে ুপশিত পেছো?
102
+ test_101.wav,আজকেরেোদে গরমটা শনিদছে।
103
+ test_102.wav,আমি হাতেে ুরজ দেখেছি।
104
+ test_103.wav,আজকেরর বায আহায খাচা় শমন।
105
+ test_104.wav,আজ রাতে আকাসে তারাজ লম পরছে।
106
+ test_105.wav,আমি দুে দুত খেয়েছি।
107
+ test_106.wav,তুমি কি গান কবে যানো?
108
+ test_107.wav,তুমি কি আজ ব্ু সথযে দেকা করেছো?
109
+ test_108.wav,আমি সকালে চিটি লিখেছি।
110
+ test_109.wav,আমি া ছটে বাই স্কুলে যাছি।
111
+ test_110.wav,আজ রাস্তার মাদে ভিেছে।
112
+ test_111.wav,আজ বিকেলে রাস্তা হনে গযছিল।
113
+ test_112.wav,আজকে প্রতিবেদনে অনতির ক াকবে।
114
+ test_113.wav,আজ েদুরে গরম ডেছে।
115
+ test_114.wav,আমিগ গরামে বাতাস খুবি শা্তই।
116
+ test_115.wav,তুমি কি আমাকে পানি দেতে পাবে?
117
+ test_116.wav,আমি জমা বনেক ভালল লাখছি।
118
+ test_117.wav,আমি নতুন বই দোকান দেখেছি।
119
+ test_118.wav,আজ াতে শাটা বাতাস সাবে।
120
+ test_119.wav,তুমি কি গাইগাসে পবে?
121
+ test_120.wav,আমি গান শুনতে ভালোবাি।
122
+ test_121.wav,আকাসে আজ মে জমে আছে।
123
+ test_122.wav,তুমি কি এখন আমাকে ডাখতে পারবে?
124
+ test_123.wav,আজ কবাই সি্যান্ নাম হ়েছে।
125
+ test_124.wav,আজকে রাতে চাটা আকারে গল।
126
+ test_125.wav,আজকেরাস্তায খবে যানজ ভেছে।
127
+ test_126.wav,আজ বিকেলে রাস্তা ম ভিজে গেছে।
128
+ test_127.wav,আমারে স্কুলে তজ ব় অনুস্ান আছি।
129
+ test_128.wav,আকাসে আজ ���ে জমিে আছে।
130
+ test_129.wav,তুমি কি খ কসাথে গলপ করেছো?
131
+ test_130.wav,তুমি কি গান শুনছো?
132
+ test_131.wav,আজ বিকেলে কলাস পরক্টা নেয খাবে।
133
+ test_132.wav,আমি সকালে দুত খেয়েছি।
134
+ test_133.wav,আজ রাস্তায় অনেক যানবহুন আছে।
135
+ test_134.wav,আমি হা তেে নতুন ব্দু পেছি।
136
+ test_135.wav,আমি সকালে হাটা খুব আনদ পাছি।
137
+ test_136.wav,আমি দুরে বা যা খে়েছি।
138
+ test_137.wav,আজ েসকালে পাখেরা গান গাইেছিল।
139
+ test_138.wav,আজ তিস ক্লাসে দলো ছনাহে।
140
+ test_139.wav,আমার গরামের বাতা শে শিত।
141
+ test_140.wav,আমি নাস্তা বাদে প়ে পযা দেখা করেছি।
142
+ test_141.wav,আজ বিকেলে রাস্তায় দুরগরনা গেছে।
143
+ test_142.wav,তুমি কি আজ খিসে যাবে?
144
+ test_143.wav,আমি ব্দুর পরে সথে খেলা খেলেছি।
145
+ test_144.wav,আমরা সবাই একসাথে হাটতে চাছি।
146
+ test_145.wav,আজকেরাস্তায় বদ গা়য আছে।
147
+ test_146.wav,আজ সকালে পানিতে সরক্টা ভিযা বে।
148
+ test_147.wav,আজকে ক্লাছে সময় বস্তি যছিল।
149
+ test_148.wav,তুমি কি আমাকে পানি দিতে পারবে?
150
+ test_149.wav,তুমি কি আগাললকা আতে পাবে?
151
+ test_150.wav,আজ বিকেলে মাটে বাারে খেলতানেখ সবাই হাসে নিখছিল।
152
+ test_151.wav,আমি আজ বাজারতে খল কিনেছি।
153
+ test_152.wav,আমি বই প়তে ভালোবাসি।
154
+ test_153.wav,আমি নতুন গান শুনতে চা।
155
+ test_154.wav,তুমি কি খনো গরামে গি নদর পাছো?
156
+ test_155.wav,আমি বিকেলে ব্দুদে সাথে গলপ করেছি।
157
+ test_156.wav,তুমি কি বই প়গসেছো?
158
+ test_157.wav,তুমি কি বই াররবে?
159
+ test_158.wav,তুমি কি িটিযা পড়ে পেেছো?
160
+ test_159.wav,আজ বিকেলে রাস্তায ে ভিছিল।
161
+ test_160.wav,তুমি কি কনো পাহা়ে গিেছো?
162
+ test_161.wav,আমি কি চালে খতে যাো।
163
+ test_162.wav,আজ সকালে রাস্তাযযহ দু বডানা করছে।
164
+ test_163.wav,আমরা সবাই মাটখে খেলতে যাছি।
165
+ test_164.wav,তুমি কি আমাকে বই়ের দোকানে লিে যাবে?
166
+ test_165.wav,আমি সকালে দু খেগেছি।
167
+ test_166.wav,আমি ব্দুরে সাথে খেলা খেলেছি।
168
+ test_167.wav,আজ বিকেলে কলাসে পরক্া নেমা খবে।
169
+ test_168.wav,আমি সপজরে নাস্তা খেি।
170
+ test_169.wav,আজ েসকালে সবাই দেরিতে আখেছে।
171
+ test_170.wav,আমি দুরে গলপলে খাছাম।
172
+ test_171.wav,তুমি কি মাকে কলমটা দেবে?
173
+ test_172.wav,আমি সকালের নাস্ত ভিছে ভুদিম খে়েছিলাম।
174
+ test_173.wav,তুমি কি আমাকে কলমটা দেবে?
175
+ test_174.wav,আমি খায় শনির প বই প়েছি।
176
+ test_175.wav,আমি াতেনি মাছতে খেতে লালোাম।
177
+ test_176.wav,তুমি কি বই়যের দোকানে গিেছলো?
178
+ test_177.wav,আমি বিকযাকার নাস্তা খেতে ভুলে গেছি।
179
+ test_178.wav,আজকেরদুরে ভাত খেয়েছে।
180
+ test_179.wav,আজ সকালে ব্্িতিরাস্তা পুরে বভিজেেছে।
181
+ test_180.wav,তুমি কি বই আনবে?
182
+ test_181.wav,তুমি কি লিবসান দেখেছো?
183
+ test_182.wav,তুমি কি গান কল দাো?
184
+ test_183.wav,আমি আখকতা গলপে বই লিখেছি।
185
+ test_184.wav,আমি দুররে মাছ খেয়েছি।
186
+ test_185.wav,আমি দুরে খরনা যির খনেছি।
187
+ test_186.wav,আজকের আকাসে সযামে বিসে যাছে।
188
+ test_187.wav,আমজাটেস্তা ে ব্দু কর দে।
189
+ test_188.wav,তজ জাটে ্ত�� ্টে ব্দকরে দাে।
190
+ test_189.wav,আজ সকালে ময স্কুলে দেরি করেছে।
191
+ test_190.wav,আজ জাতটে শ্টা হববে।
192
+ test_191.wav,আজকেদুরে অ গরম ছিল।
193
+ test_192.wav,তুমি কি আমাকে কলমটা দেবে?
194
+ test_193.wav,আমি সকালে নাস্তা খেতে বুলেগিছনশিটে পাি।
195
+ test_194.wav,আজ তিআস ক্লাসে মকতি যর্া শখনো।
196
+ test_195.wav,আমি আজ বাজার থেকে খল কিনেছি।
197
+ test_196.wav,আজ বাজারে আনজে দাম বেেছি।
198
+ test_197.wav,তুমি কি আজ বই কিননেছো?
199
+ test_198.wav,তুমি কি আজ মাক দেক আসছো?
200
+ test_199.wav,আমি দুরে খল খে়ে খুযি ়েছি।
201
+ test_200.wav,আজকে আসমা ভাগে ডাকাবে।
202
+ test_201.wav,আজ সকালে আমি বাজারে গি়েছিলাম।
203
+ test_202.wav,আজ েসকালে সুরযটাে সু্দর আিল।
204
+ test_203.wav,আজ দুরে স্কুলে ভি়ে।
205
+ test_204.wav,তুমি কি ডা শুনেছো?
206
+ test_205.wav,আজ ে বাতা শিন্া গালাগে।
207
+ test_206.wav,তুমি কি আমাকে কলমরা দেতছে?
208
+ test_207.wav,আমি গ্রনতাগরে বইো প্রব্দ লিখেছি।
209
+ test_208.wav,আমটা বাে তর গলপ করেছি।
210
+ test_209.wav,আমি বাজার থেকে কলা আনেছি।
211
+ test_210.wav,তুমি কি আমাছজ খেযেছো?
212
+ test_211.wav,আজ মারে খুব ভালো লাখছে।
213
+ test_212.wav,আমি নতুন মোবাইল কিনতে যাতে চাি।
214
+ test_213.wav,আমি গলপপ খনা আসেছিলাম।
215
+ test_214.wav,তুমি কি মোবাইলে চারজে দেবে?
216
+ test_215.wav,আমাটকে পলেরা করিকেট খেলছে।
217
+ test_216.wav,আমি গান লিখতে বইেছি।
218
+ test_217.wav,আমি আ গলপে বই লিখেছি।
219
+ test_218.wav,আমসজ সজম সাাল না পেেছি।
220
+ test_219.wav,আমি আজ নতুন জুতা কিনেছি।
221
+ test_220.wav,তুমিকি এন চা খেতে চাো?
222
+ test_221.wav,তুমি কি আজ টিবি দেখেছো?
223
+ test_222.wav,আমি নতুন বই কনেছি।
224
+ test_223.wav,আজ বিকেলে রাস্তায নে জাম যাছে।
225
+ test_224.wav,আজ আমারেরে স্কুল ব্দবে।
226
+ test_225.wav,তুমি কি এখন আমাকে দেখতে আবে?
227
+ test_226.wav,আজকেদুপুরে বিসশি গছল।
228
+ test_227.wav,আজ রাস্তায় দুর্না গরেছে।
229
+ test_228.wav,আজকেরাআকাস পরিস্কার ছিল।
230
+ test_229.wav,তুমি কি মোবাইলা চারজা দেবে?
231
+ test_230.wav,আজ রাস্তায় যানব শ্দর খেছে।
232
+ test_231.wav,আজকে খাযলে ডালের াত আছে।
233
+ test_232.wav,আজ মাদের কলাসে সিক্ক আেননছে।
234
+ test_233.wav,আজকের আকাস মেগ্লা আছিল।
235
+ test_234.wav,তুমি কি বাইরে যাতে চাো?
236
+ test_235.wav,তুরটপানিতে রাস্তা কেলে বিে গছে?
237
+ test_236.wav,তুমি কি আবই ুমে চেছলো?
238
+ test_237.wav,তুমি কি খনো খায়যা শে করোনো?
239
+ test_238.wav,আমি খাযাদ বই পড খকি খেছি।
240
+ test_239.wav,আমি ব্ুদে সাথে খেরা খেলেছি।
241
+ test_240.wav,আজ সকালে আমি বাজারে গিযেছিলাম।
242
+ test_241.wav,আজ সকালে র্টি হরাসতা ভিজা গেছে।
243
+ test_242.wav,তুমি কি বাসায় আকা ছিলেআছো?
244
+ test_243.wav,তুমি কি পই়েখন ত আমােবে?
245
+ test_244.wav,তুমি কি খাতা়র সময় দু বান করো?
246
+ test_245.wav,আজ েসকালে ম বিস্ি পডরেছে।
247
+ test_246.wav,তুমি কি সমদর ডায দেখেছো?
248
+ test_247.wav,আমি সকালা কলা স গিেছিলাম।
249
+ test_248.wav,আমি আজ নতুন জামা করেছি।
250
+ test_249.wav,আজ ে স্কুলে পরিক্টায হয়েছে।
251
+ test_250.wav,আজ বাজারে দাম প��ররেছে।
252
+ test_251.wav,আজ বিকেলে সবজি দাম ভে়েছে।
253
+ test_252.wav,আজ েসকালে মেক পড়েছে।
254
+ test_253.wav,আমি নতুন মোবাই নিতে চাছি।
255
+ test_254.wav,আজ েসকলে আটা মাটে খেলছিল।
256
+ test_255.wav,তুমি কি নতুন বই পড়তে় যাো?
257
+ test_256.wav,তুমি কি এখনোে বই প়বে?
258
+ test_257.wav,তুমি কি হাসতায চিযো?
259
+ test_258.wav,তুমি কি কনো পাাড়ে গিেছো?
260
+ test_259.wav,তুমি কি চিটিটা পড়়েনত পাবে?
261
+ test_260.wav,আজ বিকেেলে খমরা খাতে যাবো।
262
+ test_261.wav,তুমি কি এখনি শু যাছো?
263
+ test_262.wav,তুমি কি এখনো গুময তেেছো?
264
+ test_263.wav,আমি বই পড়তে প়তে গান শুনছিলাম।
265
+ test_264.wav,তুমি কি প্রিতি স্দর জাম মকো?
266
+ test_265.wav,আজ ক্লাসে নতুন পা শখাছে।
267
+ test_266.wav,আজকেরদুরে খেভি গরম ছিল।
268
+ test_267.wav,আজকেরাস্তায় যাম ছিল।
269
+ test_268.wav,আমি আজজ মালে সাদে রান েছি।
270
+ test_269.wav,আমি সকালে আমিে বাজারে দি়েছিাম।
271
+ test_270.wav,আজ মাগে দিনা ছিল।
272
+ test_271.wav,আজ বিকেলে কলাসে পরিক্শিনেমা হবে।
273
+ test_272.wav,আমি এখন টিভিতে খবর দেখেছি।
274
+ test_273.wav,আমি আজ নতুন জামা প়েছি।
275
+ test_274.wav,আজ প্রতিবেদন শু্তুনর কতা ছে।
276
+ test_275.wav,আজকেরাস্তায় যত যাম হেছে।
277
+ test_276.wav,আমি দুররে ভাত খে়েছি।
278
+ test_277.wav,তুমি কি গা শুনো দাো?
279
+ test_278.wav,আজকে রইদে শনা গরম াগে।
280
+ test_279.wav,তুমি কি কখনো পাা়ে গিেছো?
281
+ test_280.wav,আজ েআাটে ম্া ভিে।
282
+ test_281.wav,আমি নতু গান শুনেছি।
283
+ test_282.wav,আজ দুরে বভ্টি হেছে।
284
+ test_283.wav,তুমি কি এখনো গান শুননডো?
285
+ test_284.wav,আমি মা গরাননাত সাযয করেছিম।
286
+ test_285.wav,তুমি কি খবই পডরেছো?
287
+ test_286.wav,তুমি কি কলম দেবে?
288
+ test_287.wav,আমরা সবাই আকসাথে হাটতে যাখছি।
289
+ test_288.wav,তুমি কি কখনো কবিতা লিখেছো?
290
+ test_289.wav,আজ সকালে রাস্তাযকটা দুর না করছে।
291
+ test_290.wav,আমরা কলা ক্সাথে সিনেমা দেখবে।
292
+ test_291.wav,আমি দুরে খলে রস খে়েছি।
293
+ test_292.wav,তুমি কি এ খুমছো?
294
+ test_293.wav,আজ রদু গরম পরেছে।
295
+ test_294.wav,তুমি কি এখখনো স্ ি়েছো?
296
+ test_295.wav,আজ বিকেলে ক্লাসে পরক্টা নেযা খবে।
297
+ test_296.wav,আজ জাতে থারা পডেছে।
298
+ test_297.wav,তুমি কি মোবাইটা চাজে বসযেছো?
299
+ test_298.wav,তুমি কি বাসাকা চাো?
300
+ test_299.wav,আজ েসকালে বাজারে গেছিলম।
301
+ test_300.wav,তুমি কি কখখন নদর ারে গিেছলো?
302
+ test_301.wav,তুমি কি এখন চা খেতে চাো?
303
+ test_302.wav,আজ রাস্তায় মা যান জট েছে।
304
+ test_303.wav,আমি সকালে হাটতেম গিযেছিলাম।
305
+ test_304.wav,আমি হাতেে নতুন বন্দু পাছি।
306
+ test_305.wav,আমি দুরে বই পড়়ে সময় কাটা খেছি।
307
+ test_306.wav,আমরা সবাই একসাথে হাটে তাযাছি।
308
+ test_307.wav,আজ সকালে আমি বাজারে গি়েছিলম।
309
+ test_308.wav,আজ বিকেলে স়টায ম যাম যছিল।
310
+ test_309.wav,তুমি কি ন পাহারে গিযেছিলো?
311
+ test_310.wav,তুমি কি নতুবইম পড়তে চাো?
312
+ test_311.wav,আজ্্কর পানিতে রাস্তা ভিজে গিেছে।
313
+ test_312.wav,তুমি কি খনন কবিতা লিখেছো?
314
+ test_313.wav,আজকে রাইতে যলম করছে।
315
+ test_314.wav,আজকে খাব���রে দাল পাতে।
316
+ test_315.wav,তুমি কি আমাকে নতুন বই আনবে?
317
+ test_316.wav,তুমি কি পকরে সাতযে বিস্কুট খাবে?
318
+ test_317.wav,আমি দুরে চা খে়য়েি।
319
+ test_318.wav,তুমি কি আ সিনেমা দেখতে যাবে?
320
+ test_319.wav,তুমি কি নতুন গান শুনছো?
321
+ test_320.wav,আমি আ নতুন মোবাইল কিনতে যাছি।
322
+ test_321.wav,আজ েসকালে ম বাজারে গিশেছিল।
323
+ test_322.wav,আজরির পানিতে হাটা ভিজে গেছে।
324
+ test_323.wav,আমাটদে যজালাললিকে খেললো েছি।
325
+ test_324.wav,তুমি কি পুটবল কেলা খেলেছো?
326
+ test_325.wav,তুমি কি কাকের াকাজা বছো?
327
+ test_326.wav,আমি নতুন জামা পডরেছি।
328
+ test_327.wav,আজ আমরে ক্লাসে চাট েছিে।
329
+ test_328.wav,তুমি কি পরক্া পস্ুতিনিা যাছো?
330
+ test_329.wav,আমি াটা গলপে বম লিখেছি।
331
+ test_330.wav,তুমি কি খায়দে শেস করেছো?
332
+ test_331.wav,আজ রাতে তিতির গর যনয খাবাবে।
333
+ test_332.wav,আজ েসকালে সবাই দেরিতে আছিল।
334
+ test_333.wav,তুমি কি মাকে পানি দেতা পা়বে?
335
+ test_334.wav,আমি আজজ দুটে মাছ খে়েছি।
336
+ test_335.wav,তুমি কি বই়ের দোকানে কিেছিলো?
337
+ test_336.wav,আমি এখ টিভিে খব দেখছি।
338
+ test_337.wav,আজ েসকালে সবাই দেরিত আখেছে।
339
+ test_338.wav,তুমি কি নতুন বই পড়ে চাো?
340
+ test_339.wav,তুমি কি বাইিতে আকবে?
341
+ test_340.wav,তুমিকি কবি সাথে বিস্কু খাবে?
342
+ test_341.wav,তুমি কি কখন টিন পরম করছো?
343
+ test_342.wav,আমি নতুন মোবাইল কিনতে যাছি।
344
+ test_343.wav,আমি নতুন খদে চাজার কিনেছি।
345
+ test_344.wav,তুমি কি মাকে পানি দিতে পাবে?
346
+ test_345.wav,আজ বাজারে গিযযেিম।
347
+ test_346.wav,আজ সকালে রাস্তায় দুরটনা কছে।
348
+ test_347.wav,আমি বিকলে বই পড়েছি।
349
+ test_348.wav,তুমি কি বই়র দোকানে গি়েছো?
350
+ test_349.wav,আজ বাোলে ক্লাসে পরক্া নাা বে।
351
+ test_350.wav,তুমি কি গলপদে বই পড়তে ভালোবাসো?
352
+ test_351.wav,আজকে গাটায শেযে আম হেছে।
353
+ test_352.wav,তুমি কি ছিটিটা পড়়ে শুনাবে?
354
+ test_353.wav,তুমি কি এখখন আমাকে দেখতে আবে?
355
+ test_354.wav,আমরা সবাই একসাথে হাটতে যাছি।
356
+ test_355.wav,আমি সকালের নাস্তা সলেগযে দুদ খে়েছিাম।
357
+ test_356.wav,তুমি কি রাাটে যাবে?
358
+ test_357.wav,তজদজারট আস্ত স্্ে ব্দ করে দাে।
359
+ test_358.wav,তুমি কি আমাক কমনাটে দেবে?
360
+ test_359.wav,আজ ে রাস্তায় যাম ছে।
361
+ test_360.wav,আমি দুরে গান শুতে বেছিলাম।
362
+ test_361.wav,আজ বিকেলে ম বাজারে গি়েছিলম।
363
+ test_362.wav,আমি দুরে বন্দুদরা রাদে খেলেছি।
364
+ test_363.wav,তুমি কি নতুন প্রকলবই শুরু করেছো?
365
+ test_364.wav,আমি বইয়ে দোান গিয়েছলাম।
366
+ test_365.wav,আজ বিকেলে ক্লাসে পর্ানেবে।
367
+ test_366.wav,আমি টিভিতি খবর দেখতে পরছ্ কি।
368
+ test_367.wav,আমরা সবাই মাটে খেলতে যাছি।
369
+ test_368.wav,আমি সকালে সবি দিলনেছি।
370
+ test_369.wav,তুমি কি নতুন বই পডিতে চাো?
371
+ test_370.wav,আমি সকালে খব পডরেছি।
372
+ test_371.wav,আমি বিকেলে ব্দুতে সাদে গলপ করেছি।
373
+ test_372.wav,আজ আলো চানায পটিবেসরক্ারুপাবে।
374
+ test_373.wav,আজ বিকেলে মো শুু পাবে।
375
+ test_374.wav,আমি আজ বাজার থেকে পল কিননেছি।
376
+ test_375.wav,আমি বই পড়তে পরছ্দ কি।
377
+ test_376.wav,আমছরটবাই স্কুলে যাে।
378
+ test_377.wav,তুমি কি মোবাইলে সছবি তুলতে ভালোবাবে?
379
+ test_378.wav,আমি সকালে গ্তে দরি করে পেছি।
380
+ test_379.wav,আজ দুরলে গরম পড়েছিল।
381
+ test_380.wav,আমি নতুন মোবাল কিনিতে যাছি।
382
+ test_381.wav,আমারে স্কুলে স্ ব় অনু্্ান আেছি।
383
+ test_382.wav,তুমি কি এখখন চা খেযবে?
384
+ test_383.wav,তুমি কি আজ গান ুনতা বইেছো?
385
+ test_384.wav,আজকে আবাহহনক্শানডাে।
386
+ test_385.wav,তুমি কি সিনেমা দেখেছো?
387
+ test_386.wav,আজকে খাবারে ডযাল ভাত ছে।
388
+ test_387.wav,আমি সকালালে নাস্তা খেতে বইলেগেছি।
389
+ test_388.wav,আজকেরদুরে গর পরচছ্া গরমছিল।
390
+ test_389.wav,আমি পরব্দ লখা বাকা মনছি।
391
+ test_390.wav,আমি দুরে মাছ দ়ে ভাত খেেছি।
392
+ test_391.wav,আজ েসকালে রাস্তয খছিন রেছে।
393
+ test_392.wav,আমি নতুন মোবাইলে শসাজার কিনেছি।
394
+ test_393.wav,তুমি কি ছবি তুননেছো?
395
+ test_394.wav,আমি ব্দুতে সাথে খেলা খেলসম।
396
+ test_395.wav,তুমি কি মোবাইলিন শারজে দেবে?
397
+ test_396.wav,আমদজারে স্তে আস্ে ব্করে দাে।
398
+ test_397.wav,আমি টিভিত খবর যাতে পছ্ কি।
399
+ test_398.wav,আমি সকালে নতুন জামা প়ে বাইেেছিলাম।
400
+ test_399.wav,তমি কিনতুন কা়র কিনেছি?
401
+ test_400.wav,আমি দুপর পলে পায খ়েছি।
402
+ test_401.wav,আজগতাাজে আটা পরি ব নদর হা়ে বইেছিলম।
403
+ test_402.wav,আমবা় বিসিবিতালে ্ুটে চাল প়ি।
404
+ test_403.wav,তুমি কি গদেসে মতিযুদর দ যানছো?
405
+ test_404.wav,আমতা সক্রবে বলে আ দাদেরতেেছে।
406
+ test_405.wav,আমসিতেসা গ্রামের মাটে সরিচে ভুপে।
407
+ test_406.wav,আমি্ ছোরব পতিদিন বাগানে পকুলে য নি।
408
+ test_407.wav,তুমি কি নো পাহা়ে া় বডরম করেছো?
409
+ test_408.wav,আমগতমাশে আ্রা কজবাজারে সমুদর দেখতে গিেছিলম।
410
+ test_409.wav,আমিরমা়ে পতিদিন ব়ে গমে শটিন আমাজারি।
411
+ test_410.wav,আজবালে জ বস্টি দেতে মার শনেক বাললাে।
412
+ test_411.wav,তুমি কি বি্করননি মিত পর্ কলি সবলেতাো?
413
+ test_412.wav,আমরাবাপরতি সতাআতে রে পাে মিকছে।
414
+ test_413.wav,তুমি লেবসে বা নতুন জামা পে মলেযছে।
415
+ test_414.wav,আমাপ্র মাসটা সতিদিন ক্লাসে ভালোরে য।
416
+ test_415.wav,তুমি কি রাত আকাসে তারা দেখতে পন্দ কো?
417
+ test_416.wav,আম্দাা পতিদিন ভাজে ভার্দা বই চা খেে।
418
+ test_417.wav,আমবতালরাতে আমিকা সু্ সপন দেখেছিলম।
419
+ test_418.wav,তুমি কি জাননিবা্লে বাসা ােসবদেো?
420
+ test_419.wav,আজতেবাজা শি্ল আ্রানা বাতে যাে।
421
+ test_420.wav,আমি ব্দু খুব বালা গিতে বাজাতে যাই।
422
+ test_421.wav,তুমি কি সুরযত সময় আকাসের্া্ করেছো?
423
+ test_422.wav,আমি নানিচটালে রুবতা গলপ শুনি।
424
+ test_423.wav,আজগতসতা আ্রা দাত ব় শনু্্া খাতাবিতর কেছি।
425
+ test_424.wav,তুমি কি পরিবে় ্রকটা প্ত বুছো?
426
+ test_425.wav,আমি মামাজ দ্া পিশ জে চা করি।
427
+ test_426.wav,তুমি কি আনমিত লারতেকে বই পড়ো?
428
+ test_427.wav,আমে শিকট্া সবস আর স্াকে শিে।
429
+ test_428.wav,আজাে আমরা নকাদি নদর পডরেগিেছিলম।
430
+ test_429.wav,তুমি কি গনো খা়া লাখে শুজর দেখেছো?
431
+ test_430.wav,আমরজাসে থবিদেসে খা মাছজমাজ আস ুরি।
432
+ test_431.wav,তুমি কি ন প্রকরযনে ক্ি প্ম করেছো?
433
+ test_432.wav,আমসকব সা্াে পরতিন জক বযম কে।
434
+ test_433.wav,আজকরবচার আমরা স্দর বনে বাকতা চে্টা করছিল।
435
+ test_434.wav,তুমি কি বালে সাতে পনো লিখকে নানজাো?
436
+ test_435.wav,আমার খেলনেক বালোাসলরে আরস্দে যা বাবে।
437
+ test_436.wav,তুমি কি নোকর সিক্া যিম সবজি করত পুনো?
438
+ test_437.wav,আমিদেব্দুরমল আমরা পরতিমাে া বিক্র প করমসসিকে।
439
+ test_438.wav,আজকাগা আমরে চাদে বসি পমা যা দেখছিলম।
440
+ test_439.wav,তুমি কি জনোরবি্দর নাক নব পর শেরবছিলো?
441
+ test_440.wav,আমিরবই নেজ দাকতে আ ্রামে মােে সবাকে।
442
+ test_441.wav,তুমি কি খালাদলনমিতকরে শ শুস্ত কো?
443
+ test_442.wav,আমিপ্রতিবশি খজ ব়া মােজিনি সা় সানকি।
444
+ test_443.wav,আমগতমাসিন আমরা যাতে করে গিেছিলাম।
445
+ test_444.wav,তুমি কি বাতে পারেজে পরজিকটেআমাজে ব্র পাটে দেছো?
446
+ test_445.wav,আমিবই পরতিন সকারকাে দরা ি।
447
+ test_446.wav,তুমি কি খনোতপতসিস্তা পরমকরো তি সমপকগিযু যনছো?
448
+ test_447.wav,আমি াে বাে খুব স্দর আার বস াসে করই।
449
+ test_448.wav,আমগতালকাগলাখে কটা সা্িদি কন্টান েছিল।
450
+ test_449.wav,তুমি কি তুরবুলেে শিক্ানে সম্াআকে যাে াো?
451
+ test_450.wav,আজ সাস্তেবাইবিদেশে পাা স্কুলা শিেছে।
tokenizer_config.json CHANGED
@@ -1,6 +1,6 @@
1
  {
2
  "added_tokens_decoder": {
3
- "55": {
4
  "content": "[UNK]",
5
  "lstrip": true,
6
  "normalized": false,
@@ -8,7 +8,7 @@
8
  "single_word": false,
9
  "special": false
10
  },
11
- "56": {
12
  "content": "[PAD]",
13
  "lstrip": true,
14
  "normalized": false,
@@ -16,7 +16,7 @@
16
  "single_word": false,
17
  "special": false
18
  },
19
- "57": {
20
  "content": "<s>",
21
  "lstrip": false,
22
  "normalized": false,
@@ -24,7 +24,7 @@
24
  "single_word": false,
25
  "special": true
26
  },
27
- "58": {
28
  "content": "</s>",
29
  "lstrip": false,
30
  "normalized": false,
@@ -40,7 +40,7 @@
40
  "extra_special_tokens": {},
41
  "model_max_length": 1000000000000000019884624838656,
42
  "pad_token": "[PAD]",
43
- "processor_class": "Wav2Vec2BertProcessor",
44
  "replace_word_delimiter_char": " ",
45
  "target_lang": null,
46
  "tokenizer_class": "Wav2Vec2CTCTokenizer",
 
1
  {
2
  "added_tokens_decoder": {
3
+ "57": {
4
  "content": "[UNK]",
5
  "lstrip": true,
6
  "normalized": false,
 
8
  "single_word": false,
9
  "special": false
10
  },
11
+ "58": {
12
  "content": "[PAD]",
13
  "lstrip": true,
14
  "normalized": false,
 
16
  "single_word": false,
17
  "special": false
18
  },
19
+ "59": {
20
  "content": "<s>",
21
  "lstrip": false,
22
  "normalized": false,
 
24
  "single_word": false,
25
  "special": true
26
  },
27
+ "60": {
28
  "content": "</s>",
29
  "lstrip": false,
30
  "normalized": false,
 
40
  "extra_special_tokens": {},
41
  "model_max_length": 1000000000000000019884624838656,
42
  "pad_token": "[PAD]",
43
+ "processor_class": "Wav2Vec2Processor",
44
  "replace_word_delimiter_char": " ",
45
  "target_lang": null,
46
  "tokenizer_class": "Wav2Vec2CTCTokenizer",
train_results.json ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "epoch": 30.0,
3
+ "total_flos": 1.8456230162149265e+19,
4
+ "train_loss": 3.165084928395797,
5
+ "train_runtime": 15598.205,
6
+ "train_samples_per_second": 6.024,
7
+ "train_steps_per_second": 0.188
8
+ }
trainer_state.json ADDED
@@ -0,0 +1,388 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "best_global_step": 2600,
3
+ "best_metric": 0.5833333333333334,
4
+ "best_model_checkpoint": "/kaggle/working/wav2vec2-bengali-finetuned/checkpoint-2400",
5
+ "epoch": 30.0,
6
+ "eval_steps": 200,
7
+ "global_step": 2940,
8
+ "is_hyper_param_search": false,
9
+ "is_local_process_zero": true,
10
+ "is_world_process_zero": true,
11
+ "log_history": [
12
+ {
13
+ "epoch": 0.01020408163265306,
14
+ "grad_norm": 1263584.0,
15
+ "learning_rate": 0.0,
16
+ "loss": 25.6736,
17
+ "step": 1
18
+ },
19
+ {
20
+ "epoch": 1.0204081632653061,
21
+ "grad_norm": 3843419.25,
22
+ "learning_rate": 9.900000000000002e-06,
23
+ "loss": 23.811,
24
+ "step": 100
25
+ },
26
+ {
27
+ "epoch": 2.0408163265306123,
28
+ "grad_norm": 1233849.75,
29
+ "learning_rate": 1.9900000000000003e-05,
30
+ "loss": 13.9598,
31
+ "step": 200
32
+ },
33
+ {
34
+ "epoch": 2.0408163265306123,
35
+ "eval_loss": 5.328553199768066,
36
+ "eval_runtime": 11.0357,
37
+ "eval_samples_per_second": 14.951,
38
+ "eval_steps_per_second": 1.903,
39
+ "eval_wer": 1.0,
40
+ "step": 200
41
+ },
42
+ {
43
+ "epoch": 3.061224489795918,
44
+ "grad_norm": 101215.4375,
45
+ "learning_rate": 2.9900000000000002e-05,
46
+ "loss": 4.6042,
47
+ "step": 300
48
+ },
49
+ {
50
+ "epoch": 4.081632653061225,
51
+ "grad_norm": 204473.296875,
52
+ "learning_rate": 3.99e-05,
53
+ "loss": 3.5131,
54
+ "step": 400
55
+ },
56
+ {
57
+ "epoch": 4.081632653061225,
58
+ "eval_loss": 3.380544900894165,
59
+ "eval_runtime": 10.5068,
60
+ "eval_samples_per_second": 15.704,
61
+ "eval_steps_per_second": 1.999,
62
+ "eval_wer": 1.0,
63
+ "step": 400
64
+ },
65
+ {
66
+ "epoch": 5.1020408163265305,
67
+ "grad_norm": 106750.3828125,
68
+ "learning_rate": 4.99e-05,
69
+ "loss": 3.2448,
70
+ "step": 500
71
+ },
72
+ {
73
+ "epoch": 6.122448979591836,
74
+ "grad_norm": 56899.28125,
75
+ "learning_rate": 4.7971311475409835e-05,
76
+ "loss": 2.9613,
77
+ "step": 600
78
+ },
79
+ {
80
+ "epoch": 6.122448979591836,
81
+ "eval_loss": 2.839696168899536,
82
+ "eval_runtime": 10.5616,
83
+ "eval_samples_per_second": 15.623,
84
+ "eval_steps_per_second": 1.988,
85
+ "eval_wer": 1.0,
86
+ "step": 600
87
+ },
88
+ {
89
+ "epoch": 7.142857142857143,
90
+ "grad_norm": 155864.65625,
91
+ "learning_rate": 4.5922131147540986e-05,
92
+ "loss": 2.8199,
93
+ "step": 700
94
+ },
95
+ {
96
+ "epoch": 8.16326530612245,
97
+ "grad_norm": 75451.0546875,
98
+ "learning_rate": 4.387295081967213e-05,
99
+ "loss": 2.7197,
100
+ "step": 800
101
+ },
102
+ {
103
+ "epoch": 8.16326530612245,
104
+ "eval_loss": 2.606015920639038,
105
+ "eval_runtime": 10.535,
106
+ "eval_samples_per_second": 15.662,
107
+ "eval_steps_per_second": 1.993,
108
+ "eval_wer": 0.8457207207207207,
109
+ "step": 800
110
+ },
111
+ {
112
+ "epoch": 9.183673469387756,
113
+ "grad_norm": 76782.7421875,
114
+ "learning_rate": 4.182377049180328e-05,
115
+ "loss": 2.6389,
116
+ "step": 900
117
+ },
118
+ {
119
+ "epoch": 10.204081632653061,
120
+ "grad_norm": 64796.6171875,
121
+ "learning_rate": 3.977459016393443e-05,
122
+ "loss": 2.5596,
123
+ "step": 1000
124
+ },
125
+ {
126
+ "epoch": 10.204081632653061,
127
+ "eval_loss": 2.4175667762756348,
128
+ "eval_runtime": 10.5336,
129
+ "eval_samples_per_second": 15.664,
130
+ "eval_steps_per_second": 1.994,
131
+ "eval_wer": 0.7815315315315315,
132
+ "step": 1000
133
+ },
134
+ {
135
+ "epoch": 11.224489795918368,
136
+ "grad_norm": 147111.484375,
137
+ "learning_rate": 3.772540983606558e-05,
138
+ "loss": 2.4538,
139
+ "step": 1100
140
+ },
141
+ {
142
+ "epoch": 12.244897959183673,
143
+ "grad_norm": 91618.7890625,
144
+ "learning_rate": 3.5676229508196724e-05,
145
+ "loss": 2.3313,
146
+ "step": 1200
147
+ },
148
+ {
149
+ "epoch": 12.244897959183673,
150
+ "eval_loss": 2.050769805908203,
151
+ "eval_runtime": 10.5394,
152
+ "eval_samples_per_second": 15.656,
153
+ "eval_steps_per_second": 1.993,
154
+ "eval_wer": 0.7792792792792793,
155
+ "step": 1200
156
+ },
157
+ {
158
+ "epoch": 13.26530612244898,
159
+ "grad_norm": 135995.46875,
160
+ "learning_rate": 3.362704918032787e-05,
161
+ "loss": 2.1482,
162
+ "step": 1300
163
+ },
164
+ {
165
+ "epoch": 14.285714285714286,
166
+ "grad_norm": 91693.046875,
167
+ "learning_rate": 3.157786885245902e-05,
168
+ "loss": 1.9715,
169
+ "step": 1400
170
+ },
171
+ {
172
+ "epoch": 14.285714285714286,
173
+ "eval_loss": 1.6378555297851562,
174
+ "eval_runtime": 10.5414,
175
+ "eval_samples_per_second": 15.653,
176
+ "eval_steps_per_second": 1.992,
177
+ "eval_wer": 0.7894144144144144,
178
+ "step": 1400
179
+ },
180
+ {
181
+ "epoch": 15.306122448979592,
182
+ "grad_norm": 106778.4609375,
183
+ "learning_rate": 2.9528688524590165e-05,
184
+ "loss": 1.8192,
185
+ "step": 1500
186
+ },
187
+ {
188
+ "epoch": 16.3265306122449,
189
+ "grad_norm": 93321.4921875,
190
+ "learning_rate": 2.7479508196721317e-05,
191
+ "loss": 1.706,
192
+ "step": 1600
193
+ },
194
+ {
195
+ "epoch": 16.3265306122449,
196
+ "eval_loss": 1.3998359441757202,
197
+ "eval_runtime": 10.5682,
198
+ "eval_samples_per_second": 15.613,
199
+ "eval_steps_per_second": 1.987,
200
+ "eval_wer": 0.7263513513513513,
201
+ "step": 1600
202
+ },
203
+ {
204
+ "epoch": 17.346938775510203,
205
+ "grad_norm": 111310.1328125,
206
+ "learning_rate": 2.5430327868852462e-05,
207
+ "loss": 1.5935,
208
+ "step": 1700
209
+ },
210
+ {
211
+ "epoch": 18.367346938775512,
212
+ "grad_norm": 131049.40625,
213
+ "learning_rate": 2.338114754098361e-05,
214
+ "loss": 1.5412,
215
+ "step": 1800
216
+ },
217
+ {
218
+ "epoch": 18.367346938775512,
219
+ "eval_loss": 1.2491974830627441,
220
+ "eval_runtime": 10.5527,
221
+ "eval_samples_per_second": 15.636,
222
+ "eval_steps_per_second": 1.99,
223
+ "eval_wer": 0.6722972972972973,
224
+ "step": 1800
225
+ },
226
+ {
227
+ "epoch": 19.387755102040817,
228
+ "grad_norm": 150843.8125,
229
+ "learning_rate": 2.1331967213114755e-05,
230
+ "loss": 1.4727,
231
+ "step": 1900
232
+ },
233
+ {
234
+ "epoch": 20.408163265306122,
235
+ "grad_norm": 124916.6015625,
236
+ "learning_rate": 1.9282786885245903e-05,
237
+ "loss": 1.4023,
238
+ "step": 2000
239
+ },
240
+ {
241
+ "epoch": 20.408163265306122,
242
+ "eval_loss": 1.138938546180725,
243
+ "eval_runtime": 10.5847,
244
+ "eval_samples_per_second": 15.589,
245
+ "eval_steps_per_second": 1.984,
246
+ "eval_wer": 0.6317567567567568,
247
+ "step": 2000
248
+ },
249
+ {
250
+ "epoch": 21.428571428571427,
251
+ "grad_norm": 260327.703125,
252
+ "learning_rate": 1.7233606557377048e-05,
253
+ "loss": 1.3585,
254
+ "step": 2100
255
+ },
256
+ {
257
+ "epoch": 22.448979591836736,
258
+ "grad_norm": 156561.15625,
259
+ "learning_rate": 1.5184426229508198e-05,
260
+ "loss": 1.3188,
261
+ "step": 2200
262
+ },
263
+ {
264
+ "epoch": 22.448979591836736,
265
+ "eval_loss": 1.0857497453689575,
266
+ "eval_runtime": 10.5312,
267
+ "eval_samples_per_second": 15.668,
268
+ "eval_steps_per_second": 1.994,
269
+ "eval_wer": 0.6148648648648649,
270
+ "step": 2200
271
+ },
272
+ {
273
+ "epoch": 23.46938775510204,
274
+ "grad_norm": 137688.609375,
275
+ "learning_rate": 1.3135245901639346e-05,
276
+ "loss": 1.2872,
277
+ "step": 2300
278
+ },
279
+ {
280
+ "epoch": 24.489795918367346,
281
+ "grad_norm": 149320.140625,
282
+ "learning_rate": 1.1086065573770492e-05,
283
+ "loss": 1.2707,
284
+ "step": 2400
285
+ },
286
+ {
287
+ "epoch": 24.489795918367346,
288
+ "eval_loss": 1.035390019416809,
289
+ "eval_runtime": 10.5453,
290
+ "eval_samples_per_second": 15.647,
291
+ "eval_steps_per_second": 1.991,
292
+ "eval_wer": 0.6047297297297297,
293
+ "step": 2400
294
+ },
295
+ {
296
+ "epoch": 25.510204081632654,
297
+ "grad_norm": 160687.875,
298
+ "learning_rate": 9.036885245901639e-06,
299
+ "loss": 1.2261,
300
+ "step": 2500
301
+ },
302
+ {
303
+ "epoch": 26.53061224489796,
304
+ "grad_norm": 175958.0625,
305
+ "learning_rate": 6.987704918032788e-06,
306
+ "loss": 1.222,
307
+ "step": 2600
308
+ },
309
+ {
310
+ "epoch": 26.53061224489796,
311
+ "eval_loss": 1.011266827583313,
312
+ "eval_runtime": 10.5487,
313
+ "eval_samples_per_second": 15.642,
314
+ "eval_steps_per_second": 1.991,
315
+ "eval_wer": 0.5833333333333334,
316
+ "step": 2600
317
+ },
318
+ {
319
+ "epoch": 27.551020408163264,
320
+ "grad_norm": 129829.171875,
321
+ "learning_rate": 4.938524590163935e-06,
322
+ "loss": 1.2061,
323
+ "step": 2700
324
+ },
325
+ {
326
+ "epoch": 28.571428571428573,
327
+ "grad_norm": 180224.375,
328
+ "learning_rate": 2.8893442622950824e-06,
329
+ "loss": 1.2084,
330
+ "step": 2800
331
+ },
332
+ {
333
+ "epoch": 28.571428571428573,
334
+ "eval_loss": 0.9903889298439026,
335
+ "eval_runtime": 10.5794,
336
+ "eval_samples_per_second": 15.596,
337
+ "eval_steps_per_second": 1.985,
338
+ "eval_wer": 0.5833333333333334,
339
+ "step": 2800
340
+ },
341
+ {
342
+ "epoch": 29.591836734693878,
343
+ "grad_norm": 153736.046875,
344
+ "learning_rate": 8.401639344262295e-07,
345
+ "loss": 1.1881,
346
+ "step": 2900
347
+ },
348
+ {
349
+ "epoch": 30.0,
350
+ "step": 2940,
351
+ "total_flos": 1.8456230162149265e+19,
352
+ "train_loss": 3.165084928395797,
353
+ "train_runtime": 15598.205,
354
+ "train_samples_per_second": 6.024,
355
+ "train_steps_per_second": 0.188
356
+ }
357
+ ],
358
+ "logging_steps": 100,
359
+ "max_steps": 2940,
360
+ "num_input_tokens_seen": 0,
361
+ "num_train_epochs": 30,
362
+ "save_steps": 400,
363
+ "stateful_callbacks": {
364
+ "EarlyStoppingCallback": {
365
+ "args": {
366
+ "early_stopping_patience": 5,
367
+ "early_stopping_threshold": 0.01
368
+ },
369
+ "attributes": {
370
+ "early_stopping_patience_counter": 1
371
+ }
372
+ },
373
+ "TrainerControl": {
374
+ "args": {
375
+ "should_epoch_stop": false,
376
+ "should_evaluate": false,
377
+ "should_log": false,
378
+ "should_save": true,
379
+ "should_training_stop": true
380
+ },
381
+ "attributes": {}
382
+ }
383
+ },
384
+ "total_flos": 1.8456230162149265e+19,
385
+ "train_batch_size": 8,
386
+ "trial_name": null,
387
+ "trial_params": null
388
+ }
validation_predictions.csv ADDED
@@ -0,0 +1,166 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ audio,true_text,pred_text
2
+ female_mymensingh_244.wav,আজ সকালে আমি স্কুলে দেরি করেছি।,আজ সকালেমি স্কুলে দেরি করেছে।
3
+ female_mymensingh_333.wav,আজ ইতিহাস ক্লাসে আলোচনা হলো।,আজ তিখাসকলা সালে শনা হো।
4
+ female_rangpur_42.wav,তুমি কি বাসায় একা আছো?,তুমি কি মা পাড ছো?
5
+ male_dhaka_8.wav,আজ বিকেলে ক্লাসে পরীক্ষা নেওয়া হবে।,আজ বিকেলে ক্লাসছে পরিক্ানেয হবে।
6
+ male_bhola_210.wav,আজ স্কুলে ক্রীড়া অনুষ্ঠান হয়েছে।,আজ েজে স্কুলে রালা হসাছে।
7
+ female_lakshmipur_34.wav,আজ বাজারে মাছের দাম অনেক।,আজ বাজারে মাছছে দাম দেেছে।
8
+ female_sylhet_124.wav,আজ সকালে রাস্তায় অনেক কাদা হয়েছে।,আজ সকালে রাস্তায পনেক খাদা হয়েছে।
9
+ female_mymensingh_94.wav,আজকের রোদে বাইরে বের হওয়া কঠিন ছিল।,আজকেরোদে বাইরে যাযা পরশিন আছিল।
10
+ male_chittagong_259.wav,আমি চা খেতে খেতে বই পড়েছি।,আমি চান হাতে হাতে বই পডরেছি।
11
+ female_rangpur_20.wav,তুমি কি আগামীকাল ঢাকায় যাচ্ছো?,তুমি কি গামলল থাকা যাবে?
12
+ female_sylhet_85.wav,"আজ বিকেলে মাঠে বাচ্চারা খেলছিল, সবাই হাসছিল।",আজ বিকেলে মাটে পরতাতে খেলাতছসবা সািল।
13
+ male_bhola_65.wav,আজ স্কুলে ক্রীড়া প্রতিযোগিতা হয়েছে।,আজ ে আম্র স্কুলে খেতা আছে।
14
+ female_mymensingh_313.wav,আমি দুপুরে ফল খেয়েছি।,আমি দুররে খল খেয়েছি।
15
+ male_pabna_174.wav,আজ সকালে হঠাৎ করে বৃষ্টি নেমেছিল।,আজ সকালে া রে বি্টি আমছিল।
16
+ female_sylhet_41.wav,আজকের খাবারে ডাল ভাত আছে।,আজকে খানিত যাল তাছে।
17
+ female_chittagong_226.wav,আমি সকালের নাস্তা খেতে ভুলেছি।,আমি সকালে নাস্তা খেতে ুলে গেছি।
18
+ male_pabna_8.wav,আজ বিকেলে ক্লাসে পরীক্ষা নেওয়া হবে।,আজ বিকেলে ক্লাসে পরিক্টা লিে খবে।
19
+ male_barisal_34.wav,আজ বাজারে মাছের দাম অনেক।,আজ বাজারে মাছের দামে খতের ভে।
20
+ female_lakshmipur_45.wav,আজকের সকালে অনেক বৃষ্টি পড়েছে।,আজ সকালে হনেক বি্টি ভেছে।
21
+ male_dhaka_45.wav,আজকের সকালে অনেক বৃষ্টি পড়েছে।,আজ েসকালে অনাক বি্টি পড়েছিল।
22
+ male_bhola_146.wav,আমি নতুন গান শুনে আনন্দ পেয়েছি।,আমি নতুন গান শুযে আনদ পেেছি।
23
+ female_mymensingh_306.wav,আজ দুপুরে প্রচণ্ড গরম পড়েছে।,আজ দুরে অ্া গরম প়েছল।
24
+ female_chittagong_291.wav,আজ সকালে হঠাৎ বৃষ্টি নামলো।,আজ সকালে আতেকটে যান নআবে।
25
+ male_bogura_110.wav,আমি দুপুরে ভাত মাছ খেতে ভালোবাসি।,আমি দুরে ভাত না খেতে খব ভালোবি।
26
+ male_mymensingh_36.wav,তুমি কি এখন চা খেতে চাও?,তুমি কি এখন চা খেতে াো?
27
+ male_rangpur_170.wav,তুমি কি এখন চা বানাতে পারবে?,তুমি কি এখা চাভ্ত পরবে?
28
+ female_lakshmipur_102.wav,তুমি কি বাসায় একা ছিলে আজ?,তুমি কি বাসা থ় একলা আছিো।
29
+ male_rangpur_335.wav,তুমি কি প্রয়োজনীয় তথ্য সংগ্রহ করেছো?,তুমি কি জবিত্থা স্র করেছো?
30
+ male_jhenaidah_31.wav,আজ আমাদের ক্লা���ে শিক্ষক আসেননি।,আমি আমাদের কলাজে সিক্ কাসেে।
31
+ female_mymensingh_362.wav,তুমি কি গণিতের সূত্র মুখস্থ করেছো?,তুমি কি এখক শু্র পস্ত করেছো?
32
+ male_kushtia_18.wav,তুমি কি চিঠিটা পড়ে শুনাবে?,তুমি কি িিটা পড়়ে শুনাবে?
33
+ male_rangpur_133.wav,আজকের আবহাওয়া সত্যিই সুন্দর ছিল।,আজকেররে আবা়হ়য়া সু্দ ছিল।
34
+ male_jhenaidah_1.wav,আজ সকালে আমি বাজারে গিয়েছিলাম।,আজ সকালে আমি বাজারে গিয়েছিাম।
35
+ female_chittagong_210.wav,আজ স্কুলে ক্রীড়া অনুষ্ঠান হয়েছে।,আজ স্কুলে ্াদলয নু্া হে।
36
+ male_dhaka_103.wav,আজ বাজারে সবজির দাম বেড়েছে।,আজকেবাজারে সববজি দাম পেেছে।
37
+ female_mymensingh_160.wav,আমি সকালের হাঁটায় খুব আনন্দ পেয়েছি।,আমি সকালে াটা আন্দ পেেছি।
38
+ male_chittagong_156.wav,আজকের সকালে সূর্যটা সুন্দর ছিল।,আজ সকালে সরযা বে স্দরছিল।
39
+ male_jessore_6.wav,তুমি কি আমাকে পানি দিতে পারো?,তুমি কি আমাকে পানি দিতে পাবে?
40
+ male_bhola_192.wav,আজ রাতে সবাই একসাথে খাওয়া শেষ করেছে।,আজ রাতে সবাই একসাথে খেয়েছে।
41
+ male_comilla_28.wav,তুমি কি কখনো পাহাড়ে গিয়েছো?,তুমি কি এখখনো প হাড়ে গিয়েছিলো?
42
+ male_rangpur_207.wav,আজ রাস্তায় প্রচুর ভিড় জমেছে।,আজ রাস্তায ম ভি দোন ল।
43
+ male_rangpur_290.wav,তুমি কি এখনো কাজ করোনি?,তুমি কি এখন কাজ কেিছো?
44
+ male_rangpur_123.wav,তুমি কি এখন মোবাইল ব্যবহার করছো?,তুমি কি এখ মোবাইলল ভবপ কছো?
45
+ male_pabna_103.wav,আজ বাজারে সবজির দাম বেড়েছে।,আজ বাজারে সবজির দাম ভেছে।
46
+ male_brahmanbaria_73.wav,তুমি কি এখন খেতে বসবে?,তুমি কি এখন খেতে বইবে?
47
+ male_lakshmipur_326.wav,তুমি কি গ্রন্থাগারের বই এনেছো?,তুমি কি াে বই আনেছো?
48
+ male_rangpur_358.wav,আমি ক্রীড়া অনুশীলন করে সুস্থ থাকি।,আমি করযে শনুশল কে সু্্ত আছি।
49
+ female_mymensingh_151.wav,আমি সকালের নাস্তা করে স্কুলে গিয়েছি।,আমি সকালে নুল খেযে স্কুলে গেছি।
50
+ male_bhola_197.wav,তুমি কি মোবাইলের চার্জ শেষ করে ফেলেছো?,তুমি কি মোবাইলে চার শেস কুরে লিেছো?
51
+ male_noakhali_39.wav,তুমি কি এখনই বই পড়বে?,তুমি কি এখন বই প়বে?
52
+ male_rangpur_251.wav,তুমি কি এখনো কাজ শেষ করোনি?,তুমি কি এখনো কাজ শেসষ করনেো?
53
+ female_chittagong_228.wav,আজ রাতে সবাই গান গাইলো।,আজ রাতে বরগনে গান গাছে।
54
+ male_brahmanbaria_114.wav,তুমি কি প্রতিদিন সকালে হাঁটতে যাও?,তুমি কি প্রতিদিনসা নটতা যাো?
55
+ male_bhola_120.wav,তুমি কি আগামীকাল স্কুলে আসবে?,তুমি কি আগামিকালে স্কুলে আবে?
56
+ female_lakshmipur_20.wav,তুমি কি আগামীকাল ঢাকায় যাচ্ছো?,তুমি কি আ কাে ডাতা যাবে?
57
+ male_rangpur_222.wav,আজ সকালে সূর্য ধীরে উঠছিল।,আজ েসকালে সুযে আস্তা শু নেখছিল।
58
+ male_lakshmipur_259.wav,আমি চা খেতে খেতে বই পড়েছি।,আমি সচা খেতে খেতে বই পডেছি।
59
+ male_bogura_66.wav,আমি দুপুরে ভাত খেয়েছি।,আমি দুরে খাত খে়েছি।
60
+ male_dhaka_39.wav,তুমি কি এখনই বই পড়বে?,তুমি কি এখনো বই পড়বে?
61
+ male_rajshahi_16.wav,বৃষ্টির পানিতে রাস্তা ভিজে গেছে।,আমরটি পানিতে রাস্তা প়া ভিজা গছে।
62
+ male_rajshahi_83.wav,আমি সকালে ঘুম থেকে দেরি করে উঠেছি।,আমি সকালে খন থেকে দেরিকরে ডেছি।
63
+ male_sylhet_183.wav,আজ বিকেলে রাস্তায় প্রচুর যানজট হয়েছে।,আজ বিকেলে রাস্তায পরশ যানজ ডেছিল।
64
+ female_chittagong_295.wav,আমি দুপুরে ফলের রস খেয়েছি।,আমি দুে পলের শায়ছি।
65
+ male_brahmanbaria_110.wav,আমি দুপুরে ভাত মাছ খেতে ভালোবাসি।,আমি দুরে বা মাছ ছেতে বলোপি।
66
+ male_noakhali_24.wav,আমি খাওয়ার পর বই পড়েছি।,আমি খানা খ বই পরেেছি।
67
+ male_feni_14.wav,আমি সকালের নাস্তা খেতে ভুলে গেছি।,আম সকালের নাস্তা খেতে ভুলে গেছি।
68
+ male_dhaka_118.wav,আজকের দুপুরে প্রচণ্ড বৃষ্টি হয়েছে।,আজকেরদুপু়ে পরশ্দ ব্টি খয়েছে।
69
+ male_lakshmipur_310.wav,আমি হাঁটতে গিয়ে দৃশ্য দেখেছি।,আমি মাটতে যায় দরিপ্ দেখেছি।
70
+ male_natore_52.wav,তুমি কি আজ ফুটবল খেলবে?,তুমি কি আজ শুবল খেলবে?
71
+ male_chittagong_146.wav,আমি নতুন গান শুনে আনন্দ পেয়েছি।,আমি নতুন গানবিরে বতন ন্দ পাি।
72
+ male_bhola_61.wav,তুমি কি গান শোনার সময় নাচো?,তুমি কি গান শনোযা সময নাছো?
73
+ female_mymensingh_214.wav,আমি দুপুরে এক গ্লাস দুধ খেয়েছি।,আমি দুররেগলে নুত খেয়েছি।
74
+ male_natore_27.wav,আমরা সবাই একসাথে গল্প করছি।,আমরা সবাই একসাথে গলপ কেছি।
75
+ male_jhenaidah_141.wav,তুমি কি কখনো সমুদ্র দেখেছো?,তুমি কি কখনো সমুদ দেখেছো?
76
+ male_jhenaidah_147.wav,তুমি কি আমাকে একটা গল্প বলবে?,তুমি কি আমাকে াতা গলপ কলো?
77
+ male_jhenaidah_199.wav,আমি সকালের নাস্তা করে কাজ করতে বসেছিলাম।,আমি সকালের নাস্তা করে কাস করতে বসছিলাম।
78
+ female_chittagong_224.wav,তুমি কি কখনো পাহাড়ে উঠেছো?,তুমি কি এনো সময় যাত যছো?
79
+ male_sylhet_245.wav,তুমি কি আমাকে ফোনটা দেখাবে?,তুমি কি আমকে মোবাইট দেখাবে?
80
+ female_chittagong_363.wav,আজকের পরীক্ষায় জটিল প্রশ্ন ছিল।,আজ ে পরক্্ায় যসটিল পস্ন ছিল।
81
+ male_sylhet_313.wav,আমি দুপুরে ফল খেয়েছি।,আজ দুরে পল খেয়েছি।
82
+ female_lakshmipur_282.wav,আজ দুপুরে বৃষ্টিতে রাস্তা ভিজলো।,আজ দুরে র বি্িতে রাস্তা ভিজে গেছল।
83
+ male_sylhet_200.wav,তুমি কি নতুন সিনেমা দেখতে চাও?,তুমি কি নদু সিনেমা দেখতে চাো?
84
+ male_comilla_1.wav,আজ সকালে আমি বাজারে গিয়েছিলাম।,আজ সকালে আমি বাজারে গি়েছিলাম।
85
+ male_jhenaidah_282.wav,আজ দুপুরে বৃষ্টিতে রাস্তা ভিজলো।,আজ েদুরে বি্িতিে রাস্তা ভিযিল।
86
+ male_chittagong_87.wav,তুমি কি গরমে ক্লান্ত হয়ে গিয়েছো?,তুমি কি গরমে করনে গিেছো?
87
+ female_mymensingh_132.wav,তুমি কি এখনো বই পড়ে যাচ্ছো?,তুমি কি এখখ বই পড়়ে যাছো?
88
+ female_lakshmipur_394.wav,আমি প্রতিদি��� নতুন শব্দ মুখস্থ করি।,আমি পতিদিন নতুন স্া শুকস্্ কি।
89
+ female_sylhet_278.wav,তুমি কি টিভি দেখছিলে?,তুমি কি টিভি দেখেছিলো?
90
+ male_natore_8.wav,আজ বিকেলে ক্লাসে পরীক্ষা নেওয়া হবে।,আজ বিকেলে ক্লাসে পরক্টা নিযা হবে।
91
+ male_lakshmipur_218.wav,তুমি কি বাজারে সবজি কিনবে?,তুমি কি বাজারে সজ কিিককিনেছো?
92
+ male_bogura_22.wav,তুমি কি গান গাইতে জানো?,তুমি কি গান গাতের পাবে?
93
+ male_sylhet_196.wav,আমি দুপুরে ফলের রস খেতে ভালোবাসি।,আমি দুরে পলে রস খেতে ভালোপাি।
94
+ male_mymensingh_38.wav,আমি নতুন গান শুনতে চাই।,আমি নতু গান শুনতে চ।
95
+ male_lakshmipur_319.wav,আমি দুপুরে মাছ ভাত খেয়েছি।,আমি দুরে মাছ াত খে়েছি।
96
+ female_rangpur_24.wav,আমি খাওয়ার পর বই পড়েছি।,আমি খা়য় প বই পড়ছিাম।
97
+ male_rangpur_254.wav,তুমি কি গল্পের বই আনবে?,তুমি কি গলপে বই আনবে?
98
+ male_jhenaidah_236.wav,তুমি কি মোবাইলে গান শুনছিলে?,তুমি কি মোবাইলে গান শুনছো?
99
+ male_kushtia_46.wav,আমি একটা গল্পের বই লিখছি।,আমি কটা গলপর বই লিখেছি।
100
+ male_jhenaidah_107.wav,আমি স্কুলে নতুন শিক্ষক দেখেছি।,আমি স্কুলে নতুন শা দেখেছি।
101
+ male_pabna_128.wav,আমি নতুন জামা পরে বাজারে গিয়েছিলাম।,আমি নতুন জামা পডে বাজারে গিেছিলাম।
102
+ male_pabna_97.wav,আজকের ক্লাসে সবাই উপস্থিত ছিল।,আজকেরর কলাসে সবাই পস্থিতছিল।
103
+ male_chittagong_39.wav,তুমি কি এখনই বই পড়বে?,তুমি কি মতকতা প়ে বো?
104
+ female_chittagong_95.wav,আমি সকালের নাস্তা হিসেবে রুটি খেয়েছি।,আমি সকজারে নাস্তা রুটি খাছি।
105
+ male_chittagong_243.wav,আজ সকালে আমি বাজারে গিয়েছিলাম।,আজ সকালে আমি বাজারে গিয়েছিল।
106
+ male_jhenaidah_119.wav,আমি নতুন একটা বই পড়তে বসেছি।,আমি নতুন া বই পড়তে বেছি।
107
+ male_comilla_40.wav,আমরা সবাই মাঠে খেলতে যাচ্ছি।,আমরা সবালে মাটে খেলে তে যাছি।
108
+ female_chittagong_101.wav,আমি দুপুরে বন্ধুদের সাথে গল্প করেছি।,আমি দুে বন্ুে্া গলপ করেছি।
109
+ male_lakshmipur_255.wav,আজ বিকেলে মাঠে ফুটবল খেলা।,আজ বিকলে মাটে পুবল খেছে।
110
+ male_noakhali_5.wav,দরজাটা ধীরে ধীরে বন্ধ করে দাও।,আজপরান আাস্তা সতে লাগাে।
111
+ male_bhola_74.wav,আজ বিকেলে আমরা একসাথে গল্প করবো।,আজ বিকেলে আমরা একসাতে আরটা দেবে।
112
+ female_lakshmipur_390.wav,আজ ক্লাসে নতুন পাঠ শেখানো।,আজকে ক্লাসে নতুন পা শিখেছে।
113
+ female_barisal_19.wav,আমাদের গ্রামের বাতাস খুব শীতল।,আমিক গ্রামে খাযা খব শাটে।
114
+ male_natore_36.wav,তুমি কি এখন চা খেতে চাও?,তুমি কি এখন চা খেতে চাো?
115
+ male_jhenaidah_98.wav,আমি নতুন ফোনের চার্জার কিনেছি।,আমি নতুন প্ট চাররজারর কিনেছি।
116
+ male_kushtia_29.wav,আমি আজ নতুন জামা পরেছি।,আমি আজ নতুন ামা পডরেছি।
117
+ male_brahmanbaria_112.wav,আজকের আকাশে সাদা মেঘ ভেসে যাচ্ছে।,আজকেআকাসে সা্যামিে বাশা যাতেল।
118
+ female_mymensingh_351.wav,আ��� সভায় নতুন নিয়ম ঘোষণা।,আজকসবায়় নতু নিযম শন আবে।
119
+ female_mymensingh_353.wav,তুমি কি তথ্যপ্রযুক্তি পছন্দ করো?,তুমি কি পিটারা প্রজুকতি পছ্দ করোো?
120
+ male_sylhet_213.wav,আজ রাতে আমরা গান শুনবো।,আজকেরাতে আমরা গান শুনবো।
121
+ female_chittagong_347.wav,তুমি কি গবেষণাপত্র পড়ে জ্ঞান বাড়িয়েছো?,তুমি কি গবসনা পড়ত পডগন বা়ােছো?
122
+ male_jhenaidah_164.wav,তুমি কি আমাকে বইয়ের দোকানে নিয়ে যাবে?,তুমি কি আমাকে বই় দোকানে নিযে যাবে?
123
+ male_chittagong_47.wav,তুমি কি মোবাইলটা চার্জে দেবে?,তুমি কি মোবাইলে বে চাজ দেবে?
124
+ male_sylhet_305.wav,তুমি কি আমাকে কলম দেবে?,তুমি কি আআমাকে কলম দেবে?
125
+ male_pabna_70.wav,তুমি কি আজ নতুন জামা পরেছো?,তুমি কি আজ নতুন জামা প়ে াো?
126
+ male_jhenaidah_54.wav,আমি সকালের নাস্তা করতে যাচ্ছি।,আমি সকালের নাস্তা করতে যাছি।
127
+ female_lakshmipur_235.wav,আমি হাঁটতে গিয়ে নতুন বন্ধু পেয়েছি।,আমি হাটতে যায়ে নতুন ব্দু খেযেছি।
128
+ female_mymensingh_354.wav,আজ প্রতিবেদনে উন্নতির কথা বলা।,আজ প্রতিবেদনে বালোবাকা ল।
129
+ male_mymensingh_60.wav,আমি বই পড়তে ভালোবাসি।,আমি বই পড়তে ালোবাসি।
130
+ male_bhola_18.wav,তুমি কি চিঠিটা পড়ে শুনাবে?,তুমি কি চিটিটা প়়ে শুনাবে?
131
+ male_jhenaidah_114.wav,তুমি কি প্রতিদিন সকালে হাঁটতে যাও?,তুমি কি প্রতিদিন সকালে পা়তে যাো?
132
+ female_mymensingh_203.wav,তুমি কি বাইরে যেতে চাও?,তুমি কি বাই়ে যাতে চাো?
133
+ male_feni_68.wav,আজ রাস্তায় অনেক যানবাহন আছে।,আজকরাস্তায়় নক যান ভান আছে।
134
+ male_rangpur_147.wav,তুমি কি আমাকে একটা গল্প বলবে?,তুমি কি মাকেখকান গলপ পবে?
135
+ male_rangpur_398.wav,তুমি কি বিজ্ঞান প্রতিযোগিতায় যাবে?,তুমি কি বি্ান পরতিদেগিতে যাবে?
136
+ male_khulna_20.wav,তুমি কি আগামীকাল ঢাকায় যাচ্ছো?,তুমি কি আগামিকা্টাকাযে যাছো?
137
+ female_lakshmipur_277.wav,আমি দুপুরে মাছ ভাত খেয়েছি।,আমি দুরে মাছ বাত খে়েছি।
138
+ male_rangpur_304.wav,আমি সকালে বাজারে গিয়েছিলাম।,আমি সকালে বাজারে গি়েছিাম।
139
+ male_sylhet_168.wav,আজ রাতে অতিথিরা আমাদের বাসায় আসবে।,আজ রাতে কতিদিরা আমরাবসায আখবে।
140
+ male_sylhet_156.wav,আজকের সকালে সূর্যটা সুন্দর ছিল।,আজকেসকালে সিযে শুন্দর ছিল।
141
+ male_rajshahi_35.wav,আমার ছোট ভাই স্কুলে যাচ্ছে।,আমমা সট ভায় স্কুলে যাছে।
142
+ male_sylhet_346.wav,আমি নথি সঠিকভাবে জমা দিয়েছি।,আমি নতি সটিক বই জমা দেছি।
143
+ female_lakshmipur_147.wav,তুমি কি আমাকে একটা গল্প বলবে?,তুমি কি আমাকে ক্া গল শকবে?
144
+ male_brahmanbaria_76.wav,তুমি কি আজ অফিসে যাবে?,তুমি কি আজ বপিসশে যাবে?
145
+ male_natore_69.wav,আমি দুপুরে বন্ধুদের সাথে খেলেছি।,আমি তিতারে ব্ু প্তদে সাথে খেলেছি।
146
+ male_pabna_71.wav,আজকের সকালে আকাশ পরিষ্কার ছিল।,আজকেসকালে আকাস পরি্ছিল।
147
+ male_pabna_15.wav,তুমি কি আজ সিনেমা দেখতে যাবে?,তুমি কি আজ ছবি দেখতে যাবে?
148
+ male_feni_32.wav,আমি এখন টিভিতে খবর দেখছি।,আমি খন টিভিত খব চােছি।
149
+ male_bogura_95.wav,আমি সকালের নাস্তা হিসেবে রুটি খেয়েছি।,আমি সকালের নাস্তা ভশেবে রুটি খেছি।
150
+ male_chittagong_70.wav,তুমি কি আজ নতুন জামা পরেছো?,তুমি কি সাজ্্র পড়তে খরেছো?
151
+ male_chittagong_23.wav,মাঠে ছেলেরা ক্রিকেট খেলছে।,আম মারর দিক করিকেট খেলে।
152
+ female_lakshmipur_177.wav,আজ রাতে আমরা সবাই একসাথে খেতে বসবো।,আজকেরাতে আমরা সবাই একসাতে ভা খেে।
153
+ female_lakshmipur_40.wav,আমরা সবাই মাঠে খেলতে যাচ্ছি।,আমরা বা মাটে খেলতে যাছি।
154
+ female_mymensingh_294.wav,আজ রাতে আমরা গান শুনেছি।,আজ রাতে আমরা গান শুনেছি।
155
+ male_mymensingh_24.wav,আমি খাওয়ার পর বই পড়েছি।,আমি খা়নে প়ে বই প়েছি।
156
+ male_jhenaidah_58.wav,তুমি কি নতুন গান শুনেছো?,তুমি কি নতুন গান শুনেছো?
157
+ female_lakshmipur_114.wav,তুমি কি প্রতিদিন সকালে হাঁটতে যাও?,তুমি কি পতিদিন পালে াটতে যাে?
158
+ female_mymensingh_208.wav,আমি দুপুরে বন্ধুদের সাথে খেলেছি।,আমি দুররে ব্দুদে সাদে খেলেছি।
159
+ male_rajshahi_4.wav,আমি বন্ধুদের সাথে খেলা খেলেছি।,আমি ব্দুদে সাথে খেলা খেললেছি।
160
+ male_jessore_9.wav,আমি নতুন মোবাইল কিনতে যাচ্ছি।,আমি নতুন নল আলি খতে দাখছি।
161
+ female_lakshmipur_168.wav,আজ রাতে অতিথিরা আমাদের বাসায় আসবে।,আজকেরাতে মান আম্ে বাসায আবে।
162
+ female_rangpur_63.wav,আমি বাজার থেকে আম কিনেছি।,তমি পা চেকে আম কিন আনেছি।
163
+ male_bogura_4.wav,আমি বন্ধুদের সাথে খেলা খেলেছি।,আমি ব্দুদের সাদে খেলা খেলেসছি।
164
+ female_chittagong_191.wav,তুমি কি আমাকে গল্পের বইটা দেবে?,তুমি কি আমাকে কলপে বে দেবে?
165
+ male_sylhet_307.wav,আমি দুপুরে চা খেয়েছি।,আমি দুরে চা খেয়েছি।
166
+ female_sylhet_48.wav,আমরা কাল একসাথে সিনেমা দেখবো।,আমরা খাল একসাদে সিনেমা দেখবি।
vocab.json CHANGED
@@ -1,59 +1,61 @@
1
  {
2
- "[PAD]": 56,
3
- "[UNK]": 55,
 
 
4
  "|": 0,
5
- "।": 1,
6
- "ঁ": 2,
7
- "ং": 3,
8
- "অ": 4,
9
- "আ": 5,
10
- "ই": 6,
11
- "উ": 7,
12
- "এ": 8,
13
- "ও": 9,
14
- "ক": 10,
15
- "খ": 11,
16
- "গ": 12,
17
- "ঘ": 13,
18
- "ঙ": 14,
19
- "চ": 15,
20
- "ছ": 16,
21
- "জ": 17,
22
- "ঝ": 18,
23
- "ঞ": 19,
24
- "ট": 20,
25
- "ঠ": 21,
26
- "ড": 22,
27
- "ঢ": 23,
28
- "ণ": 24,
29
- "ত": 25,
30
- "থ": 26,
31
- "দ": 27,
32
- "ধ": 28,
33
- "ন": 29,
34
- "প": 30,
35
- "ফ": 31,
36
- "ব": 32,
37
- "ভ": 33,
38
- "ম": 34,
39
- "য": 35,
40
- "র": 36,
41
- "ল": 37,
42
- "শ": 38,
43
- "ষ": 39,
44
- "স": 40,
45
- "হ": 41,
46
- "়": 42,
47
- "া": 43,
48
- "ি": 44,
49
- "ী": 45,
50
- "ু": 46,
51
- "ূ": 47,
52
- "ৃ": 48,
53
- "ে": 49,
54
- "ৈ": 50,
55
- "ো": 51,
56
- "ৌ": 52,
57
- "্": 53,
58
- "ৎ": 54
59
  }
 
1
  {
2
+ ",": 1,
3
+ "?": 2,
4
+ "[PAD]": 58,
5
+ "[UNK]": 57,
6
  "|": 0,
7
+ "।": 3,
8
+ "ঁ": 4,
9
+ "ং": 5,
10
+ "অ": 6,
11
+ "আ": 7,
12
+ "ই": 8,
13
+ "উ": 9,
14
+ "এ": 10,
15
+ "ও": 11,
16
+ "ক": 12,
17
+ "খ": 13,
18
+ "গ": 14,
19
+ "ঘ": 15,
20
+ "ঙ": 16,
21
+ "চ": 17,
22
+ "ছ": 18,
23
+ "জ": 19,
24
+ "ঝ": 20,
25
+ "ঞ": 21,
26
+ "ট": 22,
27
+ "ঠ": 23,
28
+ "ড": 24,
29
+ "ঢ": 25,
30
+ "ণ": 26,
31
+ "ত": 27,
32
+ "থ": 28,
33
+ "দ": 29,
34
+ "ধ": 30,
35
+ "ন": 31,
36
+ "প": 32,
37
+ "ফ": 33,
38
+ "ব": 34,
39
+ "ভ": 35,
40
+ "ম": 36,
41
+ "য": 37,
42
+ "র": 38,
43
+ "ল": 39,
44
+ "শ": 40,
45
+ "ষ": 41,
46
+ "স": 42,
47
+ "হ": 43,
48
+ "়": 44,
49
+ "া": 45,
50
+ "ি": 46,
51
+ "ী": 47,
52
+ "ু": 48,
53
+ "ূ": 49,
54
+ "ৃ": 50,
55
+ "ে": 51,
56
+ "ৈ": 52,
57
+ "ো": 53,
58
+ "ৌ": 54,
59
+ "্": 55,
60
+ "ৎ": 56
61
  }