Automatic Speech Recognition
ESPnet
audio
dzeinali commited on
Commit
a02a6ca
·
1 Parent(s): 339baeb

Update model

Browse files
Files changed (32) hide show
  1. README.md +1263 -0
  2. data/token_list/bpe_unigram1000/bpe.model +3 -0
  3. exp/asr_stats_raw_bpe1000/train/feats_stats.npz +0 -0
  4. exp/asr_train_asr_raw_bpe1000/41epoch.pth +3 -0
  5. exp/asr_train_asr_raw_bpe1000/RESULTS.md +29 -0
  6. exp/asr_train_asr_raw_bpe1000/config.yaml +1166 -0
  7. exp/asr_train_asr_raw_bpe1000/images/acc.png +0 -0
  8. exp/asr_train_asr_raw_bpe1000/images/backward_time.png +0 -0
  9. exp/asr_train_asr_raw_bpe1000/images/cer.png +0 -0
  10. exp/asr_train_asr_raw_bpe1000/images/cer_ctc.png +0 -0
  11. exp/asr_train_asr_raw_bpe1000/images/forward_time.png +0 -0
  12. exp/asr_train_asr_raw_bpe1000/images/gpu_max_cached_mem_GB.png +0 -0
  13. exp/asr_train_asr_raw_bpe1000/images/iter_time.png +0 -0
  14. exp/asr_train_asr_raw_bpe1000/images/loss.png +0 -0
  15. exp/asr_train_asr_raw_bpe1000/images/loss_att.png +0 -0
  16. exp/asr_train_asr_raw_bpe1000/images/loss_ctc.png +0 -0
  17. exp/asr_train_asr_raw_bpe1000/images/optim0_lr0.png +0 -0
  18. exp/asr_train_asr_raw_bpe1000/images/optim_step_time.png +0 -0
  19. exp/asr_train_asr_raw_bpe1000/images/train_time.png +0 -0
  20. exp/asr_train_asr_raw_bpe1000/images/wer.png +0 -0
  21. exp/lm_train_lm_bpe1000/20epoch.pth +3 -0
  22. exp/lm_train_lm_bpe1000/config.yaml +1117 -0
  23. exp/lm_train_lm_bpe1000/images/backward_time.png +0 -0
  24. exp/lm_train_lm_bpe1000/images/forward_time.png +0 -0
  25. exp/lm_train_lm_bpe1000/images/gpu_max_cached_mem_GB.png +0 -0
  26. exp/lm_train_lm_bpe1000/images/iter_time.png +0 -0
  27. exp/lm_train_lm_bpe1000/images/loss.png +0 -0
  28. exp/lm_train_lm_bpe1000/images/optim0_lr0.png +0 -0
  29. exp/lm_train_lm_bpe1000/images/optim_step_time.png +0 -0
  30. exp/lm_train_lm_bpe1000/images/train_time.png +0 -0
  31. exp/lm_train_lm_bpe1000/perplexity_test/ppl +1 -0
  32. meta.yaml +10 -0
README.md ADDED
@@ -0,0 +1,1263 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - espnet
4
+ - audio
5
+ - automatic-speech-recognition
6
+ language: noinfo
7
+ datasets:
8
+ - bn_openslr53
9
+ license: cc-by-4.0
10
+ ---
11
+
12
+ ## ESPnet2 ASR model
13
+
14
+ ### `espnet/bn_openslr53`
15
+
16
+ This model was trained by dzeinali using bn_openslr53 recipe in [espnet](https://github.com/espnet/espnet/).
17
+
18
+ ### Demo: How to use in ESPnet2
19
+
20
+ ```bash
21
+ cd espnet
22
+ git checkout fa1b865352475b744c37f70440de1cc6b257ba70
23
+ pip install -e .
24
+ cd egs2/bn_openslr53/asr1
25
+ ./run.sh --skip_data_prep false --skip_train true --download_model espnet/bn_openslr53
26
+ ```
27
+
28
+ <!-- Generated by scripts/utils/show_asr_result.sh -->
29
+ # RESULTS
30
+ ## Environments
31
+ - date: `Mon Jan 31 10:53:20 EST 2022`
32
+ - python version: `3.9.5 (default, Jun 4 2021, 12:28:51) [GCC 7.5.0]`
33
+ - espnet version: `espnet 0.10.6a1`
34
+ - pytorch version: `pytorch 1.8.1+cu102`
35
+ - Git hash: `9d09bf551a9fe090973de60e15adec1de6b3d054`
36
+ - Commit date: `Fri Jan 21 11:43:15 2022 -0500`
37
+
38
+ ## asr_train_asr_raw_bpe1000
39
+ ### WER
40
+
41
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
42
+ |---|---|---|---|---|---|---|---|---|
43
+ |decode_asr_batch_size1_lm_lm_train_lm_bpe1000_valid.loss.ave_asr_model_valid.acc.best/sbn_test|2018|6470|74.2|21.3|4.5|2.2|28.0|48.8|
44
+
45
+ ### CER
46
+
47
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
48
+ |---|---|---|---|---|---|---|---|---|
49
+ |decode_asr_batch_size1_lm_lm_train_lm_bpe1000_valid.loss.ave_asr_model_valid.acc.best/sbn_test|2018|39196|89.4|4.3|6.3|1.4|12.0|48.8|
50
+
51
+ ### TER
52
+
53
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
54
+ |---|---|---|---|---|---|---|---|---|
55
+ |decode_asr_batch_size1_lm_lm_train_lm_bpe1000_valid.loss.ave_asr_model_valid.acc.best/sbn_test|2018|15595|77.6|12.7|9.7|1.6|24.0|48.7|
56
+
57
+ ## ASR config
58
+
59
+ <details><summary>expand</summary>
60
+
61
+ ```
62
+ config: conf/train_asr.yaml
63
+ print_config: false
64
+ log_level: INFO
65
+ dry_run: false
66
+ iterator_type: sequence
67
+ output_dir: exp/asr_train_asr_raw_bpe1000
68
+ ngpu: 1
69
+ seed: 0
70
+ num_workers: 1
71
+ num_att_plot: 3
72
+ dist_backend: nccl
73
+ dist_init_method: env://
74
+ dist_world_size: null
75
+ dist_rank: null
76
+ local_rank: 0
77
+ dist_master_addr: null
78
+ dist_master_port: null
79
+ dist_launcher: null
80
+ multiprocessing_distributed: false
81
+ unused_parameters: false
82
+ sharded_ddp: false
83
+ cudnn_enabled: true
84
+ cudnn_benchmark: false
85
+ cudnn_deterministic: true
86
+ collect_stats: false
87
+ write_collected_feats: false
88
+ max_epoch: 200
89
+ patience: 20
90
+ val_scheduler_criterion:
91
+ - valid
92
+ - loss
93
+ early_stopping_criterion:
94
+ - valid
95
+ - loss
96
+ - min
97
+ best_model_criterion:
98
+ - - valid
99
+ - acc
100
+ - max
101
+ keep_nbest_models: 10
102
+ nbest_averaging_interval: 0
103
+ grad_clip: 5
104
+ grad_clip_type: 2.0
105
+ grad_noise: false
106
+ accum_grad: 20
107
+ no_forward_run: false
108
+ resume: true
109
+ train_dtype: float32
110
+ use_amp: false
111
+ log_interval: null
112
+ use_matplotlib: true
113
+ use_tensorboard: true
114
+ use_wandb: false
115
+ wandb_project: null
116
+ wandb_id: null
117
+ wandb_entity: null
118
+ wandb_name: null
119
+ wandb_model_log_interval: -1
120
+ detect_anomaly: false
121
+ pretrain_path: null
122
+ init_param: []
123
+ ignore_init_mismatch: false
124
+ freeze_param: []
125
+ num_iters_per_epoch: null
126
+ batch_size: 20
127
+ valid_batch_size: null
128
+ batch_bins: 200000
129
+ valid_batch_bins: null
130
+ train_shape_file:
131
+ - exp/asr_stats_raw_bpe1000/train/speech_shape
132
+ - exp/asr_stats_raw_bpe1000/train/text_shape.bpe
133
+ valid_shape_file:
134
+ - exp/asr_stats_raw_bpe1000/valid/speech_shape
135
+ - exp/asr_stats_raw_bpe1000/valid/text_shape.bpe
136
+ batch_type: numel
137
+ valid_batch_type: null
138
+ fold_length:
139
+ - 80000
140
+ - 150
141
+ sort_in_batch: descending
142
+ sort_batch: descending
143
+ multiple_iterator: false
144
+ chunk_length: 500
145
+ chunk_shift_ratio: 0.5
146
+ num_cache_chunks: 1024
147
+ train_data_path_and_name_and_type:
148
+ - - dump/raw/sbn_train/wav.scp
149
+ - speech
150
+ - sound
151
+ - - dump/raw/sbn_train/text
152
+ - text
153
+ - text
154
+ valid_data_path_and_name_and_type:
155
+ - - dump/raw/sbn_dev/wav.scp
156
+ - speech
157
+ - sound
158
+ - - dump/raw/sbn_dev/text
159
+ - text
160
+ - text
161
+ allow_variable_data_keys: false
162
+ max_cache_size: 0.0
163
+ max_cache_fd: 32
164
+ valid_max_cache_size: null
165
+ optim: adam
166
+ optim_conf:
167
+ lr: 10.0
168
+ scheduler: noamlr
169
+ scheduler_conf:
170
+ warmup_steps: 25000
171
+ token_list:
172
+ - <blank>
173
+ - <unk>
174
+ - র
175
+ - ে
176
+ - ন
177
+ - ের
178
+ - া
179
+ - ল
180
+ - ক
181
+ - ্
182
+ - ো
183
+ - ত
184
+ - ি
185
+ - স
186
+ - ▁
187
+ - ই
188
+ - ী
189
+ - য়
190
+ - ম
191
+ - ু
192
+ - ▁আ
193
+ - প
194
+ - ব
195
+ - তে
196
+ - দ
197
+ - শ
198
+ - কে
199
+ - টি
200
+ - ্য
201
+ - হ
202
+ - ▁এ
203
+ - ▁না
204
+ - ▁ব
205
+ - ও
206
+ - গ
207
+ - ট
208
+ - রা
209
+ - ▁অ
210
+ - জ
211
+ - ▁বি
212
+ - ▁বা
213
+ - ▁স
214
+ - না
215
+ - ার
216
+ - ▁করে
217
+ - ধ
218
+ - নি
219
+ - ▁ম
220
+ - লে
221
+ - ▁জ
222
+ - ▁ও
223
+ - ▁হ
224
+ - চ
225
+ - তা
226
+ - দের
227
+ - ▁মা
228
+ - িত
229
+ - ▁থেকে
230
+ - ্যা
231
+ - ণ
232
+ - '-'
233
+ - ▁প্র
234
+ - তি
235
+ - ▁হয়
236
+ - ায়
237
+ - িক
238
+ - ▁এক
239
+ - ▁পা
240
+ - ▁ক
241
+ - ঁ
242
+ - ভ
243
+ - ▁ভ
244
+ - ▁সা
245
+ - লা
246
+ - ▁শ
247
+ - ','
248
+ - ্র
249
+ - ▁এই
250
+ - ▁নি
251
+ - ▁প
252
+ - বা
253
+ - ▁পর
254
+ - ফ
255
+ - ▁সে
256
+ - ক্ষ
257
+ - ছে
258
+ - মা
259
+ - ষ
260
+ - ▁কা
261
+ - টা
262
+ - বে
263
+ - িয়া
264
+ - ড়
265
+ - ▁দ
266
+ - ▁চ
267
+ - লি
268
+ - ▁ই
269
+ - ▁হা
270
+ - ▁তার
271
+ - ▁যে
272
+ - থ
273
+ - ।
274
+ - ড
275
+ - ুল
276
+ - িয়ে
277
+ - ▁গ
278
+ - বি
279
+ - ▁তা
280
+ - রি
281
+ - কা
282
+ - ▁র
283
+ - ▁ফ
284
+ - পা
285
+ - ▁ন
286
+ - ▁করা
287
+ - ং
288
+ - ▁আর
289
+ - উ
290
+ - নে
291
+ - খ
292
+ - য়ে
293
+ - ▁নিয়ে
294
+ - ▁তিনি
295
+ - ▁একটি
296
+ - নের
297
+ - ▁হয়েছে
298
+ - ্ব
299
+ - ▁ত
300
+ - ▁জন্য
301
+ - ▁যা
302
+ - বার
303
+ - ঙ্গ
304
+ - ান
305
+ - স্ত
306
+ - কার
307
+ - জা
308
+ - ূ
309
+ - ঠ
310
+ - ুর
311
+ - ▁হবে
312
+ - ▁মি
313
+ - দা
314
+ - াই
315
+ - ▁জা
316
+ - ▁বলে
317
+ - ▁কি
318
+ - ড়া
319
+ - ▁ঘ
320
+ - ▁দু
321
+ - হা
322
+ - ত্র
323
+ - ০
324
+ - ছেন
325
+ - ▁কথা
326
+ - সি
327
+ - াম
328
+ - ▁ছিল
329
+ - ▁উ
330
+ - ▁বল
331
+ - ▁তাদের
332
+ - ৃ
333
+ - ▁রা
334
+ - ▁সঙ্গে
335
+ - ▁প্রতি
336
+ - ▁এবং
337
+ - ▁ধ
338
+ - ▁ল
339
+ - ছ
340
+ - ▁খা
341
+ - ▁বে
342
+ - ▁সময়
343
+ - য়া
344
+ - জন
345
+ - মি
346
+ - ন্ত
347
+ - ▁করতে
348
+ - ▁সু
349
+ - ▁করেন
350
+ - ীর
351
+ - ৌ
352
+ - ▁অনেক
353
+ - গুলো
354
+ - ষ্ট
355
+ - ধা
356
+ - সা
357
+ - ▁হয়ে
358
+ - ▁মধ্যে
359
+ - ▁চা
360
+ - ▁লা
361
+ - ির
362
+ - ▁১
363
+ - ▁সং
364
+ - োর
365
+ - ভাবে
366
+ - ▁আমি
367
+ - ১
368
+ - শা
369
+ - াল
370
+ - জি
371
+ - ▁তারা
372
+ - ▁যায়
373
+ - মান
374
+ - ▁কাজ
375
+ - ▁কিছু
376
+ - ▁দিয়ে
377
+ - টে
378
+ - রণ
379
+ - ▁ড
380
+ - ▁উপ
381
+ - স্থ
382
+ - দি
383
+ - সে
384
+ - ▁মে
385
+ - ▁সরকার
386
+ - ▁খ
387
+ - ▁পার
388
+ - ীয়
389
+ - ক্ত
390
+ - ওয়া
391
+ - স্ট
392
+ - এ
393
+ - ▁বাংলাদেশ
394
+ - ড়ে
395
+ - ন্ট
396
+ - ▁২
397
+ - ▁আছে
398
+ - ▁সব
399
+ - ছি
400
+ - ▁দি
401
+ - ▁আমার
402
+ - ▁এখন
403
+ - মে
404
+ - ▁বছর
405
+ - ▁ট
406
+ - ▁শা
407
+ - কি
408
+ - ন্ড
409
+ - ▁নাম
410
+ - ▁কোন
411
+ - দিন
412
+ - পুর
413
+ - ▁সম্
414
+ - ছিল
415
+ - ▁পুলিশ
416
+ - ▁য
417
+ - ৈ
418
+ - ▁মানুষ
419
+ - ▁দা
420
+ - েই
421
+ - ▁এর
422
+ - ▁সালে
423
+ - ▁কর
424
+ - ঘ
425
+ - গ্র
426
+ - ▁দিন
427
+ - ▁পারে
428
+ - ্ম
429
+ - ৫
430
+ - ▁দেশ
431
+ - ▁দেখ
432
+ - ▁স্ব
433
+ - ▁সম
434
+ - ▁১৯
435
+ - ▁সি
436
+ - ▁শুরু
437
+ - ▁প্রথম
438
+ - ত্
439
+ - ▁তো
440
+ - ্ট
441
+ - ▁আগে
442
+ - ▁কোনো
443
+ - ▁রয়েছে
444
+ - ▁হচ্ছে
445
+ - ▁অব
446
+ - ছিলেন
447
+ - যোগ
448
+ - জে
449
+ - ▁ভারত
450
+ - ▁নে
451
+ - প্র
452
+ - ▁সেই
453
+ - গা
454
+ - ▁গা
455
+ - হি
456
+ - ন্ন
457
+ - ▁ছ
458
+ - ▁জন
459
+ - ▁নির্
460
+ - খা
461
+ - পি
462
+ - ▁পে
463
+ - ▁স্
464
+ - াব
465
+ - ▁মো
466
+ - ▁অনু
467
+ - ▁কিন্তু
468
+ - ৯
469
+ - ▁পরি
470
+ - ▁ঢাকা
471
+ - তার
472
+ - লো
473
+ - ▁বিষয়
474
+ - ▁তাঁর
475
+ - ৪
476
+ - র্থ
477
+ - ▁অ্যা
478
+ - ▁ঘটনা
479
+ - ▁শেষ
480
+ - ড়ি
481
+ - লেন
482
+ - ▁আমাদের
483
+ - ▁বড়
484
+ - দেশ
485
+ - ▁নেই
486
+ - ▁ব্যা
487
+ - ানো
488
+ - ▁বেশি
489
+ - মার
490
+ - বাস
491
+ - ▁তবে
492
+ - ▁কো
493
+ - শি
494
+ - ▁বিভিন্ন
495
+ - ▁নয়
496
+ - ৭
497
+ - নী
498
+ - ৩
499
+ - ▁দল
500
+ - ▁দেখা
501
+ - ঝ
502
+ - ▁করার
503
+ - ▁কে
504
+ - ▁হলে
505
+ - ুক
506
+ - ▁গু
507
+ - ▁৩
508
+ - ৬
509
+ - ▁মনে
510
+ - ▁নির্বাচন
511
+ - ▁রাজ
512
+ - ▁করেছে
513
+ - ীন
514
+ - লের
515
+ - িতে
516
+ - ▁একটা
517
+ - ঞ্চ
518
+ - ▁রাখ
519
+ - ▁থাক
520
+ - ▁আমরা
521
+ - ▁চল
522
+ - ২
523
+ - ▁কাছে
524
+ - ▁মু
525
+ - ▁পড়
526
+ - ▁সহ
527
+ - ▁হিসেবে
528
+ - জ্ঞ
529
+ - ান্ত
530
+ - ণ্ড
531
+ - ৎ
532
+ - য়ের
533
+ - ▁পু
534
+ - ▁একজন
535
+ - ▁বলেন
536
+ - ুন
537
+ - িং
538
+ - ’
539
+ - ▁বাংলা
540
+ - টার
541
+ - ুম
542
+ - ঞ্জ
543
+ - ▁বাড়ি
544
+ - ▁গত
545
+ - ▁হাজার
546
+ - ▁মতো
547
+ - ডি
548
+ - ▁তিন
549
+ - দ্ধ
550
+ - ▁এমন
551
+ - ▁কয়েক
552
+ - ▁কম
553
+ - ত্ব
554
+ - ্রা
555
+ - ▁দিকে
556
+ - ▁ছিলেন
557
+ - ▁পড়ে
558
+ - নার
559
+ - ▁করি
560
+ - কাল
561
+ - ▁মুখ
562
+ - ▁উঠ
563
+ - র্ত
564
+ - ▁টাকা
565
+ - চার
566
+ - শে
567
+ - ▁এসে
568
+ - ▁দুই
569
+ - ▁করেছেন
570
+ - ▁লোক
571
+ - ম্প
572
+ - ৮
573
+ - ষ্ঠ
574
+ - ▁মহা
575
+ - ▁কু
576
+ - ▁থাকে
577
+ - বাদ
578
+ - চি
579
+ - ▁এলাকা
580
+ - ▁জানান
581
+ - ▁প্রায়
582
+ - ▁দেয়া
583
+ - ▁গেল
584
+ - য
585
+ - চ্ছে
586
+ - ▁ছবি
587
+ - ▁নতুন
588
+ - ▁অবস্থা
589
+ - ▁অভি
590
+ - ▁আজ
591
+ - ▁কার
592
+ - ▁খু
593
+ - ▁জানা
594
+ - ▁করছে
595
+ - টির
596
+ - ▁বাংলাদেশের
597
+ - ▁বন্ধ
598
+ - কারী
599
+ - ▁অন্য
600
+ - ▁ধরে
601
+ - প্ত
602
+ - ▁তাকে
603
+ - ▁গেছে
604
+ - ▁শি
605
+ - চা
606
+ - আ
607
+ - ▁চাল
608
+ - ▁আল
609
+ - ▁৫
610
+ - ▁উত্ত
611
+ - ▁ঝ
612
+ - ▁জীবন
613
+ - লার
614
+ - ঙ
615
+ - ▁প্রকাশ
616
+ - ▁মেয়ে
617
+ - ▁রে
618
+ - ▁দেশের
619
+ - ▁খেল
620
+ - ▁মূল
621
+ - ভি
622
+ - ঙ্ক
623
+ - ▁চি
624
+ - ▁পর্যন্ত
625
+ - ▁সাথে
626
+ - লাম
627
+ - ▁৪
628
+ - ▁টি
629
+ - ▁বো
630
+ - ▁আইন
631
+ - গত
632
+ - ▁হতে
633
+ - ▁ভালো
634
+ - .
635
+ - স্ক
636
+ - ▁অভিযোগ
637
+ - ন্স
638
+ - ▁কারণে
639
+ - ▁অর্থ
640
+ - ▁অপ
641
+ - ক্স
642
+ - বু
643
+ - ▁২০
644
+ - ▁পাওয়া
645
+ - ▁খুব
646
+ - ▁মন
647
+ - সম
648
+ - ল্লা
649
+ - ব্দ
650
+ - ▁পি
651
+ - ▁ওই
652
+ - ▁করবে
653
+ - য়ার
654
+ - সহ
655
+ - ক্ষণ
656
+ - ▁নারী
657
+ - ম্ব
658
+ - ▁ফা
659
+ - ▁বেশ
660
+ - ▁পেয়ে
661
+ - দে
662
+ - ▁তখন
663
+ - িয়ার
664
+ - ▁ক্যা
665
+ - ▁ছেলে
666
+ - ▁চার
667
+ - ভার
668
+ - ▁দিতে
669
+ - ▁ক্র
670
+ - ▁গান
671
+ - বাহিনী
672
+ - ▁ভি
673
+ - কৃত
674
+ - ▁গো
675
+ - বল
676
+ - ▁ইসলাম
677
+ - ▁জি
678
+ - ▁ডি
679
+ - ন্দ্র
680
+ - ▁গ্রাম
681
+ - ▁ওপর
682
+ - ▁ভোট
683
+ - ▁পাঠ
684
+ - ▁গিয়ে
685
+ - ▁মামলা
686
+ - ▁ব্যবস্থা
687
+ - সার
688
+ - যুক্ত
689
+ - ▁মাস
690
+ - দার
691
+ - ▁সেখানে
692
+ - ▁জন্ম
693
+ - ▁পদ
694
+ - ▁কেউ
695
+ - র্ণ
696
+ - ▁দেওয়া
697
+ - ভাগ
698
+ - ▁১০
699
+ - ▁উদ্
700
+ - োয়া
701
+ - রূপ
702
+ - ▁ফেল
703
+ - ▁তৈরি
704
+ - ▁খবর
705
+ - ▁কেন
706
+ - ▁ভাষা
707
+ - ▁৬
708
+ - ▁ভাব
709
+ - ▁নেতা
710
+ - ▁জানিয়েছে
711
+ - ▁কী
712
+ - ফা
713
+ - ▁থাকা
714
+ - ▁লি
715
+ - টের
716
+ - ▁ছা
717
+ - ▁হল
718
+ - ▁গ্র
719
+ - ▁কর্ম
720
+ - ▁সদস্য
721
+ - ▁জাতীয়
722
+ - ▁ব্র
723
+ - দু
724
+ - ▁কেন্দ্র
725
+ - ▁হওয়ার
726
+ - ▁দেব
727
+ - ▁চলে
728
+ - ▁হলো
729
+ - তু
730
+ - ▁বিশ্ব
731
+ - ▁যাওয়া
732
+ - ▁যাবে
733
+ - ▁ট্র
734
+ - ▁সম্পর্ক
735
+ - ▁দিয়েছে
736
+ - ▁যদি
737
+ - ▁বিরুদ্ধে
738
+ - ▁বিশেষ
739
+ - ▁করলে
740
+ - ▁ছোট
741
+ - ▁অধি
742
+ - ▁শুন
743
+ - ▁আবার
744
+ - ▁কারণ
745
+ - ▁দলের
746
+ - ▁ফি
747
+ - ▁স্ট
748
+ - ▁দেয়
749
+ - ▁শিল্প
750
+ - ▁রাজনৈতিক
751
+ - ▁বলা
752
+ - ▁ছাড়া
753
+ - ▁জেলা
754
+ - ▁দেখে
755
+ - ▁প্রধান
756
+ - ▁এসব
757
+ - বন্ধ
758
+ - ▁কর্মকর্তা
759
+ - চ্ছি
760
+ - ▁তথ্য
761
+ - ▁অংশ
762
+ - ▁দশ
763
+ - ▁তাহা
764
+ - মন্ত্রী
765
+ - ৃত
766
+ - ▁ঠিক
767
+ - ▁রাত
768
+ - ▁আসা
769
+ - ▁থানা
770
+ - ▁গোল
771
+ - রাজ
772
+ - ▁মৃত্যু
773
+ - ▁রি
774
+ - ▁পথ
775
+ - ্যান
776
+ - ▁বিচার
777
+ - ▁শ্রমিক
778
+ - ▁গল্প
779
+ - ▁সকাল
780
+ - ▁হাতে
781
+ - ▁এটা
782
+ - ▁কবি
783
+ - ▁বাবা
784
+ - ▁দাবি
785
+ - ▁চাই
786
+ - ▁মাধ্যমে
787
+ - ▁হয়েছিল
788
+ - ▁ঢ
789
+ - ▁যাচ্ছে
790
+ - ▁২০০
791
+ - ▁চলচ্চিত্র
792
+ - ▁রহমান
793
+ - ▁লেখা
794
+ - ▁দেন
795
+ - ▁পুরুষ
796
+ - চিত্র
797
+ - ▁ব্যবহার
798
+ - ▁অনুষ্ঠান
799
+ - ▁বর্তমান
800
+ - ▁ধর্ম
801
+ - ▁দাঁড়
802
+ - ▁নিহত
803
+ - ঃ
804
+ - চ্ছ
805
+ - ▁চেষ্টা
806
+ - ▁চোখ
807
+ - ▁উপজেলা
808
+ - ▁আদালত
809
+ - ▁সামনে
810
+ - ▁রু
811
+ - ▁চেয়ে
812
+ - ▁সর্ব
813
+ - ▁হত্যা
814
+ - ▁গণ
815
+ - ▁ডাক
816
+ - ▁দ্বিতীয়
817
+ - ▁ধরনের
818
+ - ▁কবিতা
819
+ - ▁ফলে
820
+ - ▁সবচেয়ে
821
+ - গুলি
822
+ - ▁মোট
823
+ - ▁পরিবার
824
+ - ▁শিশু
825
+ - ▁হোসেন
826
+ - ▁রেখে
827
+ - ▁রায়
828
+ - ▁মাথা
829
+ - ▁দুর্
830
+ - ▁৮
831
+ - ▁টা
832
+ - ▁৭
833
+ - ▁বসে
834
+ - ▁ওয়া
835
+ - ▁ব্যক্তি
836
+ - ▁শুধু
837
+ - ▁ব্যাংক
838
+ - ▁পাকিস্তান
839
+ - ▁যখন
840
+ - ▁করিয়া
841
+ - ▁লিখ
842
+ - পূর্ণ
843
+ - ▁বিশ্ববিদ্যালয়
844
+ - ▁সংখ্যা
845
+ - ▁যুদ্ধ
846
+ - ▁হইয়া
847
+ - ▁ক্ষমতা
848
+ - ▁সাধারণ
849
+ - ▁কোটি
850
+ - ▁শিক্ষা
851
+ - ▁আলো
852
+ - ▁তুলে
853
+ - ▁সত্য
854
+ - ▁ঘটে
855
+ - ''''
856
+ - ▁দূর
857
+ - ▁প্রশ্ন
858
+ - ুদ্ধ
859
+ - ▁লাখ
860
+ - ▁নিজের
861
+ - েশন
862
+ - ▁আলোচনা
863
+ - ঈ
864
+ - ▁ক্রিকেট
865
+ - ▁সমাজ
866
+ - ▁বয়স
867
+ - ▁গ্রহণ
868
+ - ▁জায়গা
869
+ - ▁ব্যবসা
870
+ - বর্তী
871
+ - জীব
872
+ - কল্প
873
+ - ▁প্রত্য
874
+ - ▁মাত্র
875
+ - ▁উৎ
876
+ - ▁শহরে
877
+ - ▁এখানে
878
+ - ▁নেয়া
879
+ - ▁ঘোষণা
880
+ - ▁সকল
881
+ - ▁আটক
882
+ - ▁নিরাপত্তা
883
+ - ▁পাঁচ
884
+ - ▁পূর্ব
885
+ - ▁রাষ্ট্র
886
+ - ▁ভাই
887
+ - ▁বহু
888
+ - ▁পরীক্ষা
889
+ - ▁পুরো
890
+ - ▁বাইরে
891
+ - ▁থাকবে
892
+ - ▁ক্ষেত্রে
893
+ - ▁স্থান
894
+ - ▁ম্যাচ
895
+ - ▁ঘরে
896
+ - ▁সবাই
897
+ - ার্ড
898
+ - ▁উদ্ধার
899
+ - ▁ইতিহাস
900
+ - ▁সাহিত্য
901
+ - ▁সুযোগ
902
+ - ▁আন্দোলন
903
+ - ▁যুক্তরাষ্ট্র
904
+ - দর্শন
905
+ - ▁১২
906
+ - ▁১৮
907
+ - ▁প্রেম
908
+ - ▁আন্তর্জাতিক
909
+ - ল্যান্ড
910
+ - ▁সমস্যা
911
+ - ▁বিভাগ
912
+ - ▁সিদ্ধান্ত
913
+ - ▁মধ্য
914
+ - ন্দি
915
+ - ▁ছাত্র
916
+ - ▁গাড়ি
917
+ - ▁দীর্ঘ
918
+ - ▁সংবাদ
919
+ - ▁প্রয়োজন
920
+ - ▁সিনেমা
921
+ - ▁রাজধানী
922
+ - ▁স্থানীয়
923
+ - ▁একটু
924
+ - ▁বাজার
925
+ - জ্জ
926
+ - ▁পৃথিবী
927
+ - ▁বিশ্বাস
928
+ - ▁আহত
929
+ - ▁দায়িত্ব
930
+ - ▁হরতাল
931
+ - ▁সম্ভব
932
+ - ▁অফিস
933
+ - ▁অভিনয়
934
+ - ▁কলেজ
935
+ - ▁চট্টগ্রাম
936
+ - ▁ক্ল
937
+ - ▁দক্ষিণ
938
+ - ▁পক্ষে
939
+ - ▁মুক্তি
940
+ - ▁সংসদ
941
+ - ‘
942
+ - ▁উপস্থিত
943
+ - ▁ফিরে
944
+ - ▁আগামী
945
+ - ▁সংগঠন
946
+ - ▁মিনিট
947
+ - ▁হামলা
948
+ - ▁প্রতিষ্ঠান
949
+ - ▁পোশাক
950
+ - ▁প্ল
951
+ - ▁সৃষ্টি
952
+ - ▁কমিশন
953
+ - ▁আমাকে
954
+ - ▁তদন্ত
955
+ - ▁উচ্চ
956
+ - ▁রাজনীতি
957
+ - দ্দ
958
+ - ▁দর্শক
959
+ - ▁তুমি
960
+ - ▁পরিস্থিতি
961
+ - াহার
962
+ - ▁ক্ষতি
963
+ - ▁আত্ম
964
+ - ▁গ্রেপ্তার
965
+ - ▁ফুট
966
+ - ▁পাশাপাশি
967
+ - মূল
968
+ - ▁প্রধানমন্ত্রী
969
+ - কর্মী
970
+ - ▁সুন্দর
971
+ - ▁নিয়ম
972
+ - ▁আগুন
973
+ - বিজ্ঞান
974
+ - ▁সাংবাদিক
975
+ - ▁লক্ষ্য
976
+ - ▁অবশ্য
977
+ - ▁শরীর
978
+ - ▁উল্লেখ
979
+ - ▁শতাংশ
980
+ - ▁স্কুল
981
+ - ভূত
982
+ - ▁গ্রন্থ
983
+ - ▁কখনো
984
+ - ▁প্রাণ
985
+ - ▁কারখানা
986
+ - ▁হিন্দু
987
+ - ▁বিবিসি
988
+ - ▁আপনার
989
+ - ▁আহমেদ
990
+ - ▁স্ত্রী
991
+ - বর্ষ
992
+ - ▁শক্তি
993
+ - সভা
994
+ - ▁রাস্তা
995
+ - ▁রকম
996
+ - ▁পশ্চিম
997
+ - ▁অপরাধ
998
+ - ▁আসছে
999
+ - ▁সংস্থা
1000
+ - ▁পৌঁছ
1001
+ - ▁দোকান
1002
+ - ▁পত্রিকা
1003
+ - ▁লেখক
1004
+ - ▁সন্তান
1005
+ - ▁ভেতর
1006
+ - ▁এগিয়ে
1007
+ - ▁নদী
1008
+ - ▁হইল
1009
+ - ▁পরিবেশ
1010
+ - ▁প্রেসিডেন্ট
1011
+ - ▁ছেড়ে
1012
+ - ▁চেয়ারম্যান
1013
+ - ▁ধারা
1014
+ - বৃত্ত
1015
+ - ▁বিক্রি
1016
+ - ▁শ্রী
1017
+ - ▁রক্ষা
1018
+ - ▁দ্রুত
1019
+ - ▁পরিচয়
1020
+ - ▁মালিক
1021
+ - ▁উপন্যাস
1022
+ - ▁শিক্ষার্থী
1023
+ - ▁অন্যতম
1024
+ - ▁চরিত্র
1025
+ - ▁প্রতিবেদন
1026
+ - ▁প্রস্তুত
1027
+ - ▁অভিযান
1028
+ - তন্ত্র
1029
+ - ▁অগ্নি
1030
+ - ▁জনগণ
1031
+ - ▁বৃহস্পতিবার
1032
+ - ▁ব্যাপক
1033
+ - ▁অনুযায়ী
1034
+ - ▁পরিবর্তন
1035
+ - ▁কলকাতা
1036
+ - ভূমি
1037
+ - ▁নজরুল
1038
+ - ▁ভূমিকা
1039
+ - ▁জনপ্রিয়
1040
+ - ▁শিক্ষক
1041
+ - ▁তেমন
1042
+ - ▁অন্যান্য
1043
+ - ▁বিদ্যুৎ
1044
+ - খ্যাত
1045
+ - ▁অস্ত্র
1046
+ - ▁প্রস্তাব
1047
+ - ▁স্বামী
1048
+ - ▁পরিচিত
1049
+ - ▁আয়োজন
1050
+ - ▁শনিবার
1051
+ - ▁তাঁকে
1052
+ - ▁যাত্রী
1053
+ - প্রাপ্ত
1054
+ - ▁কর্মসূচি
1055
+ - ▁গঠন
1056
+ - ▁প্রভাব
1057
+ - ▁কৃষ্ণ
1058
+ - ▁সমাবেশ
1059
+ - ▁সূত্র
1060
+ - ▁অনুষ্ঠিত
1061
+ - ▁পর্যায়ে
1062
+ - ঋ
1063
+ - ▁পুরস্কার
1064
+ - ▁বিক্ষোভ
1065
+ - ▁নিয়ন্ত্রণ
1066
+ - ▁রোববার
1067
+ - ▁প্রার্থী
1068
+ - ▁যোগাযোগ
1069
+ - ▁সোমবার
1070
+ - ▁মার্চ
1071
+ - ▁কমিটি
1072
+ - ▁সংঘর্ষ
1073
+ - ▁বুধবার
1074
+ - ▁সামাজিক
1075
+ - ▁তাঁদের
1076
+ - ▁মার্কিন
1077
+ - ▁সামরিক
1078
+ - ▁নিজেদের
1079
+ - ▁মঙ্গলবার
1080
+ - ▁বক্তব্য
1081
+ - ▁চুক্তি
1082
+ - ▁যুগ
1083
+ - ▁বৈঠক
1084
+ - ▁ইউনিয়ন
1085
+ - ▁মোহাম্মদ
1086
+ - অ
1087
+ - ▁তাঁহার
1088
+ - ▁নির্মাণ
1089
+ - ▁জানুয়ারি
1090
+ - ▁আবেদন
1091
+ - ▁বিশ্বকাপ
1092
+ - ▁ফেব্রুয়ারি
1093
+ - ▁তরুণ
1094
+ - ▁হিসাব
1095
+ - ▁সন্ধ্যা
1096
+ - ▁পরিকল্পনা
1097
+ - ▁উইকেট
1098
+ - ▁ধারণা
1099
+ - ▁আনন্দ
1100
+ - মুক্ত
1101
+ - ▁উদ্দেশ্য
1102
+ - ▁চিকিৎসা
1103
+ - ▁উন্নয়ন
1104
+ - ▁আধুনিক
1105
+ - ▁ভিত্তি
1106
+ - ':'
1107
+ - "\x94"
1108
+ - ঢ
1109
+ - ‍
1110
+ - ়
1111
+ - e
1112
+ - /
1113
+ - i
1114
+ - r
1115
+ - t
1116
+ - o
1117
+ - '%'
1118
+ - l
1119
+ - a
1120
+ - n
1121
+ - '!'
1122
+ - p
1123
+ - '"'
1124
+ - s
1125
+ - '?'
1126
+ - d
1127
+ - '0'
1128
+ - '3'
1129
+ - u
1130
+ - ঞ
1131
+ - f
1132
+ - g
1133
+ - c
1134
+ - m
1135
+ - h
1136
+ - –
1137
+ - w
1138
+ - b
1139
+ - ;
1140
+ - x
1141
+ - '8'
1142
+ - '5'
1143
+ - '9'
1144
+ - k
1145
+ - ”
1146
+ - y
1147
+ - H
1148
+ - L
1149
+ - T
1150
+ - j
1151
+ - ৗ
1152
+ - B
1153
+ - K
1154
+ - _
1155
+ - z
1156
+ - “
1157
+ - F
1158
+ - v
1159
+ - '4'
1160
+ - '1'
1161
+ - '2'
1162
+ - ঔ
1163
+ - ঊ
1164
+ - "\x93"
1165
+ - D
1166
+ - O
1167
+ - œ
1168
+ - ঐ
1169
+ - ৰ
1170
+ - —
1171
+ - <sos/eos>
1172
+ init: chainer
1173
+ input_size: null
1174
+ ctc_conf:
1175
+ dropout_rate: 0.0
1176
+ ctc_type: builtin
1177
+ reduce: true
1178
+ ignore_nan_grad: true
1179
+ joint_net_conf: null
1180
+ model_conf:
1181
+ ctc_weight: 0.3
1182
+ lsm_weight: 0.1
1183
+ length_normalized_loss: false
1184
+ use_preprocessor: true
1185
+ token_type: bpe
1186
+ bpemodel: data/token_list/bpe_unigram1000/bpe.model
1187
+ non_linguistic_symbols: null
1188
+ cleaner: null
1189
+ g2p: null
1190
+ speech_volume_normalize: null
1191
+ rir_scp: null
1192
+ rir_apply_prob: 1.0
1193
+ noise_scp: null
1194
+ noise_apply_prob: 1.0
1195
+ noise_db_range: '13_15'
1196
+ frontend: default
1197
+ frontend_conf:
1198
+ fs: 16k
1199
+ specaug: null
1200
+ specaug_conf: {}
1201
+ normalize: global_mvn
1202
+ normalize_conf:
1203
+ stats_file: exp/asr_stats_raw_bpe1000/train/feats_stats.npz
1204
+ preencoder: null
1205
+ preencoder_conf: {}
1206
+ encoder: transformer
1207
+ encoder_conf:
1208
+ input_layer: conv2d
1209
+ num_blocks: 12
1210
+ linear_units: 2048
1211
+ dropout_rate: 0.1
1212
+ output_size: 256
1213
+ attention_heads: 4
1214
+ attention_dropout_rate: 0.0
1215
+ postencoder: null
1216
+ postencoder_conf: {}
1217
+ decoder: transformer
1218
+ decoder_conf:
1219
+ input_layer: embed
1220
+ num_blocks: 6
1221
+ linear_units: 2048
1222
+ dropout_rate: 0.1
1223
+ required:
1224
+ - output_dir
1225
+ - token_list
1226
+ version: 0.10.6a1
1227
+ distributed: false
1228
+ ```
1229
+
1230
+ </details>
1231
+
1232
+
1233
+
1234
+ ### Citing ESPnet
1235
+
1236
+ ```BibTex
1237
+ @inproceedings{watanabe2018espnet,
1238
+ author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson Yalta and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
1239
+ title={{ESPnet}: End-to-End Speech Processing Toolkit},
1240
+ year={2018},
1241
+ booktitle={Proceedings of Interspeech},
1242
+ pages={2207--2211},
1243
+ doi={10.21437/Interspeech.2018-1456},
1244
+ url={http://dx.doi.org/10.21437/Interspeech.2018-1456}
1245
+ }
1246
+
1247
+
1248
+
1249
+
1250
+ ```
1251
+
1252
+ or arXiv:
1253
+
1254
+ ```bibtex
1255
+ @misc{watanabe2018espnet,
1256
+ title={ESPnet: End-to-End Speech Processing Toolkit},
1257
+ author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson Yalta and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
1258
+ year={2018},
1259
+ eprint={1804.00015},
1260
+ archivePrefix={arXiv},
1261
+ primaryClass={cs.CL}
1262
+ }
1263
+ ```
data/token_list/bpe_unigram1000/bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:12b234b17241f304ef16bdab60738ca4ed41c97e2c54eb95454ff06d4a1853ac
3
+ size 259182
exp/asr_stats_raw_bpe1000/train/feats_stats.npz ADDED
Binary file (1.4 kB). View file
 
exp/asr_train_asr_raw_bpe1000/41epoch.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:6efee10b5e3904bb7a86f0bfa42761d015c2817695d78bc833c7a76c281433ac
3
+ size 111680269
exp/asr_train_asr_raw_bpe1000/RESULTS.md ADDED
@@ -0,0 +1,29 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ <!-- Generated by scripts/utils/show_asr_result.sh -->
2
+ # RESULTS
3
+ ## Environments
4
+ - date: `Mon Jan 31 10:53:20 EST 2022`
5
+ - python version: `3.9.5 (default, Jun 4 2021, 12:28:51) [GCC 7.5.0]`
6
+ - espnet version: `espnet 0.10.6a1`
7
+ - pytorch version: `pytorch 1.8.1+cu102`
8
+ - Git hash: `9d09bf551a9fe090973de60e15adec1de6b3d054`
9
+ - Commit date: `Fri Jan 21 11:43:15 2022 -0500`
10
+
11
+ ## asr_train_asr_raw_bpe1000
12
+ ### WER
13
+
14
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
15
+ |---|---|---|---|---|---|---|---|---|
16
+ |decode_asr_batch_size1_lm_lm_train_lm_bpe1000_valid.loss.ave_asr_model_valid.acc.best/sbn_test|2018|6470|74.2|21.3|4.5|2.2|28.0|48.8|
17
+
18
+ ### CER
19
+
20
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
21
+ |---|---|---|---|---|---|---|---|---|
22
+ |decode_asr_batch_size1_lm_lm_train_lm_bpe1000_valid.loss.ave_asr_model_valid.acc.best/sbn_test|2018|39196|89.4|4.3|6.3|1.4|12.0|48.8|
23
+
24
+ ### TER
25
+
26
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
27
+ |---|---|---|---|---|---|---|---|---|
28
+ |decode_asr_batch_size1_lm_lm_train_lm_bpe1000_valid.loss.ave_asr_model_valid.acc.best/sbn_test|2018|15595|77.6|12.7|9.7|1.6|24.0|48.7|
29
+
exp/asr_train_asr_raw_bpe1000/config.yaml ADDED
@@ -0,0 +1,1166 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ config: conf/train_asr.yaml
2
+ print_config: false
3
+ log_level: INFO
4
+ dry_run: false
5
+ iterator_type: sequence
6
+ output_dir: exp/asr_train_asr_raw_bpe1000
7
+ ngpu: 1
8
+ seed: 0
9
+ num_workers: 1
10
+ num_att_plot: 3
11
+ dist_backend: nccl
12
+ dist_init_method: env://
13
+ dist_world_size: null
14
+ dist_rank: null
15
+ local_rank: 0
16
+ dist_master_addr: null
17
+ dist_master_port: null
18
+ dist_launcher: null
19
+ multiprocessing_distributed: false
20
+ unused_parameters: false
21
+ sharded_ddp: false
22
+ cudnn_enabled: true
23
+ cudnn_benchmark: false
24
+ cudnn_deterministic: true
25
+ collect_stats: false
26
+ write_collected_feats: false
27
+ max_epoch: 200
28
+ patience: 20
29
+ val_scheduler_criterion:
30
+ - valid
31
+ - loss
32
+ early_stopping_criterion:
33
+ - valid
34
+ - loss
35
+ - min
36
+ best_model_criterion:
37
+ - - valid
38
+ - acc
39
+ - max
40
+ keep_nbest_models: 10
41
+ nbest_averaging_interval: 0
42
+ grad_clip: 5
43
+ grad_clip_type: 2.0
44
+ grad_noise: false
45
+ accum_grad: 20
46
+ no_forward_run: false
47
+ resume: true
48
+ train_dtype: float32
49
+ use_amp: false
50
+ log_interval: null
51
+ use_matplotlib: true
52
+ use_tensorboard: true
53
+ use_wandb: false
54
+ wandb_project: null
55
+ wandb_id: null
56
+ wandb_entity: null
57
+ wandb_name: null
58
+ wandb_model_log_interval: -1
59
+ detect_anomaly: false
60
+ pretrain_path: null
61
+ init_param: []
62
+ ignore_init_mismatch: false
63
+ freeze_param: []
64
+ num_iters_per_epoch: null
65
+ batch_size: 20
66
+ valid_batch_size: null
67
+ batch_bins: 200000
68
+ valid_batch_bins: null
69
+ train_shape_file:
70
+ - exp/asr_stats_raw_bpe1000/train/speech_shape
71
+ - exp/asr_stats_raw_bpe1000/train/text_shape.bpe
72
+ valid_shape_file:
73
+ - exp/asr_stats_raw_bpe1000/valid/speech_shape
74
+ - exp/asr_stats_raw_bpe1000/valid/text_shape.bpe
75
+ batch_type: numel
76
+ valid_batch_type: null
77
+ fold_length:
78
+ - 80000
79
+ - 150
80
+ sort_in_batch: descending
81
+ sort_batch: descending
82
+ multiple_iterator: false
83
+ chunk_length: 500
84
+ chunk_shift_ratio: 0.5
85
+ num_cache_chunks: 1024
86
+ train_data_path_and_name_and_type:
87
+ - - dump/raw/sbn_train/wav.scp
88
+ - speech
89
+ - sound
90
+ - - dump/raw/sbn_train/text
91
+ - text
92
+ - text
93
+ valid_data_path_and_name_and_type:
94
+ - - dump/raw/sbn_dev/wav.scp
95
+ - speech
96
+ - sound
97
+ - - dump/raw/sbn_dev/text
98
+ - text
99
+ - text
100
+ allow_variable_data_keys: false
101
+ max_cache_size: 0.0
102
+ max_cache_fd: 32
103
+ valid_max_cache_size: null
104
+ optim: adam
105
+ optim_conf:
106
+ lr: 10.0
107
+ scheduler: noamlr
108
+ scheduler_conf:
109
+ warmup_steps: 25000
110
+ token_list:
111
+ - <blank>
112
+ - <unk>
113
+ - র
114
+ - ে
115
+ - ন
116
+ - ের
117
+ - া
118
+ - ল
119
+ - ক
120
+ - ্
121
+ - ো
122
+ - ত
123
+ - ি
124
+ - স
125
+ - ▁
126
+ - ই
127
+ - ী
128
+ - য়
129
+ - ম
130
+ - ু
131
+ - ▁আ
132
+ - প
133
+ - ব
134
+ - তে
135
+ - দ
136
+ - শ
137
+ - কে
138
+ - টি
139
+ - ্য
140
+ - হ
141
+ - ▁এ
142
+ - ▁না
143
+ - ▁ব
144
+ - ও
145
+ - গ
146
+ - ট
147
+ - রা
148
+ - ▁অ
149
+ - জ
150
+ - ▁বি
151
+ - ▁বা
152
+ - ▁স
153
+ - না
154
+ - ার
155
+ - ▁করে
156
+ - ধ
157
+ - নি
158
+ - ▁ম
159
+ - লে
160
+ - ▁জ
161
+ - ▁ও
162
+ - ▁হ
163
+ - চ
164
+ - তা
165
+ - দের
166
+ - ▁মা
167
+ - িত
168
+ - ▁থেকে
169
+ - ্যা
170
+ - ণ
171
+ - '-'
172
+ - ▁প্র
173
+ - তি
174
+ - ▁হয়
175
+ - ায়
176
+ - িক
177
+ - ▁এক
178
+ - ▁পা
179
+ - ▁ক
180
+ - ঁ
181
+ - ভ
182
+ - ▁ভ
183
+ - ▁সা
184
+ - লা
185
+ - ▁শ
186
+ - ','
187
+ - ্র
188
+ - ▁এই
189
+ - ▁নি
190
+ - ▁প
191
+ - বা
192
+ - ▁পর
193
+ - ফ
194
+ - ▁সে
195
+ - ক্ষ
196
+ - ছে
197
+ - মা
198
+ - ষ
199
+ - ▁কা
200
+ - টা
201
+ - বে
202
+ - িয়া
203
+ - ড়
204
+ - ▁দ
205
+ - ▁চ
206
+ - লি
207
+ - ▁ই
208
+ - ▁হা
209
+ - ▁তার
210
+ - ▁যে
211
+ - থ
212
+ - ।
213
+ - ড
214
+ - ুল
215
+ - িয়ে
216
+ - ▁গ
217
+ - বি
218
+ - ▁তা
219
+ - রি
220
+ - কা
221
+ - ▁র
222
+ - ▁ফ
223
+ - পা
224
+ - ▁ন
225
+ - ▁করা
226
+ - ং
227
+ - ▁আর
228
+ - উ
229
+ - নে
230
+ - খ
231
+ - য়ে
232
+ - ▁নিয়ে
233
+ - ▁তিনি
234
+ - ▁একটি
235
+ - নের
236
+ - ▁হয়েছে
237
+ - ্ব
238
+ - ▁ত
239
+ - ▁জন্য
240
+ - ▁যা
241
+ - বার
242
+ - ঙ্গ
243
+ - ান
244
+ - স্ত
245
+ - কার
246
+ - জা
247
+ - ূ
248
+ - ঠ
249
+ - ুর
250
+ - ▁হবে
251
+ - ▁মি
252
+ - দা
253
+ - াই
254
+ - ▁জা
255
+ - ▁বলে
256
+ - ▁কি
257
+ - ড়া
258
+ - ▁ঘ
259
+ - ▁দু
260
+ - হা
261
+ - ত্র
262
+ - ০
263
+ - ছেন
264
+ - ▁কথা
265
+ - সি
266
+ - াম
267
+ - ▁ছিল
268
+ - ▁উ
269
+ - ▁বল
270
+ - ▁তাদের
271
+ - ৃ
272
+ - ▁রা
273
+ - ▁সঙ্গে
274
+ - ▁প্রতি
275
+ - ▁এবং
276
+ - ▁ধ
277
+ - ▁ল
278
+ - ছ
279
+ - ▁খা
280
+ - ▁বে
281
+ - ▁সময়
282
+ - য়া
283
+ - জন
284
+ - মি
285
+ - ন্ত
286
+ - ▁করতে
287
+ - ▁সু
288
+ - ▁করেন
289
+ - ীর
290
+ - ৌ
291
+ - ▁অনেক
292
+ - গুলো
293
+ - ষ্ট
294
+ - ধা
295
+ - সা
296
+ - ▁হয়ে
297
+ - ▁মধ্যে
298
+ - ▁চা
299
+ - ▁লা
300
+ - ির
301
+ - ▁১
302
+ - ▁সং
303
+ - োর
304
+ - ভাবে
305
+ - ▁আমি
306
+ - ১
307
+ - শা
308
+ - াল
309
+ - জি
310
+ - ▁তারা
311
+ - ▁যায়
312
+ - মান
313
+ - ▁কাজ
314
+ - ▁কিছু
315
+ - ▁দিয়ে
316
+ - টে
317
+ - রণ
318
+ - ▁ড
319
+ - ▁উপ
320
+ - স্থ
321
+ - দি
322
+ - সে
323
+ - ▁মে
324
+ - ▁সরকার
325
+ - ▁খ
326
+ - ▁পার
327
+ - ীয়
328
+ - ক্ত
329
+ - ওয়া
330
+ - স্ট
331
+ - এ
332
+ - ▁বাংলাদেশ
333
+ - ড়ে
334
+ - ন্ট
335
+ - ▁২
336
+ - ▁আছে
337
+ - ▁সব
338
+ - ছি
339
+ - ▁দি
340
+ - ▁আমার
341
+ - ▁এখন
342
+ - মে
343
+ - ▁বছর
344
+ - ▁ট
345
+ - ▁শা
346
+ - কি
347
+ - ন্ড
348
+ - ▁ন���ম
349
+ - ▁কোন
350
+ - দিন
351
+ - পুর
352
+ - ▁সম্
353
+ - ছিল
354
+ - ▁পুলিশ
355
+ - ▁য
356
+ - ৈ
357
+ - ▁মানুষ
358
+ - ▁দা
359
+ - েই
360
+ - ▁এর
361
+ - ▁সালে
362
+ - ▁কর
363
+ - ঘ
364
+ - গ্র
365
+ - ▁দিন
366
+ - ▁পারে
367
+ - ্ম
368
+ - ৫
369
+ - ▁দেশ
370
+ - ▁দেখ
371
+ - ▁স্ব
372
+ - ▁সম
373
+ - ▁১৯
374
+ - ▁সি
375
+ - ▁শুরু
376
+ - ▁প্রথম
377
+ - ত্
378
+ - ▁তো
379
+ - ্ট
380
+ - ▁আগে
381
+ - ▁কোনো
382
+ - ▁রয়েছে
383
+ - ▁হচ্ছে
384
+ - ▁অব
385
+ - ছিলেন
386
+ - যোগ
387
+ - জে
388
+ - ▁ভারত
389
+ - ▁নে
390
+ - প্র
391
+ - ▁সেই
392
+ - গা
393
+ - ▁গা
394
+ - হি
395
+ - ন্ন
396
+ - ▁ছ
397
+ - ▁জন
398
+ - ▁নির্
399
+ - খা
400
+ - পি
401
+ - ▁পে
402
+ - ▁স্
403
+ - াব
404
+ - ▁মো
405
+ - ▁অনু
406
+ - ▁কিন্তু
407
+ - ৯
408
+ - ▁পরি
409
+ - ▁ঢাকা
410
+ - তার
411
+ - লো
412
+ - ▁বিষয়
413
+ - ▁তাঁর
414
+ - ৪
415
+ - র্থ
416
+ - ▁অ্যা
417
+ - ▁ঘটনা
418
+ - ▁শেষ
419
+ - ড়ি
420
+ - লেন
421
+ - ▁আমাদের
422
+ - ▁বড়
423
+ - দেশ
424
+ - ▁নেই
425
+ - ▁ব্যা
426
+ - ানো
427
+ - ▁বেশি
428
+ - মার
429
+ - বাস
430
+ - ▁তবে
431
+ - ▁কো
432
+ - শি
433
+ - ▁বিভিন্ন
434
+ - ▁নয়
435
+ - ৭
436
+ - নী
437
+ - ৩
438
+ - ▁দল
439
+ - ▁দেখা
440
+ - ঝ
441
+ - ▁করার
442
+ - ▁কে
443
+ - ▁হলে
444
+ - ুক
445
+ - ▁গু
446
+ - ▁৩
447
+ - ৬
448
+ - ▁মনে
449
+ - ▁নির্বাচন
450
+ - ▁রাজ
451
+ - ▁করেছে
452
+ - ীন
453
+ - লের
454
+ - িতে
455
+ - ▁একটা
456
+ - ঞ্চ
457
+ - ▁রাখ
458
+ - ▁থাক
459
+ - ▁আমরা
460
+ - ▁চল
461
+ - ২
462
+ - ▁কাছে
463
+ - ▁মু
464
+ - ▁পড়
465
+ - ▁সহ
466
+ - ▁হিসেবে
467
+ - জ্ঞ
468
+ - ান্ত
469
+ - ণ্ড
470
+ - ৎ
471
+ - য়ের
472
+ - ▁পু
473
+ - ▁একজন
474
+ - ▁বলেন
475
+ - ুন
476
+ - িং
477
+ - ’
478
+ - ▁বাংলা
479
+ - টার
480
+ - ুম
481
+ - ঞ্জ
482
+ - ▁বাড়ি
483
+ - ▁গত
484
+ - ▁হাজার
485
+ - ▁মতো
486
+ - ডি
487
+ - ▁তিন
488
+ - দ্ধ
489
+ - ▁এমন
490
+ - ▁কয়েক
491
+ - ▁কম
492
+ - ত্ব
493
+ - ্রা
494
+ - ▁দিকে
495
+ - ▁ছিলেন
496
+ - ▁পড়ে
497
+ - নার
498
+ - ▁করি
499
+ - কাল
500
+ - ▁মুখ
501
+ - ▁উঠ
502
+ - র্ত
503
+ - ▁টাকা
504
+ - চার
505
+ - শে
506
+ - ▁এসে
507
+ - ▁দুই
508
+ - ▁করেছেন
509
+ - ▁লোক
510
+ - ম্প
511
+ - ৮
512
+ - ষ্ঠ
513
+ - ▁মহা
514
+ - ▁কু
515
+ - ▁থাকে
516
+ - বাদ
517
+ - চি
518
+ - ▁এলাকা
519
+ - ▁জানান
520
+ - ▁প্রায়
521
+ - ▁দেয়া
522
+ - ▁গেল
523
+ - য
524
+ - চ্ছে
525
+ - ▁ছবি
526
+ - ▁নতুন
527
+ - ▁অবস্থা
528
+ - ▁অভি
529
+ - ▁আজ
530
+ - ▁কার
531
+ - ▁খু
532
+ - ▁জানা
533
+ - ▁করছে
534
+ - টির
535
+ - ▁বাংলাদেশের
536
+ - ▁বন্ধ
537
+ - কারী
538
+ - ▁অন্য
539
+ - ▁ধরে
540
+ - প্ত
541
+ - ▁তাকে
542
+ - ▁গেছে
543
+ - ▁শি
544
+ - চা
545
+ - আ
546
+ - ▁চাল
547
+ - ▁আল
548
+ - ▁৫
549
+ - ▁উত্ত
550
+ - ▁ঝ
551
+ - ▁জীবন
552
+ - লার
553
+ - ঙ
554
+ - ▁প্রকাশ
555
+ - ▁মেয়ে
556
+ - ▁রে
557
+ - ▁দেশের
558
+ - ▁খেল
559
+ - ▁মূল
560
+ - ভি
561
+ - ঙ্ক
562
+ - ▁চি
563
+ - ▁পর্যন্ত
564
+ - ▁সাথে
565
+ - লাম
566
+ - ▁৪
567
+ - ▁টি
568
+ - ▁বো
569
+ - ▁আইন
570
+ - গত
571
+ - ▁হতে
572
+ - ▁ভালো
573
+ - .
574
+ - স্ক
575
+ - ▁অভিযোগ
576
+ - ন্স
577
+ - ▁কারণে
578
+ - ▁অর্থ
579
+ - ▁অপ
580
+ - ক্স
581
+ - বু
582
+ - ▁২০
583
+ - ▁পাওয়া
584
+ - ▁খুব
585
+ - ▁মন
586
+ - সম
587
+ - ল্লা
588
+ - ব্দ
589
+ - ▁পি
590
+ - ▁ওই
591
+ - ▁করবে
592
+ - য়ার
593
+ - সহ
594
+ - ক্ষণ
595
+ - ▁নারী
596
+ - ম্ব
597
+ - ▁ফা
598
+ - ▁বেশ
599
+ - ▁পেয়ে
600
+ - দে
601
+ - ▁তখন
602
+ - িয়ার
603
+ - ▁ক্যা
604
+ - ▁ছেলে
605
+ - ▁চার
606
+ - ভার
607
+ - ▁দিতে
608
+ - ▁ক্র
609
+ - ▁গান
610
+ - বাহিনী
611
+ - ▁ভি
612
+ - কৃত
613
+ - ▁গো
614
+ - বল
615
+ - ▁ইসলাম
616
+ - ▁জি
617
+ - ▁ডি
618
+ - ন্দ্র
619
+ - ▁গ্রাম
620
+ - ▁ওপর
621
+ - ▁ভোট
622
+ - ▁পাঠ
623
+ - ▁গিয়ে
624
+ - ▁মামলা
625
+ - ▁ব্যবস্থা
626
+ - সার
627
+ - যুক্ত
628
+ - ▁মাস
629
+ - দার
630
+ - ▁সেখানে
631
+ - ▁জন্ম
632
+ - ▁পদ
633
+ - ▁কেউ
634
+ - র্ণ
635
+ - ▁দেওয়া
636
+ - ভাগ
637
+ - ▁১০
638
+ - ▁উদ্
639
+ - োয়া
640
+ - রূপ
641
+ - ▁ফেল
642
+ - ▁তৈরি
643
+ - ▁খবর
644
+ - ▁কেন
645
+ - ▁ভাষা
646
+ - ▁৬
647
+ - ▁ভাব
648
+ - ▁নেতা
649
+ - ▁জানিয়েছে
650
+ - ▁কী
651
+ - ফা
652
+ - ▁থাকা
653
+ - ▁লি
654
+ - টের
655
+ - ▁ছা
656
+ - ▁হল
657
+ - ▁গ্র
658
+ - ▁কর্ম
659
+ - ▁সদস্য
660
+ - ▁জাতীয়
661
+ - ▁ব্র
662
+ - দু
663
+ - ▁কেন্দ্র
664
+ - ▁হওয়ার
665
+ - ▁দেব
666
+ - ▁চলে
667
+ - ▁হলো
668
+ - তু
669
+ - ▁বিশ্ব
670
+ - ▁যাওয়া
671
+ - ▁যাবে
672
+ - ▁ট্র
673
+ - ▁সম্পর্ক
674
+ - ▁দিয়েছে
675
+ - ▁যদি
676
+ - ���বিরুদ্ধে
677
+ - ▁বিশেষ
678
+ - ▁করলে
679
+ - ▁ছোট
680
+ - ▁অধি
681
+ - ▁শুন
682
+ - ▁আবার
683
+ - ▁কারণ
684
+ - ▁দলের
685
+ - ▁ফি
686
+ - ▁স্ট
687
+ - ▁দেয়
688
+ - ▁শিল্প
689
+ - ▁রাজনৈতিক
690
+ - ▁বলা
691
+ - ▁ছাড়া
692
+ - ▁জেলা
693
+ - ▁দেখে
694
+ - ▁প্রধান
695
+ - ▁এসব
696
+ - বন্ধ
697
+ - ▁কর্মকর্তা
698
+ - চ্ছি
699
+ - ▁তথ্য
700
+ - ▁অংশ
701
+ - ▁দশ
702
+ - ▁তাহা
703
+ - মন্ত্রী
704
+ - ৃত
705
+ - ▁ঠিক
706
+ - ▁রাত
707
+ - ▁আসা
708
+ - ▁থানা
709
+ - ▁গোল
710
+ - রাজ
711
+ - ▁মৃত্যু
712
+ - ▁রি
713
+ - ▁পথ
714
+ - ্যান
715
+ - ▁বিচার
716
+ - ▁শ্রমিক
717
+ - ▁গল্প
718
+ - ▁সকাল
719
+ - ▁হাতে
720
+ - ▁এটা
721
+ - ▁কবি
722
+ - ▁বাবা
723
+ - ▁দাবি
724
+ - ▁চাই
725
+ - ▁মাধ্যমে
726
+ - ▁হয়েছিল
727
+ - ▁ঢ
728
+ - ▁যাচ্ছে
729
+ - ▁২০০
730
+ - ▁চলচ্চিত্র
731
+ - ▁রহমান
732
+ - ▁লেখা
733
+ - ▁দেন
734
+ - ▁পুরুষ
735
+ - চিত্র
736
+ - ▁ব্যবহার
737
+ - ▁অনুষ্ঠান
738
+ - ▁বর্তমান
739
+ - ▁ধর্ম
740
+ - ▁দাঁড়
741
+ - ▁নিহত
742
+ - ঃ
743
+ - চ্ছ
744
+ - ▁চেষ্টা
745
+ - ▁চোখ
746
+ - ▁উপজেলা
747
+ - ▁আদালত
748
+ - ▁সামনে
749
+ - ▁রু
750
+ - ▁চেয়ে
751
+ - ▁সর্ব
752
+ - ▁হত্যা
753
+ - ▁গণ
754
+ - ▁ডাক
755
+ - ▁দ্বিতীয়
756
+ - ▁ধরনের
757
+ - ▁কবিতা
758
+ - ▁ফলে
759
+ - ▁সবচেয়ে
760
+ - গুলি
761
+ - ▁মোট
762
+ - ▁পরিবার
763
+ - ▁শিশু
764
+ - ▁হোসেন
765
+ - ▁রেখে
766
+ - ▁রায়
767
+ - ▁মাথা
768
+ - ▁দুর্
769
+ - ▁৮
770
+ - ▁টা
771
+ - ▁৭
772
+ - ▁বসে
773
+ - ▁ওয়া
774
+ - ▁ব্যক্তি
775
+ - ▁শুধু
776
+ - ▁ব্যাংক
777
+ - ▁পাকিস্তান
778
+ - ▁যখন
779
+ - ▁করিয়া
780
+ - ▁লিখ
781
+ - পূর্ণ
782
+ - ▁বিশ্ববিদ্যালয়
783
+ - ▁সংখ্যা
784
+ - ▁যুদ্ধ
785
+ - ▁হইয়া
786
+ - ▁ক্ষমতা
787
+ - ▁সাধারণ
788
+ - ▁কোটি
789
+ - ▁শিক্ষা
790
+ - ▁আলো
791
+ - ▁তুলে
792
+ - ▁সত্য
793
+ - ▁ঘটে
794
+ - ''''
795
+ - ▁দূর
796
+ - ▁প্রশ্ন
797
+ - ুদ্ধ
798
+ - ▁লাখ
799
+ - ▁নিজের
800
+ - েশন
801
+ - ▁আলোচনা
802
+ - ঈ
803
+ - ▁ক্রিকেট
804
+ - ▁সমাজ
805
+ - ▁বয়স
806
+ - ▁গ্রহণ
807
+ - ▁জায়গা
808
+ - ▁ব্যবসা
809
+ - বর্তী
810
+ - জীব
811
+ - কল্প
812
+ - ▁প্রত্য
813
+ - ▁মাত্র
814
+ - ▁উৎ
815
+ - ▁শহরে
816
+ - ▁এখানে
817
+ - ▁নেয়া
818
+ - ▁ঘোষণা
819
+ - ▁সকল
820
+ - ▁আটক
821
+ - ▁নিরাপত্তা
822
+ - ▁পাঁচ
823
+ - ▁পূর্ব
824
+ - ▁রাষ্ট্র
825
+ - ▁ভাই
826
+ - ▁বহু
827
+ - ▁পরীক্ষা
828
+ - ▁পুরো
829
+ - ▁বাইরে
830
+ - ▁থাকবে
831
+ - ▁ক্ষেত্রে
832
+ - ▁স্থান
833
+ - ▁ম্যাচ
834
+ - ▁ঘরে
835
+ - ▁সবাই
836
+ - ার্ড
837
+ - ▁উদ্ধার
838
+ - ▁ইতিহাস
839
+ - ▁সাহিত্য
840
+ - ▁সুযোগ
841
+ - ▁আন্দোলন
842
+ - ▁যুক্তরাষ্ট্র
843
+ - দর্শন
844
+ - ▁১২
845
+ - ▁১৮
846
+ - ▁প্রেম
847
+ - ▁আন্তর্জাতিক
848
+ - ল্যান্ড
849
+ - ▁সমস্যা
850
+ - ▁বিভাগ
851
+ - ▁সিদ্ধান্ত
852
+ - ▁মধ্য
853
+ - ন্দি
854
+ - ▁ছাত্র
855
+ - ▁গাড়ি
856
+ - ▁দীর্ঘ
857
+ - ▁সংবাদ
858
+ - ▁প্রয়োজন
859
+ - ▁সিনেমা
860
+ - ▁রাজধানী
861
+ - ▁স্থানীয়
862
+ - ▁একটু
863
+ - ▁বাজার
864
+ - জ্জ
865
+ - ▁পৃথিবী
866
+ - ▁বিশ্বাস
867
+ - ▁আহত
868
+ - ▁দায়িত্ব
869
+ - ▁হরতাল
870
+ - ▁সম্ভব
871
+ - ▁অফিস
872
+ - ▁অভিনয়
873
+ - ▁কলেজ
874
+ - ▁চট্টগ্রাম
875
+ - ▁ক্ল
876
+ - ▁দক্ষিণ
877
+ - ▁পক্ষে
878
+ - ▁মুক্তি
879
+ - ▁সংসদ
880
+ - ‘
881
+ - ▁উপস্থিত
882
+ - ▁ফিরে
883
+ - ▁আগামী
884
+ - ▁সংগঠন
885
+ - ▁মিনিট
886
+ - ▁হামলা
887
+ - ▁প্রতিষ্ঠান
888
+ - ▁পোশাক
889
+ - ▁প্ল
890
+ - ▁সৃষ্টি
891
+ - ▁কমিশন
892
+ - ▁আমাকে
893
+ - ▁তদন্ত
894
+ - ▁উচ্চ
895
+ - ▁রাজনীতি
896
+ - দ্দ
897
+ - ▁দর্শক
898
+ - ▁তুমি
899
+ - ▁পরিস্থিতি
900
+ - াহার
901
+ - ▁ক্ষতি
902
+ - ▁আত্ম
903
+ - ▁গ্রেপ্তার
904
+ - ▁ফুট
905
+ - ▁পাশাপাশি
906
+ - মূল
907
+ - ▁প্রধানমন্ত্রী
908
+ - কর্মী
909
+ - ▁সুন্দর
910
+ - ▁নিয়ম
911
+ - ▁আগুন
912
+ - বিজ্ঞান
913
+ - ▁সাংবাদিক
914
+ - ▁লক্ষ্য
915
+ - ▁অবশ্য
916
+ - ▁শরীর
917
+ - ▁উল্লেখ
918
+ - ▁শতাংশ
919
+ - ▁স্কুল
920
+ - ভূত
921
+ - ▁গ্রন্থ
922
+ - ▁কখনো
923
+ - ▁প্রাণ
924
+ - ▁কারখানা
925
+ - ▁হিন্দু
926
+ - ▁বিবিসি
927
+ - ▁আপনার
928
+ - ▁আহমেদ
929
+ - ▁স্ত্রী
930
+ - বর্ষ
931
+ - ▁শক্তি
932
+ - সভা
933
+ - ▁রাস্তা
934
+ - ▁রকম
935
+ - ▁পশ্চিম
936
+ - ▁অপরাধ
937
+ - ▁আসছে
938
+ - ▁সংস্থা
939
+ - ▁পৌঁছ
940
+ - ▁দোকান
941
+ - ▁পত্রিকা
942
+ - ▁লেখক
943
+ - ▁সন্তান
944
+ - ▁ভেতর
945
+ - ▁এগিয়ে
946
+ - ▁নদী
947
+ - ▁হইল
948
+ - ▁পরিবেশ
949
+ - ▁প্রেসিডেন্ট
950
+ - ▁ছেড়ে
951
+ - ▁চেয়ারম্যান
952
+ - ▁ধারা
953
+ - বৃত্ত
954
+ - ▁বিক্রি
955
+ - ▁শ্রী
956
+ - ▁রক্ষা
957
+ - ▁দ্রুত
958
+ - ▁পরিচয়
959
+ - ▁মালিক
960
+ - ▁উপন্যাস
961
+ - ▁শিক্ষার্থী
962
+ - ▁অন্যতম
963
+ - ▁চরিত্র
964
+ - ▁প্রতিবেদন
965
+ - ▁প্রস্তুত
966
+ - ▁অভিযান
967
+ - তন্ত্র
968
+ - ▁অগ্নি
969
+ - ▁জনগণ
970
+ - ▁বৃহস্পতিবার
971
+ - ▁ব্যাপক
972
+ - ▁অনুযায়ী
973
+ - ▁পরিবর্তন
974
+ - ▁কলকাতা
975
+ - ভূমি
976
+ - ▁নজরুল
977
+ - ▁ভূমিকা
978
+ - ▁জনপ্রিয়
979
+ - ▁শিক্ষক
980
+ - ▁তেমন
981
+ - ▁অন্যান্য
982
+ - ▁বিদ্যুৎ
983
+ - খ্যাত
984
+ - ▁অস্ত্র
985
+ - ▁প্রস্তাব
986
+ - ▁স্বামী
987
+ - ▁পরিচিত
988
+ - ▁আয়োজন
989
+ - ▁শনিবার
990
+ - ▁তাঁকে
991
+ - ▁যাত্রী
992
+ - প্রাপ্ত
993
+ - ▁কর্মসূচি
994
+ - ▁গঠন
995
+ - ▁প্রভাব
996
+ - ▁কৃষ্ণ
997
+ - ▁সমাবেশ
998
+ - ▁সূত্র
999
+ - ▁অনুষ্ঠিত
1000
+ - ▁পর্যায়ে
1001
+ - ঋ
1002
+ - ▁পুরস্কার
1003
+ - ▁বিক্ষোভ
1004
+ - ▁নিয়ন্ত্রণ
1005
+ - ▁রোববার
1006
+ - ▁প্রার্থী
1007
+ - ▁যোগাযোগ
1008
+ - ▁সোমবার
1009
+ - ▁মার্চ
1010
+ - ▁কমিটি
1011
+ - ▁সংঘর্ষ
1012
+ - ▁বুধবার
1013
+ - ▁সামাজিক
1014
+ - ▁তাঁদের
1015
+ - ▁মার্কিন
1016
+ - ▁সামরিক
1017
+ - ▁নিজেদের
1018
+ - ▁মঙ্গলবার
1019
+ - ▁বক্তব্য
1020
+ - ▁চুক্তি
1021
+ - ▁যুগ
1022
+ - ▁বৈঠক
1023
+ - ▁ইউনিয়ন
1024
+ - ▁মোহাম্মদ
1025
+ - অ
1026
+ - ▁তাঁহার
1027
+ - ▁নির্মাণ
1028
+ - ▁জানুয়ারি
1029
+ - ▁আবেদন
1030
+ - ▁বিশ্বকাপ
1031
+ - ▁ফেব্রুয়ারি
1032
+ - ▁তরুণ
1033
+ - ▁হিসাব
1034
+ - ▁সন্ধ্যা
1035
+ - ▁পরিকল্পনা
1036
+ - ▁উইকেট
1037
+ - ▁ধারণা
1038
+ - ▁আনন্দ
1039
+ - মুক্ত
1040
+ - ▁উদ্দেশ্য
1041
+ - ▁চিকিৎসা
1042
+ - ▁উন্নয়ন
1043
+ - ▁আধুনিক
1044
+ - ▁ভিত্তি
1045
+ - ':'
1046
+ - "\x94"
1047
+ - ঢ
1048
+ - ‍
1049
+ - ়
1050
+ - e
1051
+ - /
1052
+ - i
1053
+ - r
1054
+ - t
1055
+ - o
1056
+ - '%'
1057
+ - l
1058
+ - a
1059
+ - n
1060
+ - '!'
1061
+ - p
1062
+ - '"'
1063
+ - s
1064
+ - '?'
1065
+ - d
1066
+ - '0'
1067
+ - '3'
1068
+ - u
1069
+ - ঞ
1070
+ - f
1071
+ - g
1072
+ - c
1073
+ - m
1074
+ - h
1075
+ - –
1076
+ - w
1077
+ - b
1078
+ - ;
1079
+ - x
1080
+ - '8'
1081
+ - '5'
1082
+ - '9'
1083
+ - k
1084
+ - ”
1085
+ - y
1086
+ - H
1087
+ - L
1088
+ - T
1089
+ - j
1090
+ - ৗ
1091
+ - B
1092
+ - K
1093
+ - _
1094
+ - z
1095
+ - “
1096
+ - F
1097
+ - v
1098
+ - '4'
1099
+ - '1'
1100
+ - '2'
1101
+ - ঔ
1102
+ - ঊ
1103
+ - "\x93"
1104
+ - D
1105
+ - O
1106
+ - œ
1107
+ - ঐ
1108
+ - ৰ
1109
+ - —
1110
+ - <sos/eos>
1111
+ init: chainer
1112
+ input_size: null
1113
+ ctc_conf:
1114
+ dropout_rate: 0.0
1115
+ ctc_type: builtin
1116
+ reduce: true
1117
+ ignore_nan_grad: true
1118
+ joint_net_conf: null
1119
+ model_conf:
1120
+ ctc_weight: 0.3
1121
+ lsm_weight: 0.1
1122
+ length_normalized_loss: false
1123
+ use_preprocessor: true
1124
+ token_type: bpe
1125
+ bpemodel: data/token_list/bpe_unigram1000/bpe.model
1126
+ non_linguistic_symbols: null
1127
+ cleaner: null
1128
+ g2p: null
1129
+ speech_volume_normalize: null
1130
+ rir_scp: null
1131
+ rir_apply_prob: 1.0
1132
+ noise_scp: null
1133
+ noise_apply_prob: 1.0
1134
+ noise_db_range: '13_15'
1135
+ frontend: default
1136
+ frontend_conf:
1137
+ fs: 16k
1138
+ specaug: null
1139
+ specaug_conf: {}
1140
+ normalize: global_mvn
1141
+ normalize_conf:
1142
+ stats_file: exp/asr_stats_raw_bpe1000/train/feats_stats.npz
1143
+ preencoder: null
1144
+ preencoder_conf: {}
1145
+ encoder: transformer
1146
+ encoder_conf:
1147
+ input_layer: conv2d
1148
+ num_blocks: 12
1149
+ linear_units: 2048
1150
+ dropout_rate: 0.1
1151
+ output_size: 256
1152
+ attention_heads: 4
1153
+ attention_dropout_rate: 0.0
1154
+ postencoder: null
1155
+ postencoder_conf: {}
1156
+ decoder: transformer
1157
+ decoder_conf:
1158
+ input_layer: embed
1159
+ num_blocks: 6
1160
+ linear_units: 2048
1161
+ dropout_rate: 0.1
1162
+ required:
1163
+ - output_dir
1164
+ - token_list
1165
+ version: 0.10.6a1
1166
+ distributed: false
exp/asr_train_asr_raw_bpe1000/images/acc.png ADDED
exp/asr_train_asr_raw_bpe1000/images/backward_time.png ADDED
exp/asr_train_asr_raw_bpe1000/images/cer.png ADDED
exp/asr_train_asr_raw_bpe1000/images/cer_ctc.png ADDED
exp/asr_train_asr_raw_bpe1000/images/forward_time.png ADDED
exp/asr_train_asr_raw_bpe1000/images/gpu_max_cached_mem_GB.png ADDED
exp/asr_train_asr_raw_bpe1000/images/iter_time.png ADDED
exp/asr_train_asr_raw_bpe1000/images/loss.png ADDED
exp/asr_train_asr_raw_bpe1000/images/loss_att.png ADDED
exp/asr_train_asr_raw_bpe1000/images/loss_ctc.png ADDED
exp/asr_train_asr_raw_bpe1000/images/optim0_lr0.png ADDED
exp/asr_train_asr_raw_bpe1000/images/optim_step_time.png ADDED
exp/asr_train_asr_raw_bpe1000/images/train_time.png ADDED
exp/asr_train_asr_raw_bpe1000/images/wer.png ADDED
exp/lm_train_lm_bpe1000/20epoch.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:c44c37d90bea8561a606dda07d97d3d695c7b0ca6de33eb2ab8634c16c2a74c8
3
+ size 32288211
exp/lm_train_lm_bpe1000/config.yaml ADDED
@@ -0,0 +1,1117 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ config: conf/train_lm.yaml
2
+ print_config: false
3
+ log_level: INFO
4
+ dry_run: false
5
+ iterator_type: sequence
6
+ output_dir: exp/lm_train_lm_bpe1000
7
+ ngpu: 1
8
+ seed: 0
9
+ num_workers: 1
10
+ num_att_plot: 3
11
+ dist_backend: nccl
12
+ dist_init_method: env://
13
+ dist_world_size: null
14
+ dist_rank: null
15
+ local_rank: 0
16
+ dist_master_addr: null
17
+ dist_master_port: null
18
+ dist_launcher: null
19
+ multiprocessing_distributed: false
20
+ unused_parameters: false
21
+ sharded_ddp: false
22
+ cudnn_enabled: true
23
+ cudnn_benchmark: false
24
+ cudnn_deterministic: true
25
+ collect_stats: false
26
+ write_collected_feats: false
27
+ max_epoch: 20
28
+ patience: 3
29
+ val_scheduler_criterion:
30
+ - valid
31
+ - loss
32
+ early_stopping_criterion:
33
+ - valid
34
+ - loss
35
+ - min
36
+ best_model_criterion:
37
+ - - valid
38
+ - loss
39
+ - min
40
+ keep_nbest_models: 1
41
+ nbest_averaging_interval: 0
42
+ grad_clip: 5.0
43
+ grad_clip_type: 2.0
44
+ grad_noise: false
45
+ accum_grad: 1
46
+ no_forward_run: false
47
+ resume: true
48
+ train_dtype: float32
49
+ use_amp: false
50
+ log_interval: null
51
+ use_matplotlib: true
52
+ use_tensorboard: true
53
+ use_wandb: false
54
+ wandb_project: null
55
+ wandb_id: null
56
+ wandb_entity: null
57
+ wandb_name: null
58
+ wandb_model_log_interval: -1
59
+ detect_anomaly: false
60
+ pretrain_path: null
61
+ init_param: []
62
+ ignore_init_mismatch: false
63
+ freeze_param: []
64
+ num_iters_per_epoch: null
65
+ batch_size: 64
66
+ valid_batch_size: null
67
+ batch_bins: 1000000
68
+ valid_batch_bins: null
69
+ train_shape_file:
70
+ - exp/lm_stats_bpe1000/train/text_shape.bpe
71
+ valid_shape_file:
72
+ - exp/lm_stats_bpe1000/valid/text_shape.bpe
73
+ batch_type: folded
74
+ valid_batch_type: null
75
+ fold_length:
76
+ - 150
77
+ sort_in_batch: descending
78
+ sort_batch: descending
79
+ multiple_iterator: false
80
+ chunk_length: 500
81
+ chunk_shift_ratio: 0.5
82
+ num_cache_chunks: 1024
83
+ train_data_path_and_name_and_type:
84
+ - - dump/raw/lm_train.txt
85
+ - text
86
+ - text
87
+ valid_data_path_and_name_and_type:
88
+ - - data/sbn_dev/text
89
+ - text
90
+ - text
91
+ allow_variable_data_keys: false
92
+ max_cache_size: 0.0
93
+ max_cache_fd: 32
94
+ valid_max_cache_size: null
95
+ optim: sgd
96
+ optim_conf: {}
97
+ scheduler: null
98
+ scheduler_conf: {}
99
+ token_list:
100
+ - <blank>
101
+ - <unk>
102
+ - র
103
+ - ে
104
+ - ন
105
+ - ের
106
+ - া
107
+ - ল
108
+ - ক
109
+ - ্
110
+ - ো
111
+ - ত
112
+ - ি
113
+ - স
114
+ - ▁
115
+ - ই
116
+ - ী
117
+ - য়
118
+ - ম
119
+ - ু
120
+ - ▁আ
121
+ - প
122
+ - ব
123
+ - তে
124
+ - দ
125
+ - শ
126
+ - কে
127
+ - টি
128
+ - ্য
129
+ - হ
130
+ - ▁এ
131
+ - ▁না
132
+ - ▁ব
133
+ - ও
134
+ - গ
135
+ - ট
136
+ - রা
137
+ - ▁অ
138
+ - জ
139
+ - ▁বি
140
+ - ▁বা
141
+ - ▁স
142
+ - না
143
+ - ার
144
+ - ▁করে
145
+ - ধ
146
+ - নি
147
+ - ▁ম
148
+ - লে
149
+ - ▁জ
150
+ - ▁ও
151
+ - ▁হ
152
+ - চ
153
+ - তা
154
+ - দের
155
+ - ▁মা
156
+ - িত
157
+ - ▁থেকে
158
+ - ্যা
159
+ - ণ
160
+ - '-'
161
+ - ▁প্র
162
+ - তি
163
+ - ▁হয়
164
+ - ায়
165
+ - িক
166
+ - ▁এক
167
+ - ▁পা
168
+ - ▁ক
169
+ - ঁ
170
+ - ভ
171
+ - ▁ভ
172
+ - ▁সা
173
+ - লা
174
+ - ▁শ
175
+ - ','
176
+ - ্র
177
+ - ▁এই
178
+ - ▁নি
179
+ - ▁প
180
+ - বা
181
+ - ▁পর
182
+ - ফ
183
+ - ▁সে
184
+ - ক্ষ
185
+ - ছে
186
+ - মা
187
+ - ষ
188
+ - ▁কা
189
+ - টা
190
+ - বে
191
+ - িয়া
192
+ - ড়
193
+ - ▁দ
194
+ - ▁চ
195
+ - লি
196
+ - ▁ই
197
+ - ▁হা
198
+ - ▁তার
199
+ - ▁যে
200
+ - থ
201
+ - ।
202
+ - ড
203
+ - ুল
204
+ - িয়ে
205
+ - ▁গ
206
+ - বি
207
+ - ▁তা
208
+ - রি
209
+ - কা
210
+ - ▁র
211
+ - ▁ফ
212
+ - পা
213
+ - ▁ন
214
+ - ▁করা
215
+ - ং
216
+ - ▁আর
217
+ - উ
218
+ - নে
219
+ - খ
220
+ - য়ে
221
+ - ▁নিয়ে
222
+ - ▁তিনি
223
+ - ▁একটি
224
+ - নের
225
+ - ▁হয়েছে
226
+ - ্ব
227
+ - ▁ত
228
+ - ▁জন্য
229
+ - ▁যা
230
+ - বার
231
+ - ঙ্গ
232
+ - ান
233
+ - স্ত
234
+ - কার
235
+ - জা
236
+ - ূ
237
+ - ঠ
238
+ - ুর
239
+ - ▁হবে
240
+ - ▁মি
241
+ - দা
242
+ - াই
243
+ - ▁জা
244
+ - ▁বলে
245
+ - ▁কি
246
+ - ড়া
247
+ - ▁ঘ
248
+ - ▁দু
249
+ - হা
250
+ - ত্র
251
+ - ০
252
+ - ছেন
253
+ - ▁কথা
254
+ - সি
255
+ - াম
256
+ - ▁ছিল
257
+ - ▁উ
258
+ - ▁বল
259
+ - ▁তাদের
260
+ - ৃ
261
+ - ▁রা
262
+ - ▁সঙ্গে
263
+ - ▁প্রতি
264
+ - ▁এবং
265
+ - ▁ধ
266
+ - ▁ল
267
+ - ছ
268
+ - ▁খা
269
+ - ▁বে
270
+ - ▁সময়
271
+ - য়া
272
+ - জন
273
+ - মি
274
+ - ন্ত
275
+ - ▁করতে
276
+ - ▁সু
277
+ - ▁করেন
278
+ - ীর
279
+ - ৌ
280
+ - ▁অনেক
281
+ - গুলো
282
+ - ষ্ট
283
+ - ধা
284
+ - সা
285
+ - ▁হয়ে
286
+ - ▁মধ্যে
287
+ - ▁চা
288
+ - ▁লা
289
+ - ির
290
+ - ▁১
291
+ - ▁সং
292
+ - োর
293
+ - ভাবে
294
+ - ▁আমি
295
+ - ১
296
+ - শা
297
+ - াল
298
+ - জি
299
+ - ▁তারা
300
+ - ▁যায়
301
+ - মান
302
+ - ▁কাজ
303
+ - ▁কিছু
304
+ - ▁দিয়ে
305
+ - টে
306
+ - রণ
307
+ - ▁ড
308
+ - ▁উপ
309
+ - স্থ
310
+ - দি
311
+ - সে
312
+ - ▁মে
313
+ - ▁সরকার
314
+ - ▁খ
315
+ - ▁পার
316
+ - ীয়
317
+ - ক্ত
318
+ - ওয়া
319
+ - স্ট
320
+ - এ
321
+ - ▁বাংলাদেশ
322
+ - ড়ে
323
+ - ন্ট
324
+ - ▁২
325
+ - ▁আছে
326
+ - ▁সব
327
+ - ছি
328
+ - ▁দি
329
+ - ▁আমার
330
+ - ▁এখন
331
+ - মে
332
+ - ▁বছর
333
+ - ▁ট
334
+ - ▁শা
335
+ - কি
336
+ - ন্ড
337
+ - ▁নাম
338
+ - ▁কোন
339
+ - দিন
340
+ - পুর
341
+ - ▁সম্
342
+ - ছিল
343
+ - ▁পুলিশ
344
+ - ▁য
345
+ - ৈ
346
+ - ▁মানুষ
347
+ - ▁দা
348
+ - েই
349
+ - ▁এর
350
+ - ▁সালে
351
+ - ▁কর
352
+ - ঘ
353
+ - গ্র
354
+ - ▁দিন
355
+ - ▁পারে
356
+ - ্ম
357
+ - ৫
358
+ - ��দেশ
359
+ - ▁দেখ
360
+ - ▁স্ব
361
+ - ▁সম
362
+ - ▁১৯
363
+ - ▁সি
364
+ - ▁শুরু
365
+ - ▁প্রথম
366
+ - ত্
367
+ - ▁তো
368
+ - ্ট
369
+ - ▁আগে
370
+ - ▁কোনো
371
+ - ▁রয়েছে
372
+ - ▁হচ্ছে
373
+ - ▁অব
374
+ - ছিলেন
375
+ - যোগ
376
+ - জে
377
+ - ▁ভারত
378
+ - ▁নে
379
+ - প্র
380
+ - ▁সেই
381
+ - গা
382
+ - ▁গা
383
+ - হি
384
+ - ন্ন
385
+ - ▁ছ
386
+ - ▁জন
387
+ - ▁নির্
388
+ - খা
389
+ - পি
390
+ - ▁পে
391
+ - ▁স্
392
+ - াব
393
+ - ▁মো
394
+ - ▁অনু
395
+ - ▁কিন্তু
396
+ - ৯
397
+ - ▁পরি
398
+ - ▁ঢাকা
399
+ - তার
400
+ - লো
401
+ - ▁বিষয়
402
+ - ▁তাঁর
403
+ - ৪
404
+ - র্থ
405
+ - ▁অ্যা
406
+ - ▁ঘটনা
407
+ - ▁শেষ
408
+ - ড়ি
409
+ - লেন
410
+ - ▁আমাদের
411
+ - ▁বড়
412
+ - দেশ
413
+ - ▁নেই
414
+ - ▁ব্যা
415
+ - ানো
416
+ - ▁বেশি
417
+ - মার
418
+ - বাস
419
+ - ▁তবে
420
+ - ▁কো
421
+ - শি
422
+ - ▁বিভিন্ন
423
+ - ▁নয়
424
+ - ৭
425
+ - নী
426
+ - ৩
427
+ - ▁দল
428
+ - ▁দেখা
429
+ - ঝ
430
+ - ▁করার
431
+ - ▁কে
432
+ - ▁হলে
433
+ - ুক
434
+ - ▁গু
435
+ - ▁৩
436
+ - ৬
437
+ - ▁মনে
438
+ - ▁নির্বাচন
439
+ - ▁রাজ
440
+ - ▁করেছে
441
+ - ীন
442
+ - লের
443
+ - িতে
444
+ - ▁একটা
445
+ - ঞ্চ
446
+ - ▁রাখ
447
+ - ▁থাক
448
+ - ▁আমরা
449
+ - ▁চল
450
+ - ২
451
+ - ▁কাছে
452
+ - ▁মু
453
+ - ▁পড়
454
+ - ▁সহ
455
+ - ▁হিসেবে
456
+ - জ্ঞ
457
+ - ান্ত
458
+ - ণ্ড
459
+ - ৎ
460
+ - য়ের
461
+ - ▁পু
462
+ - ▁একজন
463
+ - ▁বলেন
464
+ - ুন
465
+ - িং
466
+ - ’
467
+ - ▁বাংলা
468
+ - টার
469
+ - ুম
470
+ - ঞ্জ
471
+ - ▁বাড়ি
472
+ - ▁গত
473
+ - ▁হাজার
474
+ - ▁মতো
475
+ - ডি
476
+ - ▁তিন
477
+ - দ্ধ
478
+ - ▁এমন
479
+ - ▁কয়েক
480
+ - ▁কম
481
+ - ত্ব
482
+ - ্রা
483
+ - ▁দিকে
484
+ - ▁ছিলেন
485
+ - ▁পড়ে
486
+ - নার
487
+ - ▁করি
488
+ - কাল
489
+ - ▁মুখ
490
+ - ▁উঠ
491
+ - র্ত
492
+ - ▁টাকা
493
+ - চার
494
+ - শে
495
+ - ▁এসে
496
+ - ▁দুই
497
+ - ▁করেছেন
498
+ - ▁লোক
499
+ - ম্প
500
+ - ৮
501
+ - ষ্ঠ
502
+ - ▁মহা
503
+ - ▁কু
504
+ - ▁থাকে
505
+ - বাদ
506
+ - চি
507
+ - ▁এলাকা
508
+ - ▁জানান
509
+ - ▁প্রায়
510
+ - ▁দেয়া
511
+ - ▁গেল
512
+ - য
513
+ - চ্ছে
514
+ - ▁ছবি
515
+ - ▁নতুন
516
+ - ▁অবস্থা
517
+ - ▁অভি
518
+ - ▁আজ
519
+ - ▁কার
520
+ - ▁খু
521
+ - ▁জানা
522
+ - ▁করছে
523
+ - টির
524
+ - ▁বাংলাদেশের
525
+ - ▁বন্ধ
526
+ - কারী
527
+ - ▁অন্য
528
+ - ▁ধরে
529
+ - প্ত
530
+ - ▁তাকে
531
+ - ▁গেছে
532
+ - ▁শি
533
+ - চা
534
+ - আ
535
+ - ▁চাল
536
+ - ▁আল
537
+ - ▁৫
538
+ - ▁উত্ত
539
+ - ▁ঝ
540
+ - ▁জীবন
541
+ - লার
542
+ - ঙ
543
+ - ▁প্রকাশ
544
+ - ▁মেয়ে
545
+ - ▁রে
546
+ - ▁দেশের
547
+ - ▁খেল
548
+ - ▁মূল
549
+ - ভি
550
+ - ঙ্ক
551
+ - ▁চি
552
+ - ▁পর্যন্ত
553
+ - ▁সাথে
554
+ - লাম
555
+ - ▁৪
556
+ - ▁টি
557
+ - ▁বো
558
+ - ▁আইন
559
+ - গত
560
+ - ▁হতে
561
+ - ▁ভালো
562
+ - .
563
+ - স্ক
564
+ - ▁অভিযোগ
565
+ - ন্স
566
+ - ▁কারণে
567
+ - ▁অর্থ
568
+ - ▁অপ
569
+ - ক্স
570
+ - বু
571
+ - ▁২০
572
+ - ▁পাওয়া
573
+ - ▁খুব
574
+ - ▁মন
575
+ - সম
576
+ - ল্লা
577
+ - ব্দ
578
+ - ▁পি
579
+ - ▁ওই
580
+ - ▁করবে
581
+ - য়ার
582
+ - সহ
583
+ - ক্ষণ
584
+ - ▁নারী
585
+ - ম্ব
586
+ - ▁ফা
587
+ - ▁বেশ
588
+ - ▁পেয়ে
589
+ - দে
590
+ - ▁তখন
591
+ - িয়ার
592
+ - ▁ক্যা
593
+ - ▁ছেলে
594
+ - ▁চার
595
+ - ভার
596
+ - ▁দিতে
597
+ - ▁ক্র
598
+ - ▁গান
599
+ - বাহিনী
600
+ - ▁ভি
601
+ - কৃত
602
+ - ▁গো
603
+ - বল
604
+ - ▁ইসলাম
605
+ - ▁জি
606
+ - ▁ডি
607
+ - ন্দ্র
608
+ - ▁গ্রাম
609
+ - ▁ওপর
610
+ - ▁ভোট
611
+ - ▁পাঠ
612
+ - ▁গিয়ে
613
+ - ▁মামলা
614
+ - ▁ব্যবস্থা
615
+ - সার
616
+ - যুক্ত
617
+ - ▁মাস
618
+ - দার
619
+ - ▁সেখানে
620
+ - ▁জন্ম
621
+ - ▁পদ
622
+ - ▁কেউ
623
+ - র্ণ
624
+ - ▁দেওয়া
625
+ - ভাগ
626
+ - ▁১০
627
+ - ▁উদ্
628
+ - োয়া
629
+ - রূপ
630
+ - ▁ফেল
631
+ - ▁তৈরি
632
+ - ▁খবর
633
+ - ▁কেন
634
+ - ▁ভাষা
635
+ - ▁৬
636
+ - ▁ভাব
637
+ - ▁নেতা
638
+ - ▁জানিয়েছে
639
+ - ▁কী
640
+ - ফা
641
+ - ▁থাকা
642
+ - ▁লি
643
+ - টের
644
+ - ▁ছা
645
+ - ▁হল
646
+ - ▁গ্র
647
+ - ▁কর্ম
648
+ - ▁সদস্য
649
+ - ▁জাতীয়
650
+ - ▁ব্র
651
+ - দু
652
+ - ▁কেন্দ্র
653
+ - ▁হওয়ার
654
+ - ▁দেব
655
+ - ▁চলে
656
+ - ▁হলো
657
+ - তু
658
+ - ▁বিশ্ব
659
+ - ▁যাওয়া
660
+ - ▁যাবে
661
+ - ▁ট্র
662
+ - ▁সম্পর্ক
663
+ - ▁দিয়েছে
664
+ - ▁যদি
665
+ - ▁বিরুদ্ধে
666
+ - ▁বিশেষ
667
+ - ▁করলে
668
+ - ▁ছোট
669
+ - ▁অধি
670
+ - ▁শুন
671
+ - ▁আবার
672
+ - ▁কারণ
673
+ - ▁দলের
674
+ - ▁ফি
675
+ - ▁স্ট
676
+ - ▁দেয়
677
+ - ▁শিল্প
678
+ - ▁রাজনৈতিক
679
+ - ▁বলা
680
+ - ▁ছাড়া
681
+ - ▁জেলা
682
+ - ▁দেখে
683
+ - ▁প্রধান
684
+ - ▁এসব
685
+ - বন্ধ
686
+ - ▁কর্মকর্তা
687
+ - চ্ছি
688
+ - ▁তথ্য
689
+ - ▁অংশ
690
+ - ▁দশ
691
+ - ▁তাহা
692
+ - মন্ত্রী
693
+ - ৃত
694
+ - ▁ঠিক
695
+ - ▁রাত
696
+ - ▁আসা
697
+ - ▁থানা
698
+ - ▁গোল
699
+ - রাজ
700
+ - ▁মৃত্যু
701
+ - ▁রি
702
+ - ▁পথ
703
+ - ্যান
704
+ - ▁বিচার
705
+ - ▁শ্রমিক
706
+ - ▁গল্প
707
+ - ▁সকাল
708
+ - ▁হাতে
709
+ - ▁এটা
710
+ - ▁কবি
711
+ - ▁বাবা
712
+ - ▁দাবি
713
+ - ▁চাই
714
+ - ▁মাধ্যমে
715
+ - ▁হয়েছিল
716
+ - ▁ঢ
717
+ - ▁যাচ্ছে
718
+ - ▁২০০
719
+ - ▁চলচ্চিত্র
720
+ - ▁রহমান
721
+ - ▁লেখা
722
+ - ▁দেন
723
+ - ▁পুরুষ
724
+ - চিত্র
725
+ - ▁ব্যবহার
726
+ - ▁অনুষ্ঠান
727
+ - ▁বর্তমান
728
+ - ▁ধর্ম
729
+ - ▁দাঁড়
730
+ - ▁নিহত
731
+ - ঃ
732
+ - চ্ছ
733
+ - ▁চেষ্টা
734
+ - ▁চোখ
735
+ - ▁উপজেলা
736
+ - ▁আদালত
737
+ - ▁সামনে
738
+ - ▁রু
739
+ - ▁চেয়ে
740
+ - ▁সর্ব
741
+ - ▁হত্যা
742
+ - ▁গণ
743
+ - ▁ডাক
744
+ - ▁দ্বিতীয়
745
+ - ▁ধরনের
746
+ - ▁কবিতা
747
+ - ▁ফলে
748
+ - ▁সবচেয়ে
749
+ - গুলি
750
+ - ▁মোট
751
+ - ▁পরিবার
752
+ - ▁শিশু
753
+ - ▁হোসেন
754
+ - ▁রেখে
755
+ - ▁রায়
756
+ - ▁মাথা
757
+ - ▁দুর্
758
+ - ▁৮
759
+ - ▁টা
760
+ - ▁৭
761
+ - ▁বসে
762
+ - ▁ওয়া
763
+ - ▁ব্যক্তি
764
+ - ▁শুধু
765
+ - ▁ব্যাংক
766
+ - ▁পাকিস্তান
767
+ - ▁যখন
768
+ - ▁করিয়া
769
+ - ▁লিখ
770
+ - পূর্ণ
771
+ - ▁বিশ্ববিদ্যালয়
772
+ - ▁সংখ্যা
773
+ - ▁যুদ্ধ
774
+ - ▁হইয়া
775
+ - ▁ক্ষমতা
776
+ - ▁সাধারণ
777
+ - ▁কোটি
778
+ - ▁শিক্ষা
779
+ - ▁আলো
780
+ - ▁তুলে
781
+ - ▁সত্য
782
+ - ▁ঘটে
783
+ - ''''
784
+ - ▁দূর
785
+ - ▁প্রশ্ন
786
+ - ুদ্ধ
787
+ - ▁লাখ
788
+ - ▁নিজের
789
+ - েশন
790
+ - ▁আলোচনা
791
+ - ঈ
792
+ - ▁ক্রিকেট
793
+ - ▁সমাজ
794
+ - ▁বয়স
795
+ - ▁গ্রহণ
796
+ - ▁জায়গা
797
+ - ▁ব্যবসা
798
+ - বর্তী
799
+ - জীব
800
+ - কল্প
801
+ - ▁প্রত্য
802
+ - ▁মাত্র
803
+ - ▁উৎ
804
+ - ▁শহরে
805
+ - ▁এখানে
806
+ - ▁নেয়া
807
+ - ▁ঘোষণা
808
+ - ▁সকল
809
+ - ▁আটক
810
+ - ▁নিরাপত্তা
811
+ - ▁পাঁচ
812
+ - ▁পূর্ব
813
+ - ▁রাষ্ট্র
814
+ - ▁ভাই
815
+ - ▁বহু
816
+ - ▁পরীক্ষা
817
+ - ▁পুরো
818
+ - ▁বাইরে
819
+ - ▁থাকবে
820
+ - ▁ক্ষেত্রে
821
+ - ▁স্থান
822
+ - ▁ম্যাচ
823
+ - ▁ঘরে
824
+ - ▁সবাই
825
+ - ার্ড
826
+ - ▁উদ্ধার
827
+ - ▁ইতিহাস
828
+ - ▁সাহিত্য
829
+ - ▁সুযোগ
830
+ - ▁আন্দোলন
831
+ - ▁যুক্তরাষ্ট্র
832
+ - দর্শন
833
+ - ▁১২
834
+ - ▁১৮
835
+ - ▁প্রেম
836
+ - ▁আন্তর্জাতিক
837
+ - ল্যান্ড
838
+ - ▁সমস্যা
839
+ - ▁বিভাগ
840
+ - ▁সিদ্ধান্ত
841
+ - ▁মধ্য
842
+ - ন্দি
843
+ - ▁ছাত্র
844
+ - ▁গাড়ি
845
+ - ▁দীর্ঘ
846
+ - ▁সংবাদ
847
+ - ▁প্রয়োজন
848
+ - ▁সিনেমা
849
+ - ▁রাজধানী
850
+ - ▁স্থানীয়
851
+ - ▁একটু
852
+ - ▁বাজার
853
+ - জ্জ
854
+ - ▁পৃথিবী
855
+ - ▁বিশ্বাস
856
+ - ▁আহত
857
+ - ▁দায়িত্ব
858
+ - ▁হরতাল
859
+ - ▁সম্ভব
860
+ - ▁অফিস
861
+ - ▁অভিনয়
862
+ - ▁কলেজ
863
+ - ▁চট্টগ্রাম
864
+ - ▁ক্ল
865
+ - ▁দক্ষিণ
866
+ - ▁পক্ষে
867
+ - ▁মুক্তি
868
+ - ▁সংসদ
869
+ - ‘
870
+ - ▁উপস্থিত
871
+ - ▁ফিরে
872
+ - ▁আগামী
873
+ - ▁সংগঠন
874
+ - ▁মিনিট
875
+ - ▁হামলা
876
+ - ▁প্রতিষ্ঠান
877
+ - ▁পোশাক
878
+ - ▁প্ল
879
+ - ▁সৃষ্টি
880
+ - ▁কমিশন
881
+ - ▁আমাকে
882
+ - ▁তদন্ত
883
+ - ▁উচ্চ
884
+ - ▁রাজনীতি
885
+ - দ্দ
886
+ - ▁দর্শক
887
+ - ▁তুমি
888
+ - ▁পরিস্থিতি
889
+ - াহার
890
+ - ▁ক্ষতি
891
+ - ▁আত্ম
892
+ - ▁গ্রেপ্তার
893
+ - ▁ফুট
894
+ - ▁পাশাপাশি
895
+ - মূল
896
+ - ▁প্রধানমন্ত্রী
897
+ - কর্মী
898
+ - ▁সুন্দর
899
+ - ▁নিয়ম
900
+ - ▁আগুন
901
+ - বিজ্ঞান
902
+ - ▁সাংবাদিক
903
+ - ▁লক্ষ্য
904
+ - ▁অবশ্য
905
+ - ▁শরীর
906
+ - ▁উল্লেখ
907
+ - ▁শতাংশ
908
+ - ▁স্কুল
909
+ - ভূত
910
+ - ▁গ্রন্থ
911
+ - ▁কখনো
912
+ - ▁প্রাণ
913
+ - ▁কারখানা
914
+ - ▁হিন্দু
915
+ - ▁বিবিসি
916
+ - ▁আপনার
917
+ - ▁আহমেদ
918
+ - ▁স্ত্রী
919
+ - বর্ষ
920
+ - ▁শক্তি
921
+ - সভা
922
+ - ▁রাস্তা
923
+ - ▁রকম
924
+ - ▁পশ্চিম
925
+ - ▁অপরাধ
926
+ - ▁আসছে
927
+ - ▁সংস্থা
928
+ - ▁পৌঁছ
929
+ - ▁দোকান
930
+ - ▁পত্রিকা
931
+ - ▁লেখক
932
+ - ▁সন্তান
933
+ - ▁ভেতর
934
+ - ▁এগিয়ে
935
+ - ▁নদী
936
+ - ▁হইল
937
+ - ▁পরিবেশ
938
+ - ▁প্রেসিডেন্ট
939
+ - ▁ছেড়ে
940
+ - ▁চেয়ারম্যান
941
+ - ▁ধারা
942
+ - বৃত্ত
943
+ - ▁বিক্রি
944
+ - ▁শ্রী
945
+ - ▁রক্ষা
946
+ - ▁দ্রুত
947
+ - ▁পরিচয়
948
+ - ▁মালিক
949
+ - ▁উপন্যাস
950
+ - ▁শিক্ষার্থী
951
+ - ▁অন্যতম
952
+ - ▁চরিত্র
953
+ - ▁প্রতিবেদন
954
+ - ▁প্রস্তুত
955
+ - ▁অভিযান
956
+ - তন্ত্র
957
+ - ▁অগ্নি
958
+ - ▁জনগণ
959
+ - ▁বৃহস্পতিবার
960
+ - ▁ব্যাপক
961
+ - ▁অনুযায়ী
962
+ - ▁পরিবর্তন
963
+ - ▁কলকাতা
964
+ - ভূমি
965
+ - ▁নজরুল
966
+ - ▁ভূমিকা
967
+ - ▁জনপ্রিয়
968
+ - ▁শিক্ষক
969
+ - ▁তেমন
970
+ - ▁অন্যান্য
971
+ - ▁বিদ্যুৎ
972
+ - খ্যাত
973
+ - ▁অস্ত্র
974
+ - ▁প্রস্তাব
975
+ - ▁স্বামী
976
+ - ▁পরিচিত
977
+ - ▁আয়োজন
978
+ - ▁শনিবার
979
+ - ▁তাঁকে
980
+ - ▁যাত্রী
981
+ - প্রাপ্ত
982
+ - ▁কর্মসূচি
983
+ - ▁গঠন
984
+ - ▁প্রভাব
985
+ - ▁কৃষ্ণ
986
+ - ▁সমাবেশ
987
+ - ▁সূত্র
988
+ - ▁অনুষ্ঠিত
989
+ - ▁পর্যায়ে
990
+ - ঋ
991
+ - ▁পুরস্কার
992
+ - ▁বিক্ষোভ
993
+ - ▁নিয়ন্ত্রণ
994
+ - ▁রোববার
995
+ - ▁প্রার্থী
996
+ - ▁যোগাযোগ
997
+ - ▁সোমবার
998
+ - ▁মার্চ
999
+ - ▁কমিটি
1000
+ - ▁সংঘর্ষ
1001
+ - ▁বুধবার
1002
+ - ▁সামাজিক
1003
+ - ▁তাঁদের
1004
+ - ▁মার্কিন
1005
+ - ▁সামরিক
1006
+ - ▁নিজেদের
1007
+ - ▁মঙ্গলবার
1008
+ - ▁বক্তব্য
1009
+ - ▁চুক্তি
1010
+ - ▁যুগ
1011
+ - ▁বৈঠক
1012
+ - ▁ইউনিয়ন
1013
+ - ▁মোহাম্মদ
1014
+ - অ
1015
+ - ▁তাঁহার
1016
+ - ▁নির্মাণ
1017
+ - ▁জানুয়ারি
1018
+ - ▁আবেদন
1019
+ - ▁বিশ্বকাপ
1020
+ - ▁ফেব্রুয়ারি
1021
+ - ▁তরুণ
1022
+ - ▁হিসাব
1023
+ - ▁সন্ধ্যা
1024
+ - ▁পরিকল্পনা
1025
+ - ▁উইকেট
1026
+ - ▁ধারণা
1027
+ - ▁আনন্দ
1028
+ - মুক্ত
1029
+ - ▁উদ্দেশ্য
1030
+ - ▁চিকিৎসা
1031
+ - ▁উন্নয়ন
1032
+ - ▁আধুনিক
1033
+ - ▁ভিত্তি
1034
+ - ':'
1035
+ - "\x94"
1036
+ - ঢ
1037
+ - ‍
1038
+ - ়
1039
+ - e
1040
+ - /
1041
+ - i
1042
+ - r
1043
+ - t
1044
+ - o
1045
+ - '%'
1046
+ - l
1047
+ - a
1048
+ - n
1049
+ - '!'
1050
+ - p
1051
+ - '"'
1052
+ - s
1053
+ - '?'
1054
+ - d
1055
+ - '0'
1056
+ - '3'
1057
+ - u
1058
+ - ঞ
1059
+ - f
1060
+ - g
1061
+ - c
1062
+ - m
1063
+ - h
1064
+ - –
1065
+ - w
1066
+ - b
1067
+ - ;
1068
+ - x
1069
+ - '8'
1070
+ - '5'
1071
+ - '9'
1072
+ - k
1073
+ - ”
1074
+ - y
1075
+ - H
1076
+ - L
1077
+ - T
1078
+ - j
1079
+ - ৗ
1080
+ - B
1081
+ - K
1082
+ - _
1083
+ - z
1084
+ - “
1085
+ - F
1086
+ - v
1087
+ - '4'
1088
+ - '1'
1089
+ - '2'
1090
+ - ঔ
1091
+ - ঊ
1092
+ - "\x93"
1093
+ - D
1094
+ - O
1095
+ - œ
1096
+ - ঐ
1097
+ - ৰ
1098
+ - —
1099
+ - <sos/eos>
1100
+ init: null
1101
+ model_conf:
1102
+ ignore_id: 0
1103
+ use_preprocessor: true
1104
+ token_type: bpe
1105
+ bpemodel: data/token_list/bpe_unigram1000/bpe.model
1106
+ non_linguistic_symbols: null
1107
+ cleaner: null
1108
+ g2p: null
1109
+ lm: seq_rnn
1110
+ lm_conf:
1111
+ nlayers: 2
1112
+ unit: 650
1113
+ required:
1114
+ - output_dir
1115
+ - token_list
1116
+ version: 0.10.6a1
1117
+ distributed: false
exp/lm_train_lm_bpe1000/images/backward_time.png ADDED
exp/lm_train_lm_bpe1000/images/forward_time.png ADDED
exp/lm_train_lm_bpe1000/images/gpu_max_cached_mem_GB.png ADDED
exp/lm_train_lm_bpe1000/images/iter_time.png ADDED
exp/lm_train_lm_bpe1000/images/loss.png ADDED
exp/lm_train_lm_bpe1000/images/optim0_lr0.png ADDED
exp/lm_train_lm_bpe1000/images/optim_step_time.png ADDED
exp/lm_train_lm_bpe1000/images/train_time.png ADDED
exp/lm_train_lm_bpe1000/perplexity_test/ppl ADDED
@@ -0,0 +1 @@
 
 
1
+ 19.692471074935586
meta.yaml ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ espnet: 0.10.6a1
2
+ files:
3
+ asr_model_file: exp/asr_train_asr_raw_bpe1000/41epoch.pth
4
+ lm_file: exp/lm_train_lm_bpe1000/20epoch.pth
5
+ python: "3.9.5 (default, Jun 4 2021, 12:28:51) \n[GCC 7.5.0]"
6
+ timestamp: 1647958476.960957
7
+ torch: 1.8.1+cu102
8
+ yaml_files:
9
+ asr_train_config: exp/asr_train_asr_raw_bpe1000/config.yaml
10
+ lm_train_config: exp/lm_train_lm_bpe1000/config.yaml