yangxiaoyu6 commited on Aug 21, 2024

Commit

0d55c0f

1 Parent(s): dfb8a62

add files

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

data/lang_bpe_500/bpe.model +3 -0
data/lang_bpe_500/tokens.txt +502 -0
decoding_results/greedy_search/errs-test-clean-greedy_search-epoch-30-avg-11-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/errs-test-clean-greedy_search-epoch-30-avg-13-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/errs-test-clean-greedy_search-epoch-30-avg-15-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/errs-test-clean-greedy_search-epoch-30-avg-7-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/errs-test-clean-greedy_search-epoch-30-avg-9-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/errs-test-clean-greedy_search-epoch-40-avg-11-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/errs-test-clean-greedy_search-epoch-40-avg-13-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/errs-test-clean-greedy_search-epoch-40-avg-15-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/errs-test-clean-greedy_search-epoch-40-avg-17-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/errs-test-clean-greedy_search-epoch-40-avg-19-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/errs-test-clean-greedy_search-epoch-40-avg-7-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/errs-test-clean-greedy_search-epoch-40-avg-9-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/errs-test-other-greedy_search-epoch-30-avg-11-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/errs-test-other-greedy_search-epoch-30-avg-13-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/errs-test-other-greedy_search-epoch-30-avg-15-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/errs-test-other-greedy_search-epoch-30-avg-7-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/errs-test-other-greedy_search-epoch-30-avg-9-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/errs-test-other-greedy_search-epoch-40-avg-11-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/errs-test-other-greedy_search-epoch-40-avg-13-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/errs-test-other-greedy_search-epoch-40-avg-15-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/errs-test-other-greedy_search-epoch-40-avg-17-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/errs-test-other-greedy_search-epoch-40-avg-19-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/errs-test-other-greedy_search-epoch-40-avg-7-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/errs-test-other-greedy_search-epoch-40-avg-9-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/log-decode-epoch-30-avg-11-context-2-max-sym-per-frame-1-use-averaged-model-2024-08-08-10-10-56 +25 -0
decoding_results/greedy_search/log-decode-epoch-30-avg-13-context-2-max-sym-per-frame-1-use-averaged-model-2024-08-08-10-09-48 +27 -0
decoding_results/greedy_search/log-decode-epoch-30-avg-15-context-2-max-sym-per-frame-1-use-averaged-model-2024-08-07-10-39-22 +28 -0
decoding_results/greedy_search/log-decode-epoch-30-avg-15-context-2-max-sym-per-frame-1-use-averaged-model-2024-08-08-10-08-02 +26 -0
decoding_results/greedy_search/log-decode-epoch-30-avg-7-context-2-max-sym-per-frame-1-use-averaged-model-2024-08-08-10-13-10 +28 -0
decoding_results/greedy_search/log-decode-epoch-30-avg-9-context-2-max-sym-per-frame-1-use-averaged-model-2024-08-08-10-12-02 +25 -0
decoding_results/greedy_search/log-decode-epoch-40-avg-11-context-2-max-sym-per-frame-1-use-averaged-model-2024-08-13-10-45-34 +26 -0
decoding_results/greedy_search/log-decode-epoch-40-avg-13-context-2-max-sym-per-frame-1-use-averaged-model-2024-08-13-10-44-27 +26 -0
decoding_results/greedy_search/log-decode-epoch-40-avg-15-context-2-max-sym-per-frame-1-use-averaged-model-2024-08-13-10-43-19 +26 -0
decoding_results/greedy_search/log-decode-epoch-40-avg-17-context-2-max-sym-per-frame-1-use-averaged-model-2024-08-13-10-42-13 +26 -0
decoding_results/greedy_search/log-decode-epoch-40-avg-19-context-2-max-sym-per-frame-1-use-averaged-model-2024-08-13-10-40-58 +25 -0
decoding_results/greedy_search/log-decode-epoch-40-avg-7-context-2-max-sym-per-frame-1-use-averaged-model-2024-08-13-10-47-51 +27 -0
decoding_results/greedy_search/log-decode-epoch-40-avg-9-context-2-max-sym-per-frame-1-use-averaged-model-2024-08-13-10-46-41 +27 -0
decoding_results/greedy_search/recogs-test-clean-greedy_search-epoch-30-avg-11-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/recogs-test-clean-greedy_search-epoch-30-avg-13-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/recogs-test-clean-greedy_search-epoch-30-avg-15-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/recogs-test-clean-greedy_search-epoch-30-avg-7-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/recogs-test-clean-greedy_search-epoch-30-avg-9-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/recogs-test-clean-greedy_search-epoch-40-avg-11-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/recogs-test-clean-greedy_search-epoch-40-avg-13-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/recogs-test-clean-greedy_search-epoch-40-avg-15-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/recogs-test-clean-greedy_search-epoch-40-avg-17-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/recogs-test-clean-greedy_search-epoch-40-avg-19-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0
decoding_results/greedy_search/recogs-test-clean-greedy_search-epoch-40-avg-7-context-2-max-sym-per-frame-1-use-averaged-model.txt +0 -0

data/lang_bpe_500/bpe.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c53433de083c4a6ad12d034550ef22de68cec62c4f58932a7b6b8b2f1e743fa5
+size 244865

data/lang_bpe_500/tokens.txt ADDED Viewed

	@@ -0,0 +1,502 @@

+<blk> 0
+<sos/eos> 1
+<unk> 2
+S 3
+▁THE 4
+▁A 5
+T 6
+▁AND 7
+ED 8
+▁OF 9
+▁TO 10
+E 11
+D 12
+N 13
+ING 14
+▁IN 15
+Y 16
+M 17
+C 18
+▁I 19
+A 20
+P 21
+▁HE 22
+R 23
+O 24
+L 25
+RE 26
+I 27
+U 28
+ER 29
+▁IT 30
+LY 31
+▁THAT 32
+▁WAS 33
+▁ 34
+▁S 35
+AR 36
+▁BE 37
+F 38
+▁C 39
+IN 40
+B 41
+▁FOR 42
+OR 43
+LE 44
+' 45
+▁HIS 46
+▁YOU 47
+AL 48
+▁RE 49
+V 50
+▁B 51
+G 52
+RI 53
+▁E 54
+▁WITH 55
+▁T 56
+▁AS 57
+LL 58
+▁P 59
+▁HER 60
+ST 61
+▁HAD 62
+▁SO 63
+▁F 64
+W 65
+CE 66
+▁IS 67
+ND 68
+▁NOT 69
+TH 70
+▁BUT 71
+EN 72
+▁SHE 73
+▁ON 74
+VE 75
+ON 76
+SE 77
+▁DE 78
+UR 79
+▁G 80
+CH 81
+K 82
+TER 83
+▁AT 84
+IT 85
+▁ME 86
+RO 87
+NE 88
+RA 89
+ES 90
+IL 91
+NG 92
+IC 93
+▁NO 94
+▁HIM 95
+ENT 96
+IR 97
+▁WE 98
+H 99
+▁DO 100
+▁ALL 101
+▁HAVE 102
+LO 103
+▁BY 104
+▁MY 105
+▁MO 106
+▁THIS 107
+LA 108
+▁ST 109
+▁WHICH 110
+▁CON 111
+▁THEY 112
+CK 113
+TE 114
+▁SAID 115
+▁FROM 116
+▁GO 117
+▁WHO 118
+▁TH 119
+▁OR 120
+▁D 121
+▁W 122
+VER 123
+LI 124
+▁SE 125
+▁ONE 126
+▁CA 127
+▁AN 128
+▁LA 129
+▁WERE 130
+EL 131
+▁HA 132
+▁MAN 133
+▁FA 134
+▁EX 135
+AD 136
+▁SU 137
+RY 138
+▁MI 139
+AT 140
+▁BO 141
+▁WHEN 142
+AN 143
+THER 144
+PP 145
+ATION 146
+▁FI 147
+▁WOULD 148
+▁PRO 149
+OW 150
+ET 151
+▁O 152
+▁THERE 153
+▁HO 154
+ION 155
+▁WHAT 156
+▁FE 157
+▁PA 158
+US 159
+MENT 160
+▁MA 161
+UT 162
+▁OUT 163
+▁THEIR 164
+▁IF 165
+▁LI 166
+▁K 167
+▁WILL 168
+▁ARE 169
+ID 170
+▁RO 171
+DE 172
+TION 173
+▁WA 174
+PE 175
+▁UP 176
+▁SP 177
+▁PO 178
+IGHT 179
+▁UN 180
+RU 181
+▁LO 182
+AS 183
+OL 184
+▁LE 185
+▁BEEN 186
+▁SH 187
+▁RA 188
+▁SEE 189
+KE 190
+UL 191
+TED 192
+▁SA 193
+UN 194
+UND 195
+ANT 196
+▁NE 197
+IS 198
+▁THEM 199
+CI 200
+GE 201
+▁COULD 202
+▁DIS 203
+OM 204
+ISH 205
+HE 206
+EST 207
+▁SOME 208
+ENCE 209
+ITY 210
+IVE 211
+▁US 212
+▁MORE 213
+▁EN 214
+ARD 215
+ATE 216
+▁YOUR 217
+▁INTO 218
+▁KNOW 219
+▁CO 220
+ANCE 221
+▁TIME 222
+▁WI 223
+▁YE 224
+AGE 225
+▁NOW 226
+TI 227
+FF 228
+ABLE 229
+▁VERY 230
+▁LIKE 231
+AM 232
+HI 233
+Z 234
+▁OTHER 235
+▁THAN 236
+▁LITTLE 237
+▁DID 238
+▁LOOK 239
+TY 240
+ERS 241
+▁CAN 242
+▁CHA 243
+▁AR 244
+X 245
+FUL 246
+UGH 247
+▁BA 248
+▁DAY 249
+▁ABOUT 250
+TEN 251
+IM 252
+▁ANY 253
+▁PRE 254
+▁OVER 255
+IES 256
+NESS 257
+ME 258
+BLE 259
+▁M 260
+ROW 261
+▁HAS 262
+▁GREAT 263
+▁VI 264
+TA 265
+▁AFTER 266
+PER 267
+▁AGAIN 268
+HO 269
+SH 270
+▁UPON 271
+▁DI 272
+▁HAND 273
+▁COM 274
+IST 275
+TURE 276
+▁STA 277
+▁THEN 278
+▁SHOULD 279
+▁GA 280
+OUS 281
+OUR 282
+▁WELL 283
+▁ONLY 284
+MAN 285
+▁GOOD 286
+▁TWO 287
+▁MAR 288
+▁SAY 289
+▁HU 290
+TING 291
+▁OUR 292
+RESS 293
+▁DOWN 294
+IOUS 295
+▁BEFORE 296
+▁DA 297
+▁NA 298
+QUI 299
+▁MADE 300
+▁EVERY 301
+▁OLD 302
+▁EVEN 303
+IG 304
+▁COME 305
+▁GRA 306
+▁RI 307
+▁LONG 308
+OT 309
+SIDE 310
+WARD 311
+▁FO 312
+▁WHERE 313
+MO 314
+LESS 315
+▁SC 316
+▁MUST 317
+▁NEVER 318
+▁HOW 319
+▁CAME 320
+▁SUCH 321
+▁RU 322
+▁TAKE 323
+▁WO 324
+▁CAR 325
+UM 326
+AK 327
+▁THINK 328
+▁MUCH 329
+▁MISTER 330
+▁MAY 331
+▁JO 332
+▁WAY 333
+▁COMP 334
+▁THOUGHT 335
+▁STO 336
+▁MEN 337
+▁BACK 338
+▁DON 339
+J 340
+▁LET 341
+▁TRA 342
+▁FIRST 343
+▁JUST 344
+▁VA 345
+▁OWN 346
+▁PLA 347
+▁MAKE 348
+ATED 349
+▁HIMSELF 350
+▁WENT 351
+▁PI 352
+GG 353
+RING 354
+▁DU 355
+▁MIGHT 356
+▁PART 357
+▁GIVE 358
+▁IMP 359
+▁BU 360
+▁PER 361
+▁PLACE 362
+▁HOUSE 363
+▁THROUGH 364
+IAN 365
+▁SW 366
+▁UNDER 367
+QUE 368
+▁AWAY 369
+▁LOVE 370
+QUA 371
+▁LIFE 372
+▁GET 373
+▁WITHOUT 374
+▁PASS 375
+▁TURN 376
+IGN 377
+▁HEAD 378
+▁MOST 379
+▁THOSE 380
+▁SHALL 381
+▁EYES 382
+▁COL 383
+▁STILL 384
+▁NIGHT 385
+▁NOTHING 386
+ITION 387
+HA 388
+▁TELL 389
+▁WORK 390
+▁LAST 391
+▁NEW 392
+▁FACE 393
+▁HI 394
+▁WORD 395
+▁FOUND 396
+▁COUNT 397
+▁OB 398
+▁WHILE 399
+▁SHA 400
+▁MEAN 401
+▁SAW 402
+▁PEOPLE 403
+▁FRIEND 404
+▁THREE 405
+▁ROOM 406
+▁SAME 407
+▁THOUGH 408
+▁RIGHT 409
+▁CHILD 410
+▁FATHER 411
+▁ANOTHER 412
+▁HEART 413
+▁WANT 414
+▁TOOK 415
+OOK 416
+▁LIGHT 417
+▁MISSUS 418
+▁OPEN 419
+▁JU 420
+▁ASKED 421
+PORT 422
+▁LEFT 423
+▁JA 424
+▁WORLD 425
+▁HOME 426
+▁WHY 427
+▁ALWAYS 428
+▁ANSWER 429
+▁SEEMED 430
+▁SOMETHING 431
+▁GIRL 432
+▁BECAUSE 433
+▁NAME 434
+▁TOLD 435
+▁NI 436
+▁HIGH 437
+IZE 438
+▁WOMAN 439
+▁FOLLOW 440
+▁RETURN 441
+▁KNEW 442
+▁EACH 443
+▁KIND 444
+▁JE 445
+▁ACT 446
+▁LU 447
+▁CERTAIN 448
+▁YEARS 449
+▁QUITE 450
+▁APPEAR 451
+▁BETTER 452
+▁HALF 453
+▁PRESENT 454
+▁PRINCE 455
+SHIP 456
+▁ALSO 457
+▁BEGAN 458
+▁HAVING 459
+▁ENOUGH 460
+▁PERSON 461
+▁LADY 462
+▁WHITE 463
+▁COURSE 464
+▁VOICE 465
+▁SPEAK 466
+▁POWER 467
+▁MORNING 468
+▁BETWEEN 469
+▁AMONG 470
+▁KEEP 471
+▁WALK 472
+▁MATTER 473
+▁TEA 474
+▁BELIEVE 475
+▁SMALL 476
+▁TALK 477
+▁FELT 478
+▁HORSE 479
+▁MYSELF 480
+▁SIX 481
+▁HOWEVER 482
+▁FULL 483
+▁HERSELF 484
+▁POINT 485
+▁STOOD 486
+▁HUNDRED 487
+▁ALMOST 488
+▁SINCE 489
+▁LARGE 490
+▁LEAVE 491
+▁PERHAPS 492
+▁DARK 493
+▁SUDDEN 494
+▁REPLIED 495
+▁ANYTHING 496
+▁WONDER 497
+▁UNTIL 498
+Q 499
+#0 500
+#1 501

decoding_results/greedy_search/errs-test-clean-greedy_search-epoch-30-avg-11-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/errs-test-clean-greedy_search-epoch-30-avg-13-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/errs-test-clean-greedy_search-epoch-30-avg-15-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/errs-test-clean-greedy_search-epoch-30-avg-7-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/errs-test-clean-greedy_search-epoch-30-avg-9-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/errs-test-clean-greedy_search-epoch-40-avg-11-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/errs-test-clean-greedy_search-epoch-40-avg-13-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/errs-test-clean-greedy_search-epoch-40-avg-15-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/errs-test-clean-greedy_search-epoch-40-avg-17-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/errs-test-clean-greedy_search-epoch-40-avg-19-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/errs-test-clean-greedy_search-epoch-40-avg-7-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/errs-test-clean-greedy_search-epoch-40-avg-9-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/errs-test-other-greedy_search-epoch-30-avg-11-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/errs-test-other-greedy_search-epoch-30-avg-13-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/errs-test-other-greedy_search-epoch-30-avg-15-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/errs-test-other-greedy_search-epoch-30-avg-7-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/errs-test-other-greedy_search-epoch-30-avg-9-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/errs-test-other-greedy_search-epoch-40-avg-11-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/errs-test-other-greedy_search-epoch-40-avg-13-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/errs-test-other-greedy_search-epoch-40-avg-15-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/errs-test-other-greedy_search-epoch-40-avg-17-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/errs-test-other-greedy_search-epoch-40-avg-19-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/errs-test-other-greedy_search-epoch-40-avg-7-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/errs-test-other-greedy_search-epoch-40-avg-9-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/log-decode-epoch-30-avg-11-context-2-max-sym-per-frame-1-use-averaged-model-2024-08-08-10-10-56 ADDED Viewed

	@@ -0,0 +1,25 @@

+2024-08-08 10:10:56,739 INFO [decode.py:833] Decoding started
+2024-08-08 10:10:56,740 INFO [decode.py:839] Device: cuda:0
+2024-08-08 10:10:56,743 INFO [decode.py:849] {'best_train_loss': inf, 'best_valid_loss': inf, 'best_train_epoch': -1, 'best_valid_epoch': -1, 'batch_idx_train': 0, 'log_interval': 50, 'reset_interval': 200, 'valid_interval': 3000, 'feature_dim': 80, 'subsampling_factor': 4, 'ignore_id': -1, 'label_smoothing': 0.1, 'warm_step': 2000, 'env_info': {'k2-version': '1.24.4', 'k2-build-type': 'Release', 'k2-with-cuda': True, 'k2-git-sha1': 'ff1d435a8d3c4eaa15828a84a7240678a70539a7', 'k2-git-date': 'Fri Feb 23 01:48:38 2024', 'lhotse-version': '1.26.0', 'torch-version': '2.0.1+cu117', 'torch-cuda-available': True, 'torch-cuda-version': '11.7', 'python-version': '3.10', 'icefall-git-branch': 'zipformer_bf16', 'icefall-git-sha1': 'd1974bef-dirty', 'icefall-git-date': 'Thu Aug 8 10:10:22 2024', 'icefall-path': '/star-xy/softwares/icefall_development/icefall_bf16', 'k2-path': '/star-xy/softwares/pyenvs/k2_cuda11/k2_cuda11/lib/python3.10/site-packages/k2/__init__.py', 'lhotse-path': '/star-xy/softwares/pyenvs/k2_cuda11/k2_cuda11/lib/python3.10/site-packages/lhotse/__init__.py', 'hostname': 'de-74279-k2-train-2-1207150844-f49d8c4f4-c49d5', 'IP address': '10.177.22.19'}, 'epoch': 30, 'iter': 0, 'avg': 11, 'use_averaged_model': True, 'exp_dir': PosixPath('zipformer/exp-full-liri-full-bf16-md1000'), 'bpe_model': 'data/lang_bpe_500/bpe.model', 'lang_dir': PosixPath('data/lang_bpe_500'), 'decoding_method': 'greedy_search', 'beam_size': 4, 'beam': 20.0, 'ngram_lm_scale': 0.01, 'max_contexts': 8, 'max_states': 64, 'context_size': 2, 'max_sym_per_frame': 1, 'num_paths': 200, 'nbest_scale': 0.5, 'use_shallow_fusion': False, 'lm_type': 'rnn', 'lm_scale': 0.3, 'tokens_ngram': 2, 'backoff_id': 500, 'context_score': 2, 'context_file': '', 'num_encoder_layers': '2,2,3,4,3,2', 'downsampling_factor': '1,2,4,8,4,2', 'feedforward_dim': '512,768,1024,1536,1024,768', 'num_heads': '4,4,4,8,4,4', 'encoder_dim': '192,256,384,512,384,256', 'query_head_dim': '32', 'value_head_dim': '12', 'pos_head_dim': '4', 'pos_dim': 48, 'encoder_unmasked_dim': '192,192,256,256,256,192', 'cnn_module_kernel': '31,31,15,15,15,31', 'decoder_dim': 512, 'joiner_dim': 512, 'attention_decoder_dim': 512, 'attention_decoder_num_layers': 6, 'attention_decoder_attention_dim': 512, 'attention_decoder_num_heads': 8, 'attention_decoder_feedforward_dim': 2048, 'causal': False, 'chunk_size': '16,32,64,-1', 'left_context_frames': '64,128,256,-1', 'use_transducer': True, 'use_ctc': False, 'use_attention_decoder': False, 'full_libri': True, 'mini_libri': False, 'manifest_dir': PosixPath('data/fbank'), 'max_duration': 600, 'bucketing_sampler': True, 'num_buckets': 30, 'concatenate_cuts': False, 'duration_factor': 1.0, 'gap': 1.0, 'on_the_fly_feats': False, 'shuffle': True, 'drop_last': True, 'return_cuts': True, 'num_workers': 2, 'enable_spec_aug': True, 'spec_aug_time_warp_factor': 80, 'enable_musan': True, 'input_strategy': 'PrecomputedFeatures', 'lm_vocab_size': 500, 'lm_epoch': 7, 'lm_avg': 1, 'lm_exp_dir': None, 'rnn_lm_embedding_dim': 2048, 'rnn_lm_hidden_dim': 2048, 'rnn_lm_num_layers': 3, 'rnn_lm_tie_weights': True, 'transformer_lm_exp_dir': None, 'transformer_lm_dim_feedforward': 2048, 'transformer_lm_encoder_dim': 768, 'transformer_lm_embedding_dim': 768, 'transformer_lm_nhead': 8, 'transformer_lm_num_layers': 16, 'transformer_lm_tie_weights': True, 'res_dir': PosixPath('zipformer/exp-full-liri-full-bf16-md1000/greedy_search'), 'has_contexts': False, 'suffix': 'epoch-30-avg-11-context-2-max-sym-per-frame-1-use-averaged-model', 'blank_id': 0, 'unk_id': 2, 'vocab_size': 500}
+2024-08-08 10:10:56,743 INFO [decode.py:851] About to create model
+2024-08-08 10:10:57,476 INFO [decode.py:918] Calculating the averaged model over epoch range from 19 (excluded) to 30
+2024-08-08 10:11:02,633 INFO [decode.py:1012] Number of model parameters: 65549011
+2024-08-08 10:11:02,633 INFO [asr_datamodule.py:467] About to get test-clean cuts
+2024-08-08 10:11:02,654 INFO [asr_datamodule.py:474] About to get test-other cuts
+2024-08-08 10:11:05,912 INFO [decode.py:706] batch 0/?, cuts processed until now is 36
+2024-08-08 10:11:31,134 INFO [decode.py:722] The transcripts are stored in zipformer/exp-full-liri-full-bf16-md1000/greedy_search/recogs-test-clean-greedy_search-epoch-30-avg-11-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-08 10:11:31,246 INFO [utils.py:657] [test-clean-greedy_search] %WER 2.42% [1274 / 52576, 152 ins, 109 del, 1013 sub ]
+2024-08-08 10:11:31,499 INFO [decode.py:735] Wrote detailed error stats to zipformer/exp-full-liri-full-bf16-md1000/greedy_search/errs-test-clean-greedy_search-epoch-30-avg-11-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-08 10:11:31,503 INFO [decode.py:751]
+For test-clean, WER of different settings are:
+greedy_search	2.42	best for test-clean
+2024-08-08 10:11:32,765 INFO [decode.py:706] batch 0/?, cuts processed until now is 43
+2024-08-08 10:11:56,085 INFO [decode.py:722] The transcripts are stored in zipformer/exp-full-liri-full-bf16-md1000/greedy_search/recogs-test-other-greedy_search-epoch-30-avg-11-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-08 10:11:56,197 INFO [utils.py:657] [test-other-greedy_search] %WER 5.42% [2837 / 52343, 283 ins, 249 del, 2305 sub ]
+2024-08-08 10:11:56,482 INFO [decode.py:735] Wrote detailed error stats to zipformer/exp-full-liri-full-bf16-md1000/greedy_search/errs-test-other-greedy_search-epoch-30-avg-11-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-08 10:11:56,485 INFO [decode.py:751]
+For test-other, WER of different settings are:
+greedy_search	5.42	best for test-other
+2024-08-08 10:11:56,485 INFO [decode.py:1047] Done!

decoding_results/greedy_search/log-decode-epoch-30-avg-13-context-2-max-sym-per-frame-1-use-averaged-model-2024-08-08-10-09-48 ADDED Viewed

	@@ -0,0 +1,27 @@

+2024-08-08 10:09:48,524 INFO [decode.py:833] Decoding started
+2024-08-08 10:09:48,524 INFO [decode.py:839] Device: cuda:0
+2024-08-08 10:09:48,531 INFO [decode.py:849] {'best_train_loss': inf, 'best_valid_loss': inf, 'best_train_epoch': -1, 'best_valid_epoch': -1, 'batch_idx_train': 0, 'log_interval': 50, 'reset_interval': 200, 'valid_interval': 3000, 'feature_dim': 80, 'subsampling_factor': 4, 'ignore_id': -1, 'label_smoothing': 0.1, 'warm_step': 2000, 'env_info': {'k2-version': '1.24.4', 'k2-build-type': 'Release', 'k2-with-cuda': True, 'k2-git-sha1': 'ff1d435a8d3c4eaa15828a84a7240678a70539a7', 'k2-git-date': 'Fri Feb 23 01:48:38 2024', 'lhotse-version': '1.26.0', 'torch-version': '2.0.1+cu117', 'torch-cuda-available': True, 'torch-cuda-version': '11.7', 'python-version': '3.10', 'icefall-git-branch': 'zipformer_bf16', 'icefall-git-sha1': '7692bd4d-dirty', 'icefall-git-date': 'Wed Jul 24 15:06:10 2024', 'icefall-path': '/star-xy/softwares/icefall_development/icefall_bf16', 'k2-path': '/star-xy/softwares/pyenvs/k2_cuda11/k2_cuda11/lib/python3.10/site-packages/k2/__init__.py', 'lhotse-path': '/star-xy/softwares/pyenvs/k2_cuda11/k2_cuda11/lib/python3.10/site-packages/lhotse/__init__.py', 'hostname': 'de-74279-k2-train-2-1207150844-f49d8c4f4-c49d5', 'IP address': '10.177.22.19'}, 'epoch': 30, 'iter': 0, 'avg': 13, 'use_averaged_model': True, 'exp_dir': PosixPath('zipformer/exp-full-liri-full-bf16-md1000'), 'bpe_model': 'data/lang_bpe_500/bpe.model', 'lang_dir': PosixPath('data/lang_bpe_500'), 'decoding_method': 'greedy_search', 'beam_size': 4, 'beam': 20.0, 'ngram_lm_scale': 0.01, 'max_contexts': 8, 'max_states': 64, 'context_size': 2, 'max_sym_per_frame': 1, 'num_paths': 200, 'nbest_scale': 0.5, 'use_shallow_fusion': False, 'lm_type': 'rnn', 'lm_scale': 0.3, 'tokens_ngram': 2, 'backoff_id': 500, 'context_score': 2, 'context_file': '', 'num_encoder_layers': '2,2,3,4,3,2', 'downsampling_factor': '1,2,4,8,4,2', 'feedforward_dim': '512,768,1024,1536,1024,768', 'num_heads': '4,4,4,8,4,4', 'encoder_dim': '192,256,384,512,384,256', 'query_head_dim': '32', 'value_head_dim': '12', 'pos_head_dim': '4', 'pos_dim': 48, 'encoder_unmasked_dim': '192,192,256,256,256,192', 'cnn_module_kernel': '31,31,15,15,15,31', 'decoder_dim': 512, 'joiner_dim': 512, 'attention_decoder_dim': 512, 'attention_decoder_num_layers': 6, 'attention_decoder_attention_dim': 512, 'attention_decoder_num_heads': 8, 'attention_decoder_feedforward_dim': 2048, 'causal': False, 'chunk_size': '16,32,64,-1', 'left_context_frames': '64,128,256,-1', 'use_transducer': True, 'use_ctc': False, 'use_attention_decoder': False, 'full_libri': True, 'mini_libri': False, 'manifest_dir': PosixPath('data/fbank'), 'max_duration': 600, 'bucketing_sampler': True, 'num_buckets': 30, 'concatenate_cuts': False, 'duration_factor': 1.0, 'gap': 1.0, 'on_the_fly_feats': False, 'shuffle': True, 'drop_last': True, 'return_cuts': True, 'num_workers': 2, 'enable_spec_aug': True, 'spec_aug_time_warp_factor': 80, 'enable_musan': True, 'input_strategy': 'PrecomputedFeatures', 'lm_vocab_size': 500, 'lm_epoch': 7, 'lm_avg': 1, 'lm_exp_dir': None, 'rnn_lm_embedding_dim': 2048, 'rnn_lm_hidden_dim': 2048, 'rnn_lm_num_layers': 3, 'rnn_lm_tie_weights': True, 'transformer_lm_exp_dir': None, 'transformer_lm_dim_feedforward': 2048, 'transformer_lm_encoder_dim': 768, 'transformer_lm_embedding_dim': 768, 'transformer_lm_nhead': 8, 'transformer_lm_num_layers': 16, 'transformer_lm_tie_weights': True, 'res_dir': PosixPath('zipformer/exp-full-liri-full-bf16-md1000/greedy_search'), 'has_contexts': False, 'suffix': 'epoch-30-avg-13-context-2-max-sym-per-frame-1-use-averaged-model', 'blank_id': 0, 'unk_id': 2, 'vocab_size': 500}
+2024-08-08 10:09:48,531 INFO [decode.py:851] About to create model
+2024-08-08 10:09:49,284 INFO [decode.py:918] Calculating the averaged model over epoch range from 17 (excluded) to 30
+2024-08-08 10:09:54,635 INFO [decode.py:1012] Number of model parameters: 65549011
+2024-08-08 10:09:54,636 INFO [asr_datamodule.py:467] About to get test-clean cuts
+2024-08-08 10:09:54,673 INFO [asr_datamodule.py:474] About to get test-other cuts
+2024-08-08 10:09:57,847 INFO [decode.py:706] batch 0/?, cuts processed until now is 36
+2024-08-08 10:09:59,108 INFO [zipformer.py:1858] name=None, attn_weights_entropy = tensor([1.8040, 3.0072, 2.6733, 3.1166], device='cuda:0')
+2024-08-08 10:10:22,145 INFO [zipformer.py:1858] name=None, attn_weights_entropy = tensor([4.1837, 4.5047, 3.0808, 2.3496], device='cuda:0')
+2024-08-08 10:10:24,049 INFO [decode.py:722] The transcripts are stored in zipformer/exp-full-liri-full-bf16-md1000/greedy_search/recogs-test-clean-greedy_search-epoch-30-avg-13-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-08 10:10:24,169 INFO [utils.py:657] [test-clean-greedy_search] %WER 2.42% [1274 / 52576, 149 ins, 109 del, 1016 sub ]
+2024-08-08 10:10:24,445 INFO [decode.py:735] Wrote detailed error stats to zipformer/exp-full-liri-full-bf16-md1000/greedy_search/errs-test-clean-greedy_search-epoch-30-avg-13-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-08 10:10:24,452 INFO [decode.py:751]
+For test-clean, WER of different settings are:
+greedy_search	2.42	best for test-clean
+2024-08-08 10:10:25,705 INFO [decode.py:706] batch 0/?, cuts processed until now is 43
+2024-08-08 10:10:49,657 INFO [decode.py:722] The transcripts are stored in zipformer/exp-full-liri-full-bf16-md1000/greedy_search/recogs-test-other-greedy_search-epoch-30-avg-13-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-08 10:10:49,776 INFO [utils.py:657] [test-other-greedy_search] %WER 5.41% [2830 / 52343, 278 ins, 242 del, 2310 sub ]
+2024-08-08 10:10:50,053 INFO [decode.py:735] Wrote detailed error stats to zipformer/exp-full-liri-full-bf16-md1000/greedy_search/errs-test-other-greedy_search-epoch-30-avg-13-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-08 10:10:50,056 INFO [decode.py:751]
+For test-other, WER of different settings are:
+greedy_search	5.41	best for test-other
+2024-08-08 10:10:50,056 INFO [decode.py:1047] Done!

decoding_results/greedy_search/log-decode-epoch-30-avg-15-context-2-max-sym-per-frame-1-use-averaged-model-2024-08-07-10-39-22 ADDED Viewed

	@@ -0,0 +1,28 @@

+2024-08-07 10:39:22,792 INFO [decode_bf16.py:833] Decoding started
+2024-08-07 10:39:22,793 INFO [decode_bf16.py:839] Device: cuda:0
+2024-08-07 10:39:22,801 INFO [decode_bf16.py:849] {'best_train_loss': inf, 'best_valid_loss': inf, 'best_train_epoch': -1, 'best_valid_epoch': -1, 'batch_idx_train': 0, 'log_interval': 50, 'reset_interval': 200, 'valid_interval': 3000, 'feature_dim': 80, 'subsampling_factor': 4, 'ignore_id': -1, 'label_smoothing': 0.1, 'warm_step': 2000, 'env_info': {'k2-version': '1.24.4', 'k2-build-type': 'Release', 'k2-with-cuda': True, 'k2-git-sha1': 'ff1d435a8d3c4eaa15828a84a7240678a70539a7', 'k2-git-date': 'Fri Feb 23 01:48:38 2024', 'lhotse-version': '1.26.0', 'torch-version': '2.0.1+cu117', 'torch-cuda-available': True, 'torch-cuda-version': '11.7', 'python-version': '3.10', 'icefall-git-branch': 'zipformer_bf16', 'icefall-git-sha1': '7692bd4d-dirty', 'icefall-git-date': 'Wed Jul 24 15:06:10 2024', 'icefall-path': '/star-xy/softwares/icefall_development/icefall_bf16', 'k2-path': '/star-xy/softwares/pyenvs/k2_cuda11/k2_cuda11/lib/python3.10/site-packages/k2/__init__.py', 'lhotse-path': '/star-xy/softwares/pyenvs/k2_cuda11/k2_cuda11/lib/python3.10/site-packages/lhotse/__init__.py', 'hostname': 'de-74279-k2-train-9-0208143539-7dbf569d4f-r7nrb', 'IP address': '10.177.13.150'}, 'epoch': 30, 'iter': 0, 'avg': 15, 'use_averaged_model': True, 'exp_dir': PosixPath('zipformer/exp-full-liri-full-bf16-md1000'), 'bpe_model': 'data/lang_bpe_500/bpe.model', 'lang_dir': PosixPath('data/lang_bpe_500'), 'decoding_method': 'greedy_search', 'beam_size': 4, 'beam': 20.0, 'ngram_lm_scale': 0.01, 'max_contexts': 8, 'max_states': 64, 'context_size': 2, 'max_sym_per_frame': 1, 'num_paths': 200, 'nbest_scale': 0.5, 'use_shallow_fusion': False, 'lm_type': 'rnn', 'lm_scale': 0.3, 'tokens_ngram': 2, 'backoff_id': 500, 'context_score': 2, 'context_file': '', 'num_encoder_layers': '2,2,3,4,3,2', 'downsampling_factor': '1,2,4,8,4,2', 'feedforward_dim': '512,768,1024,1536,1024,768', 'num_heads': '4,4,4,8,4,4', 'encoder_dim': '192,256,384,512,384,256', 'query_head_dim': '32', 'value_head_dim': '12', 'pos_head_dim': '4', 'pos_dim': 48, 'encoder_unmasked_dim': '192,192,256,256,256,192', 'cnn_module_kernel': '31,31,15,15,15,31', 'decoder_dim': 512, 'joiner_dim': 512, 'attention_decoder_dim': 512, 'attention_decoder_num_layers': 6, 'attention_decoder_attention_dim': 512, 'attention_decoder_num_heads': 8, 'attention_decoder_feedforward_dim': 2048, 'causal': False, 'chunk_size': '16,32,64,-1', 'left_context_frames': '64,128,256,-1', 'use_transducer': True, 'use_ctc': False, 'use_attention_decoder': False, 'full_libri': True, 'mini_libri': False, 'manifest_dir': PosixPath('data/fbank'), 'max_duration': 600, 'bucketing_sampler': True, 'num_buckets': 30, 'concatenate_cuts': False, 'duration_factor': 1.0, 'gap': 1.0, 'on_the_fly_feats': False, 'shuffle': True, 'drop_last': True, 'return_cuts': True, 'num_workers': 2, 'enable_spec_aug': True, 'spec_aug_time_warp_factor': 80, 'enable_musan': True, 'input_strategy': 'PrecomputedFeatures', 'lm_vocab_size': 500, 'lm_epoch': 7, 'lm_avg': 1, 'lm_exp_dir': None, 'rnn_lm_embedding_dim': 2048, 'rnn_lm_hidden_dim': 2048, 'rnn_lm_num_layers': 3, 'rnn_lm_tie_weights': True, 'transformer_lm_exp_dir': None, 'transformer_lm_dim_feedforward': 2048, 'transformer_lm_encoder_dim': 768, 'transformer_lm_embedding_dim': 768, 'transformer_lm_nhead': 8, 'transformer_lm_num_layers': 16, 'transformer_lm_tie_weights': True, 'res_dir': PosixPath('zipformer/exp-full-liri-full-bf16-md1000/greedy_search'), 'has_contexts': False, 'suffix': 'epoch-30-avg-15-context-2-max-sym-per-frame-1-use-averaged-model', 'blank_id': 0, 'unk_id': 2, 'vocab_size': 500}
+2024-08-07 10:39:22,802 INFO [decode_bf16.py:851] About to create model
+2024-08-07 10:39:23,927 INFO [decode_bf16.py:918] Calculating the averaged model over epoch range from 15 (excluded) to 30
+2024-08-07 10:39:37,680 INFO [decode_bf16.py:1012] Number of model parameters: 65549011
+2024-08-07 10:39:37,681 INFO [asr_datamodule.py:467] About to get test-clean cuts
+2024-08-07 10:39:37,692 INFO [asr_datamodule.py:474] About to get test-other cuts
+2024-08-07 10:39:46,632 INFO [decode_bf16.py:706] batch 0/?, cuts processed until now is 36
+2024-08-07 10:40:00,307 INFO [zipformer_full_bf16.py:1858] name=None, attn_weights_entropy = tensor([5.6690, 4.9965, 5.1595, 5.4509], device='cuda:0')
+2024-08-07 10:40:18,871 INFO [zipformer_full_bf16.py:1858] name=None, attn_weights_entropy = tensor([5.6741, 5.0880, 5.3362, 4.9879], device='cuda:0')
+2024-08-07 10:40:57,742 INFO [decode_bf16.py:722] The transcripts are stored in zipformer/exp-full-liri-full-bf16-md1000/greedy_search/recogs-test-clean-greedy_search-epoch-30-avg-15-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-07 10:40:57,930 INFO [utils.py:657] [test-clean-greedy_search] %WER 2.42% [1270 / 52576, 147 ins, 109 del, 1014 sub ]
+2024-08-07 10:40:58,368 INFO [decode_bf16.py:735] Wrote detailed error stats to zipformer/exp-full-liri-full-bf16-md1000/greedy_search/errs-test-clean-greedy_search-epoch-30-avg-15-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-07 10:40:58,372 INFO [decode_bf16.py:751]
+For test-clean, WER of different settings are:
+greedy_search	2.42	best for test-clean
+2024-08-07 10:41:00,192 INFO [decode_bf16.py:706] batch 0/?, cuts processed until now is 43
+2024-08-07 10:41:05,234 INFO [zipformer_full_bf16.py:1858] name=None, attn_weights_entropy = tensor([5.7368, 5.1922, 5.5282, 5.1211], device='cuda:0')
+2024-08-07 10:41:48,803 INFO [decode_bf16.py:722] The transcripts are stored in zipformer/exp-full-liri-full-bf16-md1000/greedy_search/recogs-test-other-greedy_search-epoch-30-avg-15-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-07 10:41:48,999 INFO [utils.py:657] [test-other-greedy_search] %WER 5.44% [2847 / 52343, 277 ins, 249 del, 2321 sub ]
+2024-08-07 10:41:49,461 INFO [decode_bf16.py:735] Wrote detailed error stats to zipformer/exp-full-liri-full-bf16-md1000/greedy_search/errs-test-other-greedy_search-epoch-30-avg-15-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-07 10:41:49,464 INFO [decode_bf16.py:751]
+For test-other, WER of different settings are:
+greedy_search	5.44	best for test-other
+2024-08-07 10:41:49,464 INFO [decode_bf16.py:1047] Done!

decoding_results/greedy_search/log-decode-epoch-30-avg-15-context-2-max-sym-per-frame-1-use-averaged-model-2024-08-08-10-08-02 ADDED Viewed

	@@ -0,0 +1,26 @@

+2024-08-08 10:08:02,252 INFO [decode.py:833] Decoding started
+2024-08-08 10:08:02,253 INFO [decode.py:839] Device: cuda:0
+2024-08-08 10:08:02,260 INFO [decode.py:849] {'best_train_loss': inf, 'best_valid_loss': inf, 'best_train_epoch': -1, 'best_valid_epoch': -1, 'batch_idx_train': 0, 'log_interval': 50, 'reset_interval': 200, 'valid_interval': 3000, 'feature_dim': 80, 'subsampling_factor': 4, 'ignore_id': -1, 'label_smoothing': 0.1, 'warm_step': 2000, 'env_info': {'k2-version': '1.24.4', 'k2-build-type': 'Release', 'k2-with-cuda': True, 'k2-git-sha1': 'ff1d435a8d3c4eaa15828a84a7240678a70539a7', 'k2-git-date': 'Fri Feb 23 01:48:38 2024', 'lhotse-version': '1.26.0', 'torch-version': '2.0.1+cu117', 'torch-cuda-available': True, 'torch-cuda-version': '11.7', 'python-version': '3.10', 'icefall-git-branch': 'zipformer_bf16', 'icefall-git-sha1': '7692bd4d-dirty', 'icefall-git-date': 'Wed Jul 24 15:06:10 2024', 'icefall-path': '/star-xy/softwares/icefall_development/icefall_bf16', 'k2-path': '/star-xy/softwares/pyenvs/k2_cuda11/k2_cuda11/lib/python3.10/site-packages/k2/__init__.py', 'lhotse-path': '/star-xy/softwares/pyenvs/k2_cuda11/k2_cuda11/lib/python3.10/site-packages/lhotse/__init__.py', 'hostname': 'de-74279-k2-train-2-1207150844-f49d8c4f4-c49d5', 'IP address': '10.177.22.19'}, 'epoch': 30, 'iter': 0, 'avg': 15, 'use_averaged_model': True, 'exp_dir': PosixPath('zipformer/exp-full-liri-full-bf16-md1000'), 'bpe_model': 'data/lang_bpe_500/bpe.model', 'lang_dir': PosixPath('data/lang_bpe_500'), 'decoding_method': 'greedy_search', 'beam_size': 4, 'beam': 20.0, 'ngram_lm_scale': 0.01, 'max_contexts': 8, 'max_states': 64, 'context_size': 2, 'max_sym_per_frame': 1, 'num_paths': 200, 'nbest_scale': 0.5, 'use_shallow_fusion': False, 'lm_type': 'rnn', 'lm_scale': 0.3, 'tokens_ngram': 2, 'backoff_id': 500, 'context_score': 2, 'context_file': '', 'num_encoder_layers': '2,2,3,4,3,2', 'downsampling_factor': '1,2,4,8,4,2', 'feedforward_dim': '512,768,1024,1536,1024,768', 'num_heads': '4,4,4,8,4,4', 'encoder_dim': '192,256,384,512,384,256', 'query_head_dim': '32', 'value_head_dim': '12', 'pos_head_dim': '4', 'pos_dim': 48, 'encoder_unmasked_dim': '192,192,256,256,256,192', 'cnn_module_kernel': '31,31,15,15,15,31', 'decoder_dim': 512, 'joiner_dim': 512, 'attention_decoder_dim': 512, 'attention_decoder_num_layers': 6, 'attention_decoder_attention_dim': 512, 'attention_decoder_num_heads': 8, 'attention_decoder_feedforward_dim': 2048, 'causal': False, 'chunk_size': '16,32,64,-1', 'left_context_frames': '64,128,256,-1', 'use_transducer': True, 'use_ctc': False, 'use_attention_decoder': False, 'full_libri': True, 'mini_libri': False, 'manifest_dir': PosixPath('data/fbank'), 'max_duration': 600, 'bucketing_sampler': True, 'num_buckets': 30, 'concatenate_cuts': False, 'duration_factor': 1.0, 'gap': 1.0, 'on_the_fly_feats': False, 'shuffle': True, 'drop_last': True, 'return_cuts': True, 'num_workers': 2, 'enable_spec_aug': True, 'spec_aug_time_warp_factor': 80, 'enable_musan': True, 'input_strategy': 'PrecomputedFeatures', 'lm_vocab_size': 500, 'lm_epoch': 7, 'lm_avg': 1, 'lm_exp_dir': None, 'rnn_lm_embedding_dim': 2048, 'rnn_lm_hidden_dim': 2048, 'rnn_lm_num_layers': 3, 'rnn_lm_tie_weights': True, 'transformer_lm_exp_dir': None, 'transformer_lm_dim_feedforward': 2048, 'transformer_lm_encoder_dim': 768, 'transformer_lm_embedding_dim': 768, 'transformer_lm_nhead': 8, 'transformer_lm_num_layers': 16, 'transformer_lm_tie_weights': True, 'res_dir': PosixPath('zipformer/exp-full-liri-full-bf16-md1000/greedy_search'), 'has_contexts': False, 'suffix': 'epoch-30-avg-15-context-2-max-sym-per-frame-1-use-averaged-model', 'blank_id': 0, 'unk_id': 2, 'vocab_size': 500}
+2024-08-08 10:08:02,260 INFO [decode.py:851] About to create model
+2024-08-08 10:08:03,018 INFO [decode.py:918] Calculating the averaged model over epoch range from 15 (excluded) to 30
+2024-08-08 10:08:09,307 INFO [decode.py:1012] Number of model parameters: 65549011
+2024-08-08 10:08:09,308 INFO [asr_datamodule.py:467] About to get test-clean cuts
+2024-08-08 10:08:09,323 INFO [asr_datamodule.py:474] About to get test-other cuts
+2024-08-08 10:08:12,453 INFO [decode.py:706] batch 0/?, cuts processed until now is 36
+2024-08-08 10:08:27,723 INFO [zipformer.py:1858] name=None, attn_weights_entropy = tensor([3.9975, 4.9900, 4.9416, 2.7579], device='cuda:0')
+2024-08-08 10:08:36,998 INFO [decode.py:722] The transcripts are stored in zipformer/exp-full-liri-full-bf16-md1000/greedy_search/recogs-test-clean-greedy_search-epoch-30-avg-15-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-08 10:08:37,120 INFO [utils.py:657] [test-clean-greedy_search] %WER 2.42% [1270 / 52576, 147 ins, 109 del, 1014 sub ]
+2024-08-08 10:08:37,381 INFO [decode.py:735] Wrote detailed error stats to zipformer/exp-full-liri-full-bf16-md1000/greedy_search/errs-test-clean-greedy_search-epoch-30-avg-15-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-08 10:08:37,384 INFO [decode.py:751]
+For test-clean, WER of different settings are:
+greedy_search	2.42	best for test-clean
+2024-08-08 10:08:38,543 INFO [decode.py:706] batch 0/?, cuts processed until now is 43
+2024-08-08 10:09:01,258 INFO [decode.py:722] The transcripts are stored in zipformer/exp-full-liri-full-bf16-md1000/greedy_search/recogs-test-other-greedy_search-epoch-30-avg-15-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-08 10:09:01,375 INFO [utils.py:657] [test-other-greedy_search] %WER 5.44% [2847 / 52343, 277 ins, 249 del, 2321 sub ]
+2024-08-08 10:09:01,638 INFO [decode.py:735] Wrote detailed error stats to zipformer/exp-full-liri-full-bf16-md1000/greedy_search/errs-test-other-greedy_search-epoch-30-avg-15-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-08 10:09:01,641 INFO [decode.py:751]
+For test-other, WER of different settings are:
+greedy_search	5.44	best for test-other
+2024-08-08 10:09:01,641 INFO [decode.py:1047] Done!

decoding_results/greedy_search/log-decode-epoch-30-avg-7-context-2-max-sym-per-frame-1-use-averaged-model-2024-08-08-10-13-10 ADDED Viewed

	@@ -0,0 +1,28 @@

+2024-08-08 10:13:10,193 INFO [decode.py:833] Decoding started
+2024-08-08 10:13:10,193 INFO [decode.py:839] Device: cuda:0
+2024-08-08 10:13:10,200 INFO [decode.py:849] {'best_train_loss': inf, 'best_valid_loss': inf, 'best_train_epoch': -1, 'best_valid_epoch': -1, 'batch_idx_train': 0, 'log_interval': 50, 'reset_interval': 200, 'valid_interval': 3000, 'feature_dim': 80, 'subsampling_factor': 4, 'ignore_id': -1, 'label_smoothing': 0.1, 'warm_step': 2000, 'env_info': {'k2-version': '1.24.4', 'k2-build-type': 'Release', 'k2-with-cuda': True, 'k2-git-sha1': 'ff1d435a8d3c4eaa15828a84a7240678a70539a7', 'k2-git-date': 'Fri Feb 23 01:48:38 2024', 'lhotse-version': '1.26.0', 'torch-version': '2.0.1+cu117', 'torch-cuda-available': True, 'torch-cuda-version': '11.7', 'python-version': '3.10', 'icefall-git-branch': 'zipformer_bf16', 'icefall-git-sha1': 'd1974bef-dirty', 'icefall-git-date': 'Thu Aug 8 10:10:22 2024', 'icefall-path': '/star-xy/softwares/icefall_development/icefall_bf16', 'k2-path': '/star-xy/softwares/pyenvs/k2_cuda11/k2_cuda11/lib/python3.10/site-packages/k2/__init__.py', 'lhotse-path': '/star-xy/softwares/pyenvs/k2_cuda11/k2_cuda11/lib/python3.10/site-packages/lhotse/__init__.py', 'hostname': 'de-74279-k2-train-2-1207150844-f49d8c4f4-c49d5', 'IP address': '10.177.22.19'}, 'epoch': 30, 'iter': 0, 'avg': 7, 'use_averaged_model': True, 'exp_dir': PosixPath('zipformer/exp-full-liri-full-bf16-md1000'), 'bpe_model': 'data/lang_bpe_500/bpe.model', 'lang_dir': PosixPath('data/lang_bpe_500'), 'decoding_method': 'greedy_search', 'beam_size': 4, 'beam': 20.0, 'ngram_lm_scale': 0.01, 'max_contexts': 8, 'max_states': 64, 'context_size': 2, 'max_sym_per_frame': 1, 'num_paths': 200, 'nbest_scale': 0.5, 'use_shallow_fusion': False, 'lm_type': 'rnn', 'lm_scale': 0.3, 'tokens_ngram': 2, 'backoff_id': 500, 'context_score': 2, 'context_file': '', 'num_encoder_layers': '2,2,3,4,3,2', 'downsampling_factor': '1,2,4,8,4,2', 'feedforward_dim': '512,768,1024,1536,1024,768', 'num_heads': '4,4,4,8,4,4', 'encoder_dim': '192,256,384,512,384,256', 'query_head_dim': '32', 'value_head_dim': '12', 'pos_head_dim': '4', 'pos_dim': 48, 'encoder_unmasked_dim': '192,192,256,256,256,192', 'cnn_module_kernel': '31,31,15,15,15,31', 'decoder_dim': 512, 'joiner_dim': 512, 'attention_decoder_dim': 512, 'attention_decoder_num_layers': 6, 'attention_decoder_attention_dim': 512, 'attention_decoder_num_heads': 8, 'attention_decoder_feedforward_dim': 2048, 'causal': False, 'chunk_size': '16,32,64,-1', 'left_context_frames': '64,128,256,-1', 'use_transducer': True, 'use_ctc': False, 'use_attention_decoder': False, 'full_libri': True, 'mini_libri': False, 'manifest_dir': PosixPath('data/fbank'), 'max_duration': 600, 'bucketing_sampler': True, 'num_buckets': 30, 'concatenate_cuts': False, 'duration_factor': 1.0, 'gap': 1.0, 'on_the_fly_feats': False, 'shuffle': True, 'drop_last': True, 'return_cuts': True, 'num_workers': 2, 'enable_spec_aug': True, 'spec_aug_time_warp_factor': 80, 'enable_musan': True, 'input_strategy': 'PrecomputedFeatures', 'lm_vocab_size': 500, 'lm_epoch': 7, 'lm_avg': 1, 'lm_exp_dir': None, 'rnn_lm_embedding_dim': 2048, 'rnn_lm_hidden_dim': 2048, 'rnn_lm_num_layers': 3, 'rnn_lm_tie_weights': True, 'transformer_lm_exp_dir': None, 'transformer_lm_dim_feedforward': 2048, 'transformer_lm_encoder_dim': 768, 'transformer_lm_embedding_dim': 768, 'transformer_lm_nhead': 8, 'transformer_lm_num_layers': 16, 'transformer_lm_tie_weights': True, 'res_dir': PosixPath('zipformer/exp-full-liri-full-bf16-md1000/greedy_search'), 'has_contexts': False, 'suffix': 'epoch-30-avg-7-context-2-max-sym-per-frame-1-use-averaged-model', 'blank_id': 0, 'unk_id': 2, 'vocab_size': 500}
+2024-08-08 10:13:10,200 INFO [decode.py:851] About to create model
+2024-08-08 10:13:10,953 INFO [decode.py:918] Calculating the averaged model over epoch range from 23 (excluded) to 30
+2024-08-08 10:13:15,869 INFO [decode.py:1012] Number of model parameters: 65549011
+2024-08-08 10:13:15,869 INFO [asr_datamodule.py:467] About to get test-clean cuts
+2024-08-08 10:13:15,874 INFO [asr_datamodule.py:474] About to get test-other cuts
+2024-08-08 10:13:19,051 INFO [decode.py:706] batch 0/?, cuts processed until now is 36
+2024-08-08 10:13:34,331 INFO [zipformer.py:1858] name=None, attn_weights_entropy = tensor([2.9358, 3.8801, 3.6067, 2.8585], device='cuda:0')
+2024-08-08 10:13:39,753 INFO [zipformer.py:1858] name=None, attn_weights_entropy = tensor([6.4703, 5.9052, 6.2376, 5.8522], device='cuda:0')
+2024-08-08 10:13:44,702 INFO [decode.py:722] The transcripts are stored in zipformer/exp-full-liri-full-bf16-md1000/greedy_search/recogs-test-clean-greedy_search-epoch-30-avg-7-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-08 10:13:44,814 INFO [utils.py:657] [test-clean-greedy_search] %WER 2.39% [1257 / 52576, 141 ins, 102 del, 1014 sub ]
+2024-08-08 10:13:45,082 INFO [decode.py:735] Wrote detailed error stats to zipformer/exp-full-liri-full-bf16-md1000/greedy_search/errs-test-clean-greedy_search-epoch-30-avg-7-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-08 10:13:45,086 INFO [decode.py:751]
+For test-clean, WER of different settings are:
+greedy_search	2.39	best for test-clean
+2024-08-08 10:13:46,330 INFO [decode.py:706] batch 0/?, cuts processed until now is 43
+2024-08-08 10:13:58,861 INFO [zipformer.py:1858] name=None, attn_weights_entropy = tensor([2.1300, 4.5340, 4.2289, 3.3131], device='cuda:0')
+2024-08-08 10:14:10,040 INFO [decode.py:722] The transcripts are stored in zipformer/exp-full-liri-full-bf16-md1000/greedy_search/recogs-test-other-greedy_search-epoch-30-avg-7-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-08 10:14:10,161 INFO [utils.py:657] [test-other-greedy_search] %WER 5.47% [2861 / 52343, 283 ins, 246 del, 2332 sub ]
+2024-08-08 10:14:10,430 INFO [decode.py:735] Wrote detailed error stats to zipformer/exp-full-liri-full-bf16-md1000/greedy_search/errs-test-other-greedy_search-epoch-30-avg-7-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-08 10:14:10,433 INFO [decode.py:751]
+For test-other, WER of different settings are:
+greedy_search	5.47	best for test-other
+2024-08-08 10:14:10,434 INFO [decode.py:1047] Done!

decoding_results/greedy_search/log-decode-epoch-30-avg-9-context-2-max-sym-per-frame-1-use-averaged-model-2024-08-08-10-12-02 ADDED Viewed

	@@ -0,0 +1,25 @@

+2024-08-08 10:12:02,841 INFO [decode.py:833] Decoding started
+2024-08-08 10:12:02,842 INFO [decode.py:839] Device: cuda:0
+2024-08-08 10:12:02,848 INFO [decode.py:849] {'best_train_loss': inf, 'best_valid_loss': inf, 'best_train_epoch': -1, 'best_valid_epoch': -1, 'batch_idx_train': 0, 'log_interval': 50, 'reset_interval': 200, 'valid_interval': 3000, 'feature_dim': 80, 'subsampling_factor': 4, 'ignore_id': -1, 'label_smoothing': 0.1, 'warm_step': 2000, 'env_info': {'k2-version': '1.24.4', 'k2-build-type': 'Release', 'k2-with-cuda': True, 'k2-git-sha1': 'ff1d435a8d3c4eaa15828a84a7240678a70539a7', 'k2-git-date': 'Fri Feb 23 01:48:38 2024', 'lhotse-version': '1.26.0', 'torch-version': '2.0.1+cu117', 'torch-cuda-available': True, 'torch-cuda-version': '11.7', 'python-version': '3.10', 'icefall-git-branch': 'zipformer_bf16', 'icefall-git-sha1': 'd1974bef-dirty', 'icefall-git-date': 'Thu Aug 8 10:10:22 2024', 'icefall-path': '/star-xy/softwares/icefall_development/icefall_bf16', 'k2-path': '/star-xy/softwares/pyenvs/k2_cuda11/k2_cuda11/lib/python3.10/site-packages/k2/__init__.py', 'lhotse-path': '/star-xy/softwares/pyenvs/k2_cuda11/k2_cuda11/lib/python3.10/site-packages/lhotse/__init__.py', 'hostname': 'de-74279-k2-train-2-1207150844-f49d8c4f4-c49d5', 'IP address': '10.177.22.19'}, 'epoch': 30, 'iter': 0, 'avg': 9, 'use_averaged_model': True, 'exp_dir': PosixPath('zipformer/exp-full-liri-full-bf16-md1000'), 'bpe_model': 'data/lang_bpe_500/bpe.model', 'lang_dir': PosixPath('data/lang_bpe_500'), 'decoding_method': 'greedy_search', 'beam_size': 4, 'beam': 20.0, 'ngram_lm_scale': 0.01, 'max_contexts': 8, 'max_states': 64, 'context_size': 2, 'max_sym_per_frame': 1, 'num_paths': 200, 'nbest_scale': 0.5, 'use_shallow_fusion': False, 'lm_type': 'rnn', 'lm_scale': 0.3, 'tokens_ngram': 2, 'backoff_id': 500, 'context_score': 2, 'context_file': '', 'num_encoder_layers': '2,2,3,4,3,2', 'downsampling_factor': '1,2,4,8,4,2', 'feedforward_dim': '512,768,1024,1536,1024,768', 'num_heads': '4,4,4,8,4,4', 'encoder_dim': '192,256,384,512,384,256', 'query_head_dim': '32', 'value_head_dim': '12', 'pos_head_dim': '4', 'pos_dim': 48, 'encoder_unmasked_dim': '192,192,256,256,256,192', 'cnn_module_kernel': '31,31,15,15,15,31', 'decoder_dim': 512, 'joiner_dim': 512, 'attention_decoder_dim': 512, 'attention_decoder_num_layers': 6, 'attention_decoder_attention_dim': 512, 'attention_decoder_num_heads': 8, 'attention_decoder_feedforward_dim': 2048, 'causal': False, 'chunk_size': '16,32,64,-1', 'left_context_frames': '64,128,256,-1', 'use_transducer': True, 'use_ctc': False, 'use_attention_decoder': False, 'full_libri': True, 'mini_libri': False, 'manifest_dir': PosixPath('data/fbank'), 'max_duration': 600, 'bucketing_sampler': True, 'num_buckets': 30, 'concatenate_cuts': False, 'duration_factor': 1.0, 'gap': 1.0, 'on_the_fly_feats': False, 'shuffle': True, 'drop_last': True, 'return_cuts': True, 'num_workers': 2, 'enable_spec_aug': True, 'spec_aug_time_warp_factor': 80, 'enable_musan': True, 'input_strategy': 'PrecomputedFeatures', 'lm_vocab_size': 500, 'lm_epoch': 7, 'lm_avg': 1, 'lm_exp_dir': None, 'rnn_lm_embedding_dim': 2048, 'rnn_lm_hidden_dim': 2048, 'rnn_lm_num_layers': 3, 'rnn_lm_tie_weights': True, 'transformer_lm_exp_dir': None, 'transformer_lm_dim_feedforward': 2048, 'transformer_lm_encoder_dim': 768, 'transformer_lm_embedding_dim': 768, 'transformer_lm_nhead': 8, 'transformer_lm_num_layers': 16, 'transformer_lm_tie_weights': True, 'res_dir': PosixPath('zipformer/exp-full-liri-full-bf16-md1000/greedy_search'), 'has_contexts': False, 'suffix': 'epoch-30-avg-9-context-2-max-sym-per-frame-1-use-averaged-model', 'blank_id': 0, 'unk_id': 2, 'vocab_size': 500}
+2024-08-08 10:12:02,848 INFO [decode.py:851] About to create model
+2024-08-08 10:12:03,572 INFO [decode.py:918] Calculating the averaged model over epoch range from 21 (excluded) to 30
+2024-08-08 10:12:08,825 INFO [decode.py:1012] Number of model parameters: 65549011
+2024-08-08 10:12:08,826 INFO [asr_datamodule.py:467] About to get test-clean cuts
+2024-08-08 10:12:08,834 INFO [asr_datamodule.py:474] About to get test-other cuts
+2024-08-08 10:12:11,932 INFO [decode.py:706] batch 0/?, cuts processed until now is 36
+2024-08-08 10:12:37,537 INFO [decode.py:722] The transcripts are stored in zipformer/exp-full-liri-full-bf16-md1000/greedy_search/recogs-test-clean-greedy_search-epoch-30-avg-9-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-08 10:12:37,650 INFO [utils.py:657] [test-clean-greedy_search] %WER 2.39% [1259 / 52576, 145 ins, 105 del, 1009 sub ]
+2024-08-08 10:12:37,918 INFO [decode.py:735] Wrote detailed error stats to zipformer/exp-full-liri-full-bf16-md1000/greedy_search/errs-test-clean-greedy_search-epoch-30-avg-9-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-08 10:12:37,922 INFO [decode.py:751]
+For test-clean, WER of different settings are:
+greedy_search	2.39	best for test-clean
+2024-08-08 10:12:39,182 INFO [decode.py:706] batch 0/?, cuts processed until now is 43
+2024-08-08 10:13:03,213 INFO [decode.py:722] The transcripts are stored in zipformer/exp-full-liri-full-bf16-md1000/greedy_search/recogs-test-other-greedy_search-epoch-30-avg-9-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-08 10:13:03,335 INFO [utils.py:657] [test-other-greedy_search] %WER 5.42% [2836 / 52343, 282 ins, 245 del, 2309 sub ]
+2024-08-08 10:13:03,605 INFO [decode.py:735] Wrote detailed error stats to zipformer/exp-full-liri-full-bf16-md1000/greedy_search/errs-test-other-greedy_search-epoch-30-avg-9-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-08 10:13:03,608 INFO [decode.py:751]
+For test-other, WER of different settings are:
+greedy_search	5.42	best for test-other
+2024-08-08 10:13:03,608 INFO [decode.py:1047] Done!

decoding_results/greedy_search/log-decode-epoch-40-avg-11-context-2-max-sym-per-frame-1-use-averaged-model-2024-08-13-10-45-34 ADDED Viewed

	@@ -0,0 +1,26 @@

+2024-08-13 10:45:34,039 INFO [decode.py:833] Decoding started
+2024-08-13 10:45:34,040 INFO [decode.py:839] Device: cuda:0
+2024-08-13 10:45:34,045 INFO [decode.py:849] {'best_train_loss': inf, 'best_valid_loss': inf, 'best_train_epoch': -1, 'best_valid_epoch': -1, 'batch_idx_train': 0, 'log_interval': 50, 'reset_interval': 200, 'valid_interval': 3000, 'feature_dim': 80, 'subsampling_factor': 4, 'ignore_id': -1, 'label_smoothing': 0.1, 'warm_step': 2000, 'env_info': {'k2-version': '1.24.4', 'k2-build-type': 'Release', 'k2-with-cuda': True, 'k2-git-sha1': 'ff1d435a8d3c4eaa15828a84a7240678a70539a7', 'k2-git-date': 'Fri Feb 23 01:48:38 2024', 'lhotse-version': '1.26.0', 'torch-version': '2.0.1+cu117', 'torch-cuda-available': True, 'torch-cuda-version': '11.7', 'python-version': '3.10', 'icefall-git-branch': 'zipformer_bf16', 'icefall-git-sha1': 'a288d412-clean', 'icefall-git-date': 'Mon Aug 12 11:30:21 2024', 'icefall-path': '/star-xy/softwares/icefall_development/icefall_bf16', 'k2-path': '/star-xy/softwares/pyenvs/k2_cuda11/k2_cuda11/lib/python3.10/site-packages/k2/__init__.py', 'lhotse-path': '/star-xy/softwares/pyenvs/k2_cuda11/k2_cuda11/lib/python3.10/site-packages/lhotse/__init__.py', 'hostname': 'de-74279-k2-train-2-1207150844-f49d8c4f4-c49d5', 'IP address': '10.177.22.19'}, 'epoch': 40, 'iter': 0, 'avg': 11, 'use_averaged_model': True, 'exp_dir': PosixPath('zipformer/exp-full-libri-full-bf16-md1000'), 'bpe_model': 'data/lang_bpe_500/bpe.model', 'lang_dir': PosixPath('data/lang_bpe_500'), 'decoding_method': 'greedy_search', 'beam_size': 4, 'beam': 20.0, 'ngram_lm_scale': 0.01, 'max_contexts': 8, 'max_states': 64, 'context_size': 2, 'max_sym_per_frame': 1, 'num_paths': 200, 'nbest_scale': 0.5, 'use_shallow_fusion': False, 'lm_type': 'rnn', 'lm_scale': 0.3, 'tokens_ngram': 2, 'backoff_id': 500, 'context_score': 2, 'context_file': '', 'num_encoder_layers': '2,2,3,4,3,2', 'downsampling_factor': '1,2,4,8,4,2', 'feedforward_dim': '512,768,1024,1536,1024,768', 'num_heads': '4,4,4,8,4,4', 'encoder_dim': '192,256,384,512,384,256', 'query_head_dim': '32', 'value_head_dim': '12', 'pos_head_dim': '4', 'pos_dim': 48, 'encoder_unmasked_dim': '192,192,256,256,256,192', 'cnn_module_kernel': '31,31,15,15,15,31', 'decoder_dim': 512, 'joiner_dim': 512, 'attention_decoder_dim': 512, 'attention_decoder_num_layers': 6, 'attention_decoder_attention_dim': 512, 'attention_decoder_num_heads': 8, 'attention_decoder_feedforward_dim': 2048, 'causal': False, 'chunk_size': '16,32,64,-1', 'left_context_frames': '64,128,256,-1', 'use_transducer': True, 'use_ctc': False, 'use_attention_decoder': False, 'full_libri': True, 'mini_libri': False, 'manifest_dir': PosixPath('data/fbank'), 'max_duration': 600, 'bucketing_sampler': True, 'num_buckets': 30, 'concatenate_cuts': False, 'duration_factor': 1.0, 'gap': 1.0, 'on_the_fly_feats': False, 'shuffle': True, 'drop_last': True, 'return_cuts': True, 'num_workers': 2, 'enable_spec_aug': True, 'spec_aug_time_warp_factor': 80, 'enable_musan': True, 'input_strategy': 'PrecomputedFeatures', 'lm_vocab_size': 500, 'lm_epoch': 7, 'lm_avg': 1, 'lm_exp_dir': None, 'rnn_lm_embedding_dim': 2048, 'rnn_lm_hidden_dim': 2048, 'rnn_lm_num_layers': 3, 'rnn_lm_tie_weights': True, 'transformer_lm_exp_dir': None, 'transformer_lm_dim_feedforward': 2048, 'transformer_lm_encoder_dim': 768, 'transformer_lm_embedding_dim': 768, 'transformer_lm_nhead': 8, 'transformer_lm_num_layers': 16, 'transformer_lm_tie_weights': True, 'res_dir': PosixPath('zipformer/exp-full-libri-full-bf16-md1000/greedy_search'), 'has_contexts': False, 'suffix': 'epoch-40-avg-11-context-2-max-sym-per-frame-1-use-averaged-model', 'blank_id': 0, 'unk_id': 2, 'vocab_size': 500}
+2024-08-13 10:45:34,045 INFO [decode.py:851] About to create model
+2024-08-13 10:45:34,809 INFO [decode.py:918] Calculating the averaged model over epoch range from 29 (excluded) to 40
+2024-08-13 10:45:40,202 INFO [decode.py:1012] Number of model parameters: 65549011
+2024-08-13 10:45:40,202 INFO [asr_datamodule.py:467] About to get test-clean cuts
+2024-08-13 10:45:40,212 INFO [asr_datamodule.py:474] About to get test-other cuts
+2024-08-13 10:45:43,555 INFO [decode.py:706] batch 0/?, cuts processed until now is 36
+2024-08-13 10:45:43,677 INFO [zipformer.py:1858] name=None, attn_weights_entropy = tensor([3.8951, 3.0322, 3.3314, 3.2371], device='cuda:0')
+2024-08-13 10:46:09,265 INFO [decode.py:722] The transcripts are stored in zipformer/exp-full-libri-full-bf16-md1000/greedy_search/recogs-test-clean-greedy_search-epoch-40-avg-11-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:46:09,376 INFO [utils.py:657] [test-clean-greedy_search] %WER 2.41% [1266 / 52576, 141 ins, 107 del, 1018 sub ]
+2024-08-13 10:46:09,648 INFO [decode.py:735] Wrote detailed error stats to zipformer/exp-full-libri-full-bf16-md1000/greedy_search/errs-test-clean-greedy_search-epoch-40-avg-11-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:46:09,653 INFO [decode.py:751]
+For test-clean, WER of different settings are:
+greedy_search	2.41	best for test-clean
+2024-08-13 10:46:10,929 INFO [decode.py:706] batch 0/?, cuts processed until now is 43
+2024-08-13 10:46:34,865 INFO [decode.py:722] The transcripts are stored in zipformer/exp-full-libri-full-bf16-md1000/greedy_search/recogs-test-other-greedy_search-epoch-40-avg-11-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:46:34,987 INFO [utils.py:657] [test-other-greedy_search] %WER 5.41% [2830 / 52343, 273 ins, 275 del, 2282 sub ]
+2024-08-13 10:46:35,255 INFO [decode.py:735] Wrote detailed error stats to zipformer/exp-full-libri-full-bf16-md1000/greedy_search/errs-test-other-greedy_search-epoch-40-avg-11-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:46:35,258 INFO [decode.py:751]
+For test-other, WER of different settings are:
+greedy_search	5.41	best for test-other
+2024-08-13 10:46:35,258 INFO [decode.py:1047] Done!

decoding_results/greedy_search/log-decode-epoch-40-avg-13-context-2-max-sym-per-frame-1-use-averaged-model-2024-08-13-10-44-27 ADDED Viewed

	@@ -0,0 +1,26 @@

+2024-08-13 10:44:27,327 INFO [decode.py:833] Decoding started
+2024-08-13 10:44:27,327 INFO [decode.py:839] Device: cuda:0
+2024-08-13 10:44:27,334 INFO [decode.py:849] {'best_train_loss': inf, 'best_valid_loss': inf, 'best_train_epoch': -1, 'best_valid_epoch': -1, 'batch_idx_train': 0, 'log_interval': 50, 'reset_interval': 200, 'valid_interval': 3000, 'feature_dim': 80, 'subsampling_factor': 4, 'ignore_id': -1, 'label_smoothing': 0.1, 'warm_step': 2000, 'env_info': {'k2-version': '1.24.4', 'k2-build-type': 'Release', 'k2-with-cuda': True, 'k2-git-sha1': 'ff1d435a8d3c4eaa15828a84a7240678a70539a7', 'k2-git-date': 'Fri Feb 23 01:48:38 2024', 'lhotse-version': '1.26.0', 'torch-version': '2.0.1+cu117', 'torch-cuda-available': True, 'torch-cuda-version': '11.7', 'python-version': '3.10', 'icefall-git-branch': 'zipformer_bf16', 'icefall-git-sha1': 'a288d412-clean', 'icefall-git-date': 'Mon Aug 12 11:30:21 2024', 'icefall-path': '/star-xy/softwares/icefall_development/icefall_bf16', 'k2-path': '/star-xy/softwares/pyenvs/k2_cuda11/k2_cuda11/lib/python3.10/site-packages/k2/__init__.py', 'lhotse-path': '/star-xy/softwares/pyenvs/k2_cuda11/k2_cuda11/lib/python3.10/site-packages/lhotse/__init__.py', 'hostname': 'de-74279-k2-train-2-1207150844-f49d8c4f4-c49d5', 'IP address': '10.177.22.19'}, 'epoch': 40, 'iter': 0, 'avg': 13, 'use_averaged_model': True, 'exp_dir': PosixPath('zipformer/exp-full-libri-full-bf16-md1000'), 'bpe_model': 'data/lang_bpe_500/bpe.model', 'lang_dir': PosixPath('data/lang_bpe_500'), 'decoding_method': 'greedy_search', 'beam_size': 4, 'beam': 20.0, 'ngram_lm_scale': 0.01, 'max_contexts': 8, 'max_states': 64, 'context_size': 2, 'max_sym_per_frame': 1, 'num_paths': 200, 'nbest_scale': 0.5, 'use_shallow_fusion': False, 'lm_type': 'rnn', 'lm_scale': 0.3, 'tokens_ngram': 2, 'backoff_id': 500, 'context_score': 2, 'context_file': '', 'num_encoder_layers': '2,2,3,4,3,2', 'downsampling_factor': '1,2,4,8,4,2', 'feedforward_dim': '512,768,1024,1536,1024,768', 'num_heads': '4,4,4,8,4,4', 'encoder_dim': '192,256,384,512,384,256', 'query_head_dim': '32', 'value_head_dim': '12', 'pos_head_dim': '4', 'pos_dim': 48, 'encoder_unmasked_dim': '192,192,256,256,256,192', 'cnn_module_kernel': '31,31,15,15,15,31', 'decoder_dim': 512, 'joiner_dim': 512, 'attention_decoder_dim': 512, 'attention_decoder_num_layers': 6, 'attention_decoder_attention_dim': 512, 'attention_decoder_num_heads': 8, 'attention_decoder_feedforward_dim': 2048, 'causal': False, 'chunk_size': '16,32,64,-1', 'left_context_frames': '64,128,256,-1', 'use_transducer': True, 'use_ctc': False, 'use_attention_decoder': False, 'full_libri': True, 'mini_libri': False, 'manifest_dir': PosixPath('data/fbank'), 'max_duration': 600, 'bucketing_sampler': True, 'num_buckets': 30, 'concatenate_cuts': False, 'duration_factor': 1.0, 'gap': 1.0, 'on_the_fly_feats': False, 'shuffle': True, 'drop_last': True, 'return_cuts': True, 'num_workers': 2, 'enable_spec_aug': True, 'spec_aug_time_warp_factor': 80, 'enable_musan': True, 'input_strategy': 'PrecomputedFeatures', 'lm_vocab_size': 500, 'lm_epoch': 7, 'lm_avg': 1, 'lm_exp_dir': None, 'rnn_lm_embedding_dim': 2048, 'rnn_lm_hidden_dim': 2048, 'rnn_lm_num_layers': 3, 'rnn_lm_tie_weights': True, 'transformer_lm_exp_dir': None, 'transformer_lm_dim_feedforward': 2048, 'transformer_lm_encoder_dim': 768, 'transformer_lm_embedding_dim': 768, 'transformer_lm_nhead': 8, 'transformer_lm_num_layers': 16, 'transformer_lm_tie_weights': True, 'res_dir': PosixPath('zipformer/exp-full-libri-full-bf16-md1000/greedy_search'), 'has_contexts': False, 'suffix': 'epoch-40-avg-13-context-2-max-sym-per-frame-1-use-averaged-model', 'blank_id': 0, 'unk_id': 2, 'vocab_size': 500}
+2024-08-13 10:44:27,334 INFO [decode.py:851] About to create model
+2024-08-13 10:44:28,056 INFO [decode.py:918] Calculating the averaged model over epoch range from 27 (excluded) to 40
+2024-08-13 10:44:33,483 INFO [decode.py:1012] Number of model parameters: 65549011
+2024-08-13 10:44:33,483 INFO [asr_datamodule.py:467] About to get test-clean cuts
+2024-08-13 10:44:33,493 INFO [asr_datamodule.py:474] About to get test-other cuts
+2024-08-13 10:44:36,667 INFO [decode.py:706] batch 0/?, cuts processed until now is 36
+2024-08-13 10:45:01,929 INFO [decode.py:722] The transcripts are stored in zipformer/exp-full-libri-full-bf16-md1000/greedy_search/recogs-test-clean-greedy_search-epoch-40-avg-13-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:45:02,049 INFO [utils.py:657] [test-clean-greedy_search] %WER 2.40% [1264 / 52576, 141 ins, 105 del, 1018 sub ]
+2024-08-13 10:45:02,312 INFO [decode.py:735] Wrote detailed error stats to zipformer/exp-full-libri-full-bf16-md1000/greedy_search/errs-test-clean-greedy_search-epoch-40-avg-13-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:45:02,315 INFO [decode.py:751]
+For test-clean, WER of different settings are:
+greedy_search	2.4	best for test-clean
+2024-08-13 10:45:03,524 INFO [decode.py:706] batch 0/?, cuts processed until now is 43
+2024-08-13 10:45:09,888 INFO [zipformer.py:1858] name=None, attn_weights_entropy = tensor([5.4063, 5.6510, 4.5869, 3.7669], device='cuda:0')
+2024-08-13 10:45:26,884 INFO [decode.py:722] The transcripts are stored in zipformer/exp-full-libri-full-bf16-md1000/greedy_search/recogs-test-other-greedy_search-epoch-40-avg-13-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:45:27,000 INFO [utils.py:657] [test-other-greedy_search] %WER 5.36% [2807 / 52343, 269 ins, 263 del, 2275 sub ]
+2024-08-13 10:45:27,268 INFO [decode.py:735] Wrote detailed error stats to zipformer/exp-full-libri-full-bf16-md1000/greedy_search/errs-test-other-greedy_search-epoch-40-avg-13-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:45:27,271 INFO [decode.py:751]
+For test-other, WER of different settings are:
+greedy_search	5.36	best for test-other
+2024-08-13 10:45:27,271 INFO [decode.py:1047] Done!

decoding_results/greedy_search/log-decode-epoch-40-avg-15-context-2-max-sym-per-frame-1-use-averaged-model-2024-08-13-10-43-19 ADDED Viewed

	@@ -0,0 +1,26 @@

+2024-08-13 10:43:19,424 INFO [decode.py:833] Decoding started
+2024-08-13 10:43:19,424 INFO [decode.py:839] Device: cuda:0
+2024-08-13 10:43:19,427 INFO [decode.py:849] {'best_train_loss': inf, 'best_valid_loss': inf, 'best_train_epoch': -1, 'best_valid_epoch': -1, 'batch_idx_train': 0, 'log_interval': 50, 'reset_interval': 200, 'valid_interval': 3000, 'feature_dim': 80, 'subsampling_factor': 4, 'ignore_id': -1, 'label_smoothing': 0.1, 'warm_step': 2000, 'env_info': {'k2-version': '1.24.4', 'k2-build-type': 'Release', 'k2-with-cuda': True, 'k2-git-sha1': 'ff1d435a8d3c4eaa15828a84a7240678a70539a7', 'k2-git-date': 'Fri Feb 23 01:48:38 2024', 'lhotse-version': '1.26.0', 'torch-version': '2.0.1+cu117', 'torch-cuda-available': True, 'torch-cuda-version': '11.7', 'python-version': '3.10', 'icefall-git-branch': 'zipformer_bf16', 'icefall-git-sha1': 'a288d412-clean', 'icefall-git-date': 'Mon Aug 12 11:30:21 2024', 'icefall-path': '/star-xy/softwares/icefall_development/icefall_bf16', 'k2-path': '/star-xy/softwares/pyenvs/k2_cuda11/k2_cuda11/lib/python3.10/site-packages/k2/__init__.py', 'lhotse-path': '/star-xy/softwares/pyenvs/k2_cuda11/k2_cuda11/lib/python3.10/site-packages/lhotse/__init__.py', 'hostname': 'de-74279-k2-train-2-1207150844-f49d8c4f4-c49d5', 'IP address': '10.177.22.19'}, 'epoch': 40, 'iter': 0, 'avg': 15, 'use_averaged_model': True, 'exp_dir': PosixPath('zipformer/exp-full-libri-full-bf16-md1000'), 'bpe_model': 'data/lang_bpe_500/bpe.model', 'lang_dir': PosixPath('data/lang_bpe_500'), 'decoding_method': 'greedy_search', 'beam_size': 4, 'beam': 20.0, 'ngram_lm_scale': 0.01, 'max_contexts': 8, 'max_states': 64, 'context_size': 2, 'max_sym_per_frame': 1, 'num_paths': 200, 'nbest_scale': 0.5, 'use_shallow_fusion': False, 'lm_type': 'rnn', 'lm_scale': 0.3, 'tokens_ngram': 2, 'backoff_id': 500, 'context_score': 2, 'context_file': '', 'num_encoder_layers': '2,2,3,4,3,2', 'downsampling_factor': '1,2,4,8,4,2', 'feedforward_dim': '512,768,1024,1536,1024,768', 'num_heads': '4,4,4,8,4,4', 'encoder_dim': '192,256,384,512,384,256', 'query_head_dim': '32', 'value_head_dim': '12', 'pos_head_dim': '4', 'pos_dim': 48, 'encoder_unmasked_dim': '192,192,256,256,256,192', 'cnn_module_kernel': '31,31,15,15,15,31', 'decoder_dim': 512, 'joiner_dim': 512, 'attention_decoder_dim': 512, 'attention_decoder_num_layers': 6, 'attention_decoder_attention_dim': 512, 'attention_decoder_num_heads': 8, 'attention_decoder_feedforward_dim': 2048, 'causal': False, 'chunk_size': '16,32,64,-1', 'left_context_frames': '64,128,256,-1', 'use_transducer': True, 'use_ctc': False, 'use_attention_decoder': False, 'full_libri': True, 'mini_libri': False, 'manifest_dir': PosixPath('data/fbank'), 'max_duration': 600, 'bucketing_sampler': True, 'num_buckets': 30, 'concatenate_cuts': False, 'duration_factor': 1.0, 'gap': 1.0, 'on_the_fly_feats': False, 'shuffle': True, 'drop_last': True, 'return_cuts': True, 'num_workers': 2, 'enable_spec_aug': True, 'spec_aug_time_warp_factor': 80, 'enable_musan': True, 'input_strategy': 'PrecomputedFeatures', 'lm_vocab_size': 500, 'lm_epoch': 7, 'lm_avg': 1, 'lm_exp_dir': None, 'rnn_lm_embedding_dim': 2048, 'rnn_lm_hidden_dim': 2048, 'rnn_lm_num_layers': 3, 'rnn_lm_tie_weights': True, 'transformer_lm_exp_dir': None, 'transformer_lm_dim_feedforward': 2048, 'transformer_lm_encoder_dim': 768, 'transformer_lm_embedding_dim': 768, 'transformer_lm_nhead': 8, 'transformer_lm_num_layers': 16, 'transformer_lm_tie_weights': True, 'res_dir': PosixPath('zipformer/exp-full-libri-full-bf16-md1000/greedy_search'), 'has_contexts': False, 'suffix': 'epoch-40-avg-15-context-2-max-sym-per-frame-1-use-averaged-model', 'blank_id': 0, 'unk_id': 2, 'vocab_size': 500}
+2024-08-13 10:43:19,428 INFO [decode.py:851] About to create model
+2024-08-13 10:43:20,166 INFO [decode.py:918] Calculating the averaged model over epoch range from 25 (excluded) to 40
+2024-08-13 10:43:26,038 INFO [decode.py:1012] Number of model parameters: 65549011
+2024-08-13 10:43:26,038 INFO [asr_datamodule.py:467] About to get test-clean cuts
+2024-08-13 10:43:26,051 INFO [asr_datamodule.py:474] About to get test-other cuts
+2024-08-13 10:43:29,362 INFO [decode.py:706] batch 0/?, cuts processed until now is 36
+2024-08-13 10:43:45,923 INFO [zipformer.py:1858] name=None, attn_weights_entropy = tensor([2.2681, 4.7385, 4.4889, 3.5183], device='cuda:0')
+2024-08-13 10:43:54,940 INFO [decode.py:722] The transcripts are stored in zipformer/exp-full-libri-full-bf16-md1000/greedy_search/recogs-test-clean-greedy_search-epoch-40-avg-15-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:43:55,060 INFO [utils.py:657] [test-clean-greedy_search] %WER 2.39% [1258 / 52576, 135 ins, 108 del, 1015 sub ]
+2024-08-13 10:43:55,374 INFO [decode.py:735] Wrote detailed error stats to zipformer/exp-full-libri-full-bf16-md1000/greedy_search/errs-test-clean-greedy_search-epoch-40-avg-15-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:43:55,377 INFO [decode.py:751]
+For test-clean, WER of different settings are:
+greedy_search	2.39	best for test-clean
+2024-08-13 10:43:56,709 INFO [decode.py:706] batch 0/?, cuts processed until now is 43
+2024-08-13 10:44:20,248 INFO [decode.py:722] The transcripts are stored in zipformer/exp-full-libri-full-bf16-md1000/greedy_search/recogs-test-other-greedy_search-epoch-40-avg-15-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:44:20,362 INFO [utils.py:657] [test-other-greedy_search] %WER 5.42% [2835 / 52343, 279 ins, 264 del, 2292 sub ]
+2024-08-13 10:44:20,630 INFO [decode.py:735] Wrote detailed error stats to zipformer/exp-full-libri-full-bf16-md1000/greedy_search/errs-test-other-greedy_search-epoch-40-avg-15-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:44:20,633 INFO [decode.py:751]
+For test-other, WER of different settings are:
+greedy_search	5.42	best for test-other
+2024-08-13 10:44:20,634 INFO [decode.py:1047] Done!

decoding_results/greedy_search/log-decode-epoch-40-avg-17-context-2-max-sym-per-frame-1-use-averaged-model-2024-08-13-10-42-13 ADDED Viewed

	@@ -0,0 +1,26 @@

+2024-08-13 10:42:13,088 INFO [decode.py:833] Decoding started
+2024-08-13 10:42:13,088 INFO [decode.py:839] Device: cuda:0
+2024-08-13 10:42:13,092 INFO [decode.py:849] {'best_train_loss': inf, 'best_valid_loss': inf, 'best_train_epoch': -1, 'best_valid_epoch': -1, 'batch_idx_train': 0, 'log_interval': 50, 'reset_interval': 200, 'valid_interval': 3000, 'feature_dim': 80, 'subsampling_factor': 4, 'ignore_id': -1, 'label_smoothing': 0.1, 'warm_step': 2000, 'env_info': {'k2-version': '1.24.4', 'k2-build-type': 'Release', 'k2-with-cuda': True, 'k2-git-sha1': 'ff1d435a8d3c4eaa15828a84a7240678a70539a7', 'k2-git-date': 'Fri Feb 23 01:48:38 2024', 'lhotse-version': '1.26.0', 'torch-version': '2.0.1+cu117', 'torch-cuda-available': True, 'torch-cuda-version': '11.7', 'python-version': '3.10', 'icefall-git-branch': 'zipformer_bf16', 'icefall-git-sha1': 'a288d412-clean', 'icefall-git-date': 'Mon Aug 12 11:30:21 2024', 'icefall-path': '/star-xy/softwares/icefall_development/icefall_bf16', 'k2-path': '/star-xy/softwares/pyenvs/k2_cuda11/k2_cuda11/lib/python3.10/site-packages/k2/__init__.py', 'lhotse-path': '/star-xy/softwares/pyenvs/k2_cuda11/k2_cuda11/lib/python3.10/site-packages/lhotse/__init__.py', 'hostname': 'de-74279-k2-train-2-1207150844-f49d8c4f4-c49d5', 'IP address': '10.177.22.19'}, 'epoch': 40, 'iter': 0, 'avg': 17, 'use_averaged_model': True, 'exp_dir': PosixPath('zipformer/exp-full-libri-full-bf16-md1000'), 'bpe_model': 'data/lang_bpe_500/bpe.model', 'lang_dir': PosixPath('data/lang_bpe_500'), 'decoding_method': 'greedy_search', 'beam_size': 4, 'beam': 20.0, 'ngram_lm_scale': 0.01, 'max_contexts': 8, 'max_states': 64, 'context_size': 2, 'max_sym_per_frame': 1, 'num_paths': 200, 'nbest_scale': 0.5, 'use_shallow_fusion': False, 'lm_type': 'rnn', 'lm_scale': 0.3, 'tokens_ngram': 2, 'backoff_id': 500, 'context_score': 2, 'context_file': '', 'num_encoder_layers': '2,2,3,4,3,2', 'downsampling_factor': '1,2,4,8,4,2', 'feedforward_dim': '512,768,1024,1536,1024,768', 'num_heads': '4,4,4,8,4,4', 'encoder_dim': '192,256,384,512,384,256', 'query_head_dim': '32', 'value_head_dim': '12', 'pos_head_dim': '4', 'pos_dim': 48, 'encoder_unmasked_dim': '192,192,256,256,256,192', 'cnn_module_kernel': '31,31,15,15,15,31', 'decoder_dim': 512, 'joiner_dim': 512, 'attention_decoder_dim': 512, 'attention_decoder_num_layers': 6, 'attention_decoder_attention_dim': 512, 'attention_decoder_num_heads': 8, 'attention_decoder_feedforward_dim': 2048, 'causal': False, 'chunk_size': '16,32,64,-1', 'left_context_frames': '64,128,256,-1', 'use_transducer': True, 'use_ctc': False, 'use_attention_decoder': False, 'full_libri': True, 'mini_libri': False, 'manifest_dir': PosixPath('data/fbank'), 'max_duration': 600, 'bucketing_sampler': True, 'num_buckets': 30, 'concatenate_cuts': False, 'duration_factor': 1.0, 'gap': 1.0, 'on_the_fly_feats': False, 'shuffle': True, 'drop_last': True, 'return_cuts': True, 'num_workers': 2, 'enable_spec_aug': True, 'spec_aug_time_warp_factor': 80, 'enable_musan': True, 'input_strategy': 'PrecomputedFeatures', 'lm_vocab_size': 500, 'lm_epoch': 7, 'lm_avg': 1, 'lm_exp_dir': None, 'rnn_lm_embedding_dim': 2048, 'rnn_lm_hidden_dim': 2048, 'rnn_lm_num_layers': 3, 'rnn_lm_tie_weights': True, 'transformer_lm_exp_dir': None, 'transformer_lm_dim_feedforward': 2048, 'transformer_lm_encoder_dim': 768, 'transformer_lm_embedding_dim': 768, 'transformer_lm_nhead': 8, 'transformer_lm_num_layers': 16, 'transformer_lm_tie_weights': True, 'res_dir': PosixPath('zipformer/exp-full-libri-full-bf16-md1000/greedy_search'), 'has_contexts': False, 'suffix': 'epoch-40-avg-17-context-2-max-sym-per-frame-1-use-averaged-model', 'blank_id': 0, 'unk_id': 2, 'vocab_size': 500}
+2024-08-13 10:42:13,092 INFO [decode.py:851] About to create model
+2024-08-13 10:42:13,809 INFO [decode.py:918] Calculating the averaged model over epoch range from 23 (excluded) to 40
+2024-08-13 10:42:18,591 INFO [decode.py:1012] Number of model parameters: 65549011
+2024-08-13 10:42:18,591 INFO [asr_datamodule.py:467] About to get test-clean cuts
+2024-08-13 10:42:18,600 INFO [asr_datamodule.py:474] About to get test-other cuts
+2024-08-13 10:42:21,742 INFO [decode.py:706] batch 0/?, cuts processed until now is 36
+2024-08-13 10:42:47,055 INFO [decode.py:722] The transcripts are stored in zipformer/exp-full-libri-full-bf16-md1000/greedy_search/recogs-test-clean-greedy_search-epoch-40-avg-17-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:42:47,193 INFO [utils.py:657] [test-clean-greedy_search] %WER 2.39% [1257 / 52576, 138 ins, 107 del, 1012 sub ]
+2024-08-13 10:42:47,570 INFO [decode.py:735] Wrote detailed error stats to zipformer/exp-full-libri-full-bf16-md1000/greedy_search/errs-test-clean-greedy_search-epoch-40-avg-17-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:42:47,574 INFO [decode.py:751]
+For test-clean, WER of different settings are:
+greedy_search	2.39	best for test-clean
+2024-08-13 10:42:48,866 INFO [decode.py:706] batch 0/?, cuts processed until now is 43
+2024-08-13 10:43:00,718 INFO [zipformer.py:1858] name=None, attn_weights_entropy = tensor([3.5879, 4.5445, 4.5348, 2.5455], device='cuda:0')
+2024-08-13 10:43:12,267 INFO [decode.py:722] The transcripts are stored in zipformer/exp-full-libri-full-bf16-md1000/greedy_search/recogs-test-other-greedy_search-epoch-40-avg-17-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:43:12,384 INFO [utils.py:657] [test-other-greedy_search] %WER 5.44% [2848 / 52343, 286 ins, 264 del, 2298 sub ]
+2024-08-13 10:43:12,665 INFO [decode.py:735] Wrote detailed error stats to zipformer/exp-full-libri-full-bf16-md1000/greedy_search/errs-test-other-greedy_search-epoch-40-avg-17-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:43:12,668 INFO [decode.py:751]
+For test-other, WER of different settings are:
+greedy_search	5.44	best for test-other
+2024-08-13 10:43:12,669 INFO [decode.py:1047] Done!

decoding_results/greedy_search/log-decode-epoch-40-avg-19-context-2-max-sym-per-frame-1-use-averaged-model-2024-08-13-10-40-58 ADDED Viewed

	@@ -0,0 +1,25 @@

+2024-08-13 10:40:58,910 INFO [decode.py:833] Decoding started
+2024-08-13 10:40:58,910 INFO [decode.py:839] Device: cuda:0
+2024-08-13 10:40:58,917 INFO [decode.py:849] {'best_train_loss': inf, 'best_valid_loss': inf, 'best_train_epoch': -1, 'best_valid_epoch': -1, 'batch_idx_train': 0, 'log_interval': 50, 'reset_interval': 200, 'valid_interval': 3000, 'feature_dim': 80, 'subsampling_factor': 4, 'ignore_id': -1, 'label_smoothing': 0.1, 'warm_step': 2000, 'env_info': {'k2-version': '1.24.4', 'k2-build-type': 'Release', 'k2-with-cuda': True, 'k2-git-sha1': 'ff1d435a8d3c4eaa15828a84a7240678a70539a7', 'k2-git-date': 'Fri Feb 23 01:48:38 2024', 'lhotse-version': '1.26.0', 'torch-version': '2.0.1+cu117', 'torch-cuda-available': True, 'torch-cuda-version': '11.7', 'python-version': '3.10', 'icefall-git-branch': 'zipformer_bf16', 'icefall-git-sha1': 'a288d412-clean', 'icefall-git-date': 'Mon Aug 12 11:30:21 2024', 'icefall-path': '/star-xy/softwares/icefall_development/icefall_bf16', 'k2-path': '/star-xy/softwares/pyenvs/k2_cuda11/k2_cuda11/lib/python3.10/site-packages/k2/__init__.py', 'lhotse-path': '/star-xy/softwares/pyenvs/k2_cuda11/k2_cuda11/lib/python3.10/site-packages/lhotse/__init__.py', 'hostname': 'de-74279-k2-train-2-1207150844-f49d8c4f4-c49d5', 'IP address': '10.177.22.19'}, 'epoch': 40, 'iter': 0, 'avg': 19, 'use_averaged_model': True, 'exp_dir': PosixPath('zipformer/exp-full-libri-full-bf16-md1000'), 'bpe_model': 'data/lang_bpe_500/bpe.model', 'lang_dir': PosixPath('data/lang_bpe_500'), 'decoding_method': 'greedy_search', 'beam_size': 4, 'beam': 20.0, 'ngram_lm_scale': 0.01, 'max_contexts': 8, 'max_states': 64, 'context_size': 2, 'max_sym_per_frame': 1, 'num_paths': 200, 'nbest_scale': 0.5, 'use_shallow_fusion': False, 'lm_type': 'rnn', 'lm_scale': 0.3, 'tokens_ngram': 2, 'backoff_id': 500, 'context_score': 2, 'context_file': '', 'num_encoder_layers': '2,2,3,4,3,2', 'downsampling_factor': '1,2,4,8,4,2', 'feedforward_dim': '512,768,1024,1536,1024,768', 'num_heads': '4,4,4,8,4,4', 'encoder_dim': '192,256,384,512,384,256', 'query_head_dim': '32', 'value_head_dim': '12', 'pos_head_dim': '4', 'pos_dim': 48, 'encoder_unmasked_dim': '192,192,256,256,256,192', 'cnn_module_kernel': '31,31,15,15,15,31', 'decoder_dim': 512, 'joiner_dim': 512, 'attention_decoder_dim': 512, 'attention_decoder_num_layers': 6, 'attention_decoder_attention_dim': 512, 'attention_decoder_num_heads': 8, 'attention_decoder_feedforward_dim': 2048, 'causal': False, 'chunk_size': '16,32,64,-1', 'left_context_frames': '64,128,256,-1', 'use_transducer': True, 'use_ctc': False, 'use_attention_decoder': False, 'full_libri': True, 'mini_libri': False, 'manifest_dir': PosixPath('data/fbank'), 'max_duration': 600, 'bucketing_sampler': True, 'num_buckets': 30, 'concatenate_cuts': False, 'duration_factor': 1.0, 'gap': 1.0, 'on_the_fly_feats': False, 'shuffle': True, 'drop_last': True, 'return_cuts': True, 'num_workers': 2, 'enable_spec_aug': True, 'spec_aug_time_warp_factor': 80, 'enable_musan': True, 'input_strategy': 'PrecomputedFeatures', 'lm_vocab_size': 500, 'lm_epoch': 7, 'lm_avg': 1, 'lm_exp_dir': None, 'rnn_lm_embedding_dim': 2048, 'rnn_lm_hidden_dim': 2048, 'rnn_lm_num_layers': 3, 'rnn_lm_tie_weights': True, 'transformer_lm_exp_dir': None, 'transformer_lm_dim_feedforward': 2048, 'transformer_lm_encoder_dim': 768, 'transformer_lm_embedding_dim': 768, 'transformer_lm_nhead': 8, 'transformer_lm_num_layers': 16, 'transformer_lm_tie_weights': True, 'res_dir': PosixPath('zipformer/exp-full-libri-full-bf16-md1000/greedy_search'), 'has_contexts': False, 'suffix': 'epoch-40-avg-19-context-2-max-sym-per-frame-1-use-averaged-model', 'blank_id': 0, 'unk_id': 2, 'vocab_size': 500}
+2024-08-13 10:40:58,918 INFO [decode.py:851] About to create model
+2024-08-13 10:40:59,703 INFO [decode.py:918] Calculating the averaged model over epoch range from 21 (excluded) to 40
+2024-08-13 10:41:06,624 INFO [decode.py:1012] Number of model parameters: 65549011
+2024-08-13 10:41:06,625 INFO [asr_datamodule.py:467] About to get test-clean cuts
+2024-08-13 10:41:06,644 INFO [asr_datamodule.py:474] About to get test-other cuts
+2024-08-13 10:41:11,474 INFO [decode.py:706] batch 0/?, cuts processed until now is 36
+2024-08-13 10:41:38,833 INFO [decode.py:722] The transcripts are stored in zipformer/exp-full-libri-full-bf16-md1000/greedy_search/recogs-test-clean-greedy_search-epoch-40-avg-19-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:41:38,953 INFO [utils.py:657] [test-clean-greedy_search] %WER 2.39% [1254 / 52576, 136 ins, 105 del, 1013 sub ]
+2024-08-13 10:41:39,217 INFO [decode.py:735] Wrote detailed error stats to zipformer/exp-full-libri-full-bf16-md1000/greedy_search/errs-test-clean-greedy_search-epoch-40-avg-19-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:41:39,221 INFO [decode.py:751]
+For test-clean, WER of different settings are:
+greedy_search	2.39	best for test-clean
+2024-08-13 10:41:40,479 INFO [decode.py:706] batch 0/?, cuts processed until now is 43
+2024-08-13 10:42:05,991 INFO [decode.py:722] The transcripts are stored in zipformer/exp-full-libri-full-bf16-md1000/greedy_search/recogs-test-other-greedy_search-epoch-40-avg-19-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:42:06,107 INFO [utils.py:657] [test-other-greedy_search] %WER 5.38% [2814 / 52343, 281 ins, 254 del, 2279 sub ]
+2024-08-13 10:42:06,374 INFO [decode.py:735] Wrote detailed error stats to zipformer/exp-full-libri-full-bf16-md1000/greedy_search/errs-test-other-greedy_search-epoch-40-avg-19-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:42:06,378 INFO [decode.py:751]
+For test-other, WER of different settings are:
+greedy_search	5.38	best for test-other
+2024-08-13 10:42:06,378 INFO [decode.py:1047] Done!

decoding_results/greedy_search/log-decode-epoch-40-avg-7-context-2-max-sym-per-frame-1-use-averaged-model-2024-08-13-10-47-51 ADDED Viewed

	@@ -0,0 +1,27 @@

+2024-08-13 10:47:51,660 INFO [decode.py:833] Decoding started
+2024-08-13 10:47:51,661 INFO [decode.py:839] Device: cuda:0
+2024-08-13 10:47:51,665 INFO [decode.py:849] {'best_train_loss': inf, 'best_valid_loss': inf, 'best_train_epoch': -1, 'best_valid_epoch': -1, 'batch_idx_train': 0, 'log_interval': 50, 'reset_interval': 200, 'valid_interval': 3000, 'feature_dim': 80, 'subsampling_factor': 4, 'ignore_id': -1, 'label_smoothing': 0.1, 'warm_step': 2000, 'env_info': {'k2-version': '1.24.4', 'k2-build-type': 'Release', 'k2-with-cuda': True, 'k2-git-sha1': 'ff1d435a8d3c4eaa15828a84a7240678a70539a7', 'k2-git-date': 'Fri Feb 23 01:48:38 2024', 'lhotse-version': '1.26.0', 'torch-version': '2.0.1+cu117', 'torch-cuda-available': True, 'torch-cuda-version': '11.7', 'python-version': '3.10', 'icefall-git-branch': 'zipformer_bf16', 'icefall-git-sha1': 'a288d412-clean', 'icefall-git-date': 'Mon Aug 12 11:30:21 2024', 'icefall-path': '/star-xy/softwares/icefall_development/icefall_bf16', 'k2-path': '/star-xy/softwares/pyenvs/k2_cuda11/k2_cuda11/lib/python3.10/site-packages/k2/__init__.py', 'lhotse-path': '/star-xy/softwares/pyenvs/k2_cuda11/k2_cuda11/lib/python3.10/site-packages/lhotse/__init__.py', 'hostname': 'de-74279-k2-train-2-1207150844-f49d8c4f4-c49d5', 'IP address': '10.177.22.19'}, 'epoch': 40, 'iter': 0, 'avg': 7, 'use_averaged_model': True, 'exp_dir': PosixPath('zipformer/exp-full-libri-full-bf16-md1000'), 'bpe_model': 'data/lang_bpe_500/bpe.model', 'lang_dir': PosixPath('data/lang_bpe_500'), 'decoding_method': 'greedy_search', 'beam_size': 4, 'beam': 20.0, 'ngram_lm_scale': 0.01, 'max_contexts': 8, 'max_states': 64, 'context_size': 2, 'max_sym_per_frame': 1, 'num_paths': 200, 'nbest_scale': 0.5, 'use_shallow_fusion': False, 'lm_type': 'rnn', 'lm_scale': 0.3, 'tokens_ngram': 2, 'backoff_id': 500, 'context_score': 2, 'context_file': '', 'num_encoder_layers': '2,2,3,4,3,2', 'downsampling_factor': '1,2,4,8,4,2', 'feedforward_dim': '512,768,1024,1536,1024,768', 'num_heads': '4,4,4,8,4,4', 'encoder_dim': '192,256,384,512,384,256', 'query_head_dim': '32', 'value_head_dim': '12', 'pos_head_dim': '4', 'pos_dim': 48, 'encoder_unmasked_dim': '192,192,256,256,256,192', 'cnn_module_kernel': '31,31,15,15,15,31', 'decoder_dim': 512, 'joiner_dim': 512, 'attention_decoder_dim': 512, 'attention_decoder_num_layers': 6, 'attention_decoder_attention_dim': 512, 'attention_decoder_num_heads': 8, 'attention_decoder_feedforward_dim': 2048, 'causal': False, 'chunk_size': '16,32,64,-1', 'left_context_frames': '64,128,256,-1', 'use_transducer': True, 'use_ctc': False, 'use_attention_decoder': False, 'full_libri': True, 'mini_libri': False, 'manifest_dir': PosixPath('data/fbank'), 'max_duration': 600, 'bucketing_sampler': True, 'num_buckets': 30, 'concatenate_cuts': False, 'duration_factor': 1.0, 'gap': 1.0, 'on_the_fly_feats': False, 'shuffle': True, 'drop_last': True, 'return_cuts': True, 'num_workers': 2, 'enable_spec_aug': True, 'spec_aug_time_warp_factor': 80, 'enable_musan': True, 'input_strategy': 'PrecomputedFeatures', 'lm_vocab_size': 500, 'lm_epoch': 7, 'lm_avg': 1, 'lm_exp_dir': None, 'rnn_lm_embedding_dim': 2048, 'rnn_lm_hidden_dim': 2048, 'rnn_lm_num_layers': 3, 'rnn_lm_tie_weights': True, 'transformer_lm_exp_dir': None, 'transformer_lm_dim_feedforward': 2048, 'transformer_lm_encoder_dim': 768, 'transformer_lm_embedding_dim': 768, 'transformer_lm_nhead': 8, 'transformer_lm_num_layers': 16, 'transformer_lm_tie_weights': True, 'res_dir': PosixPath('zipformer/exp-full-libri-full-bf16-md1000/greedy_search'), 'has_contexts': False, 'suffix': 'epoch-40-avg-7-context-2-max-sym-per-frame-1-use-averaged-model', 'blank_id': 0, 'unk_id': 2, 'vocab_size': 500}
+2024-08-13 10:47:51,665 INFO [decode.py:851] About to create model
+2024-08-13 10:47:52,448 INFO [decode.py:918] Calculating the averaged model over epoch range from 33 (excluded) to 40
+2024-08-13 10:47:58,181 INFO [decode.py:1012] Number of model parameters: 65549011
+2024-08-13 10:47:58,182 INFO [asr_datamodule.py:467] About to get test-clean cuts
+2024-08-13 10:47:58,191 INFO [asr_datamodule.py:474] About to get test-other cuts
+2024-08-13 10:48:01,303 INFO [decode.py:706] batch 0/?, cuts processed until now is 36
+2024-08-13 10:48:20,058 INFO [zipformer.py:1858] name=None, attn_weights_entropy = tensor([4.9036, 4.0826, 4.4653, 4.1816], device='cuda:0')
+2024-08-13 10:48:27,787 INFO [decode.py:722] The transcripts are stored in zipformer/exp-full-libri-full-bf16-md1000/greedy_search/recogs-test-clean-greedy_search-epoch-40-avg-7-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:48:27,897 INFO [utils.py:657] [test-clean-greedy_search] %WER 2.40% [1263 / 52576, 140 ins, 110 del, 1013 sub ]
+2024-08-13 10:48:28,161 INFO [decode.py:735] Wrote detailed error stats to zipformer/exp-full-libri-full-bf16-md1000/greedy_search/errs-test-clean-greedy_search-epoch-40-avg-7-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:48:28,164 INFO [decode.py:751]
+For test-clean, WER of different settings are:
+greedy_search	2.4	best for test-clean
+2024-08-13 10:48:29,411 INFO [decode.py:706] batch 0/?, cuts processed until now is 43
+2024-08-13 10:48:34,450 INFO [zipformer.py:1858] name=None, attn_weights_entropy = tensor([3.3629, 4.1523, 4.1857, 2.4414], device='cuda:0')
+2024-08-13 10:48:53,579 INFO [decode.py:722] The transcripts are stored in zipformer/exp-full-libri-full-bf16-md1000/greedy_search/recogs-test-other-greedy_search-epoch-40-avg-7-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:48:53,698 INFO [utils.py:657] [test-other-greedy_search] %WER 5.46% [2860 / 52343, 283 ins, 267 del, 2310 sub ]
+2024-08-13 10:48:53,981 INFO [decode.py:735] Wrote detailed error stats to zipformer/exp-full-libri-full-bf16-md1000/greedy_search/errs-test-other-greedy_search-epoch-40-avg-7-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:48:53,984 INFO [decode.py:751]
+For test-other, WER of different settings are:
+greedy_search	5.46	best for test-other
+2024-08-13 10:48:53,984 INFO [decode.py:1047] Done!

decoding_results/greedy_search/log-decode-epoch-40-avg-9-context-2-max-sym-per-frame-1-use-averaged-model-2024-08-13-10-46-41 ADDED Viewed

	@@ -0,0 +1,27 @@

+2024-08-13 10:46:41,885 INFO [decode.py:833] Decoding started
+2024-08-13 10:46:41,886 INFO [decode.py:839] Device: cuda:0
+2024-08-13 10:46:41,889 INFO [decode.py:849] {'best_train_loss': inf, 'best_valid_loss': inf, 'best_train_epoch': -1, 'best_valid_epoch': -1, 'batch_idx_train': 0, 'log_interval': 50, 'reset_interval': 200, 'valid_interval': 3000, 'feature_dim': 80, 'subsampling_factor': 4, 'ignore_id': -1, 'label_smoothing': 0.1, 'warm_step': 2000, 'env_info': {'k2-version': '1.24.4', 'k2-build-type': 'Release', 'k2-with-cuda': True, 'k2-git-sha1': 'ff1d435a8d3c4eaa15828a84a7240678a70539a7', 'k2-git-date': 'Fri Feb 23 01:48:38 2024', 'lhotse-version': '1.26.0', 'torch-version': '2.0.1+cu117', 'torch-cuda-available': True, 'torch-cuda-version': '11.7', 'python-version': '3.10', 'icefall-git-branch': 'zipformer_bf16', 'icefall-git-sha1': 'a288d412-clean', 'icefall-git-date': 'Mon Aug 12 11:30:21 2024', 'icefall-path': '/star-xy/softwares/icefall_development/icefall_bf16', 'k2-path': '/star-xy/softwares/pyenvs/k2_cuda11/k2_cuda11/lib/python3.10/site-packages/k2/__init__.py', 'lhotse-path': '/star-xy/softwares/pyenvs/k2_cuda11/k2_cuda11/lib/python3.10/site-packages/lhotse/__init__.py', 'hostname': 'de-74279-k2-train-2-1207150844-f49d8c4f4-c49d5', 'IP address': '10.177.22.19'}, 'epoch': 40, 'iter': 0, 'avg': 9, 'use_averaged_model': True, 'exp_dir': PosixPath('zipformer/exp-full-libri-full-bf16-md1000'), 'bpe_model': 'data/lang_bpe_500/bpe.model', 'lang_dir': PosixPath('data/lang_bpe_500'), 'decoding_method': 'greedy_search', 'beam_size': 4, 'beam': 20.0, 'ngram_lm_scale': 0.01, 'max_contexts': 8, 'max_states': 64, 'context_size': 2, 'max_sym_per_frame': 1, 'num_paths': 200, 'nbest_scale': 0.5, 'use_shallow_fusion': False, 'lm_type': 'rnn', 'lm_scale': 0.3, 'tokens_ngram': 2, 'backoff_id': 500, 'context_score': 2, 'context_file': '', 'num_encoder_layers': '2,2,3,4,3,2', 'downsampling_factor': '1,2,4,8,4,2', 'feedforward_dim': '512,768,1024,1536,1024,768', 'num_heads': '4,4,4,8,4,4', 'encoder_dim': '192,256,384,512,384,256', 'query_head_dim': '32', 'value_head_dim': '12', 'pos_head_dim': '4', 'pos_dim': 48, 'encoder_unmasked_dim': '192,192,256,256,256,192', 'cnn_module_kernel': '31,31,15,15,15,31', 'decoder_dim': 512, 'joiner_dim': 512, 'attention_decoder_dim': 512, 'attention_decoder_num_layers': 6, 'attention_decoder_attention_dim': 512, 'attention_decoder_num_heads': 8, 'attention_decoder_feedforward_dim': 2048, 'causal': False, 'chunk_size': '16,32,64,-1', 'left_context_frames': '64,128,256,-1', 'use_transducer': True, 'use_ctc': False, 'use_attention_decoder': False, 'full_libri': True, 'mini_libri': False, 'manifest_dir': PosixPath('data/fbank'), 'max_duration': 600, 'bucketing_sampler': True, 'num_buckets': 30, 'concatenate_cuts': False, 'duration_factor': 1.0, 'gap': 1.0, 'on_the_fly_feats': False, 'shuffle': True, 'drop_last': True, 'return_cuts': True, 'num_workers': 2, 'enable_spec_aug': True, 'spec_aug_time_warp_factor': 80, 'enable_musan': True, 'input_strategy': 'PrecomputedFeatures', 'lm_vocab_size': 500, 'lm_epoch': 7, 'lm_avg': 1, 'lm_exp_dir': None, 'rnn_lm_embedding_dim': 2048, 'rnn_lm_hidden_dim': 2048, 'rnn_lm_num_layers': 3, 'rnn_lm_tie_weights': True, 'transformer_lm_exp_dir': None, 'transformer_lm_dim_feedforward': 2048, 'transformer_lm_encoder_dim': 768, 'transformer_lm_embedding_dim': 768, 'transformer_lm_nhead': 8, 'transformer_lm_num_layers': 16, 'transformer_lm_tie_weights': True, 'res_dir': PosixPath('zipformer/exp-full-libri-full-bf16-md1000/greedy_search'), 'has_contexts': False, 'suffix': 'epoch-40-avg-9-context-2-max-sym-per-frame-1-use-averaged-model', 'blank_id': 0, 'unk_id': 2, 'vocab_size': 500}
+2024-08-13 10:46:41,890 INFO [decode.py:851] About to create model
+2024-08-13 10:46:42,660 INFO [decode.py:918] Calculating the averaged model over epoch range from 31 (excluded) to 40
+2024-08-13 10:46:49,190 INFO [decode.py:1012] Number of model parameters: 65549011
+2024-08-13 10:46:49,191 INFO [asr_datamodule.py:467] About to get test-clean cuts
+2024-08-13 10:46:49,207 INFO [asr_datamodule.py:474] About to get test-other cuts
+2024-08-13 10:46:51,782 INFO [zipformer.py:1858] name=None, attn_weights_entropy = tensor([6.2635, 5.6943, 6.0289, 5.6558], device='cuda:0')
+2024-08-13 10:46:52,522 INFO [decode.py:706] batch 0/?, cuts processed until now is 36
+2024-08-13 10:47:18,640 INFO [decode.py:722] The transcripts are stored in zipformer/exp-full-libri-full-bf16-md1000/greedy_search/recogs-test-clean-greedy_search-epoch-40-avg-9-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:47:18,758 INFO [utils.py:657] [test-clean-greedy_search] %WER 2.42% [1271 / 52576, 141 ins, 108 del, 1022 sub ]
+2024-08-13 10:47:19,017 INFO [decode.py:735] Wrote detailed error stats to zipformer/exp-full-libri-full-bf16-md1000/greedy_search/errs-test-clean-greedy_search-epoch-40-avg-9-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:47:19,022 INFO [decode.py:751]
+For test-clean, WER of different settings are:
+greedy_search	2.42	best for test-clean
+2024-08-13 10:47:20,272 INFO [decode.py:706] batch 0/?, cuts processed until now is 43
+2024-08-13 10:47:32,932 INFO [zipformer.py:1858] name=None, attn_weights_entropy = tensor([5.1170, 4.5429, 4.4889, 4.5820], device='cuda:0')
+2024-08-13 10:47:44,411 INFO [decode.py:722] The transcripts are stored in zipformer/exp-full-libri-full-bf16-md1000/greedy_search/recogs-test-other-greedy_search-epoch-40-avg-9-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:47:44,528 INFO [utils.py:657] [test-other-greedy_search] %WER 5.49% [2873 / 52343, 281 ins, 275 del, 2317 sub ]
+2024-08-13 10:47:44,799 INFO [decode.py:735] Wrote detailed error stats to zipformer/exp-full-libri-full-bf16-md1000/greedy_search/errs-test-other-greedy_search-epoch-40-avg-9-context-2-max-sym-per-frame-1-use-averaged-model.txt
+2024-08-13 10:47:44,803 INFO [decode.py:751]
+For test-other, WER of different settings are:
+greedy_search	5.49	best for test-other
+2024-08-13 10:47:44,803 INFO [decode.py:1047] Done!

decoding_results/greedy_search/recogs-test-clean-greedy_search-epoch-30-avg-11-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/recogs-test-clean-greedy_search-epoch-30-avg-13-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/recogs-test-clean-greedy_search-epoch-30-avg-15-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/recogs-test-clean-greedy_search-epoch-30-avg-7-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/recogs-test-clean-greedy_search-epoch-30-avg-9-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/recogs-test-clean-greedy_search-epoch-40-avg-11-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/recogs-test-clean-greedy_search-epoch-40-avg-13-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/recogs-test-clean-greedy_search-epoch-40-avg-15-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/recogs-test-clean-greedy_search-epoch-40-avg-17-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/recogs-test-clean-greedy_search-epoch-40-avg-19-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

decoding_results/greedy_search/recogs-test-clean-greedy_search-epoch-40-avg-7-context-2-max-sym-per-frame-1-use-averaged-model.txt ADDED Viewed

The diff for this file is too large to render. See raw diff