Bartelds commited on
Commit
ca20d9f
·
1 Parent(s): f32fa7b

Upload checkpoint, sanitized config, and transcripts for ctc-baseline_xlsr_set_2

Browse files
Files changed (5) hide show
  1. README.md +41 -0
  2. config.yaml +1650 -0
  3. hyp.trn +0 -0
  4. ref.trn +0 -0
  5. valid.loss.best.pth +3 -0
README.md ADDED
@@ -0,0 +1,41 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ title: "CTC-DRO XLSR-based ASR model - set 2"
3
+ language: multilingual
4
+ tags:
5
+ - asr
6
+ - ctc-dro
7
+ - XLSR
8
+ license: cc-by-nc-4.0
9
+ ---
10
+
11
+ # CTC-Baseline XLSR-based ASR model - set 2
12
+
13
+ This repository contains a CTC-Baseline XLSR-based automatic speech recognition (ASR) model trained with ESPnet.
14
+ The model was trained on balanced training data from set 2.
15
+
16
+ ## Intended Use
17
+
18
+ This model is intended for ASR. Users can run inference using the provided checkpoint (`valid.loss.best.pth`) and configuration file (`config.yaml`):
19
+ ```bash
20
+ import soundfile as sf
21
+ from espnet2.bin.asr_inference import Speech2Text
22
+
23
+ asr_train_config = "ctc-baseline_xlsr_set_2/config.yaml"
24
+ asr_model_file = "ctc-baseline_xlsr_set_2/valid.loss.best.pth"
25
+
26
+ model = Speech2Text.from_pretrained(
27
+ asr_train_config=asr_train_config,
28
+ asr_model_file=asr_model_file
29
+ )
30
+
31
+ speech, _ = sf.read("input.wav")
32
+ text, *_ = model(speech)[0]
33
+
34
+ print("Recognized text:", text)
35
+ ```
36
+
37
+ ## How to Use
38
+
39
+ 1. Clone this repository.
40
+ 2. Use ESPnet’s inference scripts with the provided `config.yaml` and checkpoint file.
41
+ 3. Ensure any external resources referenced in `config.yaml` are available at the indicated relative paths.
config.yaml ADDED
@@ -0,0 +1,1650 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ accum_grad: 16
2
+ adapter: lora
3
+ adapter_conf: {}
4
+ allow_multi_rates: false
5
+ allow_variable_data_keys: false
6
+ aux_ctc_tasks: []
7
+ batch_bins: 1000000
8
+ batch_size: 4
9
+ batch_type: duration_language
10
+ best_model_criterion:
11
+ - - valid
12
+ - loss
13
+ - min
14
+ bpemodel: null
15
+ chunk_default_fs: null
16
+ chunk_excluded_key_prefixes: []
17
+ chunk_length: 500
18
+ chunk_shift_ratio: 0.5
19
+ cleaner: null
20
+ collect_stats: false
21
+ create_graph_in_tensorboard: false
22
+ ctc_conf:
23
+ ctc_type: builtin
24
+ cudnn_benchmark: false
25
+ cudnn_deterministic: true
26
+ cudnn_enabled: true
27
+ decoder: null
28
+ decoder_conf: {}
29
+ detect_anomaly: false
30
+ distributed: false
31
+ drop_last_iter: false
32
+ dry_run: false
33
+ duration_batch_length: -1
34
+ early_stopping_criterion:
35
+ - valid
36
+ - loss
37
+ - min
38
+ encoder: transformer
39
+ encoder_conf:
40
+ attention_dropout_rate: 0.1
41
+ attention_heads: 8
42
+ dropout_rate: 0.1
43
+ input_layer: conv2d2
44
+ linear_units: 1024
45
+ normalize_before: true
46
+ num_blocks: 2
47
+ output_size: 256
48
+ positional_dropout_rate: 0.1
49
+ exclude_weight_decay: false
50
+ exclude_weight_decay_conf: {}
51
+ fold_length:
52
+ - 80000
53
+ - 150
54
+ freeze_param: []
55
+ frontend: s3prl
56
+ frontend_conf:
57
+ download_dir: ./hub
58
+ frontend_conf:
59
+ path_or_url: facebook/wav2vec2-xls-r-300m
60
+ upstream: hf_wav2vec2_custom
61
+ fs: 16k
62
+ multilayer_feature: true
63
+ g2p: null
64
+ grad_clip: 5.0
65
+ grad_clip_type: 2.0
66
+ grad_noise: false
67
+ ignore_init_mismatch: false
68
+ init: xavier_uniform
69
+ init_param: []
70
+ input_size: null
71
+ iterator_type: sequence
72
+ joint_net_conf: null
73
+ keep_nbest_models: 2
74
+ log_interval: null
75
+ log_level: INFO
76
+ max_cache_fd: 32
77
+ max_cache_size: 0.0
78
+ max_epoch: 40
79
+ model: espnet
80
+ model_conf:
81
+ ctc_weight: 1.0
82
+ multiple_iterator: false
83
+ multiprocessing_distributed: false
84
+ nbest_averaging_interval: 0
85
+ ngpu: 1
86
+ no_forward_run: false
87
+ noise_apply_prob: 1.0
88
+ noise_db_range: '13_15'
89
+ noise_scp: null
90
+ non_linguistic_symbols: ./nlsyms.txt
91
+ normalize: utterance_mvn
92
+ normalize_conf: {}
93
+ num_att_plot: 3
94
+ num_cache_chunks: 1024
95
+ num_iters_per_epoch: 1200
96
+ num_workers: 4
97
+ optim: adam
98
+ optim_conf:
99
+ lr: 0.0001
100
+ weight_decay: 1.0e-06
101
+ output_dir: ./inference_results
102
+ patience: null
103
+ postencoder: null
104
+ postencoder_conf: {}
105
+ preencoder: linear
106
+ preencoder_conf:
107
+ input_size: 1024
108
+ output_size: 80
109
+ preprocessor: default
110
+ preprocessor_conf: {}
111
+ pretrain_path: null
112
+ print_config: false
113
+ required:
114
+ - output_dir
115
+ - token_list
116
+ resume: true
117
+ rir_apply_prob: 1.0
118
+ rir_scp: null
119
+ save_strategy: all
120
+ scheduler: null
121
+ scheduler_conf: {}
122
+ seed: 0
123
+ sharded_ddp: false
124
+ short_noise_thres: 0.5
125
+ shuffle_within_batch: false
126
+ sort_batch: descending
127
+ sort_in_batch: descending
128
+ specaug: specaug
129
+ specaug_conf:
130
+ apply_freq_mask: true
131
+ apply_time_mask: true
132
+ apply_time_warp: true
133
+ freq_mask_width_range:
134
+ - 0
135
+ - 27
136
+ num_freq_mask: 2
137
+ num_time_mask: 10
138
+ time_mask_width_ratio_range:
139
+ - 0.0
140
+ - 0.05
141
+ time_warp_mode: bicubic
142
+ time_warp_window: 5
143
+ speech_volume_normalize: null
144
+ token_list:
145
+ - <blank>
146
+ - <unk>
147
+ - <space>
148
+ - E
149
+ - A
150
+ - O
151
+ - I
152
+ - N
153
+ - T
154
+ - R
155
+ - S
156
+ - L
157
+ - D
158
+ - U
159
+ - C
160
+ - P
161
+ - M
162
+ - V
163
+ - H
164
+ - ا
165
+ - K
166
+ - J
167
+ - G
168
+ - ی
169
+ - B
170
+ - Z
171
+ - ر
172
+ - ن
173
+ - م
174
+ - F
175
+ - د
176
+ - ه
177
+ - Y
178
+ - و
179
+ - ت
180
+ - ب
181
+ - W
182
+ - '[fas]'
183
+ - '[eng]'
184
+ - Č
185
+ - ک
186
+ - س
187
+ - Á
188
+ - ش
189
+ - Ž
190
+ - Š
191
+ - ل
192
+ - ز
193
+ - Í
194
+ - Ý
195
+ - '[slk]'
196
+ - '[ita]'
197
+ - خ
198
+ - 的
199
+ - Ú
200
+ - '[hrv]'
201
+ - É
202
+ - '0'
203
+ - گ
204
+ - '[yue]'
205
+ - Ť
206
+ - ف
207
+ - ق
208
+ - Q
209
+ - ج
210
+ - '1'
211
+ - ع
212
+ - پ
213
+ - چ
214
+ - Ć
215
+ - ح
216
+ - Ľ
217
+ - '2'
218
+ - آ
219
+ - È
220
+ - X
221
+ - 在
222
+ - ،
223
+ - ؟
224
+ - Ô
225
+ - '9'
226
+ - À
227
+ - 有
228
+ - ص
229
+ - 一
230
+ - 是
231
+ - '3'
232
+ - 人
233
+ - Đ
234
+ - '5'
235
+ - ط
236
+ - '6'
237
+ - '4'
238
+ - Ó
239
+ - '8'
240
+ - Ä
241
+ - Ù
242
+ - 他
243
+ - 大
244
+ - 為
245
+ - Ď
246
+ - 國
247
+ - 不
248
+ - 中
249
+ - 時
250
+ - Ň
251
+ - 這
252
+ - 和
253
+ - 們
254
+ - 以
255
+ - 能
256
+ - 多
257
+ - 上
258
+ - 會
259
+ - 了
260
+ - 要
261
+ - 到
262
+ - '7'
263
+ - 個
264
+ - 於
265
+ - 可
266
+ - 行
267
+ - 年
268
+ - غ
269
+ - 成
270
+ - ذ
271
+ - ض
272
+ - 地
273
+ - 來
274
+ - 「
275
+ - 」
276
+ - 方
277
+ - 得
278
+ - 之
279
+ - 常
280
+ - 亞
281
+ - 我
282
+ - ظ
283
+ - 生
284
+ - 對
285
+ - 也
286
+ - 並
287
+ - 分
288
+ - 公
289
+ - 用
290
+ - 過
291
+ - 些
292
+ - 子
293
+ - 後
294
+ - 部
295
+ - 其
296
+ - 日
297
+ - 所
298
+ - 發
299
+ - 車
300
+ - 但
301
+ - 、
302
+ - 此
303
+ - 美
304
+ - 加
305
+ - Ò
306
+ - 同
307
+ - 就
308
+ - 比
309
+ - 長
310
+ - 表
311
+ - ك
312
+ - 更
313
+ - 重
314
+ - 度
315
+ - 斯
316
+ - 家
317
+ - 空
318
+ - 經
319
+ - 作
320
+ - 間
321
+ - 您
322
+ - ى
323
+ - 現
324
+ - 自
325
+ - 與
326
+ - 獲
327
+ - 或
328
+ - 數
329
+ - 出
330
+ - 動
331
+ - 第
332
+ - 月
333
+ - 英
334
+ - 教
335
+ - 馬
336
+ - 種
337
+ - 力
338
+ - 西
339
+ - 特
340
+ - 必
341
+ - 通
342
+ - ئ
343
+ - ث
344
+ - 提
345
+ - 體
346
+ - 事
347
+ - 至
348
+ - 該
349
+ - 前
350
+ - 類
351
+ - 最
352
+ - 外
353
+ - 本
354
+ - 將
355
+ - 示
356
+ - 當
357
+ - 認
358
+ - 水
359
+ - ي
360
+ - 知
361
+ - 學
362
+ - 位
363
+ - 球
364
+ - 聯
365
+ - 被
366
+ - 從
367
+ - 開
368
+ - 目
369
+ - 變
370
+ - 拉
371
+ - 任
372
+ - 期
373
+ - 下
374
+ - 明
375
+ - 非
376
+ - 少
377
+ - 已
378
+ - 沒
379
+ - 起
380
+ - 員
381
+ - 電
382
+ - 小
383
+ - 都
384
+ - 法
385
+ - 理
386
+ - 入
387
+ - 式
388
+ - 正
389
+ - 著
390
+ - 造
391
+ - 說
392
+ - 及
393
+ - 稱
394
+ - 名
395
+ - 結
396
+ - 受
397
+ - 你
398
+ - 許
399
+ - 隊
400
+ - 達
401
+ - 而
402
+ - 擊
403
+ - 道
404
+ - 定
405
+ - 型
406
+ - 因
407
+ - 文
408
+ - 今
409
+ - 軍
410
+ - 進
411
+ - 路
412
+ - 太
413
+ - 解
414
+ - 量
415
+ - 航
416
+ - 三
417
+ - 者
418
+ - 確
419
+ - 手
420
+ - 主
421
+ - 關
422
+ - 未
423
+ - 心
424
+ - 語
425
+ - 曾
426
+ - 世
427
+ - 使
428
+ - 相
429
+ - 節
430
+ - 季
431
+ - 性
432
+ - 院
433
+ - 感
434
+ - 程
435
+ - 爾
436
+ - 須
437
+ - 口
438
+ - 應
439
+ - 較
440
+ - 歷
441
+ - 旅
442
+ - 己
443
+ - ژ
444
+ - Ĺ
445
+ - 代
446
+ - 印
447
+ - 基
448
+ - 里
449
+ - 王
450
+ - 讓
451
+ - 賽
452
+ - 機
453
+ - 然
454
+ - 報
455
+ - 利
456
+ - 物
457
+ - 存
458
+ - 民
459
+ - 還
460
+ - 改
461
+ - 四
462
+ - 化
463
+ - 合
464
+ - 風
465
+ - ���
466
+ - 羅
467
+ - 很
468
+ - 兩
469
+ - 面
470
+ - 且
471
+ - 強
472
+ - 記
473
+ - 史
474
+ - 控
475
+ - 連
476
+ - 某
477
+ - 身
478
+ - 南
479
+ - 處
480
+ - 座
481
+ - 意
482
+ - 全
483
+ - 字
484
+ - 場
485
+ - 準
486
+ - 視
487
+ - 備
488
+ - 樣
489
+ - 供
490
+ - 服
491
+ - 產
492
+ - 工
493
+ - 選
494
+ - 客
495
+ - 它
496
+ - 才
497
+ - 德
498
+ - 新
499
+ - 天
500
+ - 看
501
+ - 器
502
+ - 像
503
+ - Ì
504
+ - 爭
505
+ - 議
506
+ - 指
507
+ - 形
508
+ - 輕
509
+ - 流
510
+ - 次
511
+ - 北
512
+ - 巴
513
+ - 阿
514
+ - 區
515
+ - 統
516
+ - 由
517
+ - 件
518
+ - 信
519
+ - 傳
520
+ - 預
521
+ - 續
522
+ - 維
523
+ - 標
524
+ - 始
525
+ - 健
526
+ - 龍
527
+ - 活
528
+ - 約
529
+ - 持
530
+ - 塔
531
+ - 務
532
+ - 單
533
+ - 運
534
+ - 保
535
+ - 戰
536
+ - 幾
537
+ - 城
538
+ - 裡
539
+ - 難
540
+ - 高
541
+ - 原
542
+ - 回
543
+ - 住
544
+ - :
545
+ - 船
546
+ - 弓
547
+ - 題
548
+ - 二
549
+ - 打
550
+ - 百
551
+ - 帶
552
+ - 如
553
+ - ِ
554
+ - °
555
+ - 充
556
+ - 育
557
+ - 管
558
+ - 仍
559
+ - 政
560
+ - 見
561
+ - 孩
562
+ - 山
563
+ - 市
564
+ - 建
565
+ - 安
566
+ - 各
567
+ - 試
568
+ - 飛
569
+ - 組
570
+ - 網
571
+ - 裝
572
+ - 置
573
+ - 班
574
+ - 義
575
+ - 何
576
+ - 居
577
+ - 需
578
+ - 交
579
+ - 令
580
+ - 給
581
+ - 證
582
+ - 每
583
+ - 克
584
+ - 否
585
+ - 內
586
+ - 伊
587
+ - 影
588
+ - 女
589
+ - 石
590
+ - 科
591
+ - 華
592
+ - 計
593
+ - 萬
594
+ - 攻
595
+ - 先
596
+ - 超
597
+ - 訂
598
+ - 遊
599
+ - 門
600
+ - 站
601
+ - 好
602
+ - 測
603
+ - 果
604
+ - 參
605
+ - 士
606
+ - Ü
607
+ - 補
608
+ - 老
609
+ - 陸
610
+ - 野
611
+ - 況
612
+ - 東
613
+ - 鬆
614
+ - 死
615
+ - 護
616
+ - 支
617
+ - 織
618
+ - 導
619
+ - 牙
620
+ - 永
621
+ - 功
622
+ - 波
623
+ - 佳
624
+ - 聲
625
+ - 司
626
+ - 拿
627
+ - 狀
628
+ - 元
629
+ - 素
630
+ - 樂
631
+ - 除
632
+ - 官
633
+ - 則
634
+ - 洲
635
+ - 抵
636
+ - 響
637
+ - 即
638
+ - 故
639
+ - 島
640
+ - 商
641
+ - 條
642
+ - 希
643
+ - 角
644
+ - 實
645
+ - 油
646
+ - 立
647
+ - 份
648
+ - 沿
649
+ - 極
650
+ - 再
651
+ - 訊
652
+ - 雨
653
+ - 越
654
+ - 制
655
+ - 洛
656
+ - 核
657
+ - 業
658
+ - 求
659
+ - 足
660
+ - 週
661
+ - 失
662
+ - 洋
663
+ - 舉
664
+ - 總
665
+ - ·
666
+ - 雲
667
+ - 修
668
+ - ً
669
+ - 眾
670
+ - 皆
671
+ - 儘
672
+ - 九
673
+ - 遭
674
+ - 監
675
+ - 母
676
+ - 情
677
+ - 養
678
+ - 接
679
+ - 富
680
+ - 汗
681
+ - 廟
682
+ - 紀
683
+ - 輸
684
+ - 摩
685
+ - 做
686
+ - 仰
687
+ - 蘭
688
+ - 績
689
+ - 幅
690
+ - 繼
691
+ - 版
692
+ - 權
693
+ - 訴
694
+ - 洞
695
+ - 般
696
+ - 群
697
+ - 哈
698
+ - 久
699
+ - 卡
700
+ - 具
701
+ - 早
702
+ - 布
703
+ - 包
704
+ - 界
705
+ - 微
706
+ - 病
707
+ - 質
708
+ - 烈
709
+ - 七
710
+ - 六
711
+ - 轉
712
+ - 音
713
+ - 放
714
+ - 團
715
+ - 歐
716
+ - 短
717
+ - 盟
718
+ - 溫
719
+ - 往
720
+ - 尼
721
+ - 尺
722
+ - 別
723
+ - 屬
724
+ - 金
725
+ - 低
726
+ - 無
727
+ - 論
728
+ - 損
729
+ - 害
730
+ - 橫
731
+ - 去
732
+ - 向
733
+ - 取
734
+ - 甚
735
+ - 熱
736
+ - 《
737
+ - 衛
738
+ - 》
739
+ - 銀
740
+ - 魚
741
+ - 騎
742
+ - 兵
743
+ - 項
744
+ - 府
745
+ - 擁
746
+ - 反
747
+ - 平
748
+ - 票
749
+ - 線
750
+ - 底
751
+ - 登
752
+ - 承
753
+ - 助
754
+ - 差
755
+ - 冰
756
+ - 查
757
+ - 樹
758
+ - 找
759
+ - 例
760
+ - 鮮
761
+ - 火
762
+ - 點
763
+ - 奧
764
+ - 圖
765
+ - 算
766
+ - 奇
767
+ - 演
768
+ - 露
769
+ - 顯
770
+ - 途
771
+ - 光
772
+ - 潛
773
+ - 社
774
+ - 酒
775
+ - 神
776
+ - ّ
777
+ - Ŕ
778
+ - 滿
779
+ - 師
780
+ - 皇
781
+ - 顛
782
+ - 緊
783
+ - 密
784
+ - 禁
785
+ - ;
786
+ - 缺
787
+ - 坦
788
+ - 靜
789
+ - 識
790
+ - 醒
791
+ - 納
792
+ - 慶
793
+ - 餘
794
+ - 她
795
+ - 殊
796
+ - 校
797
+ - 考
798
+ - 升
799
+ - 亡
800
+ - 侵
801
+ - 犯
802
+ - 束
803
+ - 徑
804
+ - 適
805
+ - 香
806
+ - 港
807
+ - 讀
808
+ - 綠
809
+ - ‧
810
+ - 宣
811
+ - 休
812
+ - 括
813
+ - 輪
814
+ - 驚
815
+ - 快
816
+ - 速
817
+ - 息
818
+ - 號
819
+ - 申
820
+ - 態
821
+ - 族
822
+ - 尿
823
+ - 晚
824
+ - 眼
825
+ - 省
826
+ - 述
827
+ - 周
828
+ - 晨
829
+ - 燈
830
+ - 彎
831
+ - 符
832
+ - 迴
833
+ - 直
834
+ - 稅
835
+ - 氣
836
+ - 列
837
+ - 頭
838
+ - 房
839
+ - 領
840
+ - 寬
841
+ - 花
842
+ - 豹
843
+ - 只
844
+ - 邊
845
+ - 首
846
+ - 設
847
+ - 專
848
+ - 案
849
+ - 近
850
+ - 降
851
+ - 救
852
+ - 局
853
+ - 資
854
+ - 壓
855
+ - 品
856
+ - 牠
857
+ - 跨
858
+ - 命
859
+ - 製
860
+ - 食
861
+ - 半
862
+ - 游
863
+ - 氏
864
+ - 投
865
+ - 想
866
+ - 根
867
+ - 白
868
+ - 等
869
+ - 康
870
+ - 問
871
+ - 望
872
+ - 消
873
+ - 夠
874
+ - 排
875
+ - 針
876
+ - 捕
877
+ - 留
878
+ - 收
879
+ - 止
880
+ - 判
881
+ - 園
882
+ - 彩
883
+ - 土
884
+ - 餐
885
+ - 暴
886
+ - 夜
887
+ - 腦
888
+ - 幫
889
+ - 帕
890
+ - 系
891
+ - 千
892
+ - 似
893
+ - 邦
894
+ - 決
895
+ - 窗
896
+ - 戶
897
+ - 朝
898
+ - 景
899
+ - 附
900
+ - 格
901
+ - 堡
902
+ - 丹
903
+ - 真
904
+ - 霄
905
+ - 清
906
+ - 增
907
+ - 色
908
+ - 賓
909
+ - 州
910
+ - 陽
911
+ - 射
912
+ - 星
913
+ - 際
914
+ - 境
915
+ - 營
916
+ - 驗
917
+ - 端
918
+ - 衣
919
+ - 遠
920
+ - 艇
921
+ - 刑
922
+ - 那
923
+ - َ
924
+ - ؛
925
+ - ـ
926
+ - ٔ
927
+ - –
928
+ - Ç
929
+ - 范
930
+ - 浩
931
+ - 揚
932
+ - 涯
933
+ - 峰
934
+ - 勝
935
+ - 童
936
+ - 父
937
+ - 智
938
+ - 嚴
939
+ - 陷
940
+ - 河
941
+ - 青
942
+ - 圍
943
+ - 蓋
944
+ - 寺
945
+ - 粒
946
+ - 治
947
+ - 卻
948
+ - 完
949
+ - 督
950
+ - 徒
951
+ - 席
952
+ - 榮
953
+ - 駐
954
+ - 推
955
+ - 恐
956
+ - 紐
957
+ - 佛
958
+ - 構
959
+ - 敏
960
+ - 效
961
+ - 率
962
+ - 察
963
+ - 莎
964
+ - 簡
965
+ - 患
966
+ - 限
967
+ - 請
968
+ - 移
969
+ - 另
970
+ - 研
971
+ - 究
972
+ - 貓
973
+ - 聚
974
+ - 氰
975
+ - 觀
976
+ - 莫
977
+ - 颱
978
+ - 距
979
+ - 離
980
+ - 福
981
+ - 十
982
+ - 據
983
+ - 敲
984
+ - 盡
985
+ - 巡
986
+ - 探
987
+ - 險
988
+ - 諾
989
+ - 征
990
+ - 削
991
+ - 減
992
+ - 宇
993
+ - 細
994
+ - 菌
995
+ - 殖
996
+ - 俄
997
+ - 蘇
998
+ - 討
999
+ - 煮
1000
+ - 店
1001
+ - 屋
1002
+ - 歧
1003
+ - 架
1004
+ - 毀
1005
+ - 罹
1006
+ - 切
1007
+ - 虎
1008
+ - 臘
1009
+ - 畢
1010
+ - 哥
1011
+ - 係
1012
+ - 盛
1013
+ - 頓
1014
+ - .
1015
+ - 契
1016
+ - 互
1017
+ - 獨
1018
+ - 桶
1019
+ - 順
1020
+ - 牛
1021
+ - 鹿
1022
+ - 乎
1023
+ - 醫
1024
+ - 刻
1025
+ - 急
1026
+ - 送
1027
+ - 梭
1028
+ - 略
1029
+ - 典
1030
+ - 序
1031
+ - 貫
1032
+ - 憶
1033
+ - 寄
1034
+ - 庭
1035
+ - 畫
1036
+ - 致
1037
+ - 旦
1038
+ - 濟
1039
+ - 澳
1040
+ - 瓜
1041
+ - 鯊
1042
+ - 尚
1043
+ - 彼
1044
+ - 努
1045
+ - 尋
1046
+ - 睡
1047
+ - 覺
1048
+ - 夏
1049
+ - 眠
1050
+ - 跑
1051
+ - 步
1052
+ - 絕
1053
+ - 困
1054
+ - 曼
1055
+ - 林
1056
+ - 審
1057
+ - 張
1058
+ - 呈
1059
+ - 啟
1060
+ - 賣
1061
+ - 勒
1062
+ - 雷
1063
+ - 疫
1064
+ - 森
1065
+ - 屈
1066
+ - 佐
1067
+ - 館
1068
+ - 伯
1069
+ - 退
1070
+ - 鞋
1071
+ - 滑
1072
+ - 款
1073
+ - 調
1074
+ - 依
1075
+ - 僅
1076
+ - 堅
1077
+ - 硬
1078
+ - 警
1079
+ - 筆
1080
+ - 五
1081
+ - 劃
1082
+ - 競
1083
+ - 破
1084
+ - 擇
1085
+ - 料
1086
+ - 價
1087
+ - 廳
1088
+ - 濃
1089
+ - 毒
1090
+ - 歲
1091
+ - 傷
1092
+ - 模
1093
+ - 守
1094
+ - 莉
1095
+ - 共
1096
+ - 麥
1097
+ - 牌
1098
+ - 深
1099
+ - 斷
1100
+ - 混
1101
+ - 淆
1102
+ - 爆
1103
+ - 繪
1104
+ - 書
1105
+ - 錄
1106
+ - 獎
1107
+ - 攜
1108
+ - 儀
1109
+ - 什
1110
+ - 麼
1111
+ - 骨
1112
+ - 艾
1113
+ - 遺
1114
+ - 疲
1115
+ - 彈
1116
+ - 鋼
1117
+ - 琴
1118
+ - 泰
1119
+ - 舞
1120
+ - 台
1121
+ - 鄰
1122
+ - 段
1123
+ - 估
1124
+ - 閒
1125
+ - 肯
1126
+ - 告
1127
+ - 索
1128
+ - 念
1129
+ - 防
1130
+ - 避
1131
+ - 咖
1132
+ - 碼
1133
+ - 親
1134
+ - 隻
1135
+ - 猛
1136
+ - 黑
1137
+ - 厄
1138
+ - 址
1139
+ - 樓
1140
+ - 殿
1141
+ - 帝
1142
+ - 簽
1143
+ - 釀
1144
+ - 租
1145
+ - 磅
1146
+ - 斤
1147
+ - 木
1148
+ - 穿
1149
+ - 捲
1150
+ - 習
1151
+ - 廣
1152
+ - 刀
1153
+ - 言
1154
+ - 片
1155
+ - 飲
1156
+ - 糖
1157
+ - 換
1158
+ - 泡
1159
+ - …
1160
+ - »
1161
+ - «
1162
+ - ُ
1163
+ - ؤ
1164
+ - ”
1165
+ - Ö
1166
+ - ²
1167
+ - º
1168
+ - ’
1169
+ - ̇
1170
+ - 倡
1171
+ - 易
1172
+ - 兒
1173
+ - 棄
1174
+ - 域
1175
+ - 銅
1176
+ - 範
1177
+ - 涵
1178
+ - 豬
1179
+ - 暹
1180
+ - 頂
1181
+ - 末
1182
+ - 值
1183
+ - 耶
1184
+ - 跋
1185
+ - 藉
1186
+ - 鬧
1187
+ - 鐘
1188
+ - 採
1189
+ - 薩
1190
+ - 剩
1191
+ - 援
1192
+ - 韓
1193
+ - 享
1194
+ - 古
1195
+ - 鳥
1196
+ - 銳
1197
+ - 檢
1198
+ - 恩
1199
+ - 普
1200
+ - 萊
1201
+ - 漢
1202
+ - 捷
1203
+ - 貢
1204
+ - 獻
1205
+ - 擔
1206
+ - 憂
1207
+ - 症
1208
+ - 染
1209
+ - 峽
1210
+ - 谷
1211
+ - 貴
1212
+ - 奪
1213
+ - 激
1214
+ - 胺
1215
+ - 酸
1216
+ - 晶
1217
+ - 截
1218
+ - 凌
1219
+ - 汽
1220
+ - 搖
1221
+ - 滾
1222
+ - 寓
1223
+ - 哪
1224
+ - 謹
1225
+ - 慎
1226
+ - 慮
1227
+ - 宙
1228
+ - 膨
1229
+ - 脹
1230
+ - 暖
1231
+ - 候
1232
+ - 繁
1233
+ - 婦
1234
+ - 飯
1235
+ - 街
1236
+ - 櫃
1237
+ - 檯
1238
+ - 朗
1239
+ - 慘
1240
+ - 墜
1241
+ - 又
1242
+ - 獅
1243
+ - 吼
1244
+ - 嘯
1245
+ - 駝
1246
+ - 麋
1247
+ - 熊
1248
+ - 逝
1249
+ - 貌
1250
+ - 吾
1251
+ - 思
1252
+ - 靈
1253
+ - 脈
1254
+ - 繞
1255
+ - 串
1256
+ - 注
1257
+ - 仗
1258
+ - 左
1259
+ - 右
1260
+ - 疾
1261
+ - 悅
1262
+ - 爐
1263
+ - 紙
1264
+ - 暗
1265
+ - 殼
1266
+ - 志
1267
+ - 圭
1268
+ - 獵
1269
+ - 農
1270
+ - 怕
1271
+ - 走
1272
+ - 悉
1273
+ - 鞍
1274
+ - 毫
1275
+ - 背
1276
+ - 姓
1277
+ - 職
1278
+ - 呼
1279
+ - 拖
1280
+ - 鏢
1281
+ - 擲
1282
+ - 技
1283
+ - 尖
1284
+ - 握
1285
+ - 漫
1286
+ - 晝
1287
+ - 耐
1288
+ - 返
1289
+ - 崗
1290
+ - 紓
1291
+ - 岩
1292
+ - 皮
1293
+ - 善
1294
+ - 葛
1295
+ - 獄
1296
+ - 臨
1297
+ - 釋
1298
+ - 拘
1299
+ - 敗
1300
+ - 拍
1301
+ - 券
1302
+ - 窯
1303
+ - 烹
1304
+ - 烘
1305
+ - 烤
1306
+ - 錫
1307
+ - 炎
1308
+ - 苗
1309
+ - 亨
1310
+ - 抽
1311
+ - 精
1312
+ - 污
1313
+ - 執
1314
+ - 銜
1315
+ - 遙
1316
+ - 旁
1317
+ - 雪
1318
+ - 冬
1319
+ - 靴
1320
+ - 威
1321
+ - 脅
1322
+ - 勸
1323
+ - 閉
1324
+ - 齒
1325
+ - 咬
1326
+ - 碎
1327
+ - 葉
1328
+ - 枝
1329
+ - 搞
1330
+ - 央
1331
+ - 竊
1332
+ - 象
1333
+ - 徵
1334
+ - 假
1335
+ - 偷
1336
+ - 陌
1337
+ - 終
1338
+ - 椅
1339
+ - 砸
1340
+ - 玻
1341
+ - 璃
1342
+ - 憲
1343
+ - 彙
1344
+ - 集
1345
+ - 搜
1346
+ - 宗
1347
+ - 惠
1348
+ - 隨
1349
+ - 雅
1350
+ - 軟
1351
+ - 匹
1352
+ - 敵
1353
+ - 禍
1354
+ - 葬
1355
+ - 禮
1356
+ - 擬
1357
+ - 材
1358
+ - 瞭
1359
+ - 壘
1360
+ - 倖
1361
+ - 嘆
1362
+ - 茱
1363
+ - 吉
1364
+ - 卸
1365
+ - 枚
1366
+ - 幣
1367
+ - 聽
1368
+ - 默
1369
+ - 米
1370
+ - 鬥
1371
+ - 駕
1372
+ - 駛
1373
+ - 茲
1374
+ - 拒
1375
+ - 墮
1376
+ - 胎
1377
+ - 倫
1378
+ - 評
1379
+ - 弗
1380
+ - /
1381
+ - 床
1382
+ - 沉
1383
+ - 匈
1384
+ - 蘋
1385
+ - 話
1386
+ - 創
1387
+ - 復
1388
+ - 賞
1389
+ - 旗
1390
+ - 操
1391
+ - 頻
1392
+ - 誕
1393
+ - ?
1394
+ - 勞
1395
+ - 鍵
1396
+ - 唱
1397
+ - 蒂
1398
+ - 芬
1399
+ - 跌
1400
+ - 落
1401
+ - 便
1402
+ - 擅
1403
+ - 壁
1404
+ - 潦
1405
+ - 草
1406
+ - 跡
1407
+ - 塗
1408
+ - 鴉
1409
+ - 妮
1410
+ - 颶
1411
+ - 村
1412
+ - 八
1413
+ - 堂
1414
+ - 埃
1415
+ - 疑
1416
+ - 層
1417
+ - 贏
1418
+ - 紅
1419
+ - 穴
1420
+ - 浮
1421
+ - 卷
1422
+ - 竄
1423
+ - 霍
1424
+ - 胡
1425
+ - 寸
1426
+ - 灘
1427
+ - 訪
1428
+ - 誘
1429
+ - 夢
1430
+ - 倦
1431
+ - 碩
1432
+ - 頒
1433
+ - 灣
1434
+ - 費
1435
+ - 劇
1436
+ - 奈
1437
+ - 殺
1438
+ - 炸
1439
+ - 辦
1440
+ - 環
1441
+ - 艙
1442
+ - 柯
1443
+ - 巨
1444
+ - 哩
1445
+ - 優
1446
+ - 椰
1447
+ - 奶
1448
+ - 術
1449
+ - 尾
1450
+ - 耳
1451
+ - 蹈
1452
+ - 托
1453
+ - 戲
1454
+ - 旺
1455
+ - 弱
1456
+ - 懼
1457
+ - 願
1458
+ - 衡
1459
+ - 夫
1460
+ - 妻
1461
+ - 婚
1462
+ - 友
1463
+ - 祝
1464
+ - 燒
1465
+ - 喉
1466
+ - 嚨
1467
+ - 痛
1468
+ - 良
1469
+ - 待
1470
+ - 乘
1471
+ - 委
1472
+ - 瑞
1473
+ - 淨
1474
+ - 延
1475
+ - 停
1476
+ - 舒
1477
+ - 把
1478
+ - 爪
1479
+ - 馳
1480
+ - 迅
1481
+ - 盒
1482
+ - 批
1483
+ - 准
1484
+ - 柔
1485
+ - 屆
1486
+ - 齊
1487
+ - 藤
1488
+ - 仁
1489
+ - 歡
1490
+ - 吧
1491
+ - 蕾
1492
+ - 秀
1493
+ - 興
1494
+ - 汀
1495
+ - 億
1496
+ - 財
1497
+ - 豪
1498
+ - 榜
1499
+ - 瑟
1500
+ - 署
1501
+ - 愛
1502
+ - 柏
1503
+ - 聖
1504
+ - 詹
1505
+ - 姆
1506
+ - 廠
1507
+ - 旱
1508
+ - 均
1509
+ - 配
1510
+ - 引
1511
+ - 裹
1512
+ - 巾
1513
+ - 豔
1514
+ - 笑
1515
+ - 借
1516
+ - 庫
1517
+ - 洗
1518
+ - 裙
1519
+ - 稍
1520
+ - 男
1521
+ - !
1522
+ - 誌
1523
+ - 壞
1524
+ - 飾
1525
+ - 寫
1526
+ - 味
1527
+ - 渴
1528
+ - 盈
1529
+ - 郁
1530
+ - 啡
1531
+ - 甘
1532
+ - 菊
1533
+ - 茶
1534
+ - 柬
1535
+ - 埔
1536
+ - 寨
1537
+ - 夾
1538
+ - 拔
1539
+ - 築
1540
+ - 板
1541
+ - 扯
1542
+ - 掉
1543
+ - 輛
1544
+ - 拋
1545
+ - 謊
1546
+ - 授
1547
+ - 刊
1548
+ - 魯
1549
+ - 摘
1550
+ - 冠
1551
+ - 沙
1552
+ - 恆
1553
+ - 跟
1554
+ - 漿
1555
+ - 刪
1556
+ - 殘
1557
+ - 嶼
1558
+ - 陣
1559
+ - 迄
1560
+ - 災
1561
+ - 洪
1562
+ - 弧
1563
+ - 側
1564
+ - 傾
1565
+ - 斜
1566
+ - 觸
1567
+ - 緣
1568
+ - 亦
1569
+ - 曲
1570
+ - 遇
1571
+ - 麻
1572
+ - 煩
1573
+ - 播
1574
+ - 棍
1575
+ - 扔
1576
+ - 瓶
1577
+ - 剝
1578
+ - 菲
1579
+ - 律
1580
+ - 潤
1581
+ - 穫
1582
+ - 喬
1583
+ - 坡
1584
+ - 鑽
1585
+ - 躲
1586
+ - 腳
1587
+ - 閱
1588
+ - 泛
1589
+ - 藻
1590
+ - 癱
1591
+ - 瘓
1592
+ - 艘
1593
+ - 派
1594
+ - 艦
1595
+ - 崎
1596
+ - 俚
1597
+ - 鄉
1598
+ - 逗
1599
+ - 李
1600
+ - 副
1601
+ - 郵
1602
+ - 儲
1603
+ - 肝
1604
+ - 臟
1605
+ - 危
1606
+ - 訝
1607
+ - 裔
1608
+ - 初
1609
+ - 罰
1610
+ - 含
1611
+ - 午
1612
+ - 整
1613
+ - 寂
1614
+ - 噴
1615
+ - 撞
1616
+ - 迫
1617
+ - 后
1618
+ - 敞
1619
+ - 鑰
1620
+ - 匙
1621
+ - 伏
1622
+ - 俘
1623
+ - 虜
1624
+ - 規
1625
+ - 俱
1626
+ - 註
1627
+ - 冊
1628
+ - 宿
1629
+ - 鼠
1630
+ - <sos/eos>
1631
+ token_type: char
1632
+ train_dtype: float32
1633
+ unused_parameters: true
1634
+ use_adapter: false
1635
+ use_amp: false
1636
+ use_lang_prompt: false
1637
+ use_matplotlib: true
1638
+ use_nlp_prompt: false
1639
+ use_preprocessor: true
1640
+ use_tensorboard: true
1641
+ val_scheduler_criterion:
1642
+ - valid
1643
+ - loss
1644
+ valid_batch_bins: null
1645
+ valid_batch_size: null
1646
+ valid_batch_type: null
1647
+ valid_iterator_type: null
1648
+ valid_max_cache_size: null
1649
+ version: '202402'
1650
+ write_collected_feats: false
hyp.trn ADDED
The diff for this file is too large to render. See raw diff
 
ref.trn ADDED
The diff for this file is too large to render. See raw diff
 
valid.loss.best.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:0cc80b0d5b101c64ac0b30bb43126c8697a2d44f5216a1531783a76750bffc64
3
+ size 1282210444