add model and config

Files changed (6) hide show

.gitattributes +2 -0
best-3.pt +3 -0
config.json +42 -0
hyper-p.json +70 -0
lexicon_mul10.txt +3 -0
tokenizer_mul10.tknz +3 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,5 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+*.txt filter=lfs diff=lfs merge=lfs -text
+*.tknz filter=lfs diff=lfs merge=lfs -text

best-3.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c56031e62889ab9b759b269f3ddc3f5796c3511df0b7bc55e7d251c82bb67408
+size 875628375

config.json ADDED Viewed

	@@ -0,0 +1,42 @@

+{
+    "specaug": {
+        "freq_mask_width_range": 0.35,
+        "num_freq_mask": 2,
+        "num_time_mask": 10,
+        "time_mask_width_range": 0.05
+    },
+    "encoder": {
+        "type": "ConformerNet",
+        "kwargs": {
+            "num_cells": 22,
+            "idim": 80,
+            "hdim": 640,
+            "conv": "vgg2l",
+            "num_heads": 4,
+            "d_head": 160,
+            "kernel_size": 15,
+            "num_classes": 75
+        }
+    },
+    "scheduler": {
+        "type": "SchedulerNoamEarlyStop",
+        "kwargs": {
+            "warmup_step": 20000,
+            "min_step": 30000,
+            "dim_model": 640,
+            "peak_factor": 1.0,
+            "n_tol": 50
+        },
+        "optimizer": {
+            "type": "Adam",
+            "kwargs": {
+                "lr": 0.0003,
+                "betas": [
+                    0.9,
+                    0.98
+                ],
+                "weight_decay": 1e-06
+            }
+        }
+    }
+}

hyper-p.json ADDED Viewed

	@@ -0,0 +1,70 @@

+{
+    "data": {
+        "dev": [
+            "dev_en_mul",
+            "dev_es_mul",
+            "dev_fr_mul",
+            "dev_it_mul",
+            "dev_ky_mul",
+            "dev_ru_mul",
+            "dev_nl_mul",
+            "dev_tt_mul",
+            "dev_tr_mul",
+            "dev_sv-SE_mul"
+        ],
+        "test": [
+            "test_en_mul",
+            "test_es_mul",
+            "test_fr_mul",
+            "test_it_mul",
+            "test_ky_mul",
+            "test_ru_mul",
+            "test_nl_mul",
+            "test_tt_mul",
+            "test_tr_mul",
+            "test_sv-SE_mul"
+        ],
+        "filter": "10:1200"
+    },
+    "tokenizer": {
+        "type": "LexiconTokenizer",
+        "option-init": {
+            "lexicon": "dict/ten/lexicon_mul10.txt"
+        },
+        "file": "dict/ten/tokenizer_mul10.tknz",
+        "|V|": 75
+    },
+    "env": {
+        "CUDA_VISIBLE_DEVICES": "0,1,2,3,4,5,6,7,8,9"
+    },
+    "train": {
+        "bin": "cat.ctc.train",
+        "option": {
+            "amp": true,
+            "batch_size": 320,
+            "grad_norm": 5.0,
+            "grad_accum_fold": 2,
+            "check_freq": 500,
+            "large-dataset": true,
+            "ld": "data/*/{11_1000,1001_1200}/*.tar"
+        }
+    },
+    "inference": {
+        "avgmodel": {
+            "mode": "best",
+            "num": 3
+        },
+        "infer": {
+            "bin": "cat.ctc.decode",
+            "option": {
+                "beam_size": 16,
+                "nj": 16,
+                "store_ark": true
+            }
+        },
+        "er": {
+            "per": true
+        }
+    },
+    "commit": "1b77bc21f7a5faac5e47f6bc4445f23ebf0e0633"
+}

lexicon_mul10.txt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ae10e0c8cc66da6ae110745601977e2a46afdb4d398246f4884e2922429a8d22
+size 21985313

tokenizer_mul10.tknz ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4be8c9593ae6afc772067554022481c53dc5ea2cd889d1036e992bb02c493130
+size 24304800