valtec-tts-onnx / tts_config.json
valtecAI-team's picture
Upload 7 files
b315f05 verified
{
"symbols": [
"_",
"\"",
"#",
"$",
"%",
"&",
"(",
")",
"*",
"/",
"0",
"1",
"2",
"3",
"4",
"5",
"6",
"7",
"8",
"9",
":",
"AA",
"E",
"EE",
"En",
"N",
"OO",
"Q",
"V",
"[",
"\\",
"]",
"^",
"a",
"a:",
"aa",
"ae",
"ah",
"ai",
"an",
"ang",
"ao",
"aw",
"ay",
"aː",
"b",
"by",
"c",
"ch",
"d",
"dh",
"dy",
"e",
"e:",
"eh",
"ei",
"en",
"eng",
"er",
"ey",
"eː",
"f",
"g",
"gy",
"h",
"hh",
"hy",
"i",
"i0",
"i:",
"ia",
"ian",
"iang",
"iao",
"ie",
"ih",
"in",
"ing",
"iong",
"ir",
"iu",
"iy",
"iə",
"iː",
"j",
"jh",
"k",
"kw",
"ky",
"kʰ",
"l",
"m",
"my",
"n",
"ng",
"ny",
"o",
"o:",
"ong",
"ou",
"ow",
"oy",
"oː",
"p",
"py",
"q",
"r",
"ry",
"s",
"sh",
"t",
"th",
"ts",
"ty",
"tʃ",
"tʰ",
"u",
"u:",
"ua",
"uai",
"uan",
"uang",
"uh",
"ui",
"un",
"uo",
"uw",
"uə",
"uː",
"v",
"van",
"ve",
"vn",
"w",
"wʷ",
"x",
"y",
"z",
"zh",
"zy",
"~",
"«",
"µ",
"»",
"à",
"á",
"æ",
"ç",
"é",
"ê",
"ì",
"ð",
"ò",
"ó",
"ô",
"ø",
"ú",
"ă",
"ı",
"ŋ",
"œ",
"ư",
"ɐ",
"ɑ",
"ɑː",
"ɒ",
"ɓ",
"ɔ",
"ɔː",
"ɕ",
"ɖ",
"ɗ",
"ə",
"əː",
"ɛ",
"ɜ",
"ɜː",
"ɡ",
"ɣ",
"ɤ",
"ɥ",
"ɦ",
"ɨ",
"ɨə",
"ɪ",
"ɫ",
"ɬ",
"ɭ",
"ɯ",
"ɲ",
"ɵ",
"ɸ",
"ɹ",
"ɾ",
"ʁ",
"ʂ",
"ʃ",
"ʈ",
"ʉ",
"ʊ",
"ʌ",
"ʎ",
"ʏ",
"ʐ",
"ʑ",
"ʒ",
"ʔ",
"ʝ",
"ʤ",
"ʧ",
"ʰ",
"ʲ",
"ʷ",
"ˈ",
"ˌ",
"ː",
"ˑ",
"˥",
"˦",
"˧",
"˨",
"˩",
"̃",
"̆",
"̩",
"̪",
"͡",
"β",
"θ",
"и",
"л",
"р",
"т",
"ᄀ",
"ᄁ",
"ᄂ",
"ᄃ",
"ᄄ",
"ᄅ",
"ᄆ",
"ᄇ",
"ᄈ",
"ᄉ",
"ᄊ",
"ᄋ",
"ᄌ",
"ᄍ",
"ᄎ",
"ᄏ",
"ᄐ",
"ᄑ",
"ᄒ",
"ᅡ",
"ᅢ",
"ᅣ",
"ᅤ",
"ᅥ",
"ᅦ",
"ᅧ",
"ᅨ",
"ᅩ",
"ᅪ",
"ᅫ",
"ᅬ",
"ᅭ",
"ᅮ",
"ᅯ",
"ᅰ",
"ᅱ",
"ᅲ",
"ᅳ",
"ᅴ",
"ᅵ",
"ᆨ",
"ᆫ",
"ᆮ",
"ᆯ",
"ᆷ",
"ᆸ",
"ᆼ",
"ả",
"ấ",
"ẩ",
"ế",
"ọ",
"ố",
"ồ",
"ộ",
"ớ",
"ờ",
"ủ",
"ữ",
"–",
"ㄸ",
"輪",
"!",
"?",
"…",
",",
".",
"'",
"-",
"¿",
"¡",
"SP",
"UNK"
],
"symbol_to_id": {
"_": 0,
"\"": 1,
"#": 2,
"$": 3,
"%": 4,
"&": 5,
"(": 6,
")": 7,
"*": 8,
"/": 9,
"0": 10,
"1": 11,
"2": 12,
"3": 13,
"4": 14,
"5": 15,
"6": 16,
"7": 17,
"8": 18,
"9": 19,
":": 20,
"AA": 21,
"E": 22,
"EE": 23,
"En": 24,
"N": 25,
"OO": 26,
"Q": 27,
"V": 28,
"[": 29,
"\\": 30,
"]": 31,
"^": 32,
"a": 33,
"a:": 34,
"aa": 35,
"ae": 36,
"ah": 37,
"ai": 38,
"an": 39,
"ang": 40,
"ao": 41,
"aw": 42,
"ay": 43,
"aː": 44,
"b": 45,
"by": 46,
"c": 47,
"ch": 48,
"d": 49,
"dh": 50,
"dy": 51,
"e": 52,
"e:": 53,
"eh": 54,
"ei": 55,
"en": 56,
"eng": 57,
"er": 58,
"ey": 59,
"eː": 60,
"f": 61,
"g": 62,
"gy": 63,
"h": 64,
"hh": 65,
"hy": 66,
"i": 67,
"i0": 68,
"i:": 69,
"ia": 70,
"ian": 71,
"iang": 72,
"iao": 73,
"ie": 74,
"ih": 75,
"in": 76,
"ing": 77,
"iong": 78,
"ir": 79,
"iu": 80,
"iy": 81,
"iə": 82,
"iː": 83,
"j": 84,
"jh": 85,
"k": 86,
"kw": 87,
"ky": 88,
"kʰ": 89,
"l": 90,
"m": 91,
"my": 92,
"n": 93,
"ng": 94,
"ny": 95,
"o": 96,
"o:": 97,
"ong": 98,
"ou": 99,
"ow": 100,
"oy": 101,
"oː": 102,
"p": 103,
"py": 104,
"q": 105,
"r": 106,
"ry": 107,
"s": 108,
"sh": 109,
"t": 110,
"th": 111,
"ts": 112,
"ty": 113,
"tʃ": 114,
"tʰ": 115,
"u": 116,
"u:": 117,
"ua": 118,
"uai": 119,
"uan": 120,
"uang": 121,
"uh": 122,
"ui": 123,
"un": 124,
"uo": 125,
"uw": 126,
"uə": 127,
"uː": 128,
"v": 129,
"van": 130,
"ve": 131,
"vn": 132,
"w": 133,
"wʷ": 134,
"x": 135,
"y": 136,
"z": 137,
"zh": 138,
"zy": 139,
"~": 140,
"«": 141,
"µ": 142,
"»": 143,
"à": 144,
"á": 145,
"æ": 146,
"ç": 147,
"é": 148,
"ê": 149,
"ì": 150,
"ð": 151,
"ò": 152,
"ó": 153,
"ô": 154,
"ø": 155,
"ú": 156,
"ă": 157,
"ı": 158,
"ŋ": 159,
"œ": 160,
"ư": 161,
"ɐ": 162,
"ɑ": 163,
"ɑː": 164,
"ɒ": 165,
"ɓ": 166,
"ɔ": 167,
"ɔː": 168,
"ɕ": 169,
"ɖ": 170,
"ɗ": 171,
"ə": 172,
"əː": 173,
"ɛ": 174,
"ɜ": 175,
"ɜː": 176,
"ɡ": 177,
"ɣ": 178,
"ɤ": 179,
"ɥ": 180,
"ɦ": 181,
"ɨ": 182,
"ɨə": 183,
"ɪ": 184,
"ɫ": 185,
"ɬ": 186,
"ɭ": 187,
"ɯ": 188,
"ɲ": 189,
"ɵ": 190,
"ɸ": 191,
"ɹ": 192,
"ɾ": 193,
"ʁ": 194,
"ʂ": 195,
"ʃ": 196,
"ʈ": 197,
"ʉ": 198,
"ʊ": 199,
"ʌ": 200,
"ʎ": 201,
"ʏ": 202,
"ʐ": 203,
"ʑ": 204,
"ʒ": 205,
"ʔ": 206,
"ʝ": 207,
"ʤ": 208,
"ʧ": 209,
"ʰ": 210,
"ʲ": 211,
"ʷ": 212,
"ˈ": 213,
"ˌ": 214,
"ː": 215,
"ˑ": 216,
"˥": 217,
"˦": 218,
"˧": 219,
"˨": 220,
"˩": 221,
"̃": 222,
"̆": 223,
"̩": 224,
"̪": 225,
"͡": 226,
"β": 227,
"θ": 228,
"и": 229,
"л": 230,
"р": 231,
"т": 232,
"ᄀ": 233,
"ᄁ": 234,
"ᄂ": 235,
"ᄃ": 236,
"ᄄ": 237,
"ᄅ": 238,
"ᄆ": 239,
"ᄇ": 240,
"ᄈ": 241,
"ᄉ": 242,
"ᄊ": 243,
"ᄋ": 244,
"ᄌ": 245,
"ᄍ": 246,
"ᄎ": 247,
"ᄏ": 248,
"ᄐ": 249,
"ᄑ": 250,
"ᄒ": 251,
"ᅡ": 252,
"ᅢ": 253,
"ᅣ": 254,
"ᅤ": 255,
"ᅥ": 256,
"ᅦ": 257,
"ᅧ": 258,
"ᅨ": 259,
"ᅩ": 260,
"ᅪ": 261,
"ᅫ": 262,
"ᅬ": 263,
"ᅭ": 264,
"ᅮ": 265,
"ᅯ": 266,
"ᅰ": 267,
"ᅱ": 268,
"ᅲ": 269,
"ᅳ": 270,
"ᅴ": 271,
"ᅵ": 272,
"ᆨ": 273,
"ᆫ": 274,
"ᆮ": 275,
"ᆯ": 276,
"ᆷ": 277,
"ᆸ": 278,
"ᆼ": 279,
"ả": 280,
"ấ": 281,
"ẩ": 282,
"ế": 283,
"ọ": 284,
"ố": 285,
"ồ": 286,
"ộ": 287,
"ớ": 288,
"ờ": 289,
"ủ": 290,
"ữ": 291,
"–": 292,
"ㄸ": 293,
"輪": 294,
"!": 295,
"?": 296,
"…": 297,
",": 298,
".": 299,
"'": 300,
"-": 301,
"¿": 302,
"¡": 303,
"SP": 304,
"UNK": 305
},
"language_id_map": {
"ZH": 0,
"JP": 1,
"EN": 2,
"ZH_MIX_EN": 3,
"KR": 4,
"ES": 5,
"SP": 5,
"FR": 6,
"VI": 7
},
"speakers": {
"NF": 0,
"SF": 1,
"NM1": 2,
"SM": 3,
"NM2": 4
},
"num_symbols": 306,
"sample_rate": 24000,
"vi_phoneme_map": {
"a": "a",
"à": "à",
"á": "á",
"ả": "ả",
"ã": "ã",
"ạ": "ạ",
"ă": "ă",
"ằ": "ằ",
"ắ": "ắ",
"ẳ": "ẳ",
"ẵ": "ẵ",
"ặ": "ặ",
"â": "â",
"ầ": "ầ",
"ấ": "ấ",
"ẩ": "ẩ",
"ẫ": "ẫ",
"ậ": "ậ",
"e": "e",
"è": "è",
"é": "é",
"ẻ": "ẻ",
"ẽ": "ẽ",
"ẹ": "ẹ",
"ê": "ê",
"ề": "ề",
"ế": "ế",
"ể": "ể",
"ễ": "ễ",
"ệ": "ệ",
"i": "i",
"ì": "ì",
"í": "í",
"ỉ": "ỉ",
"ĩ": "ĩ",
"ị": "ị",
"o": "o",
"ò": "ò",
"ó": "ó",
"ỏ": "ỏ",
"õ": "õ",
"ọ": "ọ",
"ô": "ô",
"ồ": "ồ",
"ố": "ố",
"ổ": "ổ",
"ỗ": "ỗ",
"ộ": "ộ",
"ơ": "ơ",
"ờ": "ờ",
"ớ": "ớ",
"ở": "ở",
"ỡ": "ỡ",
"ợ": "ợ",
"u": "u",
"ù": "ù",
"ú": "ú",
"ủ": "ủ",
"ũ": "ũ",
"ụ": "ụ",
"ư": "ư",
"ừ": "ừ",
"ứ": "ứ",
"ử": "ử",
"ữ": "ữ",
"ự": "ự",
"y": "y",
"ỳ": "ỳ",
"ý": "ý",
"ỷ": "ỷ",
"ỹ": "ỹ",
"ỵ": "ỵ",
"b": "b",
"c": "c",
"d": "d",
"đ": "đ",
"f": "f",
"g": "g",
"h": "h",
"j": "j",
"k": "k",
"l": "l",
"m": "m",
"n": "n",
"p": "p",
"q": "q",
"r": "r",
"s": "s",
"t": "t",
"v": "v",
"w": "w",
"x": "x",
"z": "z"
}
}