20230202

Files changed (7) hide show

VITS/20230202-40speaker/best/D_128000.pth +3 -0
VITS/20230202-40speaker/best/G_128000.pth +3 -0
VITS/20230202-40speaker/best/config.json +104 -0
VITS/20230202-40speaker/config.json +104 -0
VITS/20230202-40speaker/pruned/P_G_128000.pth +3 -0
VITS/20230202-40speaker/pruned/config.json +104 -0
VITS/20230202-40speaker/train.log +0 -0

VITS/20230202-40speaker/best/D_128000.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a8957392ed2cc932a89d2309892af3f9b2bd837c18d7b9163b9059398a3c8df8
+size 561099143

VITS/20230202-40speaker/best/G_128000.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d380f3db75649fb4d60efbd8b80532d22653c75e2fb0cb0cfa252a2ca890f73b
+size 476905883

VITS/20230202-40speaker/best/config.json ADDED Viewed

	@@ -0,0 +1,104 @@

+{
+  "train": {
+    "log_interval": 1600,
+    "eval_interval": 1600,
+    "seed": 1234,
+    "epochs": 2000,
+    "learning_rate": 2e-4,
+    "betas": [0.8, 0.99],
+    "eps": 1e-9,
+    "batch_size": 16,
+    "fp16_run": true,
+    "lr_decay": 0.999875,
+    "segment_size": 8192,
+    "init_lr_ratio": 1,
+    "warmup_epochs": 0,
+    "c_mel": 45,
+    "c_kl": 1.0
+  },
+  "data": {
+    "training_files":"filelists/train_filelist.txt.cleaned",
+    "validation_files":"filelists/val_filelist.txt.cleaned",
+    "text_cleaners":["japanese_cleaners"],
+    "max_wav_value": 32768.0,
+    "sampling_rate": 22050,
+    "filter_length": 1024,
+    "hop_length": 256,
+    "win_length": 1024,
+    "n_mel_channels": 80,
+    "mel_fmin": 0.0,
+    "mel_fmax": null,
+    "add_blank": true,
+    "n_speakers": 40,
+    "cleaned_text": true
+  },
+  "model": {
+    "inter_channels": 192,
+    "hidden_channels": 192,
+    "filter_channels": 768,
+    "n_heads": 2,
+    "n_layers": 6,
+    "kernel_size": 3,
+    "p_dropout": 0.1,
+    "resblock": "1",
+    "resblock_kernel_sizes": [3,7,11],
+    "resblock_dilation_sizes": [[1,3,5], [1,3,5], [1,3,5]],
+    "upsample_rates": [8,8,2,2],
+    "upsample_initial_channel": 512,
+    "upsample_kernel_sizes": [16,16,4,4],
+    "n_layers_q": 3,
+    "use_spectral_norm": false,
+    "gin_channels": 256
+  },
+  "speakers": [
+    "Akaset","Alisa","AmaneInori","Andrea","Asuna","Aurora",
+    "Benten","Colcher","Dreizehn","Ennis","EtsukazuMiko",
+    "Freesia","Gawana","HagakureRuri","HazukiYuki","Ithil",
+    "Juewa","Lavira","Lilyiro","Minerdwen","Mist",
+    "NankungLin","Netsuki","NetsukiFox","NicoletteLamel","QuLing",
+    "SakuyaMako","Satya","Silenus","TsukinoMiyo","Virgina","AkasetNS",
+    "AuroraNS","SilenusNS","ColcherNS","None","None","None","None","Kokkoro"
+  ],
+  "symbols": [
+    "_",
+    ",",
+    ".",
+    "!",
+    "?",
+    "-",
+    "A",
+    "E",
+    "I",
+    "N",
+    "O",
+    "Q",
+    "U",
+    "a",
+    "b",
+    "d",
+    "e",
+    "f",
+    "g",
+    "h",
+    "i",
+    "j",
+    "k",
+    "m",
+    "n",
+    "o",
+    "p",
+    "r",
+    "s",
+    "t",
+    "u",
+    "v",
+    "w",
+    "y",
+    "z",
+    "\u0283",
+    "\u02a7",
+    "\u2193",
+    "\u2191",
+    " "
+  ]
+}

VITS/20230202-40speaker/config.json ADDED Viewed

	@@ -0,0 +1,104 @@

+{
+  "train": {
+    "log_interval": 1600,
+    "eval_interval": 1600,
+    "seed": 1234,
+    "epochs": 2000,
+    "learning_rate": 2e-4,
+    "betas": [0.8, 0.99],
+    "eps": 1e-9,
+    "batch_size": 16,
+    "fp16_run": true,
+    "lr_decay": 0.999875,
+    "segment_size": 8192,
+    "init_lr_ratio": 1,
+    "warmup_epochs": 0,
+    "c_mel": 45,
+    "c_kl": 1.0
+  },
+  "data": {
+    "training_files":"filelists/train_filelist.txt.cleaned",
+    "validation_files":"filelists/val_filelist.txt.cleaned",
+    "text_cleaners":["japanese_cleaners"],
+    "max_wav_value": 32768.0,
+    "sampling_rate": 22050,
+    "filter_length": 1024,
+    "hop_length": 256,
+    "win_length": 1024,
+    "n_mel_channels": 80,
+    "mel_fmin": 0.0,
+    "mel_fmax": null,
+    "add_blank": true,
+    "n_speakers": 40,
+    "cleaned_text": true
+  },
+  "model": {
+    "inter_channels": 192,
+    "hidden_channels": 192,
+    "filter_channels": 768,
+    "n_heads": 2,
+    "n_layers": 6,
+    "kernel_size": 3,
+    "p_dropout": 0.1,
+    "resblock": "1",
+    "resblock_kernel_sizes": [3,7,11],
+    "resblock_dilation_sizes": [[1,3,5], [1,3,5], [1,3,5]],
+    "upsample_rates": [8,8,2,2],
+    "upsample_initial_channel": 512,
+    "upsample_kernel_sizes": [16,16,4,4],
+    "n_layers_q": 3,
+    "use_spectral_norm": false,
+    "gin_channels": 256
+  },
+  "speakers": [
+    "Akaset","Alisa","AmaneInori","Andrea","Asuna","Aurora",
+    "Benten","Colcher","Dreizehn","Ennis","EtsukazuMiko",
+    "Freesia","Gawana","HagakureRuri","HazukiYuki","Ithil",
+    "Juewa","Lavira","Lilyiro","Minerdwen","Mist",
+    "NankungLin","Netsuki","NetsukiFox","NicoletteLamel","QuLing",
+    "SakuyaMako","Satya","Silenus","TsukinoMiyo","Virgina","AkasetNS",
+    "AuroraNS","SilenusNS","ColcherNS","None","None","None","None","Kokkoro"
+  ],
+  "symbols": [
+    "_",
+    ",",
+    ".",
+    "!",
+    "?",
+    "-",
+    "A",
+    "E",
+    "I",
+    "N",
+    "O",
+    "Q",
+    "U",
+    "a",
+    "b",
+    "d",
+    "e",
+    "f",
+    "g",
+    "h",
+    "i",
+    "j",
+    "k",
+    "m",
+    "n",
+    "o",
+    "p",
+    "r",
+    "s",
+    "t",
+    "u",
+    "v",
+    "w",
+    "y",
+    "z",
+    "\u0283",
+    "\u02a7",
+    "\u2193",
+    "\u2191",
+    " "
+  ]
+}

VITS/20230202-40speaker/pruned/P_G_128000.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:76c4c15bc021b4d72c3620cc13e5634744e45ebdc7cc2804f7c2487e7580a450
+size 158917793

VITS/20230202-40speaker/pruned/config.json ADDED Viewed

	@@ -0,0 +1,104 @@

+{
+  "train": {
+    "log_interval": 1600,
+    "eval_interval": 1600,
+    "seed": 1234,
+    "epochs": 2000,
+    "learning_rate": 2e-4,
+    "betas": [0.8, 0.99],
+    "eps": 1e-9,
+    "batch_size": 16,
+    "fp16_run": true,
+    "lr_decay": 0.999875,
+    "segment_size": 8192,
+    "init_lr_ratio": 1,
+    "warmup_epochs": 0,
+    "c_mel": 45,
+    "c_kl": 1.0
+  },
+  "data": {
+    "training_files":"filelists/train_filelist.txt.cleaned",
+    "validation_files":"filelists/val_filelist.txt.cleaned",
+    "text_cleaners":["japanese_cleaners"],
+    "max_wav_value": 32768.0,
+    "sampling_rate": 22050,
+    "filter_length": 1024,
+    "hop_length": 256,
+    "win_length": 1024,
+    "n_mel_channels": 80,
+    "mel_fmin": 0.0,
+    "mel_fmax": null,
+    "add_blank": true,
+    "n_speakers": 40,
+    "cleaned_text": true
+  },
+  "model": {
+    "inter_channels": 192,
+    "hidden_channels": 192,
+    "filter_channels": 768,
+    "n_heads": 2,
+    "n_layers": 6,
+    "kernel_size": 3,
+    "p_dropout": 0.1,
+    "resblock": "1",
+    "resblock_kernel_sizes": [3,7,11],
+    "resblock_dilation_sizes": [[1,3,5], [1,3,5], [1,3,5]],
+    "upsample_rates": [8,8,2,2],
+    "upsample_initial_channel": 512,
+    "upsample_kernel_sizes": [16,16,4,4],
+    "n_layers_q": 3,
+    "use_spectral_norm": false,
+    "gin_channels": 256
+  },
+  "speakers": [
+    "Akaset","Alisa","AmaneInori","Andrea","Asuna","Aurora",
+    "Benten","Colcher","Dreizehn","Ennis","EtsukazuMiko",
+    "Freesia","Gawana","HagakureRuri","HazukiYuki","Ithil",
+    "Juewa","Lavira","Lilyiro","Minerdwen","Mist",
+    "NankungLin","Netsuki","NetsukiFox","NicoletteLamel","QuLing",
+    "SakuyaMako","Satya","Silenus","TsukinoMiyo","Virgina","AkasetNS",
+    "AuroraNS","SilenusNS","ColcherNS","None","None","None","None","Kokkoro"
+  ],
+  "symbols": [
+    "_",
+    ",",
+    ".",
+    "!",
+    "?",
+    "-",
+    "A",
+    "E",
+    "I",
+    "N",
+    "O",
+    "Q",
+    "U",
+    "a",
+    "b",
+    "d",
+    "e",
+    "f",
+    "g",
+    "h",
+    "i",
+    "j",
+    "k",
+    "m",
+    "n",
+    "o",
+    "p",
+    "r",
+    "s",
+    "t",
+    "u",
+    "v",
+    "w",
+    "y",
+    "z",
+    "\u0283",
+    "\u02a7",
+    "\u2193",
+    "\u2191",
+    " "
+  ]
+}

VITS/20230202-40speaker/train.log ADDED Viewed

The diff for this file is too large to render. See raw diff