| sample_rate: 24000 | |
| encoder: | |
| idim: 512 | |
| odim: 1024 | |
| hidden: 256 | |
| n_layer: 12 | |
| bn_dim: 128 | |
| vq: | |
| dim: 1024 | |
| levels: [5, 5, 5, 5] | |
| G: 2 | |
| R: 2 | |
| decoder: | |
| idim: 512 | |
| odim: 512 | |
| hidden: 256 | |
| n_layer: 12 | |
| bn_dim: 128 | |
| sample_rate: 24000 | |
| encoder: | |
| idim: 512 | |
| odim: 1024 | |
| hidden: 256 | |
| n_layer: 12 | |
| bn_dim: 128 | |
| vq: | |
| dim: 1024 | |
| levels: [5, 5, 5, 5] | |
| G: 2 | |
| R: 2 | |
| decoder: | |
| idim: 512 | |
| odim: 512 | |
| hidden: 256 | |
| n_layer: 12 | |
| bn_dim: 128 | |