Upload folder using huggingface_hub

Browse files

Files changed (5) hide show

README.md +43 -0
config.json +220 -0
model.safetensors +3 -0
model.safetensors.index.json +484 -0
voices.npz +3 -0

README.md ADDED Viewed

	@@ -0,0 +1,43 @@

+---
+license: apache-2.0
+tags:
+- mlx
+- text-to-speech
+- speech
+- speech generation
+- voice cloning
+- tts
+- mlx-audio
+library_name: mlx-audio
+---
+# mlx-community/kitten-tts-mini
+This model was converted to MLX format from [`KittenML/kitten-tts-mini-0.8`](https://huggingface.co/KittenML/kitten-tts-mini-0.8) using mlx-audio version **0.2.8**.
+Refer to the [original model card](https://huggingface.co/KittenML/kitten-tts-mini-0.8) for more details on the model.
+## Use with mlx-audio
+```bash
+pip install -U mlx-audio
+```
+### CLI Example:
+```bash
+python -m mlx_audio.tts.generate --model mlx-community/kitten-tts-mini --text "Hello, this is a test."
+```
+### Python Example:
+```python
+from mlx_audio.tts.utils import load_model
+from mlx_audio.tts.generate import generate_audio
+model = load_model("mlx-community/kitten-tts-mini")
+generate_audio(
+    model=model,
+    text="Hello, this is a test.",
+    ref_audio="path_to_audio.wav",
+    file_prefix="test_audio",
+)
+```

config.json ADDED Viewed

	@@ -0,0 +1,220 @@

+{
+    "activation_quant_modules": [
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.dense",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.key",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.query",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.value",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.ffn",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.ffn_output",
+        "bert.encoder.embedding_hidden_mapping_in",
+        "bert_encoder",
+        "decoder.asr_res.0",
+        "decoder.decode.0.conv1",
+        "decoder.decode.0.conv1x1",
+        "decoder.decode.0.conv2",
+        "decoder.decode.0.norm1.fc",
+        "decoder.decode.0.norm2.fc",
+        "decoder.decode.1.conv1",
+        "decoder.decode.1.conv1x1",
+        "decoder.decode.1.conv2",
+        "decoder.decode.1.norm1.fc",
+        "decoder.decode.1.norm2.fc",
+        "decoder.decode.2.conv1",
+        "decoder.decode.2.conv1x1",
+        "decoder.decode.2.conv2",
+        "decoder.decode.2.norm1.fc",
+        "decoder.decode.2.norm2.fc",
+        "decoder.decode.3.conv1",
+        "decoder.decode.3.conv1x1",
+        "decoder.decode.3.conv2",
+        "decoder.decode.3.norm1.fc",
+        "decoder.decode.3.norm2.fc",
+        "decoder.encode.conv1",
+        "decoder.encode.conv1x1",
+        "decoder.encode.conv2",
+        "decoder.encode.norm1.fc",
+        "decoder.encode.norm2.fc",
+        "decoder.generator.conv_post",
+        "decoder.generator.noise_convs.0",
+        "decoder.generator.noise_convs.1",
+        "decoder.generator.noise_res.0.adain1.0.fc",
+        "decoder.generator.noise_res.0.adain1.1.fc",
+        "decoder.generator.noise_res.0.adain1.2.fc",
+        "decoder.generator.noise_res.0.adain2.0.fc",
+        "decoder.generator.noise_res.0.adain2.1.fc",
+        "decoder.generator.noise_res.0.adain2.2.fc",
+        "decoder.generator.noise_res.0.convs1.0",
+        "decoder.generator.noise_res.0.convs1.1",
+        "decoder.generator.noise_res.0.convs1.2",
+        "decoder.generator.noise_res.0.convs2.0",
+        "decoder.generator.noise_res.0.convs2.1",
+        "decoder.generator.noise_res.0.convs2.2",
+        "decoder.generator.noise_res.1.adain1.0.fc",
+        "decoder.generator.noise_res.1.adain1.1.fc",
+        "decoder.generator.noise_res.1.adain1.2.fc",
+        "decoder.generator.noise_res.1.adain2.0.fc",
+        "decoder.generator.noise_res.1.adain2.1.fc",
+        "decoder.generator.noise_res.1.adain2.2.fc",
+        "decoder.generator.noise_res.1.convs1.0",
+        "decoder.generator.noise_res.1.convs1.1",
+        "decoder.generator.noise_res.1.convs1.2",
+        "decoder.generator.noise_res.1.convs2.0",
+        "decoder.generator.noise_res.1.convs2.1",
+        "decoder.generator.noise_res.1.convs2.2",
+        "decoder.generator.resblocks.0.adain1.0.fc",
+        "decoder.generator.resblocks.0.adain1.1.fc",
+        "decoder.generator.resblocks.0.adain1.2.fc",
+        "decoder.generator.resblocks.0.adain2.0.fc",
+        "decoder.generator.resblocks.0.adain2.1.fc",
+        "decoder.generator.resblocks.0.adain2.2.fc",
+        "decoder.generator.resblocks.0.convs1.0",
+        "decoder.generator.resblocks.0.convs1.1",
+        "decoder.generator.resblocks.0.convs1.2",
+        "decoder.generator.resblocks.0.convs2.0",
+        "decoder.generator.resblocks.0.convs2.1",
+        "decoder.generator.resblocks.0.convs2.2",
+        "decoder.generator.resblocks.1.adain1.0.fc",
+        "decoder.generator.resblocks.1.adain1.1.fc",
+        "decoder.generator.resblocks.1.adain1.2.fc",
+        "decoder.generator.resblocks.1.adain2.0.fc",
+        "decoder.generator.resblocks.1.adain2.1.fc",
+        "decoder.generator.resblocks.1.adain2.2.fc",
+        "decoder.generator.resblocks.1.convs1.0",
+        "decoder.generator.resblocks.1.convs1.1",
+        "decoder.generator.resblocks.1.convs1.2",
+        "decoder.generator.resblocks.1.convs2.0",
+        "decoder.generator.resblocks.1.convs2.1",
+        "decoder.generator.resblocks.1.convs2.2",
+        "decoder.generator.resblocks.2.adain1.0.fc",
+        "decoder.generator.resblocks.2.adain1.1.fc",
+        "decoder.generator.resblocks.2.adain1.2.fc",
+        "decoder.generator.resblocks.2.adain2.0.fc",
+        "decoder.generator.resblocks.2.adain2.1.fc",
+        "decoder.generator.resblocks.2.adain2.2.fc",
+        "decoder.generator.resblocks.2.convs1.0",
+        "decoder.generator.resblocks.2.convs1.1",
+        "decoder.generator.resblocks.2.convs1.2",
+        "decoder.generator.resblocks.2.convs2.0",
+        "decoder.generator.resblocks.2.convs2.1",
+        "decoder.generator.resblocks.2.convs2.2",
+        "decoder.generator.resblocks.3.adain1.0.fc",
+        "decoder.generator.resblocks.3.adain1.1.fc",
+        "decoder.generator.resblocks.3.adain1.2.fc",
+        "decoder.generator.resblocks.3.adain2.0.fc",
+        "decoder.generator.resblocks.3.adain2.1.fc",
+        "decoder.generator.resblocks.3.adain2.2.fc",
+        "decoder.generator.resblocks.3.convs1.0",
+        "decoder.generator.resblocks.3.convs1.1",
+        "decoder.generator.resblocks.3.convs1.2",
+        "decoder.generator.resblocks.3.convs2.0",
+        "decoder.generator.resblocks.3.convs2.1",
+        "decoder.generator.resblocks.3.convs2.2",
+        "predictor.F0.0.conv1",
+        "predictor.F0.0.conv2",
+        "predictor.F0.0.norm1.fc",
+        "predictor.F0.0.norm2.fc",
+        "predictor.F0.1.conv1",
+        "predictor.F0.1.conv1x1",
+        "predictor.F0.1.conv2",
+        "predictor.F0.1.norm1.fc",
+        "predictor.F0.1.norm2.fc",
+        "predictor.F0.2.conv1",
+        "predictor.F0.2.conv2",
+        "predictor.F0.2.norm1.fc",
+        "predictor.F0.2.norm2.fc",
+        "predictor.F0_proj",
+        "predictor.N.0.conv1",
+        "predictor.N.0.conv2",
+        "predictor.N.0.norm1.fc",
+        "predictor.N.0.norm2.fc",
+        "predictor.N.1.conv1",
+        "predictor.N.1.conv1x1",
+        "predictor.N.1.conv2",
+        "predictor.N.1.norm1.fc",
+        "predictor.N.1.norm2.fc",
+        "predictor.N.2.conv1",
+        "predictor.N.2.conv2",
+        "predictor.N.2.norm1.fc",
+        "predictor.N.2.norm2.fc",
+        "predictor.N_proj",
+        "predictor.lstm",
+        "predictor.shared",
+        "predictor.text_encoder.lstms.0",
+        "predictor.text_encoder.lstms.1.fc",
+        "predictor.text_encoder.lstms.2",
+        "predictor.text_encoder.lstms.3.fc",
+        "predictor.text_encoder.lstms.4",
+        "predictor.text_encoder.lstms.5.fc",
+        "text_encoder.cnn.0.0",
+        "text_encoder.cnn.1.0",
+        "text_encoder.cnn.2.0",
+        "text_encoder.lstm"
+    ],
+    "asr_res_dim": 64,
+    "decoder_out_dim": 512,
+    "hidden_dim": 512,
+    "istftnet": {
+        "resblock_kernel_sizes": [
+            3,
+            3
+        ],
+        "upsample_rates": [
+            10,
+            6
+        ],
+        "upsample_initial_channel": 512,
+        "resblock_dilation_sizes": [
+            [
+                1,
+                3,
+                5
+            ],
+            [
+                1,
+                3,
+                5
+            ]
+        ],
+        "upsample_kernel_sizes": [
+            20,
+            12
+        ],
+        "gen_istft_n_fft": 20,
+        "gen_istft_hop_size": 5
+    },
+    "max_conv_dim": 1024,
+    "max_dur": 50,
+    "model_type": "kitten_tts",
+    "n_layer": 3,
+    "n_mels": 80,
+    "n_token": 178,
+    "plbert": {
+        "num_hidden_layers": 12,
+        "num_attention_heads": 12,
+        "hidden_size": 768,
+        "intermediate_size": 2048,
+        "max_position_embeddings": 512,
+        "embedding_size": 128,
+        "inner_group_num": 1,
+        "num_hidden_groups": 1,
+        "hidden_dropout_prob": 0.0,
+        "attention_probs_dropout_prob": 0.0,
+        "type_vocab_size": 2,
+        "layer_norm_eps": 1e-12
+    },
+    "sample_rate": 24000,
+    "speed_priors": {},
+    "style_dim": 128,
+    "text_encoder_kernel_size": 5,
+    "voice_aliases": {
+        "Bella": "expr-voice-2-f",
+        "Jasper": "expr-voice-2-m",
+        "Luna": "expr-voice-3-f",
+        "Bruno": "expr-voice-3-m",
+        "Rosie": "expr-voice-4-f",
+        "Hugo": "expr-voice-4-m",
+        "Kiki": "expr-voice-5-f",
+        "Leo": "expr-voice-5-m"
+    },
+    "voices_path": "voices.npz"
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:61f5336dd8ca3f5a63a1a9b458755f4dda39067d16806c7700977696a2ef600f
+size 289104072

model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,484 @@

+{
+    "metadata": {
+        "total_size": 289051572,
+        "total_parameters": 73782354
+    },
+    "weight_map": {
+        "bert.embeddings.LayerNorm.bias": "model.safetensors",
+        "bert.embeddings.LayerNorm.weight": "model.safetensors",
+        "bert.embeddings.position_embeddings.weight": "model.safetensors",
+        "bert.embeddings.token_type_embeddings.weight": "model.safetensors",
+        "bert.embeddings.word_embeddings.weight": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.LayerNorm.bias": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.LayerNorm.weight": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.dense.bias": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.dense.weight": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.key.bias": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.key.weight": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.query.bias": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.query.weight": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.value.bias": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.value.weight": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.ffn.bias": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.ffn.weight": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.ffn_output.bias": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.ffn_output.weight": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.full_layer_layer_norm.bias": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.full_layer_layer_norm.weight": "model.safetensors",
+        "bert.encoder.embedding_hidden_mapping_in.bias": "model.safetensors",
+        "bert.encoder.embedding_hidden_mapping_in.weight": "model.safetensors",
+        "bert.pooler.bias": "model.safetensors",
+        "bert.pooler.weight": "model.safetensors",
+        "bert_encoder.bias": "model.safetensors",
+        "bert_encoder.weight": "model.safetensors",
+        "decoder.F0_conv.bias": "model.safetensors",
+        "decoder.F0_conv.weight_g": "model.safetensors",
+        "decoder.F0_conv.weight_v": "model.safetensors",
+        "decoder.N_conv.bias": "model.safetensors",
+        "decoder.N_conv.weight_g": "model.safetensors",
+        "decoder.N_conv.weight_v": "model.safetensors",
+        "decoder.asr_res.0.bias": "model.safetensors",
+        "decoder.asr_res.0.weight_g": "model.safetensors",
+        "decoder.asr_res.0.weight_v": "model.safetensors",
+        "decoder.decode.0.conv1.bias": "model.safetensors",
+        "decoder.decode.0.conv1.weight_g": "model.safetensors",
+        "decoder.decode.0.conv1.weight_v": "model.safetensors",
+        "decoder.decode.0.conv1x1.weight_g": "model.safetensors",
+        "decoder.decode.0.conv1x1.weight_v": "model.safetensors",
+        "decoder.decode.0.conv2.bias": "model.safetensors",
+        "decoder.decode.0.conv2.weight_g": "model.safetensors",
+        "decoder.decode.0.conv2.weight_v": "model.safetensors",
+        "decoder.decode.0.norm1.fc.bias": "model.safetensors",
+        "decoder.decode.0.norm1.fc.weight": "model.safetensors",
+        "decoder.decode.0.norm2.fc.bias": "model.safetensors",
+        "decoder.decode.0.norm2.fc.weight": "model.safetensors",
+        "decoder.decode.1.conv1.bias": "model.safetensors",
+        "decoder.decode.1.conv1.weight_g": "model.safetensors",
+        "decoder.decode.1.conv1.weight_v": "model.safetensors",
+        "decoder.decode.1.conv1x1.weight_g": "model.safetensors",
+        "decoder.decode.1.conv1x1.weight_v": "model.safetensors",
+        "decoder.decode.1.conv2.bias": "model.safetensors",
+        "decoder.decode.1.conv2.weight_g": "model.safetensors",
+        "decoder.decode.1.conv2.weight_v": "model.safetensors",
+        "decoder.decode.1.norm1.fc.bias": "model.safetensors",
+        "decoder.decode.1.norm1.fc.weight": "model.safetensors",
+        "decoder.decode.1.norm2.fc.bias": "model.safetensors",
+        "decoder.decode.1.norm2.fc.weight": "model.safetensors",
+        "decoder.decode.2.conv1.bias": "model.safetensors",
+        "decoder.decode.2.conv1.weight_g": "model.safetensors",
+        "decoder.decode.2.conv1.weight_v": "model.safetensors",
+        "decoder.decode.2.conv1x1.weight_g": "model.safetensors",
+        "decoder.decode.2.conv1x1.weight_v": "model.safetensors",
+        "decoder.decode.2.conv2.bias": "model.safetensors",
+        "decoder.decode.2.conv2.weight_g": "model.safetensors",
+        "decoder.decode.2.conv2.weight_v": "model.safetensors",
+        "decoder.decode.2.norm1.fc.bias": "model.safetensors",
+        "decoder.decode.2.norm1.fc.weight": "model.safetensors",
+        "decoder.decode.2.norm2.fc.bias": "model.safetensors",
+        "decoder.decode.2.norm2.fc.weight": "model.safetensors",
+        "decoder.decode.3.conv1.bias": "model.safetensors",
+        "decoder.decode.3.conv1.weight_g": "model.safetensors",
+        "decoder.decode.3.conv1.weight_v": "model.safetensors",
+        "decoder.decode.3.conv1x1.weight_g": "model.safetensors",
+        "decoder.decode.3.conv1x1.weight_v": "model.safetensors",
+        "decoder.decode.3.conv2.bias": "model.safetensors",
+        "decoder.decode.3.conv2.weight_g": "model.safetensors",
+        "decoder.decode.3.conv2.weight_v": "model.safetensors",
+        "decoder.decode.3.norm1.fc.bias": "model.safetensors",
+        "decoder.decode.3.norm1.fc.weight": "model.safetensors",
+        "decoder.decode.3.norm2.fc.bias": "model.safetensors",
+        "decoder.decode.3.norm2.fc.weight": "model.safetensors",
+        "decoder.decode.3.pool.bias": "model.safetensors",
+        "decoder.decode.3.pool.weight_g": "model.safetensors",
+        "decoder.decode.3.pool.weight_v": "model.safetensors",
+        "decoder.encode.conv1.bias": "model.safetensors",
+        "decoder.encode.conv1.weight_g": "model.safetensors",
+        "decoder.encode.conv1.weight_v": "model.safetensors",
+        "decoder.encode.conv1x1.weight_g": "model.safetensors",
+        "decoder.encode.conv1x1.weight_v": "model.safetensors",
+        "decoder.encode.conv2.bias": "model.safetensors",
+        "decoder.encode.conv2.weight_g": "model.safetensors",
+        "decoder.encode.conv2.weight_v": "model.safetensors",
+        "decoder.encode.norm1.fc.bias": "model.safetensors",
+        "decoder.encode.norm1.fc.weight": "model.safetensors",
+        "decoder.encode.norm2.fc.bias": "model.safetensors",
+        "decoder.encode.norm2.fc.weight": "model.safetensors",
+        "decoder.generator.conv_post.bias": "model.safetensors",
+        "decoder.generator.conv_post.weight_g": "model.safetensors",
+        "decoder.generator.conv_post.weight_v": "model.safetensors",
+        "decoder.generator.m_source.l_linear.bias": "model.safetensors",
+        "decoder.generator.m_source.l_linear.weight": "model.safetensors",
+        "decoder.generator.noise_convs.0.bias": "model.safetensors",
+        "decoder.generator.noise_convs.0.weight": "model.safetensors",
+        "decoder.generator.noise_convs.1.bias": "model.safetensors",
+        "decoder.generator.noise_convs.1.weight": "model.safetensors",
+        "decoder.generator.noise_res.0.adain1.0.fc.bias": "model.safetensors",
+        "decoder.generator.noise_res.0.adain1.0.fc.weight": "model.safetensors",
+        "decoder.generator.noise_res.0.adain1.1.fc.bias": "model.safetensors",
+        "decoder.generator.noise_res.0.adain1.1.fc.weight": "model.safetensors",
+        "decoder.generator.noise_res.0.adain1.2.fc.bias": "model.safetensors",
+        "decoder.generator.noise_res.0.adain1.2.fc.weight": "model.safetensors",
+        "decoder.generator.noise_res.0.adain2.0.fc.bias": "model.safetensors",
+        "decoder.generator.noise_res.0.adain2.0.fc.weight": "model.safetensors",
+        "decoder.generator.noise_res.0.adain2.1.fc.bias": "model.safetensors",
+        "decoder.generator.noise_res.0.adain2.1.fc.weight": "model.safetensors",
+        "decoder.generator.noise_res.0.adain2.2.fc.bias": "model.safetensors",
+        "decoder.generator.noise_res.0.adain2.2.fc.weight": "model.safetensors",
+        "decoder.generator.noise_res.0.alpha1_0": "model.safetensors",
+        "decoder.generator.noise_res.0.alpha1_1": "model.safetensors",
+        "decoder.generator.noise_res.0.alpha1_2": "model.safetensors",
+        "decoder.generator.noise_res.0.alpha2_0": "model.safetensors",
+        "decoder.generator.noise_res.0.alpha2_1": "model.safetensors",
+        "decoder.generator.noise_res.0.alpha2_2": "model.safetensors",
+        "decoder.generator.noise_res.0.convs1.0.bias": "model.safetensors",
+        "decoder.generator.noise_res.0.convs1.0.weight_g": "model.safetensors",
+        "decoder.generator.noise_res.0.convs1.0.weight_v": "model.safetensors",
+        "decoder.generator.noise_res.0.convs1.1.bias": "model.safetensors",
+        "decoder.generator.noise_res.0.convs1.1.weight_g": "model.safetensors",
+        "decoder.generator.noise_res.0.convs1.1.weight_v": "model.safetensors",
+        "decoder.generator.noise_res.0.convs1.2.bias": "model.safetensors",
+        "decoder.generator.noise_res.0.convs1.2.weight_g": "model.safetensors",
+        "decoder.generator.noise_res.0.convs1.2.weight_v": "model.safetensors",
+        "decoder.generator.noise_res.0.convs2.0.bias": "model.safetensors",
+        "decoder.generator.noise_res.0.convs2.0.weight_g": "model.safetensors",
+        "decoder.generator.noise_res.0.convs2.0.weight_v": "model.safetensors",
+        "decoder.generator.noise_res.0.convs2.1.bias": "model.safetensors",
+        "decoder.generator.noise_res.0.convs2.1.weight_g": "model.safetensors",
+        "decoder.generator.noise_res.0.convs2.1.weight_v": "model.safetensors",
+        "decoder.generator.noise_res.0.convs2.2.bias": "model.safetensors",
+        "decoder.generator.noise_res.0.convs2.2.weight_g": "model.safetensors",
+        "decoder.generator.noise_res.0.convs2.2.weight_v": "model.safetensors",
+        "decoder.generator.noise_res.1.adain1.0.fc.bias": "model.safetensors",
+        "decoder.generator.noise_res.1.adain1.0.fc.weight": "model.safetensors",
+        "decoder.generator.noise_res.1.adain1.1.fc.bias": "model.safetensors",
+        "decoder.generator.noise_res.1.adain1.1.fc.weight": "model.safetensors",
+        "decoder.generator.noise_res.1.adain1.2.fc.bias": "model.safetensors",
+        "decoder.generator.noise_res.1.adain1.2.fc.weight": "model.safetensors",
+        "decoder.generator.noise_res.1.adain2.0.fc.bias": "model.safetensors",
+        "decoder.generator.noise_res.1.adain2.0.fc.weight": "model.safetensors",
+        "decoder.generator.noise_res.1.adain2.1.fc.bias": "model.safetensors",
+        "decoder.generator.noise_res.1.adain2.1.fc.weight": "model.safetensors",
+        "decoder.generator.noise_res.1.adain2.2.fc.bias": "model.safetensors",
+        "decoder.generator.noise_res.1.adain2.2.fc.weight": "model.safetensors",
+        "decoder.generator.noise_res.1.alpha1_0": "model.safetensors",
+        "decoder.generator.noise_res.1.alpha1_1": "model.safetensors",
+        "decoder.generator.noise_res.1.alpha1_2": "model.safetensors",
+        "decoder.generator.noise_res.1.alpha2_0": "model.safetensors",
+        "decoder.generator.noise_res.1.alpha2_1": "model.safetensors",
+        "decoder.generator.noise_res.1.alpha2_2": "model.safetensors",
+        "decoder.generator.noise_res.1.convs1.0.bias": "model.safetensors",
+        "decoder.generator.noise_res.1.convs1.0.weight_g": "model.safetensors",
+        "decoder.generator.noise_res.1.convs1.0.weight_v": "model.safetensors",
+        "decoder.generator.noise_res.1.convs1.1.bias": "model.safetensors",
+        "decoder.generator.noise_res.1.convs1.1.weight_g": "model.safetensors",
+        "decoder.generator.noise_res.1.convs1.1.weight_v": "model.safetensors",
+        "decoder.generator.noise_res.1.convs1.2.bias": "model.safetensors",
+        "decoder.generator.noise_res.1.convs1.2.weight_g": "model.safetensors",
+        "decoder.generator.noise_res.1.convs1.2.weight_v": "model.safetensors",
+        "decoder.generator.noise_res.1.convs2.0.bias": "model.safetensors",
+        "decoder.generator.noise_res.1.convs2.0.weight_g": "model.safetensors",
+        "decoder.generator.noise_res.1.convs2.0.weight_v": "model.safetensors",
+        "decoder.generator.noise_res.1.convs2.1.bias": "model.safetensors",
+        "decoder.generator.noise_res.1.convs2.1.weight_g": "model.safetensors",
+        "decoder.generator.noise_res.1.convs2.1.weight_v": "model.safetensors",
+        "decoder.generator.noise_res.1.convs2.2.bias": "model.safetensors",
+        "decoder.generator.noise_res.1.convs2.2.weight_g": "model.safetensors",
+        "decoder.generator.noise_res.1.convs2.2.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.0.adain1.0.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.0.adain1.0.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.0.adain1.1.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.0.adain1.1.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.0.adain1.2.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.0.adain1.2.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.0.adain2.0.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.0.adain2.0.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.0.adain2.1.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.0.adain2.1.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.0.adain2.2.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.0.adain2.2.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.0.alpha1_0": "model.safetensors",
+        "decoder.generator.resblocks.0.alpha1_1": "model.safetensors",
+        "decoder.generator.resblocks.0.alpha1_2": "model.safetensors",
+        "decoder.generator.resblocks.0.alpha2_0": "model.safetensors",
+        "decoder.generator.resblocks.0.alpha2_1": "model.safetensors",
+        "decoder.generator.resblocks.0.alpha2_2": "model.safetensors",
+        "decoder.generator.resblocks.0.convs1.0.bias": "model.safetensors",
+        "decoder.generator.resblocks.0.convs1.0.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.0.convs1.0.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.0.convs1.1.bias": "model.safetensors",
+        "decoder.generator.resblocks.0.convs1.1.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.0.convs1.1.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.0.convs1.2.bias": "model.safetensors",
+        "decoder.generator.resblocks.0.convs1.2.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.0.convs1.2.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.0.convs2.0.bias": "model.safetensors",
+        "decoder.generator.resblocks.0.convs2.0.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.0.convs2.0.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.0.convs2.1.bias": "model.safetensors",
+        "decoder.generator.resblocks.0.convs2.1.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.0.convs2.1.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.0.convs2.2.bias": "model.safetensors",
+        "decoder.generator.resblocks.0.convs2.2.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.0.convs2.2.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.1.adain1.0.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.1.adain1.0.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.1.adain1.1.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.1.adain1.1.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.1.adain1.2.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.1.adain1.2.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.1.adain2.0.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.1.adain2.0.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.1.adain2.1.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.1.adain2.1.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.1.adain2.2.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.1.adain2.2.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.1.alpha1_0": "model.safetensors",
+        "decoder.generator.resblocks.1.alpha1_1": "model.safetensors",
+        "decoder.generator.resblocks.1.alpha1_2": "model.safetensors",
+        "decoder.generator.resblocks.1.alpha2_0": "model.safetensors",
+        "decoder.generator.resblocks.1.alpha2_1": "model.safetensors",
+        "decoder.generator.resblocks.1.alpha2_2": "model.safetensors",
+        "decoder.generator.resblocks.1.convs1.0.bias": "model.safetensors",
+        "decoder.generator.resblocks.1.convs1.0.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.1.convs1.0.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.1.convs1.1.bias": "model.safetensors",
+        "decoder.generator.resblocks.1.convs1.1.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.1.convs1.1.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.1.convs1.2.bias": "model.safetensors",
+        "decoder.generator.resblocks.1.convs1.2.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.1.convs1.2.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.1.convs2.0.bias": "model.safetensors",
+        "decoder.generator.resblocks.1.convs2.0.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.1.convs2.0.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.1.convs2.1.bias": "model.safetensors",
+        "decoder.generator.resblocks.1.convs2.1.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.1.convs2.1.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.1.convs2.2.bias": "model.safetensors",
+        "decoder.generator.resblocks.1.convs2.2.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.1.convs2.2.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.2.adain1.0.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.2.adain1.0.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.2.adain1.1.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.2.adain1.1.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.2.adain1.2.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.2.adain1.2.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.2.adain2.0.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.2.adain2.0.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.2.adain2.1.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.2.adain2.1.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.2.adain2.2.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.2.adain2.2.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.2.alpha1_0": "model.safetensors",
+        "decoder.generator.resblocks.2.alpha1_1": "model.safetensors",
+        "decoder.generator.resblocks.2.alpha1_2": "model.safetensors",
+        "decoder.generator.resblocks.2.alpha2_0": "model.safetensors",
+        "decoder.generator.resblocks.2.alpha2_1": "model.safetensors",
+        "decoder.generator.resblocks.2.alpha2_2": "model.safetensors",
+        "decoder.generator.resblocks.2.convs1.0.bias": "model.safetensors",
+        "decoder.generator.resblocks.2.convs1.0.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.2.convs1.0.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.2.convs1.1.bias": "model.safetensors",
+        "decoder.generator.resblocks.2.convs1.1.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.2.convs1.1.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.2.convs1.2.bias": "model.safetensors",
+        "decoder.generator.resblocks.2.convs1.2.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.2.convs1.2.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.2.convs2.0.bias": "model.safetensors",
+        "decoder.generator.resblocks.2.convs2.0.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.2.convs2.0.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.2.convs2.1.bias": "model.safetensors",
+        "decoder.generator.resblocks.2.convs2.1.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.2.convs2.1.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.2.convs2.2.bias": "model.safetensors",
+        "decoder.generator.resblocks.2.convs2.2.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.2.convs2.2.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.3.adain1.0.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.3.adain1.0.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.3.adain1.1.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.3.adain1.1.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.3.adain1.2.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.3.adain1.2.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.3.adain2.0.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.3.adain2.0.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.3.adain2.1.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.3.adain2.1.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.3.adain2.2.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.3.adain2.2.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.3.alpha1_0": "model.safetensors",
+        "decoder.generator.resblocks.3.alpha1_1": "model.safetensors",
+        "decoder.generator.resblocks.3.alpha1_2": "model.safetensors",
+        "decoder.generator.resblocks.3.alpha2_0": "model.safetensors",
+        "decoder.generator.resblocks.3.alpha2_1": "model.safetensors",
+        "decoder.generator.resblocks.3.alpha2_2": "model.safetensors",
+        "decoder.generator.resblocks.3.convs1.0.bias": "model.safetensors",
+        "decoder.generator.resblocks.3.convs1.0.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.3.convs1.0.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.3.convs1.1.bias": "model.safetensors",
+        "decoder.generator.resblocks.3.convs1.1.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.3.convs1.1.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.3.convs1.2.bias": "model.safetensors",
+        "decoder.generator.resblocks.3.convs1.2.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.3.convs1.2.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.3.convs2.0.bias": "model.safetensors",
+        "decoder.generator.resblocks.3.convs2.0.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.3.convs2.0.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.3.convs2.1.bias": "model.safetensors",
+        "decoder.generator.resblocks.3.convs2.1.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.3.convs2.1.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.3.convs2.2.bias": "model.safetensors",
+        "decoder.generator.resblocks.3.convs2.2.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.3.convs2.2.weight_v": "model.safetensors",
+        "decoder.generator.ups.0.bias": "model.safetensors",
+        "decoder.generator.ups.0.weight_g": "model.safetensors",
+        "decoder.generator.ups.0.weight_v": "model.safetensors",
+        "decoder.generator.ups.1.bias": "model.safetensors",
+        "decoder.generator.ups.1.weight_g": "model.safetensors",
+        "decoder.generator.ups.1.weight_v": "model.safetensors",
+        "predictor.F0.0.conv1.bias": "model.safetensors",
+        "predictor.F0.0.conv1.weight_g": "model.safetensors",
+        "predictor.F0.0.conv1.weight_v": "model.safetensors",
+        "predictor.F0.0.conv2.bias": "model.safetensors",
+        "predictor.F0.0.conv2.weight_g": "model.safetensors",
+        "predictor.F0.0.conv2.weight_v": "model.safetensors",
+        "predictor.F0.0.norm1.fc.bias": "model.safetensors",
+        "predictor.F0.0.norm1.fc.weight": "model.safetensors",
+        "predictor.F0.0.norm2.fc.bias": "model.safetensors",
+        "predictor.F0.0.norm2.fc.weight": "model.safetensors",
+        "predictor.F0.1.conv1.bias": "model.safetensors",
+        "predictor.F0.1.conv1.weight_g": "model.safetensors",
+        "predictor.F0.1.conv1.weight_v": "model.safetensors",
+        "predictor.F0.1.conv1x1.weight_g": "model.safetensors",
+        "predictor.F0.1.conv1x1.weight_v": "model.safetensors",
+        "predictor.F0.1.conv2.bias": "model.safetensors",
+        "predictor.F0.1.conv2.weight_g": "model.safetensors",
+        "predictor.F0.1.conv2.weight_v": "model.safetensors",
+        "predictor.F0.1.norm1.fc.bias": "model.safetensors",
+        "predictor.F0.1.norm1.fc.weight": "model.safetensors",
+        "predictor.F0.1.norm2.fc.bias": "model.safetensors",
+        "predictor.F0.1.norm2.fc.weight": "model.safetensors",
+        "predictor.F0.1.pool.bias": "model.safetensors",
+        "predictor.F0.1.pool.weight_g": "model.safetensors",
+        "predictor.F0.1.pool.weight_v": "model.safetensors",
+        "predictor.F0.2.conv1.bias": "model.safetensors",
+        "predictor.F0.2.conv1.weight_g": "model.safetensors",
+        "predictor.F0.2.conv1.weight_v": "model.safetensors",
+        "predictor.F0.2.conv2.bias": "model.safetensors",
+        "predictor.F0.2.conv2.weight_g": "model.safetensors",
+        "predictor.F0.2.conv2.weight_v": "model.safetensors",
+        "predictor.F0.2.norm1.fc.bias": "model.safetensors",
+        "predictor.F0.2.norm1.fc.weight": "model.safetensors",
+        "predictor.F0.2.norm2.fc.bias": "model.safetensors",
+        "predictor.F0.2.norm2.fc.weight": "model.safetensors",
+        "predictor.F0_proj.bias": "model.safetensors",
+        "predictor.F0_proj.weight": "model.safetensors",
+        "predictor.N.0.conv1.bias": "model.safetensors",
+        "predictor.N.0.conv1.weight_g": "model.safetensors",
+        "predictor.N.0.conv1.weight_v": "model.safetensors",
+        "predictor.N.0.conv2.bias": "model.safetensors",
+        "predictor.N.0.conv2.weight_g": "model.safetensors",
+        "predictor.N.0.conv2.weight_v": "model.safetensors",
+        "predictor.N.0.norm1.fc.bias": "model.safetensors",
+        "predictor.N.0.norm1.fc.weight": "model.safetensors",
+        "predictor.N.0.norm2.fc.bias": "model.safetensors",
+        "predictor.N.0.norm2.fc.weight": "model.safetensors",
+        "predictor.N.1.conv1.bias": "model.safetensors",
+        "predictor.N.1.conv1.weight_g": "model.safetensors",
+        "predictor.N.1.conv1.weight_v": "model.safetensors",
+        "predictor.N.1.conv1x1.weight_g": "model.safetensors",
+        "predictor.N.1.conv1x1.weight_v": "model.safetensors",
+        "predictor.N.1.conv2.bias": "model.safetensors",
+        "predictor.N.1.conv2.weight_g": "model.safetensors",
+        "predictor.N.1.conv2.weight_v": "model.safetensors",
+        "predictor.N.1.norm1.fc.bias": "model.safetensors",
+        "predictor.N.1.norm1.fc.weight": "model.safetensors",
+        "predictor.N.1.norm2.fc.bias": "model.safetensors",
+        "predictor.N.1.norm2.fc.weight": "model.safetensors",
+        "predictor.N.1.pool.bias": "model.safetensors",
+        "predictor.N.1.pool.weight_g": "model.safetensors",
+        "predictor.N.1.pool.weight_v": "model.safetensors",
+        "predictor.N.2.conv1.bias": "model.safetensors",
+        "predictor.N.2.conv1.weight_g": "model.safetensors",
+        "predictor.N.2.conv1.weight_v": "model.safetensors",
+        "predictor.N.2.conv2.bias": "model.safetensors",
+        "predictor.N.2.conv2.weight_g": "model.safetensors",
+        "predictor.N.2.conv2.weight_v": "model.safetensors",
+        "predictor.N.2.norm1.fc.bias": "model.safetensors",
+        "predictor.N.2.norm1.fc.weight": "model.safetensors",
+        "predictor.N.2.norm2.fc.bias": "model.safetensors",
+        "predictor.N.2.norm2.fc.weight": "model.safetensors",
+        "predictor.N_proj.bias": "model.safetensors",
+        "predictor.N_proj.weight": "model.safetensors",
+        "predictor.duration_proj.linear_layer.bias": "model.safetensors",
+        "predictor.duration_proj.linear_layer.weight": "model.safetensors",
+        "predictor.lstm.Wh_backward": "model.safetensors",
+        "predictor.lstm.Wh_forward": "model.safetensors",
+        "predictor.lstm.Wx_backward": "model.safetensors",
+        "predictor.lstm.Wx_forward": "model.safetensors",
+        "predictor.lstm.bias_hh_backward": "model.safetensors",
+        "predictor.lstm.bias_hh_forward": "model.safetensors",
+        "predictor.lstm.bias_ih_backward": "model.safetensors",
+        "predictor.lstm.bias_ih_forward": "model.safetensors",
+        "predictor.shared.Wh_backward": "model.safetensors",
+        "predictor.shared.Wh_forward": "model.safetensors",
+        "predictor.shared.Wx_backward": "model.safetensors",
+        "predictor.shared.Wx_forward": "model.safetensors",
+        "predictor.shared.bias_hh_backward": "model.safetensors",
+        "predictor.shared.bias_hh_forward": "model.safetensors",
+        "predictor.shared.bias_ih_backward": "model.safetensors",
+        "predictor.shared.bias_ih_forward": "model.safetensors",
+        "predictor.text_encoder.lstms.0.Wh_backward": "model.safetensors",
+        "predictor.text_encoder.lstms.0.Wh_forward": "model.safetensors",
+        "predictor.text_encoder.lstms.0.Wx_backward": "model.safetensors",
+        "predictor.text_encoder.lstms.0.Wx_forward": "model.safetensors",
+        "predictor.text_encoder.lstms.0.bias_hh_backward": "model.safetensors",
+        "predictor.text_encoder.lstms.0.bias_hh_forward": "model.safetensors",
+        "predictor.text_encoder.lstms.0.bias_ih_backward": "model.safetensors",
+        "predictor.text_encoder.lstms.0.bias_ih_forward": "model.safetensors",
+        "predictor.text_encoder.lstms.1.fc.bias": "model.safetensors",
+        "predictor.text_encoder.lstms.1.fc.weight": "model.safetensors",
+        "predictor.text_encoder.lstms.2.Wh_backward": "model.safetensors",
+        "predictor.text_encoder.lstms.2.Wh_forward": "model.safetensors",
+        "predictor.text_encoder.lstms.2.Wx_backward": "model.safetensors",
+        "predictor.text_encoder.lstms.2.Wx_forward": "model.safetensors",
+        "predictor.text_encoder.lstms.2.bias_hh_backward": "model.safetensors",
+        "predictor.text_encoder.lstms.2.bias_hh_forward": "model.safetensors",
+        "predictor.text_encoder.lstms.2.bias_ih_backward": "model.safetensors",
+        "predictor.text_encoder.lstms.2.bias_ih_forward": "model.safetensors",
+        "predictor.text_encoder.lstms.3.fc.bias": "model.safetensors",
+        "predictor.text_encoder.lstms.3.fc.weight": "model.safetensors",
+        "predictor.text_encoder.lstms.4.Wh_backward": "model.safetensors",
+        "predictor.text_encoder.lstms.4.Wh_forward": "model.safetensors",
+        "predictor.text_encoder.lstms.4.Wx_backward": "model.safetensors",
+        "predictor.text_encoder.lstms.4.Wx_forward": "model.safetensors",
+        "predictor.text_encoder.lstms.4.bias_hh_backward": "model.safetensors",
+        "predictor.text_encoder.lstms.4.bias_hh_forward": "model.safetensors",
+        "predictor.text_encoder.lstms.4.bias_ih_backward": "model.safetensors",
+        "predictor.text_encoder.lstms.4.bias_ih_forward": "model.safetensors",
+        "predictor.text_encoder.lstms.5.fc.bias": "model.safetensors",
+        "predictor.text_encoder.lstms.5.fc.weight": "model.safetensors",
+        "text_encoder.cnn.0.0.bias": "model.safetensors",
+        "text_encoder.cnn.0.0.weight_g": "model.safetensors",
+        "text_encoder.cnn.0.0.weight_v": "model.safetensors",
+        "text_encoder.cnn.0.1.bias": "model.safetensors",
+        "text_encoder.cnn.0.1.weight": "model.safetensors",
+        "text_encoder.cnn.1.0.bias": "model.safetensors",
+        "text_encoder.cnn.1.0.weight_g": "model.safetensors",
+        "text_encoder.cnn.1.0.weight_v": "model.safetensors",
+        "text_encoder.cnn.1.1.bias": "model.safetensors",
+        "text_encoder.cnn.1.1.weight": "model.safetensors",
+        "text_encoder.cnn.2.0.bias": "model.safetensors",
+        "text_encoder.cnn.2.0.weight_g": "model.safetensors",
+        "text_encoder.cnn.2.0.weight_v": "model.safetensors",
+        "text_encoder.cnn.2.1.bias": "model.safetensors",
+        "text_encoder.cnn.2.1.weight": "model.safetensors",
+        "text_encoder.embedding.weight": "model.safetensors",
+        "text_encoder.lstm.Wh_backward": "model.safetensors",
+        "text_encoder.lstm.Wh_forward": "model.safetensors",
+        "text_encoder.lstm.Wx_backward": "model.safetensors",
+        "text_encoder.lstm.Wx_forward": "model.safetensors",
+        "text_encoder.lstm.bias_hh_backward": "model.safetensors",
+        "text_encoder.lstm.bias_hh_forward": "model.safetensors",
+        "text_encoder.lstm.bias_ih_backward": "model.safetensors",
+        "text_encoder.lstm.bias_ih_forward": "model.safetensors"
+    }
+}

voices.npz ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:40ad2638952b77b7b2f30127e2608e169fc69dd256b53bd8aaa3409a33193c42
+size 3278902