Add MLX 4-bit quantized model

Browse files

Files changed (5) hide show

README.md +38 -0
config.json +228 -0
model.safetensors +3 -0
model.safetensors.index.json +634 -0
voices.npz +3 -0

README.md ADDED Viewed

	@@ -0,0 +1,38 @@

+---
+tags:
+- mlx
+- text-to-speech
+- kitten-tts
+---
+# mlx-community/kitten-tts-micro-0.8-4bit
+This is the **INT4 (MLX 4-bit)** MLX conversion of `KittenML/kitten-tts-micro-0.8`.
+## Usage
+```bash
+pip install -U mlx-audio
+```
+```bash
+python -m mlx_audio.tts.generate --model mlx-community/kitten-tts-micro-0.8-4bit --text "This is a local MLX test voice." --voice "expr-voice-5-m"
+```
+## Inference Notes
+The MLX implementation includes small end-of-utterance smoothing to prevent abrupt cutoffs.
+You can override it with `fade_out_ms=0` and `tail_silence_ms=0` in `Model.generate()`.
+## Conversion Notes / Fixes
+- AdaIN `fc.weight` orientation was corrected (ONNX stores as `(in, out)` even when square).
+- AdaIN Snake `alpha` parameters are loaded and used for generator resblocks.
+- ConvTranspose output padding matches the original (right-side pad for `output_padding=1`).
+- Phase slice is passed through `sin` before ISTFT, matching the ONNX graph.
+- ISTFT uses normalized windowing without phase unwrap (to match original behavior).
+- Tail trim + dynamic fade-out + tail silence are applied at inference time to avoid a trailing spurt.
+## Original Model
+Refer to the original model card for details: https://huggingface.co/KittenML/kitten-tts-micro-0.8

config.json ADDED Viewed

	@@ -0,0 +1,228 @@

+{
+    "activation_quant_modules": [
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.key",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.query",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.value",
+        "bert.encoder.embedding_hidden_mapping_in",
+        "bert_encoder",
+        "decoder.asr_res.0",
+        "decoder.decode.0.conv1",
+        "decoder.decode.0.conv1x1",
+        "decoder.decode.0.conv2",
+        "decoder.decode.0.norm1.fc",
+        "decoder.decode.0.norm2.fc",
+        "decoder.decode.1.conv1",
+        "decoder.decode.1.conv1x1",
+        "decoder.decode.1.conv2",
+        "decoder.decode.1.norm1.fc",
+        "decoder.decode.1.norm2.fc",
+        "decoder.decode.2.conv1",
+        "decoder.decode.2.conv1x1",
+        "decoder.decode.2.conv2",
+        "decoder.decode.2.norm1.fc",
+        "decoder.decode.2.norm2.fc",
+        "decoder.decode.3.conv1",
+        "decoder.decode.3.conv1x1",
+        "decoder.decode.3.conv2",
+        "decoder.decode.3.norm1.fc",
+        "decoder.decode.3.norm2.fc",
+        "decoder.encode.conv1",
+        "decoder.encode.conv1x1",
+        "decoder.encode.conv2",
+        "decoder.encode.norm1.fc",
+        "decoder.encode.norm2.fc",
+        "decoder.generator.conv_post",
+        "decoder.generator.noise_convs.0",
+        "decoder.generator.noise_convs.1",
+        "decoder.generator.noise_res.0.adain1.0.fc",
+        "decoder.generator.noise_res.0.adain1.1.fc",
+        "decoder.generator.noise_res.0.adain1.2.fc",
+        "decoder.generator.noise_res.0.adain2.0.fc",
+        "decoder.generator.noise_res.0.adain2.1.fc",
+        "decoder.generator.noise_res.0.adain2.2.fc",
+        "decoder.generator.noise_res.0.convs1.0",
+        "decoder.generator.noise_res.0.convs1.1",
+        "decoder.generator.noise_res.0.convs1.2",
+        "decoder.generator.noise_res.0.convs2.0",
+        "decoder.generator.noise_res.0.convs2.1",
+        "decoder.generator.noise_res.0.convs2.2",
+        "decoder.generator.noise_res.1.adain1.0.fc",
+        "decoder.generator.noise_res.1.adain1.1.fc",
+        "decoder.generator.noise_res.1.adain1.2.fc",
+        "decoder.generator.noise_res.1.adain2.0.fc",
+        "decoder.generator.noise_res.1.adain2.1.fc",
+        "decoder.generator.noise_res.1.adain2.2.fc",
+        "decoder.generator.noise_res.1.convs1.0",
+        "decoder.generator.noise_res.1.convs1.1",
+        "decoder.generator.noise_res.1.convs1.2",
+        "decoder.generator.noise_res.1.convs2.0",
+        "decoder.generator.noise_res.1.convs2.1",
+        "decoder.generator.noise_res.1.convs2.2",
+        "decoder.generator.resblocks.0.adain1.0.fc",
+        "decoder.generator.resblocks.0.adain1.1.fc",
+        "decoder.generator.resblocks.0.adain1.2.fc",
+        "decoder.generator.resblocks.0.adain2.0.fc",
+        "decoder.generator.resblocks.0.adain2.1.fc",
+        "decoder.generator.resblocks.0.adain2.2.fc",
+        "decoder.generator.resblocks.0.convs1.0",
+        "decoder.generator.resblocks.0.convs1.1",
+        "decoder.generator.resblocks.0.convs1.2",
+        "decoder.generator.resblocks.0.convs2.0",
+        "decoder.generator.resblocks.0.convs2.1",
+        "decoder.generator.resblocks.0.convs2.2",
+        "decoder.generator.resblocks.1.adain1.0.fc",
+        "decoder.generator.resblocks.1.adain1.1.fc",
+        "decoder.generator.resblocks.1.adain1.2.fc",
+        "decoder.generator.resblocks.1.adain2.0.fc",
+        "decoder.generator.resblocks.1.adain2.1.fc",
+        "decoder.generator.resblocks.1.adain2.2.fc",
+        "decoder.generator.resblocks.1.convs1.0",
+        "decoder.generator.resblocks.1.convs1.1",
+        "decoder.generator.resblocks.1.convs1.2",
+        "decoder.generator.resblocks.1.convs2.0",
+        "decoder.generator.resblocks.1.convs2.1",
+        "decoder.generator.resblocks.1.convs2.2",
+        "decoder.generator.resblocks.2.adain1.0.fc",
+        "decoder.generator.resblocks.2.adain1.1.fc",
+        "decoder.generator.resblocks.2.adain1.2.fc",
+        "decoder.generator.resblocks.2.adain2.0.fc",
+        "decoder.generator.resblocks.2.adain2.1.fc",
+        "decoder.generator.resblocks.2.adain2.2.fc",
+        "decoder.generator.resblocks.2.convs1.0",
+        "decoder.generator.resblocks.2.convs1.1",
+        "decoder.generator.resblocks.2.convs1.2",
+        "decoder.generator.resblocks.2.convs2.0",
+        "decoder.generator.resblocks.2.convs2.1",
+        "decoder.generator.resblocks.2.convs2.2",
+        "decoder.generator.resblocks.3.adain1.0.fc",
+        "decoder.generator.resblocks.3.adain1.1.fc",
+        "decoder.generator.resblocks.3.adain1.2.fc",
+        "decoder.generator.resblocks.3.adain2.0.fc",
+        "decoder.generator.resblocks.3.adain2.1.fc",
+        "decoder.generator.resblocks.3.adain2.2.fc",
+        "decoder.generator.resblocks.3.convs1.0",
+        "decoder.generator.resblocks.3.convs1.1",
+        "decoder.generator.resblocks.3.convs1.2",
+        "decoder.generator.resblocks.3.convs2.0",
+        "decoder.generator.resblocks.3.convs2.1",
+        "decoder.generator.resblocks.3.convs2.2",
+        "predictor.F0.0.conv1",
+        "predictor.F0.0.conv2",
+        "predictor.F0.0.norm1.fc",
+        "predictor.F0.0.norm2.fc",
+        "predictor.F0.1.conv1",
+        "predictor.F0.1.conv1x1",
+        "predictor.F0.1.conv2",
+        "predictor.F0.1.norm1.fc",
+        "predictor.F0.1.norm2.fc",
+        "predictor.F0.2.conv1",
+        "predictor.F0.2.conv2",
+        "predictor.F0.2.norm1.fc",
+        "predictor.F0.2.norm2.fc",
+        "predictor.F0_proj",
+        "predictor.N.0.conv1",
+        "predictor.N.0.conv2",
+        "predictor.N.0.norm1.fc",
+        "predictor.N.0.norm2.fc",
+        "predictor.N.1.conv1",
+        "predictor.N.1.conv1x1",
+        "predictor.N.1.conv2",
+        "predictor.N.1.norm1.fc",
+        "predictor.N.1.norm2.fc",
+        "predictor.N.2.conv1",
+        "predictor.N.2.conv2",
+        "predictor.N.2.norm1.fc",
+        "predictor.N.2.norm2.fc",
+        "predictor.N_proj",
+        "predictor.duration_proj.linear_layer",
+        "predictor.lstm",
+        "predictor.shared",
+        "predictor.text_encoder.lstms.0",
+        "predictor.text_encoder.lstms.1.fc",
+        "predictor.text_encoder.lstms.2",
+        "predictor.text_encoder.lstms.3.fc",
+        "predictor.text_encoder.lstms.4",
+        "predictor.text_encoder.lstms.5.fc",
+        "text_encoder.cnn.0.0",
+        "text_encoder.cnn.1.0",
+        "text_encoder.cnn.2.0",
+        "text_encoder.lstm"
+    ],
+    "asr_res_dim": 64,
+    "decoder_out_dim": 256,
+    "hidden_dim": 512,
+    "istftnet": {
+        "resblock_kernel_sizes": [
+            3,
+            3
+        ],
+        "upsample_rates": [
+            10,
+            6
+        ],
+        "upsample_initial_channel": 256,
+        "resblock_dilation_sizes": [
+            [
+                1,
+                3,
+                5
+            ],
+            [
+                1,
+                3,
+                5
+            ]
+        ],
+        "upsample_kernel_sizes": [
+            20,
+            12
+        ],
+        "gen_istft_n_fft": 20,
+        "gen_istft_hop_size": 5
+    },
+    "max_conv_dim": 256,
+    "max_dur": 50,
+    "model_type": "kitten_tts",
+    "n_layer": 3,
+    "n_mels": 80,
+    "n_token": 178,
+    "plbert": {
+        "num_hidden_layers": 12,
+        "num_attention_heads": 12,
+        "hidden_size": 768,
+        "intermediate_size": 2048,
+        "max_position_embeddings": 512,
+        "embedding_size": 128,
+        "inner_group_num": 1,
+        "num_hidden_groups": 1,
+        "hidden_dropout_prob": 0.0,
+        "attention_probs_dropout_prob": 0.0,
+        "type_vocab_size": 2,
+        "layer_norm_eps": 1e-12
+    },
+    "quantization": {
+        "group_size": 64,
+        "bits": 4,
+        "mode": "affine"
+    },
+    "quantization_config": {
+        "group_size": 64,
+        "bits": 4,
+        "mode": "affine"
+    },
+    "sample_rate": 24000,
+    "speed_priors": {},
+    "style_dim": 128,
+    "text_encoder_kernel_size": 5,
+    "voice_aliases": {
+        "Bella": "expr-voice-2-f",
+        "Jasper": "expr-voice-2-m",
+        "Luna": "expr-voice-3-f",
+        "Bruno": "expr-voice-3-m",
+        "Rosie": "expr-voice-4-f",
+        "Hugo": "expr-voice-4-m",
+        "Kiki": "expr-voice-5-f",
+        "Leo": "expr-voice-5-m"
+    },
+    "voices_path": "voices.npz"
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9edc51ac0f94c26fdffc2ecabcdd9153479e215122c222521bc2177ae35ecdc6
+size 106623089

model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,634 @@

+{
+    "metadata": {
+        "total_size": 106554804,
+        "total_parameters": 35545426
+    },
+    "weight_map": {
+        "bert.embeddings.LayerNorm.bias": "model.safetensors",
+        "bert.embeddings.LayerNorm.weight": "model.safetensors",
+        "bert.embeddings.position_embeddings.biases": "model.safetensors",
+        "bert.embeddings.position_embeddings.scales": "model.safetensors",
+        "bert.embeddings.position_embeddings.weight": "model.safetensors",
+        "bert.embeddings.token_type_embeddings.biases": "model.safetensors",
+        "bert.embeddings.token_type_embeddings.scales": "model.safetensors",
+        "bert.embeddings.token_type_embeddings.weight": "model.safetensors",
+        "bert.embeddings.word_embeddings.biases": "model.safetensors",
+        "bert.embeddings.word_embeddings.scales": "model.safetensors",
+        "bert.embeddings.word_embeddings.weight": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.LayerNorm.bias": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.LayerNorm.weight": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.dense.bias": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.dense.biases": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.dense.scales": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.dense.weight": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.key.bias": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.key.biases": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.key.scales": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.key.weight": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.query.bias": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.query.biases": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.query.scales": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.query.weight": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.value.bias": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.value.biases": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.value.scales": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.attention.value.weight": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.ffn.bias": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.ffn.biases": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.ffn.scales": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.ffn.weight": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.ffn_output.bias": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.ffn_output.biases": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.ffn_output.scales": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.ffn_output.weight": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.full_layer_layer_norm.bias": "model.safetensors",
+        "bert.encoder.albert_layer_groups.0.albert_layers.0.full_layer_layer_norm.weight": "model.safetensors",
+        "bert.encoder.embedding_hidden_mapping_in.bias": "model.safetensors",
+        "bert.encoder.embedding_hidden_mapping_in.biases": "model.safetensors",
+        "bert.encoder.embedding_hidden_mapping_in.scales": "model.safetensors",
+        "bert.encoder.embedding_hidden_mapping_in.weight": "model.safetensors",
+        "bert.pooler.bias": "model.safetensors",
+        "bert.pooler.biases": "model.safetensors",
+        "bert.pooler.scales": "model.safetensors",
+        "bert.pooler.weight": "model.safetensors",
+        "bert_encoder.bias": "model.safetensors",
+        "bert_encoder.biases": "model.safetensors",
+        "bert_encoder.scales": "model.safetensors",
+        "bert_encoder.weight": "model.safetensors",
+        "decoder.F0_conv.bias": "model.safetensors",
+        "decoder.F0_conv.weight_g": "model.safetensors",
+        "decoder.F0_conv.weight_v": "model.safetensors",
+        "decoder.N_conv.bias": "model.safetensors",
+        "decoder.N_conv.weight_g": "model.safetensors",
+        "decoder.N_conv.weight_v": "model.safetensors",
+        "decoder.asr_res.0.bias": "model.safetensors",
+        "decoder.asr_res.0.weight_g": "model.safetensors",
+        "decoder.asr_res.0.weight_v": "model.safetensors",
+        "decoder.decode.0.conv1.bias": "model.safetensors",
+        "decoder.decode.0.conv1.weight_g": "model.safetensors",
+        "decoder.decode.0.conv1.weight_v": "model.safetensors",
+        "decoder.decode.0.conv1x1.weight_g": "model.safetensors",
+        "decoder.decode.0.conv1x1.weight_v": "model.safetensors",
+        "decoder.decode.0.conv2.bias": "model.safetensors",
+        "decoder.decode.0.conv2.weight_g": "model.safetensors",
+        "decoder.decode.0.conv2.weight_v": "model.safetensors",
+        "decoder.decode.0.norm1.fc.bias": "model.safetensors",
+        "decoder.decode.0.norm1.fc.biases": "model.safetensors",
+        "decoder.decode.0.norm1.fc.scales": "model.safetensors",
+        "decoder.decode.0.norm1.fc.weight": "model.safetensors",
+        "decoder.decode.0.norm2.fc.bias": "model.safetensors",
+        "decoder.decode.0.norm2.fc.biases": "model.safetensors",
+        "decoder.decode.0.norm2.fc.scales": "model.safetensors",
+        "decoder.decode.0.norm2.fc.weight": "model.safetensors",
+        "decoder.decode.1.conv1.bias": "model.safetensors",
+        "decoder.decode.1.conv1.weight_g": "model.safetensors",
+        "decoder.decode.1.conv1.weight_v": "model.safetensors",
+        "decoder.decode.1.conv1x1.weight_g": "model.safetensors",
+        "decoder.decode.1.conv1x1.weight_v": "model.safetensors",
+        "decoder.decode.1.conv2.bias": "model.safetensors",
+        "decoder.decode.1.conv2.weight_g": "model.safetensors",
+        "decoder.decode.1.conv2.weight_v": "model.safetensors",
+        "decoder.decode.1.norm1.fc.bias": "model.safetensors",
+        "decoder.decode.1.norm1.fc.biases": "model.safetensors",
+        "decoder.decode.1.norm1.fc.scales": "model.safetensors",
+        "decoder.decode.1.norm1.fc.weight": "model.safetensors",
+        "decoder.decode.1.norm2.fc.bias": "model.safetensors",
+        "decoder.decode.1.norm2.fc.biases": "model.safetensors",
+        "decoder.decode.1.norm2.fc.scales": "model.safetensors",
+        "decoder.decode.1.norm2.fc.weight": "model.safetensors",
+        "decoder.decode.2.conv1.bias": "model.safetensors",
+        "decoder.decode.2.conv1.weight_g": "model.safetensors",
+        "decoder.decode.2.conv1.weight_v": "model.safetensors",
+        "decoder.decode.2.conv1x1.weight_g": "model.safetensors",
+        "decoder.decode.2.conv1x1.weight_v": "model.safetensors",
+        "decoder.decode.2.conv2.bias": "model.safetensors",
+        "decoder.decode.2.conv2.weight_g": "model.safetensors",
+        "decoder.decode.2.conv2.weight_v": "model.safetensors",
+        "decoder.decode.2.norm1.fc.bias": "model.safetensors",
+        "decoder.decode.2.norm1.fc.biases": "model.safetensors",
+        "decoder.decode.2.norm1.fc.scales": "model.safetensors",
+        "decoder.decode.2.norm1.fc.weight": "model.safetensors",
+        "decoder.decode.2.norm2.fc.bias": "model.safetensors",
+        "decoder.decode.2.norm2.fc.biases": "model.safetensors",
+        "decoder.decode.2.norm2.fc.scales": "model.safetensors",
+        "decoder.decode.2.norm2.fc.weight": "model.safetensors",
+        "decoder.decode.3.conv1.bias": "model.safetensors",
+        "decoder.decode.3.conv1.weight_g": "model.safetensors",
+        "decoder.decode.3.conv1.weight_v": "model.safetensors",
+        "decoder.decode.3.conv1x1.weight_g": "model.safetensors",
+        "decoder.decode.3.conv1x1.weight_v": "model.safetensors",
+        "decoder.decode.3.conv2.bias": "model.safetensors",
+        "decoder.decode.3.conv2.weight_g": "model.safetensors",
+        "decoder.decode.3.conv2.weight_v": "model.safetensors",
+        "decoder.decode.3.norm1.fc.bias": "model.safetensors",
+        "decoder.decode.3.norm1.fc.biases": "model.safetensors",
+        "decoder.decode.3.norm1.fc.scales": "model.safetensors",
+        "decoder.decode.3.norm1.fc.weight": "model.safetensors",
+        "decoder.decode.3.norm2.fc.bias": "model.safetensors",
+        "decoder.decode.3.norm2.fc.biases": "model.safetensors",
+        "decoder.decode.3.norm2.fc.scales": "model.safetensors",
+        "decoder.decode.3.norm2.fc.weight": "model.safetensors",
+        "decoder.decode.3.pool.bias": "model.safetensors",
+        "decoder.decode.3.pool.weight_g": "model.safetensors",
+        "decoder.decode.3.pool.weight_v": "model.safetensors",
+        "decoder.encode.conv1.bias": "model.safetensors",
+        "decoder.encode.conv1.weight_g": "model.safetensors",
+        "decoder.encode.conv1.weight_v": "model.safetensors",
+        "decoder.encode.conv1x1.weight_g": "model.safetensors",
+        "decoder.encode.conv1x1.weight_v": "model.safetensors",
+        "decoder.encode.conv2.bias": "model.safetensors",
+        "decoder.encode.conv2.weight_g": "model.safetensors",
+        "decoder.encode.conv2.weight_v": "model.safetensors",
+        "decoder.encode.norm1.fc.bias": "model.safetensors",
+        "decoder.encode.norm1.fc.biases": "model.safetensors",
+        "decoder.encode.norm1.fc.scales": "model.safetensors",
+        "decoder.encode.norm1.fc.weight": "model.safetensors",
+        "decoder.encode.norm2.fc.bias": "model.safetensors",
+        "decoder.encode.norm2.fc.biases": "model.safetensors",
+        "decoder.encode.norm2.fc.scales": "model.safetensors",
+        "decoder.encode.norm2.fc.weight": "model.safetensors",
+        "decoder.generator.conv_post.bias": "model.safetensors",
+        "decoder.generator.conv_post.weight_g": "model.safetensors",
+        "decoder.generator.conv_post.weight_v": "model.safetensors",
+        "decoder.generator.m_source.l_linear.bias": "model.safetensors",
+        "decoder.generator.m_source.l_linear.weight": "model.safetensors",
+        "decoder.generator.noise_convs.0.bias": "model.safetensors",
+        "decoder.generator.noise_convs.0.weight": "model.safetensors",
+        "decoder.generator.noise_convs.1.bias": "model.safetensors",
+        "decoder.generator.noise_convs.1.weight": "model.safetensors",
+        "decoder.generator.noise_res.0.adain1.0.fc.bias": "model.safetensors",
+        "decoder.generator.noise_res.0.adain1.0.fc.biases": "model.safetensors",
+        "decoder.generator.noise_res.0.adain1.0.fc.scales": "model.safetensors",
+        "decoder.generator.noise_res.0.adain1.0.fc.weight": "model.safetensors",
+        "decoder.generator.noise_res.0.adain1.1.fc.bias": "model.safetensors",
+        "decoder.generator.noise_res.0.adain1.1.fc.biases": "model.safetensors",
+        "decoder.generator.noise_res.0.adain1.1.fc.scales": "model.safetensors",
+        "decoder.generator.noise_res.0.adain1.1.fc.weight": "model.safetensors",
+        "decoder.generator.noise_res.0.adain1.2.fc.bias": "model.safetensors",
+        "decoder.generator.noise_res.0.adain1.2.fc.biases": "model.safetensors",
+        "decoder.generator.noise_res.0.adain1.2.fc.scales": "model.safetensors",
+        "decoder.generator.noise_res.0.adain1.2.fc.weight": "model.safetensors",
+        "decoder.generator.noise_res.0.adain2.0.fc.bias": "model.safetensors",
+        "decoder.generator.noise_res.0.adain2.0.fc.biases": "model.safetensors",
+        "decoder.generator.noise_res.0.adain2.0.fc.scales": "model.safetensors",
+        "decoder.generator.noise_res.0.adain2.0.fc.weight": "model.safetensors",
+        "decoder.generator.noise_res.0.adain2.1.fc.bias": "model.safetensors",
+        "decoder.generator.noise_res.0.adain2.1.fc.biases": "model.safetensors",
+        "decoder.generator.noise_res.0.adain2.1.fc.scales": "model.safetensors",
+        "decoder.generator.noise_res.0.adain2.1.fc.weight": "model.safetensors",
+        "decoder.generator.noise_res.0.adain2.2.fc.bias": "model.safetensors",
+        "decoder.generator.noise_res.0.adain2.2.fc.biases": "model.safetensors",
+        "decoder.generator.noise_res.0.adain2.2.fc.scales": "model.safetensors",
+        "decoder.generator.noise_res.0.adain2.2.fc.weight": "model.safetensors",
+        "decoder.generator.noise_res.0.alpha1_0": "model.safetensors",
+        "decoder.generator.noise_res.0.alpha1_1": "model.safetensors",
+        "decoder.generator.noise_res.0.alpha1_2": "model.safetensors",
+        "decoder.generator.noise_res.0.alpha2_0": "model.safetensors",
+        "decoder.generator.noise_res.0.alpha2_1": "model.safetensors",
+        "decoder.generator.noise_res.0.alpha2_2": "model.safetensors",
+        "decoder.generator.noise_res.0.convs1.0.bias": "model.safetensors",
+        "decoder.generator.noise_res.0.convs1.0.weight_g": "model.safetensors",
+        "decoder.generator.noise_res.0.convs1.0.weight_v": "model.safetensors",
+        "decoder.generator.noise_res.0.convs1.1.bias": "model.safetensors",
+        "decoder.generator.noise_res.0.convs1.1.weight_g": "model.safetensors",
+        "decoder.generator.noise_res.0.convs1.1.weight_v": "model.safetensors",
+        "decoder.generator.noise_res.0.convs1.2.bias": "model.safetensors",
+        "decoder.generator.noise_res.0.convs1.2.weight_g": "model.safetensors",
+        "decoder.generator.noise_res.0.convs1.2.weight_v": "model.safetensors",
+        "decoder.generator.noise_res.0.convs2.0.bias": "model.safetensors",
+        "decoder.generator.noise_res.0.convs2.0.weight_g": "model.safetensors",
+        "decoder.generator.noise_res.0.convs2.0.weight_v": "model.safetensors",
+        "decoder.generator.noise_res.0.convs2.1.bias": "model.safetensors",
+        "decoder.generator.noise_res.0.convs2.1.weight_g": "model.safetensors",
+        "decoder.generator.noise_res.0.convs2.1.weight_v": "model.safetensors",
+        "decoder.generator.noise_res.0.convs2.2.bias": "model.safetensors",
+        "decoder.generator.noise_res.0.convs2.2.weight_g": "model.safetensors",
+        "decoder.generator.noise_res.0.convs2.2.weight_v": "model.safetensors",
+        "decoder.generator.noise_res.1.adain1.0.fc.bias": "model.safetensors",
+        "decoder.generator.noise_res.1.adain1.0.fc.biases": "model.safetensors",
+        "decoder.generator.noise_res.1.adain1.0.fc.scales": "model.safetensors",
+        "decoder.generator.noise_res.1.adain1.0.fc.weight": "model.safetensors",
+        "decoder.generator.noise_res.1.adain1.1.fc.bias": "model.safetensors",
+        "decoder.generator.noise_res.1.adain1.1.fc.biases": "model.safetensors",
+        "decoder.generator.noise_res.1.adain1.1.fc.scales": "model.safetensors",
+        "decoder.generator.noise_res.1.adain1.1.fc.weight": "model.safetensors",
+        "decoder.generator.noise_res.1.adain1.2.fc.bias": "model.safetensors",
+        "decoder.generator.noise_res.1.adain1.2.fc.biases": "model.safetensors",
+        "decoder.generator.noise_res.1.adain1.2.fc.scales": "model.safetensors",
+        "decoder.generator.noise_res.1.adain1.2.fc.weight": "model.safetensors",
+        "decoder.generator.noise_res.1.adain2.0.fc.bias": "model.safetensors",
+        "decoder.generator.noise_res.1.adain2.0.fc.biases": "model.safetensors",
+        "decoder.generator.noise_res.1.adain2.0.fc.scales": "model.safetensors",
+        "decoder.generator.noise_res.1.adain2.0.fc.weight": "model.safetensors",
+        "decoder.generator.noise_res.1.adain2.1.fc.bias": "model.safetensors",
+        "decoder.generator.noise_res.1.adain2.1.fc.biases": "model.safetensors",
+        "decoder.generator.noise_res.1.adain2.1.fc.scales": "model.safetensors",
+        "decoder.generator.noise_res.1.adain2.1.fc.weight": "model.safetensors",
+        "decoder.generator.noise_res.1.adain2.2.fc.bias": "model.safetensors",
+        "decoder.generator.noise_res.1.adain2.2.fc.biases": "model.safetensors",
+        "decoder.generator.noise_res.1.adain2.2.fc.scales": "model.safetensors",
+        "decoder.generator.noise_res.1.adain2.2.fc.weight": "model.safetensors",
+        "decoder.generator.noise_res.1.alpha1_0": "model.safetensors",
+        "decoder.generator.noise_res.1.alpha1_1": "model.safetensors",
+        "decoder.generator.noise_res.1.alpha1_2": "model.safetensors",
+        "decoder.generator.noise_res.1.alpha2_0": "model.safetensors",
+        "decoder.generator.noise_res.1.alpha2_1": "model.safetensors",
+        "decoder.generator.noise_res.1.alpha2_2": "model.safetensors",
+        "decoder.generator.noise_res.1.convs1.0.bias": "model.safetensors",
+        "decoder.generator.noise_res.1.convs1.0.weight_g": "model.safetensors",
+        "decoder.generator.noise_res.1.convs1.0.weight_v": "model.safetensors",
+        "decoder.generator.noise_res.1.convs1.1.bias": "model.safetensors",
+        "decoder.generator.noise_res.1.convs1.1.weight_g": "model.safetensors",
+        "decoder.generator.noise_res.1.convs1.1.weight_v": "model.safetensors",
+        "decoder.generator.noise_res.1.convs1.2.bias": "model.safetensors",
+        "decoder.generator.noise_res.1.convs1.2.weight_g": "model.safetensors",
+        "decoder.generator.noise_res.1.convs1.2.weight_v": "model.safetensors",
+        "decoder.generator.noise_res.1.convs2.0.bias": "model.safetensors",
+        "decoder.generator.noise_res.1.convs2.0.weight_g": "model.safetensors",
+        "decoder.generator.noise_res.1.convs2.0.weight_v": "model.safetensors",
+        "decoder.generator.noise_res.1.convs2.1.bias": "model.safetensors",
+        "decoder.generator.noise_res.1.convs2.1.weight_g": "model.safetensors",
+        "decoder.generator.noise_res.1.convs2.1.weight_v": "model.safetensors",
+        "decoder.generator.noise_res.1.convs2.2.bias": "model.safetensors",
+        "decoder.generator.noise_res.1.convs2.2.weight_g": "model.safetensors",
+        "decoder.generator.noise_res.1.convs2.2.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.0.adain1.0.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.0.adain1.0.fc.biases": "model.safetensors",
+        "decoder.generator.resblocks.0.adain1.0.fc.scales": "model.safetensors",
+        "decoder.generator.resblocks.0.adain1.0.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.0.adain1.1.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.0.adain1.1.fc.biases": "model.safetensors",
+        "decoder.generator.resblocks.0.adain1.1.fc.scales": "model.safetensors",
+        "decoder.generator.resblocks.0.adain1.1.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.0.adain1.2.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.0.adain1.2.fc.biases": "model.safetensors",
+        "decoder.generator.resblocks.0.adain1.2.fc.scales": "model.safetensors",
+        "decoder.generator.resblocks.0.adain1.2.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.0.adain2.0.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.0.adain2.0.fc.biases": "model.safetensors",
+        "decoder.generator.resblocks.0.adain2.0.fc.scales": "model.safetensors",
+        "decoder.generator.resblocks.0.adain2.0.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.0.adain2.1.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.0.adain2.1.fc.biases": "model.safetensors",
+        "decoder.generator.resblocks.0.adain2.1.fc.scales": "model.safetensors",
+        "decoder.generator.resblocks.0.adain2.1.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.0.adain2.2.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.0.adain2.2.fc.biases": "model.safetensors",
+        "decoder.generator.resblocks.0.adain2.2.fc.scales": "model.safetensors",
+        "decoder.generator.resblocks.0.adain2.2.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.0.alpha1_0": "model.safetensors",
+        "decoder.generator.resblocks.0.alpha1_1": "model.safetensors",
+        "decoder.generator.resblocks.0.alpha1_2": "model.safetensors",
+        "decoder.generator.resblocks.0.alpha2_0": "model.safetensors",
+        "decoder.generator.resblocks.0.alpha2_1": "model.safetensors",
+        "decoder.generator.resblocks.0.alpha2_2": "model.safetensors",
+        "decoder.generator.resblocks.0.convs1.0.bias": "model.safetensors",
+        "decoder.generator.resblocks.0.convs1.0.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.0.convs1.0.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.0.convs1.1.bias": "model.safetensors",
+        "decoder.generator.resblocks.0.convs1.1.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.0.convs1.1.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.0.convs1.2.bias": "model.safetensors",
+        "decoder.generator.resblocks.0.convs1.2.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.0.convs1.2.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.0.convs2.0.bias": "model.safetensors",
+        "decoder.generator.resblocks.0.convs2.0.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.0.convs2.0.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.0.convs2.1.bias": "model.safetensors",
+        "decoder.generator.resblocks.0.convs2.1.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.0.convs2.1.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.0.convs2.2.bias": "model.safetensors",
+        "decoder.generator.resblocks.0.convs2.2.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.0.convs2.2.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.1.adain1.0.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.1.adain1.0.fc.biases": "model.safetensors",
+        "decoder.generator.resblocks.1.adain1.0.fc.scales": "model.safetensors",
+        "decoder.generator.resblocks.1.adain1.0.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.1.adain1.1.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.1.adain1.1.fc.biases": "model.safetensors",
+        "decoder.generator.resblocks.1.adain1.1.fc.scales": "model.safetensors",
+        "decoder.generator.resblocks.1.adain1.1.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.1.adain1.2.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.1.adain1.2.fc.biases": "model.safetensors",
+        "decoder.generator.resblocks.1.adain1.2.fc.scales": "model.safetensors",
+        "decoder.generator.resblocks.1.adain1.2.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.1.adain2.0.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.1.adain2.0.fc.biases": "model.safetensors",
+        "decoder.generator.resblocks.1.adain2.0.fc.scales": "model.safetensors",
+        "decoder.generator.resblocks.1.adain2.0.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.1.adain2.1.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.1.adain2.1.fc.biases": "model.safetensors",
+        "decoder.generator.resblocks.1.adain2.1.fc.scales": "model.safetensors",
+        "decoder.generator.resblocks.1.adain2.1.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.1.adain2.2.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.1.adain2.2.fc.biases": "model.safetensors",
+        "decoder.generator.resblocks.1.adain2.2.fc.scales": "model.safetensors",
+        "decoder.generator.resblocks.1.adain2.2.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.1.alpha1_0": "model.safetensors",
+        "decoder.generator.resblocks.1.alpha1_1": "model.safetensors",
+        "decoder.generator.resblocks.1.alpha1_2": "model.safetensors",
+        "decoder.generator.resblocks.1.alpha2_0": "model.safetensors",
+        "decoder.generator.resblocks.1.alpha2_1": "model.safetensors",
+        "decoder.generator.resblocks.1.alpha2_2": "model.safetensors",
+        "decoder.generator.resblocks.1.convs1.0.bias": "model.safetensors",
+        "decoder.generator.resblocks.1.convs1.0.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.1.convs1.0.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.1.convs1.1.bias": "model.safetensors",
+        "decoder.generator.resblocks.1.convs1.1.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.1.convs1.1.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.1.convs1.2.bias": "model.safetensors",
+        "decoder.generator.resblocks.1.convs1.2.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.1.convs1.2.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.1.convs2.0.bias": "model.safetensors",
+        "decoder.generator.resblocks.1.convs2.0.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.1.convs2.0.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.1.convs2.1.bias": "model.safetensors",
+        "decoder.generator.resblocks.1.convs2.1.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.1.convs2.1.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.1.convs2.2.bias": "model.safetensors",
+        "decoder.generator.resblocks.1.convs2.2.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.1.convs2.2.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.2.adain1.0.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.2.adain1.0.fc.biases": "model.safetensors",
+        "decoder.generator.resblocks.2.adain1.0.fc.scales": "model.safetensors",
+        "decoder.generator.resblocks.2.adain1.0.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.2.adain1.1.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.2.adain1.1.fc.biases": "model.safetensors",
+        "decoder.generator.resblocks.2.adain1.1.fc.scales": "model.safetensors",
+        "decoder.generator.resblocks.2.adain1.1.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.2.adain1.2.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.2.adain1.2.fc.biases": "model.safetensors",
+        "decoder.generator.resblocks.2.adain1.2.fc.scales": "model.safetensors",
+        "decoder.generator.resblocks.2.adain1.2.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.2.adain2.0.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.2.adain2.0.fc.biases": "model.safetensors",
+        "decoder.generator.resblocks.2.adain2.0.fc.scales": "model.safetensors",
+        "decoder.generator.resblocks.2.adain2.0.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.2.adain2.1.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.2.adain2.1.fc.biases": "model.safetensors",
+        "decoder.generator.resblocks.2.adain2.1.fc.scales": "model.safetensors",
+        "decoder.generator.resblocks.2.adain2.1.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.2.adain2.2.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.2.adain2.2.fc.biases": "model.safetensors",
+        "decoder.generator.resblocks.2.adain2.2.fc.scales": "model.safetensors",
+        "decoder.generator.resblocks.2.adain2.2.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.2.alpha1_0": "model.safetensors",
+        "decoder.generator.resblocks.2.alpha1_1": "model.safetensors",
+        "decoder.generator.resblocks.2.alpha1_2": "model.safetensors",
+        "decoder.generator.resblocks.2.alpha2_0": "model.safetensors",
+        "decoder.generator.resblocks.2.alpha2_1": "model.safetensors",
+        "decoder.generator.resblocks.2.alpha2_2": "model.safetensors",
+        "decoder.generator.resblocks.2.convs1.0.bias": "model.safetensors",
+        "decoder.generator.resblocks.2.convs1.0.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.2.convs1.0.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.2.convs1.1.bias": "model.safetensors",
+        "decoder.generator.resblocks.2.convs1.1.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.2.convs1.1.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.2.convs1.2.bias": "model.safetensors",
+        "decoder.generator.resblocks.2.convs1.2.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.2.convs1.2.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.2.convs2.0.bias": "model.safetensors",
+        "decoder.generator.resblocks.2.convs2.0.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.2.convs2.0.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.2.convs2.1.bias": "model.safetensors",
+        "decoder.generator.resblocks.2.convs2.1.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.2.convs2.1.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.2.convs2.2.bias": "model.safetensors",
+        "decoder.generator.resblocks.2.convs2.2.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.2.convs2.2.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.3.adain1.0.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.3.adain1.0.fc.biases": "model.safetensors",
+        "decoder.generator.resblocks.3.adain1.0.fc.scales": "model.safetensors",
+        "decoder.generator.resblocks.3.adain1.0.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.3.adain1.1.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.3.adain1.1.fc.biases": "model.safetensors",
+        "decoder.generator.resblocks.3.adain1.1.fc.scales": "model.safetensors",
+        "decoder.generator.resblocks.3.adain1.1.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.3.adain1.2.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.3.adain1.2.fc.biases": "model.safetensors",
+        "decoder.generator.resblocks.3.adain1.2.fc.scales": "model.safetensors",
+        "decoder.generator.resblocks.3.adain1.2.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.3.adain2.0.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.3.adain2.0.fc.biases": "model.safetensors",
+        "decoder.generator.resblocks.3.adain2.0.fc.scales": "model.safetensors",
+        "decoder.generator.resblocks.3.adain2.0.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.3.adain2.1.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.3.adain2.1.fc.biases": "model.safetensors",
+        "decoder.generator.resblocks.3.adain2.1.fc.scales": "model.safetensors",
+        "decoder.generator.resblocks.3.adain2.1.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.3.adain2.2.fc.bias": "model.safetensors",
+        "decoder.generator.resblocks.3.adain2.2.fc.biases": "model.safetensors",
+        "decoder.generator.resblocks.3.adain2.2.fc.scales": "model.safetensors",
+        "decoder.generator.resblocks.3.adain2.2.fc.weight": "model.safetensors",
+        "decoder.generator.resblocks.3.alpha1_0": "model.safetensors",
+        "decoder.generator.resblocks.3.alpha1_1": "model.safetensors",
+        "decoder.generator.resblocks.3.alpha1_2": "model.safetensors",
+        "decoder.generator.resblocks.3.alpha2_0": "model.safetensors",
+        "decoder.generator.resblocks.3.alpha2_1": "model.safetensors",
+        "decoder.generator.resblocks.3.alpha2_2": "model.safetensors",
+        "decoder.generator.resblocks.3.convs1.0.bias": "model.safetensors",
+        "decoder.generator.resblocks.3.convs1.0.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.3.convs1.0.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.3.convs1.1.bias": "model.safetensors",
+        "decoder.generator.resblocks.3.convs1.1.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.3.convs1.1.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.3.convs1.2.bias": "model.safetensors",
+        "decoder.generator.resblocks.3.convs1.2.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.3.convs1.2.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.3.convs2.0.bias": "model.safetensors",
+        "decoder.generator.resblocks.3.convs2.0.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.3.convs2.0.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.3.convs2.1.bias": "model.safetensors",
+        "decoder.generator.resblocks.3.convs2.1.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.3.convs2.1.weight_v": "model.safetensors",
+        "decoder.generator.resblocks.3.convs2.2.bias": "model.safetensors",
+        "decoder.generator.resblocks.3.convs2.2.weight_g": "model.safetensors",
+        "decoder.generator.resblocks.3.convs2.2.weight_v": "model.safetensors",
+        "decoder.generator.ups.0.bias": "model.safetensors",
+        "decoder.generator.ups.0.weight_g": "model.safetensors",
+        "decoder.generator.ups.0.weight_v": "model.safetensors",
+        "decoder.generator.ups.1.bias": "model.safetensors",
+        "decoder.generator.ups.1.weight_g": "model.safetensors",
+        "decoder.generator.ups.1.weight_v": "model.safetensors",
+        "predictor.F0.0.conv1.bias": "model.safetensors",
+        "predictor.F0.0.conv1.weight_g": "model.safetensors",
+        "predictor.F0.0.conv1.weight_v": "model.safetensors",
+        "predictor.F0.0.conv2.bias": "model.safetensors",
+        "predictor.F0.0.conv2.weight_g": "model.safetensors",
+        "predictor.F0.0.conv2.weight_v": "model.safetensors",
+        "predictor.F0.0.norm1.fc.bias": "model.safetensors",
+        "predictor.F0.0.norm1.fc.biases": "model.safetensors",
+        "predictor.F0.0.norm1.fc.scales": "model.safetensors",
+        "predictor.F0.0.norm1.fc.weight": "model.safetensors",
+        "predictor.F0.0.norm2.fc.bias": "model.safetensors",
+        "predictor.F0.0.norm2.fc.biases": "model.safetensors",
+        "predictor.F0.0.norm2.fc.scales": "model.safetensors",
+        "predictor.F0.0.norm2.fc.weight": "model.safetensors",
+        "predictor.F0.1.conv1.bias": "model.safetensors",
+        "predictor.F0.1.conv1.weight_g": "model.safetensors",
+        "predictor.F0.1.conv1.weight_v": "model.safetensors",
+        "predictor.F0.1.conv1x1.weight_g": "model.safetensors",
+        "predictor.F0.1.conv1x1.weight_v": "model.safetensors",
+        "predictor.F0.1.conv2.bias": "model.safetensors",
+        "predictor.F0.1.conv2.weight_g": "model.safetensors",
+        "predictor.F0.1.conv2.weight_v": "model.safetensors",
+        "predictor.F0.1.norm1.fc.bias": "model.safetensors",
+        "predictor.F0.1.norm1.fc.biases": "model.safetensors",
+        "predictor.F0.1.norm1.fc.scales": "model.safetensors",
+        "predictor.F0.1.norm1.fc.weight": "model.safetensors",
+        "predictor.F0.1.norm2.fc.bias": "model.safetensors",
+        "predictor.F0.1.norm2.fc.biases": "model.safetensors",
+        "predictor.F0.1.norm2.fc.scales": "model.safetensors",
+        "predictor.F0.1.norm2.fc.weight": "model.safetensors",
+        "predictor.F0.1.pool.bias": "model.safetensors",
+        "predictor.F0.1.pool.weight_g": "model.safetensors",
+        "predictor.F0.1.pool.weight_v": "model.safetensors",
+        "predictor.F0.2.conv1.bias": "model.safetensors",
+        "predictor.F0.2.conv1.weight_g": "model.safetensors",
+        "predictor.F0.2.conv1.weight_v": "model.safetensors",
+        "predictor.F0.2.conv2.bias": "model.safetensors",
+        "predictor.F0.2.conv2.weight_g": "model.safetensors",
+        "predictor.F0.2.conv2.weight_v": "model.safetensors",
+        "predictor.F0.2.norm1.fc.bias": "model.safetensors",
+        "predictor.F0.2.norm1.fc.biases": "model.safetensors",
+        "predictor.F0.2.norm1.fc.scales": "model.safetensors",
+        "predictor.F0.2.norm1.fc.weight": "model.safetensors",
+        "predictor.F0.2.norm2.fc.bias": "model.safetensors",
+        "predictor.F0.2.norm2.fc.biases": "model.safetensors",
+        "predictor.F0.2.norm2.fc.scales": "model.safetensors",
+        "predictor.F0.2.norm2.fc.weight": "model.safetensors",
+        "predictor.F0_proj.bias": "model.safetensors",
+        "predictor.F0_proj.weight": "model.safetensors",
+        "predictor.N.0.conv1.bias": "model.safetensors",
+        "predictor.N.0.conv1.weight_g": "model.safetensors",
+        "predictor.N.0.conv1.weight_v": "model.safetensors",
+        "predictor.N.0.conv2.bias": "model.safetensors",
+        "predictor.N.0.conv2.weight_g": "model.safetensors",
+        "predictor.N.0.conv2.weight_v": "model.safetensors",
+        "predictor.N.0.norm1.fc.bias": "model.safetensors",
+        "predictor.N.0.norm1.fc.biases": "model.safetensors",
+        "predictor.N.0.norm1.fc.scales": "model.safetensors",
+        "predictor.N.0.norm1.fc.weight": "model.safetensors",
+        "predictor.N.0.norm2.fc.bias": "model.safetensors",
+        "predictor.N.0.norm2.fc.biases": "model.safetensors",
+        "predictor.N.0.norm2.fc.scales": "model.safetensors",
+        "predictor.N.0.norm2.fc.weight": "model.safetensors",
+        "predictor.N.1.conv1.bias": "model.safetensors",
+        "predictor.N.1.conv1.weight_g": "model.safetensors",
+        "predictor.N.1.conv1.weight_v": "model.safetensors",
+        "predictor.N.1.conv1x1.weight_g": "model.safetensors",
+        "predictor.N.1.conv1x1.weight_v": "model.safetensors",
+        "predictor.N.1.conv2.bias": "model.safetensors",
+        "predictor.N.1.conv2.weight_g": "model.safetensors",
+        "predictor.N.1.conv2.weight_v": "model.safetensors",
+        "predictor.N.1.norm1.fc.bias": "model.safetensors",
+        "predictor.N.1.norm1.fc.biases": "model.safetensors",
+        "predictor.N.1.norm1.fc.scales": "model.safetensors",
+        "predictor.N.1.norm1.fc.weight": "model.safetensors",
+        "predictor.N.1.norm2.fc.bias": "model.safetensors",
+        "predictor.N.1.norm2.fc.biases": "model.safetensors",
+        "predictor.N.1.norm2.fc.scales": "model.safetensors",
+        "predictor.N.1.norm2.fc.weight": "model.safetensors",
+        "predictor.N.1.pool.bias": "model.safetensors",
+        "predictor.N.1.pool.weight_g": "model.safetensors",
+        "predictor.N.1.pool.weight_v": "model.safetensors",
+        "predictor.N.2.conv1.bias": "model.safetensors",
+        "predictor.N.2.conv1.weight_g": "model.safetensors",
+        "predictor.N.2.conv1.weight_v": "model.safetensors",
+        "predictor.N.2.conv2.bias": "model.safetensors",
+        "predictor.N.2.conv2.weight_g": "model.safetensors",
+        "predictor.N.2.conv2.weight_v": "model.safetensors",
+        "predictor.N.2.norm1.fc.bias": "model.safetensors",
+        "predictor.N.2.norm1.fc.biases": "model.safetensors",
+        "predictor.N.2.norm1.fc.scales": "model.safetensors",
+        "predictor.N.2.norm1.fc.weight": "model.safetensors",
+        "predictor.N.2.norm2.fc.bias": "model.safetensors",
+        "predictor.N.2.norm2.fc.biases": "model.safetensors",
+        "predictor.N.2.norm2.fc.scales": "model.safetensors",
+        "predictor.N.2.norm2.fc.weight": "model.safetensors",
+        "predictor.N_proj.bias": "model.safetensors",
+        "predictor.N_proj.weight": "model.safetensors",
+        "predictor.duration_proj.linear_layer.bias": "model.safetensors",
+        "predictor.duration_proj.linear_layer.biases": "model.safetensors",
+        "predictor.duration_proj.linear_layer.scales": "model.safetensors",
+        "predictor.duration_proj.linear_layer.weight": "model.safetensors",
+        "predictor.lstm.Wh_backward": "model.safetensors",
+        "predictor.lstm.Wh_forward": "model.safetensors",
+        "predictor.lstm.Wx_backward": "model.safetensors",
+        "predictor.lstm.Wx_forward": "model.safetensors",
+        "predictor.lstm.bias_hh_backward": "model.safetensors",
+        "predictor.lstm.bias_hh_forward": "model.safetensors",
+        "predictor.lstm.bias_ih_backward": "model.safetensors",
+        "predictor.lstm.bias_ih_forward": "model.safetensors",
+        "predictor.shared.Wh_backward": "model.safetensors",
+        "predictor.shared.Wh_forward": "model.safetensors",
+        "predictor.shared.Wx_backward": "model.safetensors",
+        "predictor.shared.Wx_forward": "model.safetensors",
+        "predictor.shared.bias_hh_backward": "model.safetensors",
+        "predictor.shared.bias_hh_forward": "model.safetensors",
+        "predictor.shared.bias_ih_backward": "model.safetensors",
+        "predictor.shared.bias_ih_forward": "model.safetensors",
+        "predictor.text_encoder.lstms.0.Wh_backward": "model.safetensors",
+        "predictor.text_encoder.lstms.0.Wh_forward": "model.safetensors",
+        "predictor.text_encoder.lstms.0.Wx_backward": "model.safetensors",
+        "predictor.text_encoder.lstms.0.Wx_forward": "model.safetensors",
+        "predictor.text_encoder.lstms.0.bias_hh_backward": "model.safetensors",
+        "predictor.text_encoder.lstms.0.bias_hh_forward": "model.safetensors",
+        "predictor.text_encoder.lstms.0.bias_ih_backward": "model.safetensors",
+        "predictor.text_encoder.lstms.0.bias_ih_forward": "model.safetensors",
+        "predictor.text_encoder.lstms.1.fc.bias": "model.safetensors",
+        "predictor.text_encoder.lstms.1.fc.biases": "model.safetensors",
+        "predictor.text_encoder.lstms.1.fc.scales": "model.safetensors",
+        "predictor.text_encoder.lstms.1.fc.weight": "model.safetensors",
+        "predictor.text_encoder.lstms.2.Wh_backward": "model.safetensors",
+        "predictor.text_encoder.lstms.2.Wh_forward": "model.safetensors",
+        "predictor.text_encoder.lstms.2.Wx_backward": "model.safetensors",
+        "predictor.text_encoder.lstms.2.Wx_forward": "model.safetensors",
+        "predictor.text_encoder.lstms.2.bias_hh_backward": "model.safetensors",
+        "predictor.text_encoder.lstms.2.bias_hh_forward": "model.safetensors",
+        "predictor.text_encoder.lstms.2.bias_ih_backward": "model.safetensors",
+        "predictor.text_encoder.lstms.2.bias_ih_forward": "model.safetensors",
+        "predictor.text_encoder.lstms.3.fc.bias": "model.safetensors",
+        "predictor.text_encoder.lstms.3.fc.biases": "model.safetensors",
+        "predictor.text_encoder.lstms.3.fc.scales": "model.safetensors",
+        "predictor.text_encoder.lstms.3.fc.weight": "model.safetensors",
+        "predictor.text_encoder.lstms.4.Wh_backward": "model.safetensors",
+        "predictor.text_encoder.lstms.4.Wh_forward": "model.safetensors",
+        "predictor.text_encoder.lstms.4.Wx_backward": "model.safetensors",
+        "predictor.text_encoder.lstms.4.Wx_forward": "model.safetensors",
+        "predictor.text_encoder.lstms.4.bias_hh_backward": "model.safetensors",
+        "predictor.text_encoder.lstms.4.bias_hh_forward": "model.safetensors",
+        "predictor.text_encoder.lstms.4.bias_ih_backward": "model.safetensors",
+        "predictor.text_encoder.lstms.4.bias_ih_forward": "model.safetensors",
+        "predictor.text_encoder.lstms.5.fc.bias": "model.safetensors",
+        "predictor.text_encoder.lstms.5.fc.biases": "model.safetensors",
+        "predictor.text_encoder.lstms.5.fc.scales": "model.safetensors",
+        "predictor.text_encoder.lstms.5.fc.weight": "model.safetensors",
+        "text_encoder.cnn.0.0.bias": "model.safetensors",
+        "text_encoder.cnn.0.0.weight_g": "model.safetensors",
+        "text_encoder.cnn.0.0.weight_v": "model.safetensors",
+        "text_encoder.cnn.0.1.bias": "model.safetensors",
+        "text_encoder.cnn.0.1.weight": "model.safetensors",
+        "text_encoder.cnn.1.0.bias": "model.safetensors",
+        "text_encoder.cnn.1.0.weight_g": "model.safetensors",
+        "text_encoder.cnn.1.0.weight_v": "model.safetensors",
+        "text_encoder.cnn.1.1.bias": "model.safetensors",
+        "text_encoder.cnn.1.1.weight": "model.safetensors",
+        "text_encoder.cnn.2.0.bias": "model.safetensors",
+        "text_encoder.cnn.2.0.weight_g": "model.safetensors",
+        "text_encoder.cnn.2.0.weight_v": "model.safetensors",
+        "text_encoder.cnn.2.1.bias": "model.safetensors",
+        "text_encoder.cnn.2.1.weight": "model.safetensors",
+        "text_encoder.embedding.biases": "model.safetensors",
+        "text_encoder.embedding.scales": "model.safetensors",
+        "text_encoder.embedding.weight": "model.safetensors",
+        "text_encoder.lstm.Wh_backward": "model.safetensors",
+        "text_encoder.lstm.Wh_forward": "model.safetensors",
+        "text_encoder.lstm.Wx_backward": "model.safetensors",
+        "text_encoder.lstm.Wx_forward": "model.safetensors",
+        "text_encoder.lstm.bias_hh_backward": "model.safetensors",
+        "text_encoder.lstm.bias_hh_forward": "model.safetensors",
+        "text_encoder.lstm.bias_ih_backward": "model.safetensors",
+        "text_encoder.lstm.bias_ih_forward": "model.safetensors"
+    }
+}

voices.npz ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:112710c1be8ad0e967c190fb0fd95cbe5848ec4791b93209f20b28b7da20dac1
+size 3278902