TuKoResearch
/

WavTokenizer

Model card Files Files and versions

klemenk commited on Nov 24, 2025

Commit

7060505

·

verified ·

1 Parent(s): 3592734

Update config.json

Files changed (1) hide show

config.json +8 -10

config.json CHANGED Viewed

@@ -1,8 +1,6 @@
 {
   "_name_or_path": "TuKoResearch/WavTokenizer",
-  "architectures": [
-    "WavTokenizer"
-  ],
   "auto_map": {
     "AutoConfig": "configuration_wavtokenizer.WavTokenizerConfig",
     "AutoModel": "modeling_wavtokenizer.WavTokenizer"
@@ -16,17 +14,17 @@
   "padding": "center",
   "feature_dim": 512,
-  "encoder_dim": 64,
-  "encoder_rates": [8, 5, 4, 2],
   "latent_dim": 512,
   "codebook_size": 4096,
-  "codebook_dim": 8,
   "num_quantizers": 1,
   "backbone_type": "vocos",
   "backbone_dim": 768,
-  "backbone_num_blocks": 8,
   "backbone_intermediate_dim": 2304,
   "backbone_kernel_size": 7,
   "backbone_layer_scale_init_value": 1e-6,
@@ -34,11 +32,11 @@
   "head_type": "istft",
   "head_dim": 641,
-  "use_attention": true,
   "attention_dim": 768,
   "attention_heads": 8,
-  "attention_layers": 1,
   "torch_dtype": "float32",
   "transformers_version": "4.40.0"
-}

 {
   "_name_or_path": "TuKoResearch/WavTokenizer",
+  "architectures": ["WavTokenizer"],
   "auto_map": {
     "AutoConfig": "configuration_wavtokenizer.WavTokenizerConfig",
     "AutoModel": "modeling_wavtokenizer.WavTokenizer"
   "padding": "center",
   "feature_dim": 512,
+  "encoder_dim": 32,
+  "encoder_rates": [2, 4, 5, 8],
   "latent_dim": 512,
   "codebook_size": 4096,
+  "codebook_dim": 512,
   "num_quantizers": 1,
   "backbone_type": "vocos",
   "backbone_dim": 768,
+  "backbone_num_blocks": 12,
   "backbone_intermediate_dim": 2304,
   "backbone_kernel_size": 7,
   "backbone_layer_scale_init_value": 1e-6,
   "head_type": "istft",
   "head_dim": 641,
+  "use_attention": false,
   "attention_dim": 768,
   "attention_heads": 8,
+  "attention_layers": 0,
   "torch_dtype": "float32",
   "transformers_version": "4.40.0"
+}