rookie9
/

PicoAudio2

Model card Files Files and versions

rookie9 commited on Sep 13, 2025

Commit

08ae370

·

verified ·

1 Parent(s): 79f3e78

Update config.json

Files changed (1) hide show

config.json +3 -3

config.json CHANGED Viewed

@@ -45,7 +45,7 @@
     "latent_dim": 128,
     "downsampling_ratio": 480,
     "sample_rate": 24000,
-    "pretrained_ckpt": "/mnt/petrelfs/zhengzihao/cache/ezaudio/ckpts/vae/1m.pt",
     "bottleneck": {
       "_target_": "models.autoencoder.waveform.stable_vae.VAEBottleneck"
     }
@@ -90,11 +90,11 @@
     "_target_": "models.content_encoder.caption_encoder.ContentEncoder",
     "text_encoder": {
       "_target_": "models.content_encoder.text_encoder.T5TextEncoder",
-      "model_name": "/mnt/petrelfs/zhengzihao/cache/google-flan-t5-large"
     }
   },
   "frame_resolution": 0.005,
-  "noise_scheduler_name": "/mnt/petrelfs/zhengzihao/cache/stabilityai-stable-diffusion-2-1",
   "snr_gamma": 5.0,
   "classifier_free_guidance": true,
   "cfg_drop_ratio": 0.2,

     "latent_dim": 128,
     "downsampling_ratio": 480,
     "sample_rate": 24000,
+    "pretrained_ckpt": "ezaudio_vae/1m.pt",
     "bottleneck": {
       "_target_": "models.autoencoder.waveform.stable_vae.VAEBottleneck"
     }
     "_target_": "models.content_encoder.caption_encoder.ContentEncoder",
     "text_encoder": {
       "_target_": "models.content_encoder.text_encoder.T5TextEncoder",
+      "model_name": "google/flan-t5-large"
     }
   },
   "frame_resolution": 0.005,
+  "noise_scheduler_name": "stabilityai-stable-diffusion-2-1",
   "snr_gamma": 5.0,
   "classifier_free_guidance": true,
   "cfg_drop_ratio": 0.2,