ByteDance
/

Bernini-Diffusers

@@ -3,13 +3,8 @@
   "architectures": ["BerniniModel"],
   "mllm_attn_implementation": "sdpa",
   "partial_pretrain_model": "",
-  "diff_dec_config_path": "./pretrained_models/Bernini-Diffusers",
-  "transformer_config_path": "./pretrained_models/Bernini-Diffusers/transformer_config.json",
-  "transformer_2_config_path": "./pretrained_models/Bernini-Diffusers/transformer_2_config.json",
-  "wan22_base": "./pretrained_models/Bernini-Diffusers",
-  "vae_model_path": "./pretrained_models/Bernini-Diffusers",
   "vae_subfolder": "vae",
-  "vae_config_path": "./pretrained_models/Bernini-Diffusers/vae/config.json",
   "cotrain": true,
   "boundary_ratio": 0.417,
   "switch_dit_boundary": 0.875,
@@ -19,9 +14,7 @@
   "mode_scale": 1.29,
   "scratch": true,
   "transformers_version": "4.57.3",
-  "mllm_config_path": "./pretrained_models/Bernini-Diffusers",
   "mllm_subfolder": "mllm",
-  "processor_config_path": "./pretrained_models/Bernini-Diffusers",
   "processor_subfolder": "mllm",
   "bernini_ckpt_subfolder": "bernini",
   "scratch_mllm": true,
@@ -38,7 +31,7 @@
     "shift": 2.0
   },
   "connector_cfg": {
-    "model_type": "QwenConnector",
     "out_dim_for_gen": 4096,
     "enable_gen_branch": true,
     "out_dim_for_vit": 3584,
@@ -50,9 +43,7 @@
     "generator_type": "default"
   },
   "t5_max_sequence_length": 512,
-  "t5_text_encoder_path": "./pretrained_models/Bernini-Diffusers",
   "t5_text_encoder_subfolder": "t5_text_encoder",
-  "t5_tokenizer_path": "./pretrained_models/Bernini-Diffusers",
   "t5_tokenizer_subfolder": "t5_tokenizer",
   "t5_combine_type": "concat_with_zero_init",
   "target_fps": 16

   "architectures": ["BerniniModel"],
   "mllm_attn_implementation": "sdpa",
   "partial_pretrain_model": "",
+  "base_dir": "ByteDance/Bernini-Diffusers",
   "vae_subfolder": "vae",
   "cotrain": true,
   "boundary_ratio": 0.417,
   "switch_dit_boundary": 0.875,
   "mode_scale": 1.29,
   "scratch": true,
   "transformers_version": "4.57.3",
   "mllm_subfolder": "mllm",
   "processor_subfolder": "mllm",
   "bernini_ckpt_subfolder": "bernini",
   "scratch_mllm": true,
     "shift": 2.0
   },
   "connector_cfg": {
+    "model_type": "MLPConnector",
     "out_dim_for_gen": 4096,
     "enable_gen_branch": true,
     "out_dim_for_vit": 3584,
     "generator_type": "default"
   },
   "t5_max_sequence_length": 512,
   "t5_text_encoder_subfolder": "t5_text_encoder",
   "t5_tokenizer_subfolder": "t5_tokenizer",
   "t5_combine_type": "concat_with_zero_init",
   "target_fps": 16