File size: 617 Bytes
{
  "_class_name": "CausalLingBotWorldTransformer3DModel",
  "_diffusers_version": "0.35.0.dev0",
  "added_kv_proj_dim": null,
  "attention_head_dim": 128,
  "cross_attn_norm": true,
  "eps": 1e-06,
  "ffn_dim": 13824,
  "freq_dim": 256,
  "image_dim": null,
  "in_channels": 36,
  "num_attention_heads": 40,
  "num_layers": 40,
  "out_channels": 16,
  "patch_size": [
    1,
    2,
    2
  ],
  "pos_embed_seq_len": null,
  "qk_norm": "rms_norm_across_heads",
  "rope_max_seq_len": 1024,
  "text_dim": 4096,
  "local_attn_size": -1,
  "sink_size": 9,
  "num_frames_per_block": 3,
  "sliding_window_num_frames": 18
}