File size: 1,466 Bytes

55ab486

{
  "alora_invocation_tokens": null,
  "alpha_pattern": {},
  "arrow_config": null,
  "auto_mapping": {
    "base_model_class": "Qwen3_5MoeForConditionalGeneration",
    "parent_library": "transformers.models.qwen3_5_moe.modeling_qwen3_5_moe",
    "unsloth_fixed": true
  },
  "base_model_name_or_path": "/workspace/models/Qwen3.5-35B-A3B",
  "bias": "none",
  "corda_config": null,
  "ensure_weight_tying": false,
  "eva_config": null,
  "exclude_modules": null,
  "fan_in_fan_out": false,
  "inference_mode": true,
  "init_lora_weights": true,
  "layer_replication": null,
  "layers_pattern": null,
  "layers_to_transform": null,
  "loftq_config": {},
  "lora_alpha": 128,
  "lora_bias": false,
  "lora_dropout": 0.0,
  "megatron_config": null,
  "megatron_core": "megatron.core",
  "modules_to_save": [
    "lm_head",
    "embed_tokens"
  ],
  "peft_type": "LORA",
  "peft_version": "0.18.1",
  "qalora_group_size": 16,
  "r": 128,
  "rank_pattern": {},
  "revision": null,
  "target_modules": [
    "in_proj_qkv",
    "attn.proj",
    "in_proj_z",
    "o_proj",
    "k_proj",
    "mlp.linear_fc2",
    "mlp.linear_fc1",
    "v_proj",
    "shared_expert_gate",
    "out_proj",
    "down_proj",
    "up_proj",
    "qkv",
    "in_proj_b",
    "lm_head",
    "in_proj_a",
    "q_proj",
    "gate_proj"
  ],
  "target_parameters": null,
  "task_type": "CAUSAL_LM",
  "trainable_token_indices": null,
  "use_dora": false,
  "use_qalora": false,
  "use_rslora": false
}