Upload runs/LFM2.5-VL-450M-vlm_sft-vlm_mix_pa-all-lr1em05-w0p1-lora_a-20260502_104403/configs/sat_vl_sft_single.yaml with huggingface_hub

Files changed (1) hide show

runs/LFM2.5-VL-450M-vlm_sft-vlm_mix_pa-all-lr1em05-w0p1-lora_a-20260502_104403/configs/sat_vl_sft_single.yaml ADDED Viewed

+project_name: "nutonic_sat_vl_sft_single"
+model_name: "LFM2.5-VL-450M"
+training_type: "vlm_sft"
+dataset:
+  path: "/data/nutonic/vlm_mix_parquet"
+  type: "vlm_sft"
+  limit: null
+  test_size: 0.002
+  split: "train"
+  image_root: "/data/nutonic/sat-vl-sft-training-ready-v1"
+  cache_dataset: false
+training_config:
+  extends: "DEFAULT_VLM_SFT"
+  num_train_epochs: 1
+  per_device_train_batch_size: 8
+  gradient_accumulation_steps: 4
+  learning_rate: 1e-05
+  warmup_ratio: 0.05
+  weight_decay: 0.0
+  lr_scheduler_type: "cosine"
+  logging_steps: 10
+  save_strategy: "epoch"
+  eval_strategy: "epoch"
+  eval_on_start: true
+  gradient_checkpointing: true
+  dataloader_drop_last: true
+  max_image_tokens: null
+  do_image_splitting: true
+  vision_encoder_lr_multiplier: 0.05
+  tracker: "trackio"
+  trackio_space_id: "NuTonic/lspace-trackio"
+peft_config:
+  extends: "DEFAULT_VLM_LORA"
+  use_peft: true
+  r: 16
+  lora_alpha: 32
+  lora_dropout: 0.05
+  bias: "none"