bytess
/

zrah-model-1.0

Generated from Trainer

Model card Files Files and versions

bytess commited on May 30, 2025

Commit

43e3774

·

verified ·

1 Parent(s): fe4db89

Update README.md

Files changed (1) hide show

README.md +5 -12

README.md CHANGED Viewed

@@ -25,10 +25,10 @@ Axolotl version: `0.8.0.dev0`
 ```yaml
 adapter: lora
-base_model: mistralai/Mistral-7B-v0.1
 model_type: MistralForCausalLM
 tokenizer_type: AutoTokenizer
-bf16: auto
 dataset_processes: 32
 datasets:
   - path: bytess/zrah-personal-ai
@@ -38,7 +38,7 @@ gradient_checkpointing: false
 learning_rate: 0.0002
 lora_alpha: 32
 lora_dropout: 0.05
-lora_r: 16
 lora_target_modules:
   - q_proj
   - v_proj
@@ -50,7 +50,7 @@ lora_target_modules:
 loraplus_lr_embedding: 1.0e-06
 lr_scheduler: cosine
 max_prompt_len: 512
-micro_batch_size: 2
 num_epochs: 3
 optimizer: adamw_torch
 output_dir: ./outputs/zrah_model
@@ -63,14 +63,7 @@ sequence_len: 2048
 shuffle_merged_datasets: true
 train_on_inputs: false
 trl:
-  use_vllm: true
-  vllm_device: auto
-  vllm_dtype: bfloat16
-  vllm_gpu_memory_utilization: 0.9
-  log_completions: false
-  ref_model_mixup_alpha: 0.9
-  ref_model_sync_steps: 64
-  sync_ref_model: false
 val_set_size: 0.0
 weight_decay: 0.0
 ```

 ```yaml
 adapter: lora
+base_model: mistralai/Mistral-7B-Instruct-v0.3
 model_type: MistralForCausalLM
 tokenizer_type: AutoTokenizer
+bf16: true
 dataset_processes: 32
 datasets:
   - path: bytess/zrah-personal-ai
 learning_rate: 0.0002
 lora_alpha: 32
 lora_dropout: 0.05
+lora_r: 16           # Or try 8 for smaller size later
 lora_target_modules:
   - q_proj
   - v_proj
 loraplus_lr_embedding: 1.0e-06
 lr_scheduler: cosine
 max_prompt_len: 512
+micro_batch_size: 4  # Increase from 2 if GPU allows
 num_epochs: 3
 optimizer: adamw_torch
 output_dir: ./outputs/zrah_model
 shuffle_merged_datasets: true
 train_on_inputs: false
 trl:
+  use_vllm: false
 val_set_size: 0.0
 weight_decay: 0.0
 ```