Update README.md

Files changed (1) hide show

README.md CHANGED Viewed

@@ -133,7 +133,7 @@ llamafactory-cli train logicsct_train_Mistral_Nemo_qlora_sft_otfq.yaml       # V
 llamafactory-cli chat logicsct_inference_Mistral_Nemo_qlora_sft_otfq.yaml    # VRAM used: 24833MiB for inference of base model + QLoRA adapter
 llamafactory-cli export logicsct_export_Mistral_Nemo_qlora_sft.yaml          # VRAM used:   657MiB + about 24 GB of system RAM for exporting a merged verison of the model with its adapter
 llamafactory-cli export logicsct_export_Mistral_Nemo_qlora_sft_Q4.yaml       # VRAM used: 30353MiB for a 4bit quant export of the merged model
-llamafactory-cli chat logicsct_inference_Mistral_Nemo_qlora_sft_otfq_Q4.yaml # VRAM used:  8541MiB-9569MiB VRAM for inference of the 4bit quant merged model (increasing with increasing context length)
 ```
 ### Comparison of Open Source Training/Models with OpenAI Proprietary Fine-Tuning

 llamafactory-cli chat logicsct_inference_Mistral_Nemo_qlora_sft_otfq.yaml    # VRAM used: 24833MiB for inference of base model + QLoRA adapter
 llamafactory-cli export logicsct_export_Mistral_Nemo_qlora_sft.yaml          # VRAM used:   657MiB + about 24 GB of system RAM for exporting a merged verison of the model with its adapter
 llamafactory-cli export logicsct_export_Mistral_Nemo_qlora_sft_Q4.yaml       # VRAM used: 30353MiB for a 4bit quant export of the merged model
+llamafactory-cli chat logicsct_inference_Mistral_Nemo_qlora_sft_otfq_Q4.yaml # VRAM used:  8541MiB-9569MiB for inference of the 4bit quant merged model (increasing with increasing context length)
 ```
 ### Comparison of Open Source Training/Models with OpenAI Proprietary Fine-Tuning