wheattoast11
/

agent-zero-training-scripts

wheattoast11 commited on Jan 31

Commit

26827fc

verified ·

1 Parent(s): 906a710

Upload train_glm_qlora_v4.py with huggingface_hub

Files changed (1) hide show

train_glm_qlora_v4.py CHANGED Viewed

@@ -16,8 +16,11 @@ Agent Zero SFT: zai-org/GLM-4.7-Flash (30B MoE)
 QLoRA (4-bit) with CPU offloading for layers that don't fit in 24GB VRAM.
 """
 import torch
 import trackio
 from datasets import load_dataset
 from peft import LoraConfig
 from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
@@ -36,7 +39,6 @@ bnb_config = BitsAndBytesConfig(
     llm_int8_enable_fp32_cpu_offload=True,
 )
-import os
 offload_dir = "/tmp/offload"
 os.makedirs(offload_dir, exist_ok=True)

 QLoRA (4-bit) with CPU offloading for layers that don't fit in 24GB VRAM.
 """
+import os
 import torch
 import trackio
+from huggingface_hub import login
+login(token=os.environ["HF_TOKEN"])
 from datasets import load_dataset
 from peft import LoraConfig
 from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
     llm_int8_enable_fp32_cpu_offload=True,
 )
 offload_dir = "/tmp/offload"
 os.makedirs(offload_dir, exist_ok=True)