stmasson
/

training-scripts

stmasson commited on Dec 22, 2025

Commit

7dbc984

verified ·

1 Parent(s): a18220e

Upload scripts/train_orpo_n8n_thinking.py with huggingface_hub

Files changed (1) hide show

scripts/train_orpo_n8n_thinking.py CHANGED Viewed

@@ -9,7 +9,6 @@
 #     "bitsandbytes",
 #     "sentencepiece",
 #     "protobuf",
-#     "flash-attn",
 # ]
 # ///
@@ -71,7 +70,7 @@ model = AutoModelForCausalLM.from_pretrained(
     MODEL_NAME,
     quantization_config=bnb_config,
     device_map="auto",
-    attn_implementation="flash_attention_2",
 )
 # LoRA configuration for efficient training on 7B model

 #     "bitsandbytes",
 #     "sentencepiece",
 #     "protobuf",
 # ]
 # ///
     MODEL_NAME,
     quantization_config=bnb_config,
     device_map="auto",
+    attn_implementation="sdpa",  # Use scaled dot-product attention
 )
 # LoRA configuration for efficient training on 7B model