KevinKeller
/

cognitive-trainer-scripts

KevinKeller commited on Dec 27, 2025

Commit

239cbc2

verified ·

1 Parent(s): 7c9b6bf

Upload train_pattern_selector.py with huggingface_hub

Files changed (1) hide show

train_pattern_selector.py CHANGED Viewed

@@ -1,5 +1,5 @@
 # /// script
-# dependencies = ["trl>=0.17.0", "peft>=0.15.0", "datasets", "transformers", "accelerate", "bitsandbytes"]
 # ///
 import os
@@ -9,6 +9,13 @@ from trl import SFTTrainer, SFTConfig
 from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
 import torch
 print("Loading dataset...")
 dataset = load_dataset("KevinKeller/cognitive-pattern-selector-v1")
 train_dataset = dataset["train"]
@@ -29,7 +36,8 @@ bnb_config = BitsAndBytesConfig(
 )
 tokenizer = AutoTokenizer.from_pretrained(model_id, trust_remote_code=True)
-tokenizer.pad_token = tokenizer.eos_token
 model = AutoModelForCausalLM.from_pretrained(
     model_id,
@@ -71,7 +79,7 @@ trainer = SFTTrainer(
     train_dataset=train_dataset,
     eval_dataset=eval_dataset,
     peft_config=peft_config,
-    processing_class=tokenizer,
     args=training_args,
 )

 # /// script
+# dependencies = ["trl>=0.12.0", "peft>=0.13.0", "datasets", "transformers>=4.45.0", "accelerate", "bitsandbytes", "huggingface_hub"]
 # ///
 import os
 from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
 import torch
+# Authenticate
+from huggingface_hub import login
+hf_token = os.environ.get("HF_TOKEN")
+if hf_token:
+    login(token=hf_token)
+    print("Authenticated with HuggingFace")
 print("Loading dataset...")
 dataset = load_dataset("KevinKeller/cognitive-pattern-selector-v1")
 train_dataset = dataset["train"]
 )
 tokenizer = AutoTokenizer.from_pretrained(model_id, trust_remote_code=True)
+if tokenizer.pad_token is None:
+    tokenizer.pad_token = tokenizer.eos_token
 model = AutoModelForCausalLM.from_pretrained(
     model_id,
     train_dataset=train_dataset,
     eval_dataset=eval_dataset,
     peft_config=peft_config,
+    tokenizer=tokenizer,
     args=training_args,
 )