ceperaltab
/

elixir-trainer-code

ceperaltab commited on Dec 23, 2025

Commit

7cb962d

verified ·

1 Parent(s): fe0f10c

Upload train.py with huggingface_hub

Files changed (1) hide show

train.py CHANGED Viewed

@@ -13,9 +13,9 @@ from trl import SFTTrainer
 # --- CONFIGURATION ---
 # Base model: Using a quantized Llama 3 or Mistral is recommended for consumer GPUs.
 # Ensure you have access to the model on Hugging Face (might need login).
-MODEL_NAME = "meta-llama/Meta-Llama-3-8B"
 DATASET_NAME = "ceperaltab/elixir-golden-dataset"
-OUTPUT_DIR = "elixir-model-adapter"
 def main():
     print(f"Loading dataset from {DATASET_NAME}...")

 # --- CONFIGURATION ---
 # Base model: Using a quantized Llama 3 or Mistral is recommended for consumer GPUs.
 # Ensure you have access to the model on Hugging Face (might need login).
+MODEL_NAME = "Qwen/Qwen2.5-Coder-7B-Instruct"
 DATASET_NAME = "ceperaltab/elixir-golden-dataset"
+OUTPUT_DIR = "elixir-model-qwen"
 def main():
     print(f"Loading dataset from {DATASET_NAME}...")