Spaces:

Nutnell
/

DirectEd_AI

Runtime error

App Files Files Community

Nutnell commited on Aug 23, 2025

Commit

23ed3ee

verified ·

1 Parent(s): a5f4140

Update fine_tune.py

Browse files

Files changed (1) hide show

fine_tune.py +29 -8

fine_tune.py CHANGED Viewed

@@ -1,3 +1,6 @@
 import os
 import torch
 from datasets import load_dataset
@@ -17,18 +20,20 @@ import uvicorn
 base_model_name = "unsloth/llama-3-8b-Instruct-bnb-4bit"
 output_dir = "/data/fine_tuning"
 dataset_path = "dataset.jsonl"
-hub_model_id = "Nutnell/direct-ed-finetune-job"
 # --- Initialize model and tokenizer variables ---
 model = None
 tokenizer = None
 # --- Training Logic ---
 if not os.path.exists(os.path.join(output_dir, 'adapter_config.json')):
     print("No fine-tuned model found. Starting training...")
     dataset = load_dataset("json", data_files=dataset_path, split="train")
     model = AutoModelForCausalLM.from_pretrained(
         base_model_name,
         device_map="auto",
@@ -51,6 +56,7 @@ if not os.path.exists(os.path.join(output_dir, 'adapter_config.json')):
         target_modules=["q_proj", "k_proj", "v_proj", "o_proj", "gate_proj", "up_proj", "down_proj"],
     )
     training_arguments = TrainingArguments(
         output_dir=output_dir,
         num_train_epochs=1,
@@ -66,42 +72,52 @@ if not os.path.exists(os.path.join(output_dir, 'adapter_config.json')):
         group_by_length=True,
         lr_scheduler_type="linear",
         push_to_hub=True,
-        hub_model_id=hub_model_id,
     )
     trainer = SFTTrainer(
         model=model,
         train_dataset=dataset,
         peft_config=peft_config,
-        dataset_text_field="text",
         args=training_arguments,
     )
     trainer.train()
     trainer.model.save_pretrained(output_dir)
     print(f"Fine-tuned model adapter saved to {output_dir}")
-    # Push trained model to Hub
-    trainer.push_to_hub()
     model = trainer.model
 else:
     print("Found existing fine-tuned model. Loading for inference...")
     base_model = AutoModelForCausalLM.from_pretrained(
         base_model_name,
         device_map="auto",
         trust_remote_code=True,
     )
     model = PeftModel.from_pretrained(base_model, output_dir)
     tokenizer = AutoTokenizer.from_pretrained(base_model_name, trust_remote_code=True)
-# --- Inference Pipeline ---
 print("Setting up inference pipeline...")
 pipe = pipeline("text-generation", model=model, tokenizer=tokenizer, device_map="auto")
 print("Inference pipeline ready.")
 # --- FastAPI App ---
 class GenerateRequest(BaseModel):
     prompt: str
@@ -113,6 +129,11 @@ def home():
 @app.post("/generate")
 def generate(request: GenerateRequest):
     formatted_prompt = f"<|start_header_id|>user<|end_header_id|>\n\n{request.prompt}<|eot_id|><|start_header_id|>assistant<|end_header_id|>\n\n"
     outputs = pipe(formatted_prompt, max_new_tokens=200, do_sample=True, temperature=0.7)
-    return {"response": outputs[0]["generated_text"]}

 import os
 import torch
 from datasets import load_dataset
 base_model_name = "unsloth/llama-3-8b-Instruct-bnb-4bit"
 output_dir = "/data/fine_tuning"
 dataset_path = "dataset.jsonl"
 # --- Initialize model and tokenizer variables ---
 model = None
 tokenizer = None
 # --- Training Logic ---
+# Check if a fine-tuned model adapter already exists
 if not os.path.exists(os.path.join(output_dir, 'adapter_config.json')):
     print("No fine-tuned model found. Starting training...")
+    # Load dataset
     dataset = load_dataset("json", data_files=dataset_path, split="train")
+    # Load base model for training
     model = AutoModelForCausalLM.from_pretrained(
         base_model_name,
         device_map="auto",
         target_modules=["q_proj", "k_proj", "v_proj", "o_proj", "gate_proj", "up_proj", "down_proj"],
     )
+    # Training args
     training_arguments = TrainingArguments(
         output_dir=output_dir,
         num_train_epochs=1,
         group_by_length=True,
         lr_scheduler_type="linear",
         push_to_hub=True,
+        hub_model_id = "Nutnell/direct-ed-finetune-job"
     )
+    # Initialize Trainer
     trainer = SFTTrainer(
         model=model,
         train_dataset=dataset,
         peft_config=peft_config,
+        dataset_text_field="text", # Ensure your dataset has a 'text' column
         args=training_arguments,
     )
+    # Train the model
     trainer.train()
+    # Save the trained adapter
     trainer.model.save_pretrained(output_dir)
     print(f"Fine-tuned model adapter saved to {output_dir}")
     model = trainer.model
+# --- Inference Logic ---
+# If training did not run, load the existing model
 else:
     print("Found existing fine-tuned model. Loading for inference...")
+    # Load the base model
     base_model = AutoModelForCausalLM.from_pretrained(
         base_model_name,
         device_map="auto",
         trust_remote_code=True,
     )
+    # Apply the PEFT adapter
     model = PeftModel.from_pretrained(base_model, output_dir)
     tokenizer = AutoTokenizer.from_pretrained(base_model_name, trust_remote_code=True)
+# --- Create Inference Pipeline ---
 print("Setting up inference pipeline...")
 pipe = pipeline("text-generation", model=model, tokenizer=tokenizer, device_map="auto")
 print("Inference pipeline ready.")
 # --- FastAPI App ---
+# PYDANTIC MODEL FOR THE REQUEST BODY
 class GenerateRequest(BaseModel):
     prompt: str
 @app.post("/generate")
 def generate(request: GenerateRequest):
+    # Access the prompt from the request object
     formatted_prompt = f"<|start_header_id|>user<|end_header_id|>\n\n{request.prompt}<|eot_id|><|start_header_id|>assistant<|end_header_id|>\n\n"
     outputs = pipe(formatted_prompt, max_new_tokens=200, do_sample=True, temperature=0.7)
+    return {"response": outputs[0]["generated_text"]}
+if __name__ == "__main__":
+    uvicorn.run(app, host="0.0.0.0", port=7860)