Final_Assignment

Sleeping

Nav772 commited on Jun 15, 2025

Commit

fb6f0ce

verified ·

1 Parent(s): ee43ff0

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -10,7 +10,7 @@ DEFAULT_API_URL = "https://agents-course-unit4-scoring.hf.space"
 # --- Basic Agent Definition ---
 # ----- THIS IS WERE YOU CAN BUILD WHAT YOU WANT ------
-from transformers import pipeline, AutoTokenizer, AutoModelForCausalLM
 class BasicAgent:
     def __init__(self):
@@ -18,13 +18,16 @@ class BasicAgent:
         model_id = "mistralai/Mistral-7B-Instruct-v0.1"
         self.tokenizer = AutoTokenizer.from_pretrained(model_id)
         self.model = AutoModelForCausalLM.from_pretrained(model_id)
         self.pipeline = pipeline(
             "text-generation",
             model=self.model,
             tokenizer=self.tokenizer,
-            device=-1  # CPU
         )
     def __call__(self, question: str) -> str:
@@ -32,13 +35,17 @@ class BasicAgent:
         try:
             prompt = f"<s>[INST] {question.strip()} [/INST]"
-            result = self.pipeline(prompt, max_new_tokens=256, temperature=0.7)
-            return result[0]["generated_text"].split("[/INST]")[-1].strip()
         except Exception as e:
             print(f"❌ Error during model inference: {e}")
             return f"❌ Model Error: {str(e)}"
 def run_and_submit_all( profile: gr.OAuthProfile | None):
     """
     Fetches all questions, runs the BasicAgent on them, submits all answers,

 # --- Basic Agent Definition ---
 # ----- THIS IS WERE YOU CAN BUILD WHAT YOU WANT ------
+from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
 class BasicAgent:
     def __init__(self):
         model_id = "mistralai/Mistral-7B-Instruct-v0.1"
+        # Load model and tokenizer directly
         self.tokenizer = AutoTokenizer.from_pretrained(model_id)
         self.model = AutoModelForCausalLM.from_pretrained(model_id)
+        # Create inference pipeline
         self.pipeline = pipeline(
             "text-generation",
             model=self.model,
             tokenizer=self.tokenizer,
+            device=-1
         )
     def __call__(self, question: str) -> str:
         try:
             prompt = f"<s>[INST] {question.strip()} [/INST]"
+            output = self.pipeline(prompt, max_new_tokens=256, temperature=0.7)
+            # Extract and clean the response
+            generated_text = output[0]["generated_text"]
+            response = generated_text.split("[/INST]")[-1].strip()
+            return response
         except Exception as e:
             print(f"❌ Error during model inference: {e}")
             return f"❌ Model Error: {str(e)}"
 def run_and_submit_all( profile: gr.OAuthProfile | None):
     """
     Fetches all questions, runs the BasicAgent on them, submits all answers,