Module_2

Running

srbhavya01 commited on 8 days ago

Commit

ca8790e

verified ·

1 Parent(s): 4e3e940

Update model_api.py

Files changed (1) hide show

model_api.py CHANGED Viewed

@@ -1,28 +1,21 @@
 from huggingface_hub import InferenceClient
 import os
-from dotenv import load_dotenv
-load_dotenv()
 def query_model(prompt):
     try:
         HF_TOKEN = os.getenv("HF_TOKEN")
-        client = InferenceClient(
             model="Qwen/Qwen2.5-7B-Instruct",
-            token=HF_TOKEN
-        )
-        response = client.chat_completion(
             messages=[
                 {"role": "system", "content": "You are a professional fitness trainer."},
                 {"role": "user", "content": prompt}
             ],
-            max_tokens=1200,
             temperature=0.7
         )
         return response.choices[0].message.content
     except Exception as e:
-        return f"Model Error: {str(e)}"

 from huggingface_hub import InferenceClient
 import os
 def query_model(prompt):
     try:
         HF_TOKEN = os.getenv("HF_TOKEN")
+        # You can also set provider at the client level
+        client = InferenceClient(api_key=HF_TOKEN, provider="auto")
+        response = client.chat.completions.create(
             model="Qwen/Qwen2.5-7B-Instruct",
             messages=[
                 {"role": "system", "content": "You are a professional fitness trainer."},
                 {"role": "user", "content": prompt}
             ],
+            max_tokens=1500,
             temperature=0.7
         )
         return response.choices[0].message.content
     except Exception as e:
+        return f"Error: {str(e)}"