Module_2

Running

srbhavya01 commited on 9 days ago

Commit

c06dc28

verified ·

1 Parent(s): 963ebeb

Update model_api.py

Files changed (1) hide show

model_api.py CHANGED Viewed

@@ -1,25 +1,21 @@
 from huggingface_hub import InferenceClient
 import os
-from dotenv import load_dotenv
-load_dotenv()
 def query_model(prompt):
-    HF_TOKEN = os.getenv("HF_TOKEN")
-    client = InferenceClient(
-        model="meta-llama/Llama-3.2-3B-Instruct",
-        token=HF_TOKEN
-    )
-    response = client.chat_completion(
-        messages=[
-            {"role": "system", "content": "You are a professional fitness trainer."},
-            {"role": "user", "content": prompt}
-        ],
-        max_tokens=800,
-        temperature=0.7
-    )
-    return response.choices[0].message.content

 from huggingface_hub import InferenceClient
 import os
 def query_model(prompt):
+    try:
+        HF_TOKEN = os.getenv("HF_TOKEN")
+        # You can also set provider at the client level
+        client = InferenceClient(api_key=HF_TOKEN, provider="auto")
+        response = client.chat.completions.create(
+            model="Qwen/Qwen2.5-7B-Instruct",
+            messages=[
+                {"role": "system", "content": "You are a professional fitness trainer."},
+                {"role": "user", "content": prompt}
+            ],
+            max_tokens=1500,
+            temperature=0.7
+        )
+        return response.choices[0].message.content
+    except Exception as e:
+        return f"Error: {str(e)}"