Spaces:

gk2410
/

AIMLInterviewer

Sleeping

gk2410 commited on Jan 3

Commit

7804499

verified ·

1 Parent(s): ab1e95e

Update llm.py

Files changed (1) hide show

llm.py CHANGED Viewed

@@ -1,20 +1,29 @@
-import requests
 import os
-API_URL = "https://api-inference.huggingface.co/models/mistralai/Mistral-7B-Instruct-v0.2"
-HEADERS = {
-    "Authorization": f"Bearer {os.environ['HF_TOKEN']}"
-}
-def ask_llm(prompt):
     payload = {
         "inputs": prompt,
-        "parameters": {
-            "max_new_tokens": 300,
-            "temperature": 0.4,
-            "return_full_text": False
-        }
     }
-    r = requests.post(API_URL, headers=HEADERS, json=payload, timeout=120)
-    r.raise_for_status()
-    return r.json()[0]["generated_text"]

 import os
+import requests
+HF_MODEL_URL = "https://api-inference.huggingface.co/models/mistralai/Mistral-7B-Instruct-v0.2"
+HF_TOKEN = os.environ.get("HF_TOKEN")
+HEADERS = {"Authorization": f"Bearer {HF_TOKEN}"}
+def ask_llm(prompt: str, max_tokens: int = 300) -> str:
+    if not HF_TOKEN:
+        return "Error: HF_TOKEN environment variable not set."
     payload = {
         "inputs": prompt,
+        "parameters": {"max_new_tokens": max_tokens},
+        "options": {"wait_for_model": True}
     }
+    try:
+        response = requests.post(HF_MODEL_URL, headers=HEADERS, json=payload, timeout=120)
+        response.raise_for_status()
+        result = response.json()
+        if isinstance(result, list) and "generated_text" in result[0]:
+            return result[0]["generated_text"]
+        else:
+            return str(result)
+    except requests.exceptions.RequestException as e:
+        return f"Error querying LLM: {e}"