Spaces:

Rahul-8799
/

MAC_UI

Sleeping

Rahul-8799 commited on May 9, 2025

Commit

dcb6f6f

verified ·

1 Parent(s): 86b318b

Update utils/inference.py

Files changed (1) hide show

utils/inference.py CHANGED Viewed

@@ -12,13 +12,15 @@ headers = {
 def call_model(prompt: str) -> str:
     response = requests.post(
-        f"{API_URL}/v1/completions",
         headers=headers,
         json={
-            "prompt": prompt,
-            "max_new_tokens": 2048,
-            "temperature": 0.3,
-            "do_sample": False
         }
     )
@@ -26,4 +28,13 @@ def call_model(prompt: str) -> str:
         raise RuntimeError(f"Inference error: {response.status_code} - {response.text}")
     result = response.json()
-    return result.get("generated_text", "⚠️ No output generated.")

 def call_model(prompt: str) -> str:
     response = requests.post(
+        f"{API_URL}/generate",  # <-- use /generate for HF endpoints
         headers=headers,
         json={
+            "inputs": prompt,
+            "parameters": {
+                "max_new_tokens": 2048,
+                "temperature": 0.3,
+                "do_sample": False
+            }
         }
     )
         raise RuntimeError(f"Inference error: {response.status_code} - {response.text}")
     result = response.json()
+    # Handle variations in response format
+    if isinstance(result, dict) and "generated_text" in result:
+        return result["generated_text"]
+    elif isinstance(result, list) and "generated_text" in result[0]:
+        return result[0]["generated_text"]
+    elif "text" in result:
+        return result["text"]
+    else:
+        return "⚠️ No output generated."