Spaces:

investmentllm
/

LLM-Model2

Sleeping

investmentllm commited on 20 days ago

Commit

6efefd7

verified ·

1 Parent(s): da5099d

Upload api/server.py with huggingface_hub

Files changed (1) hide show

api/server.py CHANGED Viewed

@@ -62,5 +62,27 @@ def serve_ui():
         return FileResponse(str(ui_file))
     return HTMLResponse("<h1>UI not found</h1>")
 if __name__ == "__main__":
     uvicorn.run("api.server:app", host=API_HOST, port=API_PORT, reload=False)

         return FileResponse(str(ui_file))
     return HTMLResponse("<h1>UI not found</h1>")
+@app.get("/test-llm")
+def test_llm():
+    import requests, os
+    from config.settings import HF_TOKEN
+    results = {}
+    models = [
+        "meta-llama/Llama-3.3-70B-Instruct",
+        "Qwen/QwQ-32B",
+        "meta-llama/Meta-Llama-3-8B-Instruct",
+        "HuggingFaceH4/zephyr-7b-beta",
+        "mistralai/Mistral-7B-Instruct-v0.2"
+    ]
+    for model in models:
+        try:
+            url = f"https://api-inference.huggingface.co/models/{model}"
+            r = requests.post(url, headers={"Authorization": f"Bearer {HF_TOKEN}"}, json={"inputs": "say hi", "parameters": {"max_new_tokens": 5}}, timeout=15)
+            results[model] = f"{r.status_code}: {r.text[:100]}"
+        except Exception as e:
+            results[model] = f"ERROR: {str(e)[:100]}"
+    return results
 if __name__ == "__main__":
     uvicorn.run("api.server:app", host=API_HOST, port=API_PORT, reload=False)