Spaces:

AkashMnd
/

ShadyLLM

Sleeping

App Files Files Community

AkashMnd commited on Dec 19, 2023

Commit

d90fe60

1 Parent(s): 1461f2c

Create app.py

Browse files

Files changed (1) hide show

app.py +91 -0

app.py ADDED Viewed

	@@ -0,0 +1,91 @@

+import time
+from typing import Any, List, Mapping, Optional
+import gradio as gr
+from langchain.callbacks.manager import CallbackManagerForLLMRun
+from langchain.llms.base import LLM
+import requests
+class RunpodServerlessLLM(LLM):
+    pod_id: str
+    api_key: str
+    request_ids: List[str] = []
+    @property
+    def _llm_type(self) -> str:
+        return "runpod_serverless"
+    def _call(
+        self,
+        prompt: str,
+        stop: Optional[List[str]] = None,
+        run_manager: Optional[CallbackManagerForLLMRun] = None,
+        **kwargs: Any,
+    ) -> str:
+        if stop is not None and self._current_job_id is not None:
+            #TODO: handle stop sequence
+            ...
+        response = self._run_generate_request(prompt)
+        return response
+    @property
+    def _identifying_params(self) -> Mapping[str, Any]:
+        """Get the identifying parameters."""
+        return {"pod_id": self.pod_id}
+    def _request_headers(self) -> Mapping[str, str]:
+        return {
+            "accept": "application/json",
+            "content-type": "application/json",
+            "authorization": self.api_key,
+        }
+    def _request_url(self) -> str:
+        return f"https://api.runpod.ai/v2/{self.pod_id}"
+    def _run_generate_request(self, prompt: str) -> str:
+        headers = self._request_headers()
+        input = {
+            "method_name": "generate",
+            "input": {"model": "mistral", "prompt": prompt},
+        }
+        print("before request", input, self._request_url(), headers)
+        # TODO: Handle network errors
+        out = requests.post(
+            f"{self._request_url()}/run",
+            headers=headers,
+            json={"input": input},
+        ).json()
+        id = out["id"]
+        self.request_ids.append(id)
+        while out["status"] != "COMPLETED":
+            out = requests.get(
+                f"{self._request_url()}/status/{id}",
+                headers=headers,
+            ).json()
+            time.sleep(1)
+        return out["output"]["response"]
+llm = RunpodServerlessLLM(
+    pod_id="bbr5w1ja6f12mx",
+    api_key="B6WXXQ95XTG45909LKTQMPHP1F7JO09EXEMDTRN9",
+)
+def llmresponse(user_prompt):
+    response = llm.predict(user_prompt)
+    return response
+iface = gr.Interface(
+    fn=llmresponse,
+    inputs=gr.Textbox(label="User Prompt", placeholder="Enter Your Prompt"),
+    outputs=gr.Textbox(label="LLM Output"),
+    title="Shady GPT😏",
+    description="No Censorship (Excluding Some Really Devilish shit) , Average Response Time - 45 seconds first try , Made By Akash Mondal"
+)
+iface.launch()