Spaces:

AkashMnd
/

ShadyLLM

Sleeping

App Files Files Community

ShadyLLM / app.py

AkashMnd

Update app.py

3dfd64d about 2 years ago

raw

history blame contribute delete

2.64 kB

	import time
	import os
	from typing import Any, List, Mapping, Optional
	import gradio as gr
	from langchain.callbacks.manager import CallbackManagerForLLMRun
	from langchain.llms.base import LLM
	import requests


	class RunpodServerlessLLM(LLM):
	pod_id: str
	api_key: str
	request_ids: List[str] = []

	@property
	def _llm_type(self) -> str:
	return "runpod_serverless"

	def _call(
	self,
	prompt: str,
	stop: Optional[List[str]] = None,
	run_manager: Optional[CallbackManagerForLLMRun] = None,
	**kwargs: Any,
	) -> str:
	if stop is not None and self._current_job_id is not None:
	#TODO: handle stop sequence
	...
	response = self._run_generate_request(prompt)
	return response

	@property
	def _identifying_params(self) -> Mapping[str, Any]:
	"""Get the identifying parameters."""
	return {"pod_id": self.pod_id}

	def _request_headers(self) -> Mapping[str, str]:
	return {
	"accept": "application/json",
	"content-type": "application/json",
	"authorization": self.api_key,
	}

	def _request_url(self) -> str:
	return f"https://api.runpod.ai/v2/{self.pod_id}"


	def _run_generate_request(self, prompt: str) -> str:
	headers = self._request_headers()
	input = {
	"method_name": "generate",
	"input": {"model": "mistral", "prompt": prompt},
	}
	print("before request", input, self._request_url(), headers)

	# TODO: Handle network errors
	out = requests.post(
	f"{self._request_url()}/run",
	headers=headers,
	json={"input": input},
	).json()

	id = out["id"]
	self.request_ids.append(id)

	while out["status"] != "COMPLETED":
	out = requests.get(
	f"{self._request_url()}/status/{id}",
	headers=headers,
	).json()
	time.sleep(1)

	return out["output"]["response"]

	llm = RunpodServerlessLLM(
	pod_id=os.getenv("podid"),
	api_key=os.getenv("api"),
	)
	def llmresponse(user_prompt):
	response = llm.predict(user_prompt)
	return response

	iface = gr.Interface(
	fn=llmresponse,
	inputs=gr.Textbox(label="User Prompt", placeholder="Enter Your Prompt"),
	outputs=gr.Textbox(label="LLM Output"),
	title="SkynetGPT",
	description="No Censorship ( This GPT cannot deny to answer) , Average Response Time - 45 seconds first try , Made By Akash Mondal , You are responsible for usage just like owning a weapon"

	)

	iface.launch()