Spaces:

hashan-7
/

Chat7-CodeX-Backend

Paused

App Files Files Community

hashan-7 commited on Mar 21

Commit

895ed04

verified ·

1 Parent(s): 3f6ba20

add the code

Browse files

Files changed (1) hide show

model_client.py +80 -0

model_client.py CHANGED Viewed

	@@ -0,0 +1,80 @@

+import requests
+from typing import Optional, Tuple
+from config import settings
+class ModelClient:
+    def __init__(self):
+        self.primary_model = settings.PRIMARY_CODE_MODEL
+        self.fallback_model = settings.FALLBACK_CODE_MODEL
+        self.timeout = settings.MODEL_TIMEOUT_SECONDS
+        self.temperature = settings.DEFAULT_TEMPERATURE
+        self.top_p = settings.DEFAULT_TOP_P
+    def _build_payload(self, prompt: str, model_name: str) -> dict:
+        return {
+            "inputs": prompt,
+            "parameters": {
+                "temperature": self.temperature,
+                "top_p": self.top_p,
+                "return_full_text": False,
+            },
+            "options": {
+                "wait_for_model": True,
+                "use_cache": False,
+            },
+            "model": model_name,
+        }
+    def _extract_text(self, response_json) -> str:
+        if isinstance(response_json, list) and len(response_json) > 0:
+            first_item = response_json[0]
+            if isinstance(first_item, dict):
+                if "generated_text" in first_item:
+                    return str(first_item["generated_text"]).strip()
+        if isinstance(response_json, dict):
+            if "generated_text" in response_json:
+                return str(response_json["generated_text"]).strip()
+            if "error" in response_json:
+                raise RuntimeError(str(response_json["error"]).strip())
+        raise RuntimeError("Invalid model response format.")
+    def _call_huggingface_model(self, prompt: str, model_name: str) -> str:
+        api_url = f"https://api-inference.huggingface.co/models/{model_name}"
+        headers = {}
+        hf_token = getattr(settings, "HUGGINGFACE_API_TOKEN", "")
+        if hf_token:
+            headers["Authorization"] = f"Bearer {hf_token}"
+        payload = self._build_payload(prompt, model_name)
+        response = requests.post(
+            api_url,
+            headers=headers,
+            json=payload,
+            timeout=self.timeout,
+        )
+        response.raise_for_status()
+        return self._extract_text(response.json())
+    def generate(self, prompt: str) -> Tuple[str, str, bool]:
+        try:
+            output = self._call_huggingface_model(prompt, self.primary_model)
+            return output, self.primary_model, False
+        except Exception as primary_error:
+            print(f"Primary model failed: {primary_error}")
+            try:
+                output = self._call_huggingface_model(prompt, self.fallback_model)
+                return output, self.fallback_model, True
+            except Exception as fallback_error:
+                print(f"Fallback model failed: {fallback_error}")
+                raise RuntimeError("Both primary and fallback models failed.")
+model_client = ModelClient()