Spaces:

Pikeras
/

Equitia-evaluation-tool

Sleeping

App Files Files Community

Pikeras commited on Mar 4

Commit

b7fdad8

verified ·

1 Parent(s): 2f2fc9b

Update src/web/hf_client.py

Browse files

Files changed (1) hide show

src/web/hf_client.py +32 -4

src/web/hf_client.py CHANGED Viewed

@@ -10,12 +10,13 @@ def generar_respuesta_hf(
     timeout_segundos: int,
     numero_reintentos: int,
 ) -> str:
-    url = f"https://router.huggingface.co/hf-inference/models/{model_id}"
     headers = {
         "Authorization": f"Bearer {api_key}",
         "Content-Type": "application/json",
     }
-    payload = {
         "inputs": prompt,
         "parameters": {
             "return_full_text": False,
@@ -23,14 +24,41 @@ def generar_respuesta_hf(
             "temperature": 0.0,
         },
     }
     ultimo_error = None
     for _ in range(numero_reintentos):
         try:
-            response = requests.post(url, headers=headers, json=payload, timeout=timeout_segundos)
             if response.status_code >= 400:
-                ultimo_error = f"HTTP {response.status_code}: {response.text[:200]}"
                 continue
             body = response.json()
             if isinstance(body, list) and body:

     timeout_segundos: int,
     numero_reintentos: int,
 ) -> str:
+    url_hf_inference = f"https://router.huggingface.co/hf-inference/models/{model_id}"
+    url_chat = "https://router.huggingface.co/v1/chat/completions"
     headers = {
         "Authorization": f"Bearer {api_key}",
         "Content-Type": "application/json",
     }
+    payload_hf_inference = {
         "inputs": prompt,
         "parameters": {
             "return_full_text": False,
             "temperature": 0.0,
         },
     }
+    payload_chat = {
+        "model": model_id,
+        "messages": [{"role": "user", "content": prompt}],
+        "max_tokens": 64,
+        "temperature": 0.0,
+    }
     ultimo_error = None
     for _ in range(numero_reintentos):
         try:
+            response = requests.post(
+                url_hf_inference,
+                headers=headers,
+                json=payload_hf_inference,
+                timeout=timeout_segundos,
+            )
+            if response.status_code == 404:
+                response = requests.post(
+                    url_chat,
+                    headers=headers,
+                    json=payload_chat,
+                    timeout=timeout_segundos,
+                )
             if response.status_code >= 400:
+                if response.status_code == 404:
+                    ultimo_error = (
+                        "HTTP 404: modelo no disponible en Hugging Face Inference Router "
+                        "o sin permisos para tu token. Prueba otro model_id."
+                    )
+                else:
+                    ultimo_error = f"HTTP {response.status_code}: {response.text[:250]}"
                 continue
             body = response.json()
             if isinstance(body, list) and body: