Spaces:

factorstudios
/

FServe

Sleeping

Factor Studios commited on Aug 14, 2025

Commit

6ff57b4

verified ·

1 Parent(s): 72acfcf

Update http_storage.py

Files changed (1) hide show

http_storage.py CHANGED Viewed

@@ -32,7 +32,7 @@ class HTTPGPUStorage:
             return
         self.base_url = base_url.rstrip('/')
-        self.api_base = f"{self.base_url}/api/v1"
         self.session_token = None
         self.session_id = None
         self.lock = threading.Lock()
@@ -177,7 +177,7 @@ class HTTPGPUStorage:
             response = self._make_request(
                 'POST',
-                f'/vram/blocks/{tensor_id}',
                 json=request_data
             )
@@ -209,7 +209,7 @@ class HTTPGPUStorage:
                 logging.warning(f"Tensor {tensor_id} not registered in VRAM")
                 # Still try to load it in case it exists on server
-            response = self._make_request('GET', f'/vram/blocks/{tensor_id}')
             if response and response.get('status') == 'success':
                 data = response.get('data')
@@ -396,7 +396,7 @@ class HTTPGPUStorage:
             response = self._make_request(
                 'POST',
-                f'/models/{model_name}/inference',
                 json=request_data
             )
@@ -416,9 +416,8 @@ class HTTPGPUStorage:
     def ping(self) -> bool:
         """Ping the server to check connection status."""
-        try:
-            response = self._make_request('GET', '/status')
-            return response and response.get('status') == 'ok'
         except Exception as e:
             logging.error(f"Ping failed: {e}")
             return False

             return
         self.base_url = base_url.rstrip('/')
+        self.api_base = f"{self.base_url}"
         self.session_token = None
         self.session_id = None
         self.lock = threading.Lock()
             response = self._make_request(
                 'POST',
+                f'/api/v1/vram/blocks/{tensor_id}',
                 json=request_data
             )
                 logging.warning(f"Tensor {tensor_id} not registered in VRAM")
                 # Still try to load it in case it exists on server
+            response = self._make_request('GET', f'/api/v1/vram/blocks/{tensor_id}')
             if response and response.get('status') == 'success':
                 data = response.get('data')
             response = self._make_request(
                 'POST',
+                f'/api/v1/models/{model_name}/inference',
                 json=request_data
             )
     def ping(self) -> bool:
         """Ping the server to check connection status."""
+        try:            response = self._make_request("GET", f"/api/v1/sessions")
+            return response and response.get("session_token") is not None
         except Exception as e:
             logging.error(f"Ping failed: {e}")
             return False