Spaces:

factorstudios
/

FServe

Sleeping

App Files Files Community

Factor Studios commited on Aug 14, 2025

Commit

3302df9

verified ·

1 Parent(s): c12c99a

Update test_ai_integration_http.py

Browse files

Files changed (1) hide show

test_ai_integration_http.py +18 -4

test_ai_integration_http.py CHANGED Viewed

@@ -243,20 +243,34 @@ def test_ai_integration_http():
             print("Falling back to placeholder model mode...")
             # Try loading with placeholder model
             try:
                 placeholder_model = {
                     "model_name": model_id,
                     "model_type": "placeholder",
                     "parameters": 1000000,  # Small placeholder
-                    "architecture": "test",
                     "loaded_at": time.time(),
-                    # Required GPU architecture configuration
-                    "num_sms": 108,  # Similar to A100
                     "tensor_cores_per_sm": 4,
                     "cuda_cores_per_sm": 64,
                     "compute_capability": "8.0",
-                    "vram_allocation": "dynamic"
                 }
                 success = ai_accelerator_for_loading.load_model(
                     model_id=model_id,
                     model=placeholder_model,

             print("Falling back to placeholder model mode...")
             # Try loading with placeholder model
             try:
+                # Match server-side model configuration
                 placeholder_model = {
                     "model_name": model_id,
                     "model_type": "placeholder",
                     "parameters": 1000000,  # Small placeholder
+                    "architecture": {
+                        "type": "nvidia_ampere",
+                        "features": ["tensor_cores", "ray_tracing", "dynamic_scheduling"]
+                    },
                     "loaded_at": time.time(),
+                    # Server-validated GPU architecture configuration
+                    "num_sms": 108,  # A100 config
                     "tensor_cores_per_sm": 4,
                     "cuda_cores_per_sm": 64,
                     "compute_capability": "8.0",
+                    "vram_config": {
+                        "size_gb": 40,
+                        "bandwidth_gbps": 1555,
+                        "cache_size_mb": 40,
+                        "allocation": "dynamic"
+                    }
                 }
+                # Validate required fields before loading
+                required_fields = ["num_sms", "tensor_cores_per_sm", "cuda_cores_per_sm"]
+                if not all(field in placeholder_model for field in required_fields):
+                    raise ValueError(f"Missing required GPU architecture fields: {[f for f in required_fields if f not in placeholder_model]}")
                 success = ai_accelerator_for_loading.load_model(
                     model_id=model_id,
                     model=placeholder_model,