Spaces:

factorstudios
/

NMFL

Runtime error

App Files Files Community

Factor Studios commited on Aug 14, 2025

Commit

c10be9a

verified ·

1 Parent(s): 897c760

Update test_ai_integration_http.py

Browse files

Files changed (1) hide show

test_ai_integration_http.py +20 -5

test_ai_integration_http.py CHANGED Viewed

@@ -12,12 +12,13 @@ from typing import Any, Optional
 import torch
 from torch import nn
 import torch.nn.functional as F
-from torch.overrides import TorchFunctionMode
 from PIL import Image
 from transformers import (
     AutoTokenizer,
     AutoModelForCausalLM,
-    AutoProcessor
 )
 from virtual_vram import VirtualVRAM
 from http_storage import HTTPGPUStorage
@@ -113,21 +114,35 @@ def test_ai_integration_http():
             logger.info(f"Loading {model_name}")
             try:
                 processor = AutoProcessor.from_pretrained(
                     model_name,
-                    trust_remote_code=True
                 )
                 model = AutoModelForCausalLM.from_pretrained(
                     model_name,
-                    trust_remote_code=True
                 )
-                status['processor_loaded'] = True
                 status['model_loaded'] = True
                 # Log model architecture
                 model_size = get_model_size(model)
                 logger.info(f"Model loaded: {model_size/1e9:.2f} GB in parameters")
                 logger.info(f"Model architecture: {model.__class__.__name__}")
             except Exception as e:
                 logger.error(f"Model loading failed: {str(e)}")
                 raise

 import torch
 from torch import nn
 import torch.nn.functional as F
+from torch.utils._python_dispatch import TorchFunctionMode
 from PIL import Image
 from transformers import (
     AutoTokenizer,
     AutoModelForCausalLM,
+    AutoProcessor,
+    AutoConfig
 )
 from virtual_vram import VirtualVRAM
 from http_storage import HTTPGPUStorage
             logger.info(f"Loading {model_name}")
             try:
+                # Load processor with direct configuration
                 processor = AutoProcessor.from_pretrained(
                     model_name,
+                    trust_remote_code=True,
+                    return_tensors="pt"
                 )
+                status['processor_loaded'] = True
+                # Load model with vision config
+                from transformers import AutoConfig
+                config = AutoConfig.from_pretrained(
+                    model_name,
+                    trust_remote_code=True,
+                    torch_dtype=torch.float32  # Use float32 for better compatibility
+                )
                 model = AutoModelForCausalLM.from_pretrained(
                     model_name,
+                    config=config,
+                    trust_remote_code=True,
+                    device_map=None  # Don't auto-map devices
                 )
                 status['model_loaded'] = True
                 # Log model architecture
                 model_size = get_model_size(model)
                 logger.info(f"Model loaded: {model_size/1e9:.2f} GB in parameters")
                 logger.info(f"Model architecture: {model.__class__.__name__}")
+                logger.info(f"Model config type: {type(config).__name__}")
             except Exception as e:
                 logger.error(f"Model loading failed: {str(e)}")
                 raise