Spaces:

ASLP-lab
/

VoiceSculptor

Runtime error

ASLP-lab commited on Jan 7

Commit

d4f7955

verified ·

1 Parent(s): 07cdf55

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -49,10 +49,13 @@ def load_models():
         logger.info("🚀 Loading vLLM model on GPU...")
         model = LLM(
             model=LLASA_MODEL_ID,
-            gpu_memory_utilization=0.8,
-            max_model_len=2048,
-            enforce_eager=True,
-            device="cuda"
         )
     if codec_model is None:

         logger.info("🚀 Loading vLLM model on GPU...")
         model = LLM(
             model=LLASA_MODEL_ID,
+            gpu_memory_utilization=0.90,
+            max_model_len=2048,
+            enable_prefix_caching=True,
+            dtype='auto',
+            quantization=None,
+            enforce_eager=False,
+            kv_cache_dtype='auto'
         )
     if codec_model is None: