Spaces:

Executor-Tyrant-Framework
/

Condensate

Runtime error

Executor-Tyrant-Framework Claude Opus 4.6 (1M context) commited on Mar 29

Commit

487e5c0

1 Parent(s): 0f055ca

Fix: increase GPU timeout to 180s, remove torch_dtype kwarg

3.25GB download + 5 inference passes was exceeding 120s.
Let from_pretrained use its default dtype (avoids deprecation warning).

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>

Files changed (1) hide show

app.py +2 -5

app.py CHANGED Viewed

@@ -30,7 +30,7 @@ GRAPH = None
 MODEL_NAME = "gpt2-large"
-@spaces.GPU(duration=120)
 def load_and_train():
     """Load model + train predictor in a single GPU call."""
     global MODEL, TOKENIZER, MEMBRANE, PREDICTOR, GRAPH
@@ -45,10 +45,7 @@ def load_and_train():
         TOKENIZER.pad_token = TOKENIZER.eos_token
     # Load model directly to GPU
-    MODEL = AutoModelForCausalLM.from_pretrained(
-        MODEL_NAME,
-        torch_dtype=torch.float32,
-    )
     MODEL.eval()
     MODEL.to("cuda")

 MODEL_NAME = "gpt2-large"
+@spaces.GPU(duration=180)
 def load_and_train():
     """Load model + train predictor in a single GPU call."""
     global MODEL, TOKENIZER, MEMBRANE, PREDICTOR, GRAPH
         TOKENIZER.pad_token = TOKENIZER.eos_token
     # Load model directly to GPU
+    MODEL = AutoModelForCausalLM.from_pretrained(MODEL_NAME)
     MODEL.eval()
     MODEL.to("cuda")