Spaces:

pendar02
/

biomedical

Sleeping

App Files Files Community

pendar02 commited on Jan 10, 2025

Commit

2d9eebc

verified ·

1 Parent(s): 1229bf2

Update app.py

Browse files

Files changed (1) hide show

app.py +8 -15

app.py CHANGED Viewed

@@ -40,49 +40,42 @@ def load_model(model_type):
     manage_resources()
     try:
-        # Set lower precision to reduce memory usage
-        torch_dtype = torch.float32
-        if torch.cuda.is_available():
-            device = "cuda"
-        else:
-            device = "cpu"
-            torch_dtype = torch.float32  # Use float32 for CPU
         if model_type == "summarize":
             base_model = AutoModelForSeq2SeqLM.from_pretrained(
                 "facebook/bart-large-cnn",
                 cache_dir="./models",
-                torch_dtype=torch_dtype,
                 low_cpu_mem_usage=True
             )
             model = PeftModel.from_pretrained(
                 base_model,
                 "pendar02/results",
-                device_map=device,
-                torch_dtype=torch_dtype
             )
             tokenizer = AutoTokenizer.from_pretrained(
                 "facebook/bart-large-cnn",
                 cache_dir="./models"
             )
         else:  # question_focused
-            base_model = AutoModelForSeq2SeqLM.from_pretrained(
                 "GanjinZero/biobart-base",
                 cache_dir="./models",
-                torch_dtype=torch_dtype,
                 low_cpu_mem_usage=True
             )
             model = PeftModel.from_pretrained(
                 base_model,
                 "pendar02/biobart-finetune",
-                device_map=device,
-                torch_dtype=torch_dtype
             )
             tokenizer = AutoTokenizer.from_pretrained(
                 "GanjinZero/biobart-base",
                 cache_dir="./models"
             )
         model.eval()
         return model, tokenizer
     except Exception as e:

     manage_resources()
     try:
+        # For CPU-only environment, don't use device_map
         if model_type == "summarize":
             base_model = AutoModelForSeq2SeqLM.from_pretrained(
                 "facebook/bart-large-cnn",
                 cache_dir="./models",
+                torch_dtype=torch.float32,
                 low_cpu_mem_usage=True
             )
             model = PeftModel.from_pretrained(
                 base_model,
                 "pendar02/results",
+                torch_dtype=torch.float32
             )
             tokenizer = AutoTokenizer.from_pretrained(
                 "facebook/bart-large-cnn",
                 cache_dir="./models"
             )
         else:  # question_focused
+            base_model = AutoModelForSeq2SeqLation_model = AutoModelForSeq2SeqLM.from_pretrained(
                 "GanjinZero/biobart-base",
                 cache_dir="./models",
+                torch_dtype=torch.float32,
                 low_cpu_mem_usage=True
             )
             model = PeftModel.from_pretrained(
                 base_model,
                 "pendar02/biobart-finetune",
+                torch_dtype=torch.float32
             )
             tokenizer = AutoTokenizer.from_pretrained(
                 "GanjinZero/biobart-base",
                 cache_dir="./models"
             )
+        # Ensure model is on CPU
+        model = model.cpu()
         model.eval()
         return model, tokenizer
     except Exception as e: