Spaces:

CEIA-POSITIVO
/

public_chat

Sleeping

Fazzioni commited on Jan 19

Commit

7111032

verified ·

1 Parent(s): 44f55ae

Update src/backend/model_loader.py

Files changed (1) hide show

src/backend/model_loader.py CHANGED Viewed

@@ -73,20 +73,21 @@ def load_model(
         model = AutoModelForCausalLM.from_pretrained( model_name, **args)
         # Move modelo para CPU se não há GPU e device_map não foi usado
-        if device_map is None and not has_cuda:
-            model = model.to("cpu")
         # Cria pipeline
         pipeline_kwargs = {
             "model": model,
             "tokenizer": tokenizer,
         }
         # Só adiciona device ao pipeline se não usar device_map no modelo
-        if device_map is None:
-            pipeline_kwargs["device"] = 0 if has_cuda else -1
-        else:
-            pipeline_kwargs["device_map"] = device_map
         pipe = pipeline("text-generation", **pipeline_kwargs)

         model = AutoModelForCausalLM.from_pretrained( model_name, **args)
         # Move modelo para CPU se não há GPU e device_map não foi usado
+        #if device_map is None and not has_cuda:
+        #    model = model.to("cpu")
         # Cria pipeline
         pipeline_kwargs = {
             "model": model,
             "tokenizer": tokenizer,
+            'device_map': args["device_map"]
         }
         # Só adiciona device ao pipeline se não usar device_map no modelo
+        #if device_map is None:
+        #    pipeline_kwargs["device"] = 0 if has_cuda else -1
+        #else:
+        #    pipeline_kwargs["device_map"] = device_map
         pipe = pipeline("text-generation", **pipeline_kwargs)