Spaces:

entropy25
/

mt

Running

entropy25 commited on 3 days ago

Commit

1f33fbe

verified ·

1 Parent(s): 4d25cd1

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -31,9 +31,12 @@ MAX_LENGTH = 256
 tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL)
 base_model = AutoModelForSeq2SeqLM.from_pretrained(
     BASE_MODEL,
-    quantization_config=BitsAndBytesConfig(load_in_8bit=True),
     low_cpu_mem_usage=True,
 )
@@ -91,7 +94,7 @@ def translate_cached(text, source_lang, target_lang):
     adapter_name, tgt_code = config
     start = time.time()
-    device = next(model.parameters()).device
     translated_paragraphs = []
     for paragraph in text.split("\n"):
@@ -111,7 +114,7 @@ def translate_cached(text, source_lang, target_lang):
                 truncation=True,
                 max_length=MAX_LENGTH,
             )
-            inputs = {k: v.to(device) for k, v in inputs.items()}
             with adapter_lock:
                 model.set_adapter(adapter_name)

 tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL)
+device = "cuda" if torch.cuda.is_available() else "cpu"
 base_model = AutoModelForSeq2SeqLM.from_pretrained(
     BASE_MODEL,
+    quantization_config=BitsAndBytesConfig(load_in_8bit=True) if device == "cuda" else None,
+    device_map={"": 0} if device == "cuda" else None,
     low_cpu_mem_usage=True,
 )
     adapter_name, tgt_code = config
     start = time.time()
+    dev = next(model.parameters()).device
     translated_paragraphs = []
     for paragraph in text.split("\n"):
                 truncation=True,
                 max_length=MAX_LENGTH,
             )
+            inputs = {k: v.to(dev) for k, v in inputs.items()}
             with adapter_lock:
                 model.set_adapter(adapter_name)