Spaces:

akshit-g
/

SeeForMe-Life

Sleeping

akshit-g commited on Dec 5, 2024

Commit

b0dd6ae

verified ·

1 Parent(s): a77f3d8

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -8,16 +8,16 @@ from PIL import ImageDraw
 from torchvision.transforms.v2 import Resize
 import subprocess
-# subprocess.run('pip install flash-attn --no-build-isolation', env={'FLASH_ATTENTION_SKIP_CUDA_BUILD': "TRUE"}, shell=True)
 model_id = "vikhyatk/moondream2"
 revision = "2024-05-20"
 tokenizer = AutoTokenizer.from_pretrained(model_id, revision=revision)
 moondream = AutoModelForCausalLM.from_pretrained(
     model_id, trust_remote_code=True, revision=revision,
-    # torch_dtype=torch.bfloat16, device_map={"": "cuda"}
-    torch_dtype=torch.float32, device_map="cpu"
-    # attn_implementation="flash_attention_2"
 )
 moondream.eval()

 from torchvision.transforms.v2 import Resize
 import subprocess
+subprocess.run('pip install flash-attn --no-build-isolation', env={'FLASH_ATTENTION_SKIP_CUDA_BUILD': "TRUE"}, shell=True)
 model_id = "vikhyatk/moondream2"
 revision = "2024-05-20"
 tokenizer = AutoTokenizer.from_pretrained(model_id, revision=revision)
 moondream = AutoModelForCausalLM.from_pretrained(
     model_id, trust_remote_code=True, revision=revision,
+    torch_dtype=torch.bfloat16, device_map={"": "cuda"},
+    # torch_dtype=torch.float32, device_map="cpu"
+    attn_implementation="flash_attention_2"
 )
 moondream.eval()