Spaces:

fthor
/

test

Paused

fthor commited on Dec 21, 2023

Commit

3ac1ccb

1 Parent(s): 854f0cf

added flash_attention

Files changed (2) hide show

app.py CHANGED Viewed

@@ -18,7 +18,9 @@ processor = AutoProcessor.from_pretrained(model_id)
 model = LlavaForConditionalGeneration.from_pretrained(
     model_id,
     quantization_config=quantization_config,
-    device_map="auto"
 )

 model = LlavaForConditionalGeneration.from_pretrained(
     model_id,
     quantization_config=quantization_config,
+    device_map="auto",
+    use_flash_attention_2=True,
+    low_cpu_mem_usage=True
 )

requirements.txt CHANGED Viewed

@@ -150,3 +150,4 @@ webencodings==0.5.1
 websocket-client==1.7.0
 websockets==11.0.3
 widgetsnbextension==4.0.9

 websocket-client==1.7.0
 websockets==11.0.3
 widgetsnbextension==4.0.9
+sentence_transformers