EasyChat

Runtime error

Cran-May commited on Nov 4, 2023

Commit

1c8bb22

1 Parent(s): 9a97f45

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -8,7 +8,7 @@ import time
 import sys
 os.system("pip install --upgrade pip")
-os.system('''CMAKE_ARGS="-DLLAMA_AVX512=ON" pip install llama-cpp-python''')
 from huggingface_hub import snapshot_download
 from llama_cpp import Llama
@@ -46,7 +46,7 @@ def get_system_tokens(model):
 repo_name = "TheBloke/CausalLM-14B-GGUF"
-model_name = "causallm_14b.Q4_1.gguf"
 snapshot_download(repo_id=repo_name, local_dir=".", allow_patterns=model_name)
 model = Llama(

 import sys
 os.system("pip install --upgrade pip")
+os.system('''CMAKE_ARGS="-DLLAMA_AVX512=ON -DLLAMA_AVX512_VBMI=ON -DLLAMA_AVX512_VNNI=ON -DLLAMA_FP16_VA=ON" pip install llama-cpp-python''')
 from huggingface_hub import snapshot_download
 from llama_cpp import Llama
 repo_name = "TheBloke/CausalLM-14B-GGUF"
+model_name = "causallm_14b.Q4_0.gguf"
 snapshot_download(repo_id=repo_name, local_dir=".", allow_patterns=model_name)
 model = Llama(