GLM-4-DOC

Runtime error

vilarin commited on May 28, 2024

Commit

8951355

verified ·

1 Parent(s): e18b750

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -5,8 +5,7 @@ import os
 from huggingface_hub import hf_hub_download
 import base64
 from llama_cpp import Llama
-from llama_cpp.llama_chat_format import LlamaChatCompletionHandler
 os.environ["HF_HUB_ENABLE_HF_TRANSFER"] = "1"
 MODEL_LIST = ["openbmb/MiniCPM-Llama3-V-2_5","openbmb/MiniCPM-Llama3-V-2_5-int4"]
@@ -27,7 +26,7 @@ CSS = """
 }
 """
-chat_handler = LlamaChatCompletionHandler.from_pretrained(
     repo_id="openbmb/MiniCPM-Llama3-V-2_5-gguf",
     filename="*mmproj*",
 )
@@ -35,7 +34,7 @@ chat_handler = LlamaChatCompletionHandler.from_pretrained(
 llm = Llama.from_pretrained(
   repo_id="openbmb/MiniCPM-Llama3-V-2_5-gguf",
   filename="ggml-model-Q5_K_M.gguf",
-  chat_handler=chat_handler,
   n_ctx=4096,
   verbose=True
 )

 from huggingface_hub import hf_hub_download
 import base64
 from llama_cpp import Llama
+from llama_cpp.llama_tokenizer import LlamaHFTokenizer
 os.environ["HF_HUB_ENABLE_HF_TRANSFER"] = "1"
 MODEL_LIST = ["openbmb/MiniCPM-Llama3-V-2_5","openbmb/MiniCPM-Llama3-V-2_5-int4"]
 }
 """
+tokenizer = LlamaHFTokenizer.from_pretrained(
     repo_id="openbmb/MiniCPM-Llama3-V-2_5-gguf",
     filename="*mmproj*",
 )
 llm = Llama.from_pretrained(
   repo_id="openbmb/MiniCPM-Llama3-V-2_5-gguf",
   filename="ggml-model-Q5_K_M.gguf",
+  tokenizer=tokenizer,
   n_ctx=4096,
   verbose=True
 )