Spaces:

moriire
/

OpenGenAI

Sleeping

moriire commited on Apr 29, 2024

Commit

3ace823

verified ·

1 Parent(s): 71778ca

Update app/llm.py

Files changed (1) hide show

app/llm.py CHANGED Viewed

@@ -38,9 +38,9 @@ llm_chat = llama_cpp.Llama.from_pretrained(
     #chat_format="llama-2"
 )
 llm_generate = llama_cpp.Llama.from_pretrained(
-    repo_id="moriire/healthcare-ai-q2_k",
-    filename="*.gguf",
-    tokenizer=llama_cpp.llama_tokenizer.LlamaHFTokenizer.from_pretrained("moriire/healthcare-ai-adapter-merged_16bit"),
     verbose=False,
      n_ctx=4096,
      n_gpu_layers=0,

     #chat_format="llama-2"
 )
 llm_generate = llama_cpp.Llama.from_pretrained(
+    repo_id="Qwen/Qwen1.5-0.5B-Chat-GGUF",
+    filename="*q4_0.gguf",
+    #tokenizer=llama_cpp.llama_tokenizer.LlamaHFTokenizer.from_pretrained("moriire/healthcare-ai-adapter-merged_16bit"),
     verbose=False,
      n_ctx=4096,
      n_gpu_layers=0,