Spaces:

nardocolin
/

Colin-AI

Running

nardocolin commited on Nov 7, 2025

Commit

2ffa3b5

1 Parent(s): 8145b04

smaller quantisation

Files changed (2) hide show

app.py CHANGED Viewed

@@ -24,7 +24,7 @@ REPO_LLM   = "unsloth/Phi-4-mini-instruct-GGUF"
 REPO_PIPER = "nardocolin/nardocolin-pipertts"
 EMBED_FILE = "gguf/mxbai-embed-large-v1-f16.gguf"
-LLM_FILE   = "Phi-4-mini-instruct.Q8_0.gguf"
 PIPER_ONNX = "high/colin-voice_high.onnx"
 PIPER_JSON = "high/colin-voice_high.onnx.json"

 REPO_PIPER = "nardocolin/nardocolin-pipertts"
 EMBED_FILE = "gguf/mxbai-embed-large-v1-f16.gguf"
+LLM_FILE   = "Phi-4-mini-instruct.Q4_K_M.gguf"
 PIPER_ONNX = "high/colin-voice_high.onnx"
 PIPER_JSON = "high/colin-voice_high.onnx.json"

requirements.txt CHANGED Viewed

@@ -1,5 +1,5 @@
 gradio>=4.44.0
-llama-cpp-python==0.3.1
 qdrant-client>=1.9.1
 huggingface_hub>=0.24.0
 piper-tts>=1.2.0

 gradio>=4.44.0
+llama-cpp-python>=0.3.12
 qdrant-client>=1.9.1
 huggingface_hub>=0.24.0
 piper-tts>=1.2.0