b24e544
208f694
4c84370
b4e7f48
4c84370
| | #!/bin/bash
/app/llama.cpp/build/bin/llama-server \
--model /models/model.gguf \
--host 0.0.0.0 \
--port 7860 \
--fit off \
--threads $(nproc) \
--mlock \
--no-mmap \
-c 262144 \
--rope-scaling yarn \
--rope-scale 16 |