Spaces:

Javedalam
/

llamacpp-tiny

Running

Javedalam commited on Sep 3, 2025

Commit

757a4d9

1 Parent(s): 63adad0

Bake model at build; keep llama-server ENTRYPOINT

Files changed (1) hide show

Dockerfile CHANGED Viewed

@@ -1,8 +1,17 @@
 FROM ghcr.io/ggerganov/llama.cpp:server
-ADD https://huggingface.co/bartowski/Qwen2.5-0.5B-Instruct-GGUF/resolve/main/Qwen2.5-0.5B-Instruct-Q4_K_M.gguf /models/model.gguf
 EXPOSE 7860
 CMD ["-m","/models/model.gguf","-c","2048","-ngl","0","-t","4","--host","0.0.0.0","--port","7860"]
-ENTRYPOINT ["/bin/sh","-lc"]
-CMD ["test -f /models/model.gguf || (mkdir -p /models && curl -fL --retry 5 --retry-delay 2 -o /models/model.gguf https://huggingface.co/bartowski/Qwen2.5-0.5B-Instruct-GGUF/resolve/main/Qwen2.5-0.5B-Instruct-Q4_K_M.gguf); exec llama-server -m /models/model.gguf -c 2048 -ngl 0 -t 4 --host 0.0.0.0 --port 7860"]

 FROM ghcr.io/ggerganov/llama.cpp:server
+# ensure curl exists (covers Debian/Ubuntu or Alpine bases)
+RUN set -eux; \
+  if command -v curl >/dev/null 2>&1; then :; \
+  elif command -v apk  >/dev/null 2>&1; then apk add --no-cache curl ca-certificates; \
+  elif command -v apt-get >/dev/null 2>&1; then apt-get update && apt-get install -y --no-install-recommends curl ca-certificates && rm -rf /var/lib/apt/lists/*; \
+  else echo "no supported pkg manager" && exit 1; fi
+# bake tiny model into the image (fail build if download fails)
+RUN mkdir -p /models && \
+    curl -fL --retry 5 --retry-delay 2 -o /models/model.gguf \
+    https://huggingface.co/bartowski/Qwen2.5-0.5B-Instruct-GGUF/resolve/main/Qwen2.5-0.5B-Instruct-Q4_K_M.gguf
 EXPOSE 7860
+# base image ENTRYPOINT is already ["llama-server"]; pass only args:
 CMD ["-m","/models/model.gguf","-c","2048","-ngl","0","-t","4","--host","0.0.0.0","--port","7860"]