lh4b

Sleeping

lxui commited on Mar 15

Commit

7d1a73e

verified ·

1 Parent(s): ca5b718

Update Dockerfile

Files changed (1) hide show

Dockerfile CHANGED Viewed

@@ -1,20 +1,26 @@
 # 第一阶段：从官方镜像中提取 llama-server 可执行文件
-# 注意：如果 ggerganov 仓库不行，可以尝试 ggml-org 组织下的镜像
-#FROM ghcr.io/ggerganov/llama.cpp:server as llama
-# 备选镜像（如果上面的失败）：
- FROM ghcr.io/ggml-org/llama.cpp:server as llama
 # 第二阶段：构建你的 FastAPI 环境
 FROM python:3.10-slim
 WORKDIR /app
-# 从第一阶段复制 llama-server 到当前镜像的 /usr/local/bin/
 COPY --from=llama /app/llama-server /usr/local/bin/llama-server
-# 安装系统依赖（如果需要）
-RUN apt-get update && apt-get install -y \
-    && rm -rf /var/lib/apt/lists/*
 # 复制 Python 依赖文件并安装
 COPY requirements.txt .
@@ -24,13 +30,9 @@ RUN pip install --no-cache-dir --upgrade pip && \
 # 复制应用代码
 COPY app.py .
-# 创建目录用于存放模型文件（可通过 Volume 挂载或下载）
-RUN mkdir -p /models
-# 暴露端口：llama-server 默认 8080，FastAPI 默认 7860
 EXPOSE 8080 7860
 # 启动脚本：先启动 llama-server（后台），再启动 uvicorn（前台）
-# 注意：llama-server 的参数 --host 0.0.0.0 允许外部访问，--ctx-size 设置上下文窗口
 CMD sh -c "llama-server --model /models/Qwen3.5-4B-Q4_K_M.gguf --host 127.0.0.1 --port 8080 --ctx-size 4096 & \
            uvicorn app:app --host 0.0.0.0 --port 7860"

 # 第一阶段：从官方镜像中提取 llama-server 可执行文件
+FROM ghcr.io/ggml-org/llama.cpp:server as llama
 # 第二阶段：构建你的 FastAPI 环境
 FROM python:3.10-slim
 WORKDIR /app
+# 安装系统依赖（包括下载工具 wget）
+RUN apt-get update && apt-get install -y --no-install-recommends \
+    wget \
+    && rm -rf /var/lib/apt/lists/*
+# 从第一阶段复制 llama-server 到当前镜像
 COPY --from=llama /app/llama-server /usr/local/bin/llama-server
+# 创建模型目录
+RUN mkdir -p /models
+# 下载模型文件（以 Qwen3.5-4B Q4_K_M 为例）
+# 如果下载失败，可以尝试更换镜像源或使用 curl
+RUN wget -O /models/Qwen3.5-4B-Q4_K_M.gguf \
+    https://huggingface.co/lmstudio-community/Qwen3.5-4B-GGUF/resolve/main/Qwen3.5-4B-Q4_K_M.gguf
 # 复制 Python 依赖文件并安装
 COPY requirements.txt .
 # 复制应用代码
 COPY app.py .
+# 暴露端口
 EXPOSE 8080 7860
 # 启动脚本：先启动 llama-server（后台），再启动 uvicorn（前台）
 CMD sh -c "llama-server --model /models/Qwen3.5-4B-Q4_K_M.gguf --host 127.0.0.1 --port 8080 --ctx-size 4096 & \
            uvicorn app:app --host 0.0.0.0 --port 7860"