Spaces:

airsltd
/

LiquidAI_hf

Sleeping

OpenCode Deployer commited on Jan 23

Commit

1e941ef

1 Parent(s): 5fd9c8d

update

Files changed (2) hide show

Dockerfile CHANGED Viewed

@@ -1,3 +1,21 @@
 FROM ubuntu:22.04
 ENV DEBIAN_FRONTEND=noninteractive
@@ -9,24 +27,17 @@ ENV THREADS="-1"
 ENV TEMPERATURE="0.7"
 ENV PREDICT_TOKENS="2048"
 RUN apt-get update && apt-get install -y \
     curl \
-    wget \
-    build-essential \
-    git \
-    python3 \
-    python3-pip \
     && rm -rf /var/lib/apt/lists/*
 WORKDIR /app
-COPY start-lfm25-server.sh /app/start-lfm25-server.sh
-RUN git clone https://github.com/ggerganov/llama.cpp.git /tmp/llamacpp && \
-    cd /tmp/llamacpp && \
-    make LLAMA_SERVER=1 && \
-    cp /tmp/llamacpp/llama-server /usr/local/bin/ && \
-    rm -rf /tmp/llamacpp
 RUN echo "📥 下载 LFM2.5-1.2B-Thinking-Q4_K_M.gguf (731MB)..." && \
     curl -L -o "$MODEL_FILE" \

+# 构建阶段
+FROM ubuntu:22.04 AS builder
+ENV DEBIAN_FRONTEND=noninteractive
+RUN apt-get update && apt-get install -y \
+    build-essential \
+    git \
+    cmake \
+    curl \
+    && rm -rf /var/lib/apt/lists/*
+RUN git clone https://github.com/ggerganov/llama.cpp.git /tmp/llamacpp && \
+    cd /tmp/llamacpp && \
+    cmake -B build -DLLAMA_BUILD_SERVER=ON && \
+    cmake --build build --config Release
+# 运行阶段
 FROM ubuntu:22.04
 ENV DEBIAN_FRONTEND=noninteractive
 ENV TEMPERATURE="0.7"
 ENV PREDICT_TOKENS="2048"
+# 仅安装运行时依赖
 RUN apt-get update && apt-get install -y \
     curl \
     && rm -rf /var/lib/apt/lists/*
 WORKDIR /app
+# 从构建阶段复制 llama-server
+COPY --from=builder /tmp/llamacpp/build/bin/llama-server /usr/local/bin/
+COPY start-lfm25-server.sh /app/start-lfm25-server.sh
 RUN echo "📥 下载 LFM2.5-1.2B-Thinking-Q4_K_M.gguf (731MB)..." && \
     curl -L -o "$MODEL_FILE" \

README.md CHANGED Viewed

@@ -44,6 +44,22 @@ curl -X POST "http://localhost:7860/v1/chat/completions" \
 ## 🐳 Docker 部署
 ### 本地部署
 ```bash

 ## 🐳 Docker 部署
+### 构建说明
+Dockerfile 使用多阶段构建和 CMake 构建系统来编译 llama.cpp：
+**构建阶段**：
+- 安装构建依赖（build-essential, git, cmake）
+- 使用 `-DLLAMA_BUILD_SERVER=ON` 标志构建 llama-server
+- 编译 Release 版本以获得最佳性能
+**运行阶段**：
+- 仅安装运行时依赖（curl）
+- 从构建阶段复制编译好的 llama-server
+- 下载模型文件并配置环境
+这种多阶段构建方式显著减少了最终镜像大小。
 ### 本地部署
 ```bash