Spaces:

CharlieBonito
/

ClarityGuardAgent

Sleeping

App Files Files Community

CharlieBonito commited on Apr 23

Commit

e50038f

verified ·

1 Parent(s): 003c4d1

Update Dockerfile

Browse files

Files changed (1) hide show

Dockerfile +53 -12

Dockerfile CHANGED Viewed

@@ -1,12 +1,53 @@
-FROM nvidia/cuda:12.4.0-runtime-ubuntu22.04
-# Instalamos util-linux para tener lscpu
-RUN apt-get update && apt-get install -y util-linux && rm -rf /var/lib/apt/lists/*
-# Usamos el formato simple de comando
-CMD echo "=== RECURSOS DEL SPACE ===" && \
-    echo "--- CPU ---" && lscpu | grep "Model name" && \
-    echo "--- RAM ---" && free -h && \
-    echo "--- GPU ---" && nvidia-smi && \
-    echo "" && \
-    echo "¡Hola Carlos! Aquí tienes los datos de tu L4 en Manizales."

+# Etapa 1: Compilación de llama-server con CUDA 13.2 y Ubuntu 24.04
+FROM nvidia/cuda:13.2.1-cudnn-devel-ubuntu24.04 AS llama-builder
+ENV DEBIAN_FRONTEND=noninteractive
+# Instalamos las herramientas necesarias para compilar
+RUN apt-get update && apt-get install -y \
+    git cmake build-essential \
+    && rm -rf /var/lib/apt/lists/*
+# Clonamos y compilamos llama.cpp
+# ARCHITECTURES=89 es la clave para que corra perfecto en tu L4 (y en tu 4060)
+RUN git clone --depth 1 https://github.com/ggerganov/llama.cpp /tmp/llama-cpp-src && \
+    cd /tmp/llama-cpp-src && \
+    cmake -B build \
+      -DGGML_CUDA=ON \
+      -DCMAKE_CUDA_ARCHITECTURES=89 \
+      -DLLAMA_BUILD_SERVER=ON \
+      -DCMAKE_BUILD_TYPE=Release && \
+    cmake --build build --target llama-server -j$(nproc) && \
+    mkdir -p /opt/llama-cpp && \
+    cp build/bin/llama-server /opt/llama-cpp/llama-server && \
+    chmod +x /opt/llama-cpp/llama-server
+# Etapa 2: Imagen de ejecución (Runtime) - Mucho más ligera
+FROM nvidia/cuda:13.2.1-cudnn-runtime-ubuntu24.04
+ENV DEBIAN_FRONTEND=noninteractive
+# Ubuntu 24.04 usa Python 3.12 por defecto
+RUN apt-get update && apt-get install -y \
+    python3 python3-pip \
+    git git-lfs curl \
+    && rm -rf /var/lib/apt/lists/*
+# Copiamos el binario que compilamos en la etapa anterior
+COPY --from=llama-builder /opt/llama-cpp/llama-server /opt/llama-cpp/llama-server
+WORKDIR /app
+# Instalamos tus dependencias de Python
+# Nota: En Ubuntu 24.04 usamos --break-system-packages para instalar directo en el contenedor
+COPY requirements.txt .
+RUN pip install --no-cache-dir --break-system-packages -r requirements.txt
+# Copiamos todo tu código (app.py, modelos, etc.)
+COPY . .
+# Puerto por defecto de Hugging Face
+EXPOSE 7860
+# Iniciamos tu aplicación
+CMD ["python3", "app.py"]