QJMKWB commited on
Commit
962cced
·
verified ·
1 Parent(s): d377b8c

Update Dockerfile

Browse files
Files changed (1) hide show
  1. Dockerfile +12 -10
Dockerfile CHANGED
@@ -1,13 +1,13 @@
1
  FROM python:3.10-slim
2
 
3
- # Docker začína ako root, takže toto prejde:
4
  RUN apt-get update && apt-get install -y \
5
  build-essential \
6
  cmake \
7
- & rm -rf /var/lib/apt/lists/*
 
8
 
9
- # 1. Nastavenie domovského adresára a oprávnení
10
- # HF Spaces vyžaduje, aby aplikácia bežala v /app a pod užívateľom s ID 1000
11
  RUN useradd -m -u 1000 user
12
  USER user
13
  ENV HOME=/home/user \
@@ -16,17 +16,19 @@ ENV HOME=/home/user \
16
 
17
  WORKDIR $HOME/app
18
 
19
- # 2. Inštalácia potrebných balíkov
 
20
  RUN pip install --no-cache-dir huggingface_hub llama-cpp-python[server]
21
 
22
- # 3. Sťahovanie modelu (Opravený príkaz bez local-dir, ktorý robil chybu)
23
- # Sťahujeme do štandardnej cache, čo je v Spaces stabilnejšie
24
  RUN huggingface-cli download bartowski/Qwen2.5-Coder-7B-Instruct-GGUF \
25
  Qwen2.5-Coder-7B-Instruct-Q4_K_M.gguf \
26
- --local-dir .
 
27
 
28
- # 4. Spustenie servera s podporou Anthropic API
29
- # --chat_format chatml je dôležitý pre Qwen modely
30
  CMD ["python3", "-m", "llama_cpp.server", \
31
  "--model", "Qwen2.5-Coder-7B-Instruct-Q4_K_M.gguf", \
32
  "--host", "0.0.0.0", \
 
1
  FROM python:3.10-slim
2
 
3
+ # Inštalácia systémových závislostí pod rootom
4
  RUN apt-get update && apt-get install -y \
5
  build-essential \
6
  cmake \
7
+ git \
8
+ && rm -rf /var/lib/apt/lists/*
9
 
10
+ # Vytvorenie užívateľa (HF Spaces štandard)
 
11
  RUN useradd -m -u 1000 user
12
  USER user
13
  ENV HOME=/home/user \
 
16
 
17
  WORKDIR $HOME/app
18
 
19
+ # Inštalácia python balíkov
20
+ RUN pip install --no-cache-dir --upgrade pip
21
  RUN pip install --no-cache-dir huggingface_hub llama-cpp-python[server]
22
 
23
+ # Sťahovanie modelu - OPRAVENÝ PRÍKAZ
24
+ # Používame --include na špecifikáciu konkrétneho GGUF súboru
25
  RUN huggingface-cli download bartowski/Qwen2.5-Coder-7B-Instruct-GGUF \
26
  Qwen2.5-Coder-7B-Instruct-Q4_K_M.gguf \
27
+ --local-dir . \
28
+ --local-dir-use-symlinks False
29
 
30
+ # Spustenie servera
31
+ # Pridaný parameter --n_ctx pre kontextové okno (uprav podľa RAM v Space)
32
  CMD ["python3", "-m", "llama_cpp.server", \
33
  "--model", "Qwen2.5-Coder-7B-Instruct-Q4_K_M.gguf", \
34
  "--host", "0.0.0.0", \