Spaces:

Finish-him
/

prometheus-embedding-generator

Sleeping

Finish-him commited on Jul 23, 2025

Commit

b5c2272

verified ·

1 Parent(s): 8d6f77a

update

Files changed (1) hide show

Dockerfile CHANGED Viewed

@@ -1,31 +1,30 @@
 # Usa uma imagem base oficial com Python
-FROM python:3.9
-# Cria um usuário não-root para segurança
-RUN useradd -m -u 1000 user
-USER user
-# --- CORREÇÃO INICIA AQUI ---
-# Define a pasta de cache dentro do diretório home do usuário.
-# Todas as bibliotecas do Hugging Face usarão este caminho.
-ENV HF_HOME=/home/user/.cache/huggingface
-ENV SENTENCE_TRANSFORMERS_HOME=/home/user/.cache/torch
-# Cria a pasta de cache e garante que o usuário tenha permissão para escrever nela.
-RUN mkdir -p $HF_HOME && mkdir -p $SENTENCE_TRANSFORMERS_HOME
-# --- CORREÇÃO TERMINA AQUI ---
 # Define o diretório de trabalho
 WORKDIR /app
 # Copia o arquivo de requerimentos e instala as dependências
-COPY --chown=user ./requirements.txt requirements.txt
 RUN pip install --no-cache-dir --upgrade -r requirements.txt
-# Copia todos os outros arquivos (seu script, seu .zip, etc.)
-COPY --chown=user . .
-# Comando que será executado quando o Space iniciar
 CMD ["python", "train.py"]

 # Usa uma imagem base oficial com Python
+FROM python:3.9-slim-buster
 # Define o diretório de trabalho
 WORKDIR /app
+# --- ETAPA 1: INSTALAR GIT E CLONAR OS DADOS DO PRÓPRIO SPACE ---
+# Instala o git-lfs para lidar com arquivos grandes
+RUN apt-get update && apt-get install -y git git-lfs && git-lfs install
+# Clona o repositório deste próprio Space para uma pasta chamada /app/dados
+# Isso garante que todos os seus arquivos (CSVs, JSONs) estarão disponíveis
+RUN git clone https://huggingface.co/spaces/Finish-him/prometheus-embedding-generator ./dados
+# --- ETAPA 2: CONFIGURAR O AMBIENTE PYTHON ---
 # Copia o arquivo de requerimentos e instala as dependências
+COPY requirements.txt .
 RUN pip install --no-cache-dir --upgrade -r requirements.txt
+# Copia o script de treinamento
+COPY train.py .
+# Define o caminho do cache para evitar erros de permissão
+ENV HF_HOME=/app/cache/huggingface
+ENV SENTENCE_TRANSFORMERS_HOME=/app/cache/torch
+RUN mkdir -p $HF_HOME && mkdir -p $SENTENCE_TRANSFORMERS_HOME && chown -R 1000:1000 /app/cache
+# --- ETAPA 3: EXECUTAR O SCRIPT ---
+# Executa o script de treinamento quando o Space iniciar
 CMD ["python", "train.py"]