Spaces:

AndaiMD
/

brainbench

Sleeping

AndaiMD commited on Jun 12, 2025

Commit

b94b823

1 Parent(s): ae67e14

loader

Files changed (2) hide show

Dockerfile CHANGED Viewed

@@ -1,11 +1,20 @@
-FROM python:3.10
 WORKDIR /code
-COPY requirements.txt .
-RUN pip install --no-cache-dir -r requirements.txt
-COPY . .
-CMD ["uvicorn", "app.main:app", "--host", "0.0.0.0", "--port", "7860"]

+FROM python:3.9
 WORKDIR /code
+COPY ./requirements.txt /code/requirements.txt
+RUN pip install --no-cache-dir --upgrade -r /code/requirements.txt
+RUN useradd -m -u 1000 user
+USER user
+ENV HOME=/home/user \
+	PATH=/home/user/.local/bin:$PATH
+WORKDIR $HOME/app
+COPY --chown=user . $HOME/app
+CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "7860"]

app/model_loader.py CHANGED Viewed

@@ -34,27 +34,27 @@
 #     )
 #     return model, tokenizer
-from transformers import AutoModelForCausalLM, AutoTokenizer
 import os
 def load_model():
-    model_name = "gpt2"
-    cache_dir = "/tmp/hf_cache"
-    # Ensure cache dir exists and is writable
-    os.makedirs(cache_dir, exist_ok=True)
-    os.environ["TRANSFORMERS_CACHE"] = cache_dir
-    os.environ["HF_HOME"] = cache_dir
     tokenizer = AutoTokenizer.from_pretrained(
         model_name,
-        cache_dir=cache_dir,
-        use_fast=True
     )
     model = AutoModelForCausalLM.from_pretrained(
         model_name,
-        cache_dir=cache_dir
     )
     return model, tokenizer

 #     )
 #     return model, tokenizer
 import os
+from transformers import AutoModelForCausalLM, AutoTokenizer
 def load_model():
+    # Use a user-writable cache directory (important for Docker non-root)
+    HF_CACHE = os.path.expanduser("~/.cache/huggingface")
+    os.makedirs(HF_CACHE, exist_ok=True)
+    os.environ["TRANSFORMERS_CACHE"] = HF_CACHE
+    os.environ["HF_HOME"] = HF_CACHE
+    model_name = "gpt2"
     tokenizer = AutoTokenizer.from_pretrained(
         model_name,
+        cache_dir=HF_CACHE
     )
     model = AutoModelForCausalLM.from_pretrained(
         model_name,
+        cache_dir=HF_CACHE
     )
     return model, tokenizer