Spaces:

AndaiMD
/

brainbench

Sleeping

AndaiMD commited on Jun 13, 2025

Commit

7b23d6d

1 Parent(s): 71681f4

bits

Files changed (3) hide show

Dockerfile CHANGED Viewed

@@ -5,6 +5,8 @@ WORKDIR /code
 COPY ./requirements.txt /code/requirements.txt
 RUN pip install --no-cache-dir --upgrade -r /code/requirements.txt
 RUN useradd -m -u 1000 user

 COPY ./requirements.txt /code/requirements.txt
 RUN pip install --no-cache-dir --upgrade -r /code/requirements.txt
+RUN apt-get update && apt-get install -y libbitsandbytes-dev
 RUN useradd -m -u 1000 user

app/model_loader.py CHANGED Viewed

@@ -20,7 +20,8 @@ def load_model():
         use_auth_token=hf_token,
         cache_dir="/tmp/hf_cache",
         torch_dtype="auto",
-        device_map="auto"
     )
     model = PeftModel.from_pretrained(
         base_model,

         use_auth_token=hf_token,
         cache_dir="/tmp/hf_cache",
         torch_dtype="auto",
+        device_map="auto",
+        load_in_8bit=True  # <-- Try enabling 8-bit
     )
     model = PeftModel.from_pretrained(
         base_model,

requirements.txt CHANGED Viewed

@@ -5,3 +5,4 @@ torch
 accelerate
 fastapi
 uvicorn

 accelerate
 fastapi
 uvicorn
+bitsandbytes