Spaces:

SamOliveira
/

research_assistant

Sleeping

Sam-Oliveira commited on Jun 23, 2025

Commit

d0a0b7a

1 Parent(s): f2f3755

change triton cache

Files changed (2) hide show

src/streamlit_app.py CHANGED Viewed

@@ -15,6 +15,7 @@ for var in (
     "HF_HUB_CACHE",
     "TRANSFORMERS_CACHE",
     "SENTENCE_TRANSFORMERS_HOME",
 ):
     os.environ[var] = str(CACHE_DIR)

     "HF_HUB_CACHE",
     "TRANSFORMERS_CACHE",
     "SENTENCE_TRANSFORMERS_HOME",
+    "TRITON_CACHE_DIR",
 ):
     os.environ[var] = str(CACHE_DIR)

src/summarise.py CHANGED Viewed

@@ -18,14 +18,16 @@ PROMPT = (
 # ---------------------------------------------------------------------- #
 def load_pipe():
     cache_dir = pathlib.Path(tempfile.gettempdir()) / "hf_cache"
     model = AutoModelForCausalLM.from_pretrained(
         MODEL_NAME,
-        cache_dir=cache_dir,
-        #load_in_4bit=True,
         device_map="auto"
     )
-    tok   = AutoTokenizer.from_pretrained(MODEL_NAME, cache_dir=cache_dir)
     tok.pad_token = tok.eos_token
     return pipeline(
         "text-generation",

 # ---------------------------------------------------------------------- #
 def load_pipe():
+    # Cache directories are already set up in streamlit_app.py
     cache_dir = pathlib.Path(tempfile.gettempdir()) / "hf_cache"
     model = AutoModelForCausalLM.from_pretrained(
         MODEL_NAME,
+        cache_dir=str(cache_dir),
+        load_in_4bit=True,
         device_map="auto"
     )
+    tok   = AutoTokenizer.from_pretrained(MODEL_NAME, cache_dir=str(cache_dir))
     tok.pad_token = tok.eos_token
     return pipeline(
         "text-generation",