Loren commited on
Commit
fe4e560
·
verified ·
1 Parent(s): 5accf8d

Upload database.py

Browse files
Files changed (1) hide show
  1. app/database.py +10 -7
app/database.py CHANGED
@@ -1,4 +1,14 @@
1
  import os
 
 
 
 
 
 
 
 
 
 
2
  from typing import List, Dict, Any
3
  import duckdb
4
  import faiss
@@ -21,13 +31,6 @@ FAISS_INDEX_FILE = "faiss_index.bin"
21
  MODEL_NAME = "intfloat/multilingual-e5-small"
22
  CROSS_ENCODER_NAME = "cross-encoder/ms-marco-MiniLM-L12-v2"
23
 
24
- cache_dir = "/tmp"
25
- os.makedirs(cache_dir, exist_ok=True)
26
- # Rediriger le cache HF globalement
27
- os.environ["HF_HOME"] = cache_dir
28
- os.environ["HF_DATASETS_CACHE"] = cache_dir
29
- os.environ["TRANSFORMERS_CACHE"] = cache_dir
30
-
31
  # Téléchargement des fichiers Parquet depuis Hugging Face
32
  articles_parquet = hf_hub_download(
33
  repo_id=REPO_ID,
 
1
  import os
2
+ # Règle d’or : toute variable d’environnement qui influence le cache Hugging Face doit être
3
+ # définie avant d’importer datasets ou transformers, sinon elle sera ignorée.
4
+ cache_dir = "/tmp"
5
+ os.makedirs(cache_dir, exist_ok=True)
6
+
7
+ # Rediriger le cache HF globalement
8
+ os.environ["HF_HOME"] = cache_dir
9
+ os.environ["HF_DATASETS_CACHE"] = os.path.join(cache_dir, "datasets")
10
+ os.environ["TRANSFORMERS_CACHE"] = os.path.join(cache_dir, "transformers")
11
+
12
  from typing import List, Dict, Any
13
  import duckdb
14
  import faiss
 
31
  MODEL_NAME = "intfloat/multilingual-e5-small"
32
  CROSS_ENCODER_NAME = "cross-encoder/ms-marco-MiniLM-L12-v2"
33
 
 
 
 
 
 
 
 
34
  # Téléchargement des fichiers Parquet depuis Hugging Face
35
  articles_parquet = hf_hub_download(
36
  repo_id=REPO_ID,