Spaces:
Sleeping
Sleeping
Upload database.py
Browse files- app/database.py +10 -7
app/database.py
CHANGED
|
@@ -1,4 +1,14 @@
|
|
| 1 |
import os
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 2 |
from typing import List, Dict, Any
|
| 3 |
import duckdb
|
| 4 |
import faiss
|
|
@@ -21,13 +31,6 @@ FAISS_INDEX_FILE = "faiss_index.bin"
|
|
| 21 |
MODEL_NAME = "intfloat/multilingual-e5-small"
|
| 22 |
CROSS_ENCODER_NAME = "cross-encoder/ms-marco-MiniLM-L12-v2"
|
| 23 |
|
| 24 |
-
cache_dir = "/tmp"
|
| 25 |
-
os.makedirs(cache_dir, exist_ok=True)
|
| 26 |
-
# Rediriger le cache HF globalement
|
| 27 |
-
os.environ["HF_HOME"] = cache_dir
|
| 28 |
-
os.environ["HF_DATASETS_CACHE"] = cache_dir
|
| 29 |
-
os.environ["TRANSFORMERS_CACHE"] = cache_dir
|
| 30 |
-
|
| 31 |
# Téléchargement des fichiers Parquet depuis Hugging Face
|
| 32 |
articles_parquet = hf_hub_download(
|
| 33 |
repo_id=REPO_ID,
|
|
|
|
| 1 |
import os
|
| 2 |
+
# Règle d’or : toute variable d’environnement qui influence le cache Hugging Face doit être
|
| 3 |
+
# définie avant d’importer datasets ou transformers, sinon elle sera ignorée.
|
| 4 |
+
cache_dir = "/tmp"
|
| 5 |
+
os.makedirs(cache_dir, exist_ok=True)
|
| 6 |
+
|
| 7 |
+
# Rediriger le cache HF globalement
|
| 8 |
+
os.environ["HF_HOME"] = cache_dir
|
| 9 |
+
os.environ["HF_DATASETS_CACHE"] = os.path.join(cache_dir, "datasets")
|
| 10 |
+
os.environ["TRANSFORMERS_CACHE"] = os.path.join(cache_dir, "transformers")
|
| 11 |
+
|
| 12 |
from typing import List, Dict, Any
|
| 13 |
import duckdb
|
| 14 |
import faiss
|
|
|
|
| 31 |
MODEL_NAME = "intfloat/multilingual-e5-small"
|
| 32 |
CROSS_ENCODER_NAME = "cross-encoder/ms-marco-MiniLM-L12-v2"
|
| 33 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 34 |
# Téléchargement des fichiers Parquet depuis Hugging Face
|
| 35 |
articles_parquet = hf_hub_download(
|
| 36 |
repo_id=REPO_ID,
|