Spaces:

smitharauco
/

rock_chat

Sleeping

smitharauco commited on Aug 20, 2025

Commit

d72603f

1 Parent(s): c15db97

update cache

Files changed (2) hide show

app.py CHANGED Viewed

@@ -6,11 +6,11 @@ from code.rag_core import RAGConfig, SongIndex, Responder, classify_title
 CSV_PATH = os.environ.get("CSV_PATH", "data.songs.csv")
 GENRE_NAME = os.environ.get("GENRE_NAME", "Rock & Roll")
 app = FastAPI(title="RAG Rock & Roll Checker API", version="1.0.0")
 # Cargar índice al arrancar
-cfg = RAGConfig(songs_csv=CSV_PATH, genre_name=GENRE_NAME)
 song_index = SongIndex(cfg)
 responder = Responder(cfg.genre_name)

 CSV_PATH = os.environ.get("CSV_PATH", "data.songs.csv")
 GENRE_NAME = os.environ.get("GENRE_NAME", "Rock & Roll")
+TRANSFORMERS_CACHE  = os.environ.get("TRANSFORMERS_CACHE", "")
 app = FastAPI(title="RAG Rock & Roll Checker API", version="1.0.0")
 # Cargar índice al arrancar
+cfg = RAGConfig(songs_csv=CSV_PATH, genre_name=GENRE_NAME,cache = TRANSFORMERS_CACHE)
 song_index = SongIndex(cfg)
 responder = Responder(cfg.genre_name)

code/rag_core.py CHANGED Viewed

@@ -29,12 +29,13 @@ def normalize_title(t: str) -> str:
 class RAGConfig:
     songs_csv: str
     genre_name: str = "Rock & Roll"
 class SongIndex:
     def __init__(self, cfg: RAGConfig):
         self.cfg = cfg
         self.df = self._load_dataset(cfg.songs_csv)
-        self.model = SentenceTransformer(EMBEDDING_MODEL_NAME)
         self.index, self.embeddings = self._build_faiss(self.df["title"].tolist())
         self.norm_to_idx = {normalize_title(t): i for i, t in enumerate(self.df["title"].tolist())}

 class RAGConfig:
     songs_csv: str
     genre_name: str = "Rock & Roll"
+    cache : str
 class SongIndex:
     def __init__(self, cfg: RAGConfig):
         self.cfg = cfg
         self.df = self._load_dataset(cfg.songs_csv)
+        self.model = SentenceTransformer(EMBEDDING_MODEL_NAME,cache_folder=self.cfg.cache)
         self.index, self.embeddings = self._build_faiss(self.df["title"].tolist())
         self.norm_to_idx = {normalize_title(t): i for i, t in enumerate(self.df["title"].tolist())}