Spaces:

khadijaaao
/

chatbot

Sleeping

App Files Files Community

khadijaaao commited on Jun 19, 2025

Commit

40a3ddb

verified ·

1 Parent(s): 658c13c

Update src/streamlit_app.py

Browse files

Files changed (1) hide show

src/streamlit_app.py +18 -49

src/streamlit_app.py CHANGED Viewed

@@ -1,60 +1,30 @@
 import streamlit as st
 import os
-import gdown
 from llama_cpp import Llama
 from langchain_community.vectorstores import FAISS
 from langchain_community.embeddings import HuggingFaceEmbeddings
 # --- Configuration de la page Streamlit ---
 st.set_page_config(page_title="Votre Coach RAG", layout="wide")
 st.title("Votre Coach Expert")
 st.write("Posez une question sur vos documents, et je vous répondrai en me basant sur leur contenu.")
-# --- Chemins et URL ---
-# MODIFICATION : On cible un dossier dans /tmp, qui est toujours accessible en écriture
-DOSSIER_MODELE_TMP = "/tmp/downloaded_model"
-NOM_FICHIER_MODELE = "Meta-Llama-3-8B-Instruct.Q4_K_M.gguf"
-CHEMIN_MODELE_LOCAL = os.path.join(DOSSIER_MODELE_TMP, NOM_FICHIER_MODELE)
-ID_DRIVE_MODELE = "1LujSBXb8LTgbLdj27klizQJB-M7p0Oob" # Votre ID de fichier Google Drive
-def download_model_from_drive(output_path):
-    """
-    Télécharge le modèle depuis Google Drive dans le dossier /tmp si le fichier n'existe pas.
-    """
-    # Crée le dossier de destination dans /tmp s'il n'existe pas
-    # Cela va maintenant fonctionner car on a le droit d'écrire dans /tmp
-    os.makedirs(os.path.dirname(output_path), exist_ok=True)
-    if not os.path.exists(output_path):
-        with st.spinner(f"Téléchargement du modèle depuis Google Drive vers {output_path}... (une seule fois par session)"):
-            try:
-                gdown.download(id=ID_DRIVE_MODELE, output=output_path, quiet=False)
-                st.success("Modèle téléchargé avec succès !")
-            except Exception as e:
-                st.error(f"Échec du téléchargement depuis Google Drive : {e}")
-                st.stop()
-    return output_path
 # --- Fonctions de chargement mises en cache ---
 @st.cache_resource
 def load_llm():
-    """
-    S'assure que le modèle est téléchargé depuis Drive, puis le charge en mémoire.
-    """
-    # Étape 1: S'assurer que le fichier est bien là en utilisant notre nouvelle fonction
-    model_path = download_model_from_drive(CHEMIN_MODELE_LOCAL)
-    # Étape 2: Charger le modèle depuis son chemin dans /tmp
-    with st.spinner("Chargement du modèle LLM en mémoire..."):
-        llm = Llama(
-            model_path=model_path,
-            n_gpu_layers=0,
-            n_ctx=4096,
-            verbose=False,
-            chat_format="llama-3"
         )
     return llm
 @st.cache_resource
@@ -64,15 +34,15 @@ def load_retriever(faiss_path, embeddings_path):
         vectorstore = FAISS.load_local(faiss_path, embeddings_model, allow_dangerous_deserialization=True)
     return vectorstore.as_retriever(search_kwargs={"k": 5})
-# --- Chemins d'accès (relatifs) pour les fichiers du projet ---
-DOSSIER_PROJET = os.path.dirname(__file__)
-CHEMIN_INDEX_FAISS = os.path.join(DOSSIER_PROJET, "faiss_index_wize")
-CHEMIN_MODELE_EMBEDDINGS = os.path.join(DOSSIER_PROJET, "embedding_model")
-# --- Chargement principal ---
 try:
     llm = load_llm()
-    # On suppose que les autres fichiers (FAISS, embeddings) sont bien dans votre dépôt Git
     retriever = load_retriever(CHEMIN_INDEX_FAISS, CHEMIN_MODELE_EMBEDDINGS)
     st.success("Les modèles sont chargés et prêts !")
 except Exception as e:
@@ -89,7 +59,7 @@ for message in st.session_state.messages:
         st.markdown(message["content"])
 # --- Logique de Chat ---
-if prompt := st.chat_input("Posez votre question ici...."):
     st.session_state.messages.append({"role": "user", "content": prompt})
     with st.chat_message("user"):
         st.markdown(prompt)
@@ -98,7 +68,6 @@ if prompt := st.chat_input("Posez votre question ici...."):
         with st.spinner("Je réfléchis..."):
             docs = retriever.invoke(prompt)
             context = "\n".join([doc.page_content for doc in docs])
             system_prompt = "Vous êtes Un coach expert. Répondez à la question en vous basant uniquement sur le contexte fourni."
             full_prompt = f"""<|begin_of_text|><|start_header_id|>system<|end_header_id|>\n{system_prompt}\nContexte : {context}<|eot_id|><|start_header_id|>user<|end_header_id|>\nQuestion : {prompt}<|eot_id|><|start_header_id|>assistant<|end_header_id|>"""

 import streamlit as st
 import os
 from llama_cpp import Llama
 from langchain_community.vectorstores import FAISS
 from langchain_community.embeddings import HuggingFaceEmbeddings
+from huggingface_hub import hf_hub_download
 # --- Configuration de la page Streamlit ---
 st.set_page_config(page_title="Votre Coach RAG", layout="wide")
 st.title("Votre Coach Expert")
 st.write("Posez une question sur vos documents, et je vous répondrai en me basant sur leur contenu.")
 # --- Fonctions de chargement mises en cache ---
 @st.cache_resource
 def load_llm():
+    model_repo_id = "QuantFactory/Meta-Llama-3-8B-Instruct-GGUF"
+    model_filename = "Meta-Llama-3-8B-Instruct.Q4_K_M.gguf"
+    with st.spinner(f"Téléchargement du modèle '{model_filename}'... (Cette étape est longue et n'a lieu qu'une seule fois)"):
+        model_path = hf_hub_download(
+            repo_id=model_repo_id,
+            filename=model_filename,
+            cache_dir='/tmp/hf_cache'
         )
+    with st.spinner("Chargement du modèle LLM en mémoire..."):
+        llm = Llama(model_path=model_path, n_gpu_layers=0, n_ctx=4096, verbose=False, chat_format="llama-3")
     return llm
 @st.cache_resource
         vectorstore = FAISS.load_local(faiss_path, embeddings_model, allow_dangerous_deserialization=True)
     return vectorstore.as_retriever(search_kwargs={"k": 5})
+# --- Chemins d'accès (relatifs) ---
+# ✅ MODIFICATION : On s'assure que les chemins sont à la racine de l'application '/app'
+# au lieu de '/app/src'. C'est plus simple à gérer.
+CHEMIN_INDEX_FAISS = "faiss_index_wize"
+CHEMIN_MODELE_EMBEDDINGS = "embedding_model"
+# --- Chargement des modèles via Streamlit ---
 try:
     llm = load_llm()
     retriever = load_retriever(CHEMIN_INDEX_FAISS, CHEMIN_MODELE_EMBEDDINGS)
     st.success("Les modèles sont chargés et prêts !")
 except Exception as e:
         st.markdown(message["content"])
 # --- Logique de Chat ---
+if prompt := st.chat_input("Posez votre question ici..."):
     st.session_state.messages.append({"role": "user", "content": prompt})
     with st.chat_message("user"):
         st.markdown(prompt)
         with st.spinner("Je réfléchis..."):
             docs = retriever.invoke(prompt)
             context = "\n".join([doc.page_content for doc in docs])
             system_prompt = "Vous êtes Un coach expert. Répondez à la question en vous basant uniquement sur le contexte fourni."
             full_prompt = f"""<|begin_of_text|><|start_header_id|>system<|end_header_id|>\n{system_prompt}\nContexte : {context}<|eot_id|><|start_header_id|>user<|end_header_id|>\nQuestion : {prompt}<|eot_id|><|start_header_id|>assistant<|end_header_id|>"""