# MistralChat.py (version LangGraph hybride RAG + SQL) import atexit import os import threading import time import requests import streamlit as st import logfire # --------------------------------------------------------------------------- # Keep-alive côté serveur : thread daemon qui se ping lui-même toutes les 25 min # Fonctionne même si aucun navigateur n'a la page ouverte. # L'URL cible est lue depuis la variable d'environnement STREAMLIT_URL # (par défaut http://localhost:7860). # # Protection inter-processus via un fichier PID (/tmp/.streamlit_keepalive.pid) : # Streamlit peut spawner plusieurs workers ; sans ce verrou, chaque processus # démarrerait son propre thread keep-alive en parallèle. # --------------------------------------------------------------------------- _KEEPALIVE_WARMUP_S = 60 # délai avant le 1er ping (laisse Streamlit démarrer) _KEEPALIVE_MIN_INTERVAL_S = 1500 # intervalle minimum entre deux pings (25 min) _KEEPALIVE_PIDFILE = "/tmp/.streamlit_keepalive.pid" def _keepalive_loop(url: str, interval: int) -> None: """Boucle infinie de ping keep-alive.""" effective_interval = max(interval, _KEEPALIVE_MIN_INTERVAL_S) time.sleep(_KEEPALIVE_WARMUP_S) while True: try: resp = requests.get(url, timeout=10) logfire.info(f"[keep-alive] ping → {url} status={resp.status_code}") except Exception as exc: logfire.warning(f"[keep-alive] ping échoué : {exc}") time.sleep(effective_interval) def _start_keepalive() -> None: """Démarre le thread de keep-alive une seule fois, tous processus confondus. Utilise un fichier PID pour empêcher les workers Streamlit secondaires de démarrer leur propre thread (le verrou threading ne suffit pas car chaque processus a son propre espace mémoire). """ pid = os.getpid() # Vérifier si un autre processus a déjà démarré le keep-alive if os.path.exists(_KEEPALIVE_PIDFILE): try: with open(_KEEPALIVE_PIDFILE) as f: existing_pid = int(f.read().strip()) # Tester si ce processus est encore vivant (signal 0 = vérification) os.kill(existing_pid, 0) logfire.info(f"[keep-alive] déjà actif dans le processus {existing_pid} — ignoré.") return # Un thread tourne déjà dans un autre worker except (ProcessLookupError, ValueError): pass # Le processus propriétaire est mort → on prend le relais # Écrire notre PID et nettoyer à la sortie try: with open(_KEEPALIVE_PIDFILE, "w") as f: f.write(str(pid)) atexit.register(lambda: os.unlink(_KEEPALIVE_PIDFILE) if os.path.exists(_KEEPALIVE_PIDFILE) else None) except OSError: pass # /tmp non accessible — on démarre quand même sans protection fichier url = os.getenv("STREAMLIT_URL", "http://localhost:7860") interval = int(os.getenv("KEEPALIVE_INTERVAL_S", str(25 * 60))) # défaut : 25 min effective = max(interval, _KEEPALIVE_MIN_INTERVAL_S) t = threading.Thread(target=_keepalive_loop, args=(url, interval), daemon=True, name="streamlit-keepalive") t.start() logfire.info( f"[keep-alive] thread démarré (pid={pid}) — warmup {_KEEPALIVE_WARMUP_S}s " f"puis ping toutes les {effective}s sur {url}" ) _start_keepalive() try: from utils.config import ( MISTRAL_API_KEY, MODEL_NAME, APP_TITLE, NAME, LOGFIRE_TOKEN, PG_HOST, PG_PORT, PG_DB, PG_ADMIN, POSTGRES_PASSWORD, ) from utils.vector_store import VectorStoreManager from utils.langgraph_app import build_graph, AppState # Graphe partagé RAG + SQL from load_excel_to_db import main as load_excel_main except ImportError as e: st.error(f"Erreur d'importation: {e}. Vérifiez la structure de vos dossiers et les fichiers dans 'utils'.") st.stop() # --- Configuration de Logfire --- if LOGFIRE_TOKEN: logfire.configure(token=LOGFIRE_TOKEN, send_to_logfire=True) else: logfire.configure(send_to_logfire=False) # --- Initialisation de la base SQL (si public.teams est vide) --- @st.cache_resource def init_sql_db(): """Vérifie si public.teams est vide ; si oui, lance le pipeline ETL Excel → PostgreSQL. Retourne une liste de tuples (niveau, message) pour affichage dans la sidebar.""" import psycopg2 messages = [] try: conn = psycopg2.connect( host=PG_HOST, port=PG_PORT, dbname=PG_DB, user=PG_ADMIN, password=POSTGRES_PASSWORD, ) with conn.cursor() as cur: cur.execute("SELECT COUNT(*) FROM public.teams;") count = cur.fetchone()[0] conn.close() if count == 0: logfire.info("public.teams vide — démarrage du chargement Excel → PostgreSQL.") messages.append(("info", "⏳ Base SQL vide — chargement des données en cours…")) load_excel_main() messages.append(("success", "✅ Données SQL chargées avec succès.")) else: logfire.info(f"public.teams contient {count} ligne(s) — chargement ignoré.") messages.append(("success", f"✅ Base SQL opérationnelle ({count} équipe(s) chargée(s)).")) except Exception as e: logfire.error("Erreur lors de la vérification/initialisation de la base SQL", erreur=str(e)) messages.append(("warning", f"⚠️ Impossible de vérifier la base SQL : {e}")) return messages # --- Chargement du Vector Store (mis en cache) --- @st.cache_resource def get_vector_store_manager(): """Retourne (manager_ou_None, liste_de_messages).""" logfire.info("Tentative de chargement du VectorStoreManager...") messages = [] try: manager = VectorStoreManager() if manager.index is None or not manager.document_chunks: messages.append(("error", "❌ L'index vectoriel ou les chunks n'ont pas pu être chargés.")) messages.append(("warning", "Assurez-vous d'avoir exécuté 'python indexer.py' après avoir placé vos fichiers dans le dossier 'inputs'.")) logfire.error("Index Faiss ou chunks non trouvés/chargés par VectorStoreManager.") return None, messages logfire.info(f"VectorStoreManager chargé avec succès ({manager.index.ntotal} vecteurs).") messages.append(("success", f"✅ Index vectoriel chargé ({manager.index.ntotal} vecteurs).")) return manager, messages except FileNotFoundError: messages.append(("error", "❌ Fichiers d'index ou de chunks non trouvés.")) messages.append(("warning", "Veuillez exécuter 'python indexer.py' pour créer la base de connaissances.")) logfire.error("FileNotFoundError lors de l'init de VectorStoreManager.") return None, messages except Exception as e: messages.append(("error", f"❌ Erreur inattendue lors du chargement du VectorStoreManager: {e}")) logfire.exception("Erreur chargement VectorStoreManager") return None, messages sql_messages = init_sql_db() vector_store_manager, vs_messages = get_vector_store_manager() # --- Compilation du graphe LangGraph hybride (RAG + SQL) --- @st.cache_resource def get_langgraph(_vector_store_manager): """Construit et cache le graphe LangGraph (évite la recompilation à chaque rerun).""" logfire.info("Compilation du graphe LangGraph...") graph, llm = build_graph(_vector_store_manager) logfire.info("Graphe LangGraph compilé et mis en cache.") return graph graph = get_langgraph(vector_store_manager) # ============================== # CSS Global — Design professionnel & responsive # ============================== st.markdown(""" """, unsafe_allow_html=True) # ============================== # Interface Utilisateur Streamlit # ============================== # --- Sidebar : état des bases de données --- with st.sidebar: st.markdown("""