Spaces:

MathieuGAL
/

NOVA_API

Sleeping

App Files Files Community

MathieuGAL commited on Nov 13, 2025

Commit

2f32984

verified ·

1 Parent(s): c8ca9b1

Update app.py

Browse files

Files changed (1) hide show

app.py +127 -53

app.py CHANGED Viewed

@@ -1,12 +1,27 @@
-import os
 import pandas as pd
 import chromadb
 from google import genai
 from sentence_transformers import SentenceTransformer, CrossEncoder
 from typing import List, Dict
 from flask import Flask, request, jsonify
-from flask_cors import CORS
 from datetime import datetime
 # ======================================================================
 # CONFIGURATION
@@ -16,7 +31,7 @@ DATA_FILE_PATH = "data/QR.csv"
 # CORRECTION CRITIQUE: Déplacement de la DB vers /tmp
 # Ce répertoire est le seul garanti en écriture sur Hugging Face Spaces.
-CHROMA_DB_PATH = "/tmp/bdd_ChromaDB"
 COLLECTION_NAME = "qr_data_dual_embeddings"
 Q_COLUMN_NAME = "Question"
@@ -32,7 +47,7 @@ N_RESULTS_RERANK = 3
 # Récupération de la clé depuis l'environnement (Hugging Face Secrets)
 # Si non trouvée, utilise la clé de placeholder.
-GEMINI_API_KEY = os.getenv("GEMINI_API_KEY", "AIzaSyDXXY7uSXryTxZ51jQFsSLcPnC_Ivt9V1g")
 GEMINI_MODEL = "gemini-2.5-flash"
 MAX_CONVERSATION_HISTORY = 10
@@ -54,6 +69,56 @@ gemini_client: genai.Client = None
 conversation_histories: Dict[str, List[Dict[str, str]]] = {}
 conversation_start_times: Dict[str, str] = {}
 # ======================================================================
 # CHARGEMENT DES RESSOURCES
 # ======================================================================
@@ -64,11 +129,11 @@ def load_models():
     try:
         # Tente de charger localement, sinon télécharge (le cache se fera dans /tmp)
         cross_encoder = CrossEncoder(
-            SRC_CROSS_ENCODER if os.path.exists(SRC_CROSS_ENCODER)
             else "cross-encoder/mmarco-mMiniLMv2-L12-H384-v1"
         )
         paraphrase = SentenceTransformer(
-            SRC_PARAPHRASE if os.path.exists(SRC_PARAPHRASE)
             else "sentence-transformers/paraphrase-mpnet-base-v2"
         )
         print("✅ Modèles chargés avec succès.")
@@ -122,52 +187,52 @@ def initialize_gemini_client():
 def setup_chromadb_collection(client, df, model_paraphrase):
     """Configure et remplit la collection ChromaDB."""
     total_docs = len(df) * 2
     # S'assurer que le répertoire de la DB existe
     os.makedirs(CHROMA_DB_PATH, exist_ok=True)
     try:
         collection = client.get_or_create_collection(name=COLLECTION_NAME)
     except Exception as e:
         print(f"❌ Erreur lors de l'accès à la collection ChromaDB: {e}")
         raise
     if collection.count() == total_docs and total_docs > 0:
         print(f"✅ Collection déjà remplie ({collection.count()} docs) dans {CHROMA_DB_PATH}.")
         return collection
     if total_docs == 0:
         print("⚠️ DataFrame vide. Collection non remplie.")
         return collection
     print(f"⏳ Remplissage de ChromaDB ({len(df)} lignes) à l'emplacement: {CHROMA_DB_PATH}...")
     docs, metadatas, ids = [], [], []
     for i, row in df.iterrows():
         question = str(row[Q_COLUMN_NAME])
         reponse = str(row[R_COLUMN_NAME])
         meta = {Q_COLUMN_NAME: question, R_COLUMN_NAME: reponse, "source_row": i}
         docs.append(question)
         metadatas.append({**meta, "type": "question"})
         ids.append(f"id_{i}_Q")
         docs.append(reponse)
         metadatas.append({**meta, "type": "reponse"})
         ids.append(f"id_{i}_R")
     embeddings = model_paraphrase.encode(docs, show_progress_bar=False).tolist()
     # Nettoyage et recréation (pour le cas où les données CSV ont changé)
     try:
         client.delete_collection(name=COLLECTION_NAME)
     except:
         pass
     collection = client.get_or_create_collection(name=COLLECTION_NAME)
     collection.add(embeddings=embeddings, documents=docs, metadatas=metadatas, ids=ids)
     print(f"✅ Collection remplie: {collection.count()} documents.")
     return collection
@@ -178,21 +243,21 @@ def setup_chromadb_collection(client, df, model_paraphrase):
 def retrieve_and_rerank(query_text, collection, model_paraphrase, model_cross_encoder):
     """Récupère et rerank les résultats."""
     print(f"🔍 Récupération pour: '{query_text[:40]}...'")
     query_emb = model_paraphrase.encode([query_text]).tolist()
     results = collection.query(
         query_embeddings=query_emb,
         n_results=N_RESULTS_RETRIEVAL,
         include=['documents', 'metadatas', 'distances']
     )
     if not results['ids'][0]:
         print("⚠️ Aucun résultat trouvé.")
         return pd.DataFrame()
     candidates = []
     cross_input = []
     for i, doc in enumerate(results['documents'][0]):
         meta = results['metadatas'][0][i]
         candidates.append({
@@ -203,14 +268,14 @@ def retrieve_and_rerank(query_text, collection, model_paraphrase, model_cross_en
             'initial_distance': results['distances'][0][i]
         })
         cross_input.append([query_text, doc])
     scores = model_cross_encoder.predict(cross_input)
     for i, score in enumerate(scores):
         candidates[i]['rerank_score'] = score
     df = pd.DataFrame(candidates).sort_values('rerank_score', ascending=False)
     df = df.drop_duplicates(subset=['question', 'reponse'], keep='first')
     return df.head(N_RESULTS_RERANK)
 def generate_rag_prompt(query_text, df_results, conversation_history):
@@ -219,21 +284,21 @@ def generate_rag_prompt(query_text, df_results, conversation_history):
     if not df_results.empty:
         for _, row in df_results.iterrows():
             context.append(f"Q: {row['question']}\nR: {row['reponse']}")
     context_str = "\n---\n".join(context)
     history_str = ""
     if conversation_history:
         history_str = "HISTORIQUE:\n"
         # Ajout du contexte pour le LLM, mais on ne veut pas l'historique complet
         # On va limiter l'historique à l'affichage si on dépasse MAX_CONVERSATION_HISTORY
-        display_history = conversation_history[-(MAX_CONVERSATION_HISTORY * 2):]
         for msg in display_history:
             role = "USER" if msg["role"] == "user" else "ASSISTANT"
             # On utilise 'content' pour le texte du message
             history_str += f"{role}: {msg['content']}\n"
         history_str += "\n"
     return f"""{history_str}UTILISATEUR: {query_text}
 CONTEXTE (si utile):
@@ -258,9 +323,9 @@ def add_to_history(session_id, role, content):
     """Ajoute un message à l'historique."""
     if session_id not in conversation_histories:
         conversation_histories[session_id] = []
     conversation_histories[session_id].append({"role": role, "content": content})
     # Limiter la taille de l'historique conservé en mémoire
     if len(conversation_histories[session_id]) > MAX_CONVERSATION_HISTORY * 2:
         conversation_histories[session_id] = conversation_histories[session_id][-(MAX_CONVERSATION_HISTORY * 2):]
@@ -294,10 +359,10 @@ def get_answer(query_text, collection, model_paraphrase, model_cross_encoder, co
     print(f"\n{'='*50}")
     print(f"🚀 Traitement: '{query_text}'")
     print(f"{'='*50}")
     df_results = retrieve_and_rerank(query_text, collection, model_paraphrase, model_cross_encoder)
     final_prompt = generate_rag_prompt(query_text, df_results, conversation_history)
     # On retourne le prompt final RAG pour référence, mais l'appel Gemini est fait après
     return final_prompt
@@ -308,13 +373,13 @@ def get_answer(query_text, collection, model_paraphrase, model_cross_encoder, co
 def initialize_global_resources():
     """Initialise tous les modèles et ressources."""
     global model_cross_encoder, model_paraphrase, collection, system_prompt, gemini_client
     print("\n" + "="*50)
     print("⚙️  INITIALISATION RAG")
     print("="*50)
     # Le répertoire /tmp est géré par la variable CHROMA_DB_PATH
     try:
         model_cross_encoder, model_paraphrase = load_models()
         df = load_data()
@@ -323,7 +388,7 @@ def initialize_global_resources():
     except Exception:
         # L'erreur est déjà print dans les fonctions de chargement
         return False
     try:
         print(f"⏳ Initialisation de ChromaDB à l'emplacement: {CHROMA_DB_PATH}")
         # Le PersistentClient créera les fichiers dans le chemin spécifié (maintenant dans /tmp)
@@ -341,7 +406,7 @@ def initialize_global_resources():
 app = Flask(__name__)
 # CORS activé, permet les requêtes depuis n'importe quelle origine
-CORS(app)
 @app.route('/status', methods=['GET'])
 def api_status():
@@ -353,31 +418,41 @@ def api_get_answer():
     """Endpoint principal pour obtenir une réponse."""
     if any(x is None for x in [model_cross_encoder, model_paraphrase, collection, system_prompt, gemini_client]):
         return jsonify({"error": "Ressources non chargées. Veuillez vérifier les logs d'initialisation."}), 500
     try:
         data = request.get_json()
         query_text = data.get('query_text')
         session_id = data.get('session_id', 'archive')
         if not query_text:
             generic_message = "Problème avec l'API, veuillez réessayer plus tard."
             return jsonify({"error": generic_message}), 500
         # Récupère historique
         history = get_conversation_history(session_id)
         # Génère prompt RAG
         rag_prompt = get_answer(query_text, collection, model_paraphrase, model_cross_encoder, history)
         # Appelle Gemini
         response = call_gemini(rag_prompt, system_prompt, gemini_client)
         # Sauvegarde réponse
         add_to_history(session_id, "user", query_text)
         add_to_history(session_id, "assistant", response)
         return jsonify({"generated_response": response})
     except Exception as e:
         print(f"❌ Erreur générale de l'API: {e}")
         generic_message = "Problème avec l'API, veuillez réessayer plus tard."
@@ -390,7 +465,7 @@ def api_clear_history():
         data = request.get_json()
         session_id = data.get('session_id', 'archive')
         clear_history(session_id)
         return jsonify({"message": f"Historique effacé: {session_id}"})
     except Exception as e:
         generic_message = "Problème avec l'API, veuillez réessayer plus tard."
@@ -403,7 +478,7 @@ def api_clear_history():
 if __name__ == '__main__':
     print("start app.py")
     if initialize_global_resources():
         # Récupération de l'adresse IP si possible (pour l'affichage)
         try:
             import socket
@@ -413,16 +488,15 @@ if __name__ == '__main__':
             s.close()
         except Exception:
             local_ip = "127.0.0.1" # Fallback si échec
         print("\n" + "="*50)
         print("🌐 SERVEUR DÉMARRÉ")
         print(f"✅ API accessible à l'URL (via l'interface réseau locale): http://{local_ip}:{API_PORT}")
         print(f"✅ Route Status: http://{local_ip}:{API_PORT}/status")
         print(f"💡 N'oubliez pas de configurer 'app_port: 1212' et 'sdk: docker' dans votre README.md !")
         print("="*50 + "\n")
         # L'utilisation de host='0.0.0.0' dans app.run() permet l'accès depuis l'extérieur
         app.run(host=API_HOST, port=API_PORT, debug=False)
     else:
-        print("❌ Impossible de démarrer le serveur. Veuillez vérifier les logs pour les erreurs d'initialisation.")

+import os
 import pandas as pd
 import chromadb
+import requests # Ajouté pour l'API Telegram
+import json # Ajouté pour l'API Telegram
 from google import genai
 from sentence_transformers import SentenceTransformer, CrossEncoder
 from typing import List, Dict
 from flask import Flask, request, jsonify
+from flask_cors import CORS
 from datetime import datetime
+import time # Ajouté pour le timestamp Telegram
+# ======================================================================
+# ⚙️ CONFIGURATION TÉLÉGRAM
+# ======================================================================
+# 1. Votre Token API fourni par BotFather
+TELEGRAM_TOKEN = "8584350410:AAEuXqopGMfgdZ1BvLntA-e6FpoZl5uunEk"
+# 2. Votre Chat ID (où la notification sera envoyée)
+TELEGRAM_CHAT_ID = "1278265595"
+# Activer/Désactiver l'envoi de notifications
+TELEGRAM_NOTIFICATIONS_ENABLED = True
 # ======================================================================
 # CONFIGURATION
 # CORRECTION CRITIQUE: Déplacement de la DB vers /tmp
 # Ce répertoire est le seul garanti en écriture sur Hugging Face Spaces.
+CHROMA_DB_PATH = "/tmp/bdd_ChromaDB"
 COLLECTION_NAME = "qr_data_dual_embeddings"
 Q_COLUMN_NAME = "Question"
 # Récupération de la clé depuis l'environnement (Hugging Face Secrets)
 # Si non trouvée, utilise la clé de placeholder.
+GEMINI_API_KEY = os.getenv("GEMINI_API_KEY", "AIzaSyDXXY7uSXryTxZ51jQFsSLcPnC_Ivt9V1g")
 GEMINI_MODEL = "gemini-2.5-flash"
 MAX_CONVERSATION_HISTORY = 10
 conversation_histories: Dict[str, List[Dict[str, str]]] = {}
 conversation_start_times: Dict[str, str] = {}
+# ======================================================================
+# 🤖 FONCTION D'ENVOI TÉLÉGRAM
+# ======================================================================
+def send_llm_interaction_to_telegram(question: str, reponse_llm: str, session_id: str, token: str, chat_id: str):
+    """
+    Envoie une notification d'interaction Question/Réponse à Telegram.
+    """
+    if not TELEGRAM_NOTIFICATIONS_ENABLED:
+        return
+    # Construction du message formaté
+    MESSAGE = f"""
+*🔔 Nouvelle Interaction LLM 🔔*
+*Session ID:* `{session_id}`
+*Heure:* {time.strftime('%Y-%m-%d %H:%M:%S')}
+*Question (Utilisateur):*
+{question}
+*Réponse (LLM - Début):*
+{reponse_llm[:200]}...
+"""
+    # Construction de l'URL pour la méthode 'sendMessage'
+    url = f"https://api.telegram.org/bot{token}/sendMessage"
+    # Paramètres de la requête
+    params = {
+        "chat_id": chat_id,
+        "text": MESSAGE,
+        "parse_mode": "Markdown"
+    }
+    try:
+        # Envoi de la requête POST (sans bloquer le processus principal)
+        response = requests.post(url, params=params, timeout=5)
+        response.raise_for_status()
+        if response.json().get("ok"):
+            print(f"✅ Notification Telegram envoyée pour la session {session_id}.")
+        else:
+            print(f"❌ Échec envoi Telegram: {response.json().get('description')}")
+    except requests.exceptions.RequestException as e:
+        print(f"❌ Erreur connexion Telegram: {e}")
+    except Exception as e:
+        print(f"❌ Erreur inattendue Telegram: {e}")
 # ======================================================================
 # CHARGEMENT DES RESSOURCES
 # ======================================================================
     try:
         # Tente de charger localement, sinon télécharge (le cache se fera dans /tmp)
         cross_encoder = CrossEncoder(
+            SRC_CROSS_ENCODER if os.path.exists(SRC_CROSS_ENCODER)
             else "cross-encoder/mmarco-mMiniLMv2-L12-H384-v1"
         )
         paraphrase = SentenceTransformer(
+            SRC_PARAPHRASE if os.path.exists(SRC_PARAPHRASE)
             else "sentence-transformers/paraphrase-mpnet-base-v2"
         )
         print("✅ Modèles chargés avec succès.")
 def setup_chromadb_collection(client, df, model_paraphrase):
     """Configure et remplit la collection ChromaDB."""
     total_docs = len(df) * 2
     # S'assurer que le répertoire de la DB existe
     os.makedirs(CHROMA_DB_PATH, exist_ok=True)
     try:
         collection = client.get_or_create_collection(name=COLLECTION_NAME)
     except Exception as e:
         print(f"❌ Erreur lors de l'accès à la collection ChromaDB: {e}")
         raise
     if collection.count() == total_docs and total_docs > 0:
         print(f"✅ Collection déjà remplie ({collection.count()} docs) dans {CHROMA_DB_PATH}.")
         return collection
     if total_docs == 0:
         print("⚠️ DataFrame vide. Collection non remplie.")
         return collection
     print(f"⏳ Remplissage de ChromaDB ({len(df)} lignes) à l'emplacement: {CHROMA_DB_PATH}...")
     docs, metadatas, ids = [], [], []
     for i, row in df.iterrows():
         question = str(row[Q_COLUMN_NAME])
         reponse = str(row[R_COLUMN_NAME])
         meta = {Q_COLUMN_NAME: question, R_COLUMN_NAME: reponse, "source_row": i}
         docs.append(question)
         metadatas.append({**meta, "type": "question"})
         ids.append(f"id_{i}_Q")
         docs.append(reponse)
         metadatas.append({**meta, "type": "reponse"})
         ids.append(f"id_{i}_R")
     embeddings = model_paraphrase.encode(docs, show_progress_bar=False).tolist()
     # Nettoyage et recréation (pour le cas où les données CSV ont changé)
     try:
         client.delete_collection(name=COLLECTION_NAME)
     except:
         pass
     collection = client.get_or_create_collection(name=COLLECTION_NAME)
     collection.add(embeddings=embeddings, documents=docs, metadatas=metadatas, ids=ids)
     print(f"✅ Collection remplie: {collection.count()} documents.")
     return collection
 def retrieve_and_rerank(query_text, collection, model_paraphrase, model_cross_encoder):
     """Récupère et rerank les résultats."""
     print(f"🔍 Récupération pour: '{query_text[:40]}...'")
     query_emb = model_paraphrase.encode([query_text]).tolist()
     results = collection.query(
         query_embeddings=query_emb,
         n_results=N_RESULTS_RETRIEVAL,
         include=['documents', 'metadatas', 'distances']
     )
     if not results['ids'][0]:
         print("⚠️ Aucun résultat trouvé.")
         return pd.DataFrame()
     candidates = []
     cross_input = []
     for i, doc in enumerate(results['documents'][0]):
         meta = results['metadatas'][0][i]
         candidates.append({
             'initial_distance': results['distances'][0][i]
         })
         cross_input.append([query_text, doc])
     scores = model_cross_encoder.predict(cross_input)
     for i, score in enumerate(scores):
         candidates[i]['rerank_score'] = score
     df = pd.DataFrame(candidates).sort_values('rerank_score', ascending=False)
     df = df.drop_duplicates(subset=['question', 'reponse'], keep='first')
     return df.head(N_RESULTS_RERANK)
 def generate_rag_prompt(query_text, df_results, conversation_history):
     if not df_results.empty:
         for _, row in df_results.iterrows():
             context.append(f"Q: {row['question']}\nR: {row['reponse']}")
     context_str = "\n---\n".join(context)
     history_str = ""
     if conversation_history:
         history_str = "HISTORIQUE:\n"
         # Ajout du contexte pour le LLM, mais on ne veut pas l'historique complet
         # On va limiter l'historique à l'affichage si on dépasse MAX_CONVERSATION_HISTORY
+        display_history = conversation_history[-(MAX_CONVERSATION_HISTORY * 2):]
         for msg in display_history:
             role = "USER" if msg["role"] == "user" else "ASSISTANT"
             # On utilise 'content' pour le texte du message
             history_str += f"{role}: {msg['content']}\n"
         history_str += "\n"
     return f"""{history_str}UTILISATEUR: {query_text}
 CONTEXTE (si utile):
     """Ajoute un message à l'historique."""
     if session_id not in conversation_histories:
         conversation_histories[session_id] = []
     conversation_histories[session_id].append({"role": role, "content": content})
     # Limiter la taille de l'historique conservé en mémoire
     if len(conversation_histories[session_id]) > MAX_CONVERSATION_HISTORY * 2:
         conversation_histories[session_id] = conversation_histories[session_id][-(MAX_CONVERSATION_HISTORY * 2):]
     print(f"\n{'='*50}")
     print(f"🚀 Traitement: '{query_text}'")
     print(f"{'='*50}")
     df_results = retrieve_and_rerank(query_text, collection, model_paraphrase, model_cross_encoder)
     final_prompt = generate_rag_prompt(query_text, df_results, conversation_history)
     # On retourne le prompt final RAG pour référence, mais l'appel Gemini est fait après
     return final_prompt
 def initialize_global_resources():
     """Initialise tous les modèles et ressources."""
     global model_cross_encoder, model_paraphrase, collection, system_prompt, gemini_client
     print("\n" + "="*50)
     print("⚙️  INITIALISATION RAG")
     print("="*50)
     # Le répertoire /tmp est géré par la variable CHROMA_DB_PATH
     try:
         model_cross_encoder, model_paraphrase = load_models()
         df = load_data()
     except Exception:
         # L'erreur est déjà print dans les fonctions de chargement
         return False
     try:
         print(f"⏳ Initialisation de ChromaDB à l'emplacement: {CHROMA_DB_PATH}")
         # Le PersistentClient créera les fichiers dans le chemin spécifié (maintenant dans /tmp)
 app = Flask(__name__)
 # CORS activé, permet les requêtes depuis n'importe quelle origine
+CORS(app)
 @app.route('/status', methods=['GET'])
 def api_status():
     """Endpoint principal pour obtenir une réponse."""
     if any(x is None for x in [model_cross_encoder, model_paraphrase, collection, system_prompt, gemini_client]):
         return jsonify({"error": "Ressources non chargées. Veuillez vérifier les logs d'initialisation."}), 500
     try:
         data = request.get_json()
         query_text = data.get('query_text')
         session_id = data.get('session_id', 'archive')
         if not query_text:
             generic_message = "Problème avec l'API, veuillez réessayer plus tard."
             return jsonify({"error": generic_message}), 500
         # Récupère historique
         history = get_conversation_history(session_id)
         # Génère prompt RAG
         rag_prompt = get_answer(query_text, collection, model_paraphrase, model_cross_encoder, history)
         # Appelle Gemini
         response = call_gemini(rag_prompt, system_prompt, gemini_client)
         # Sauvegarde réponse
         add_to_history(session_id, "user", query_text)
         add_to_history(session_id, "assistant", response)
+        # 🚀 AJOUT DE LA NOTIFICATION TÉLÉGRAM
+        send_llm_interaction_to_telegram(
+            question=query_text,
+            reponse_llm=response,
+            session_id=session_id,
+            token=TELEGRAM_TOKEN,
+            chat_id=TELEGRAM_CHAT_ID
+        )
+        # ------------------------------------
         return jsonify({"generated_response": response})
     except Exception as e:
         print(f"❌ Erreur générale de l'API: {e}")
         generic_message = "Problème avec l'API, veuillez réessayer plus tard."
         data = request.get_json()
         session_id = data.get('session_id', 'archive')
         clear_history(session_id)
         return jsonify({"message": f"Historique effacé: {session_id}"})
     except Exception as e:
         generic_message = "Problème avec l'API, veuillez réessayer plus tard."
 if __name__ == '__main__':
     print("start app.py")
     if initialize_global_resources():
         # Récupération de l'adresse IP si possible (pour l'affichage)
         try:
             import socket
             s.close()
         except Exception:
             local_ip = "127.0.0.1" # Fallback si échec
         print("\n" + "="*50)
         print("🌐 SERVEUR DÉMARRÉ")
         print(f"✅ API accessible à l'URL (via l'interface réseau locale): http://{local_ip}:{API_PORT}")
         print(f"✅ Route Status: http://{local_ip}:{API_PORT}/status")
         print(f"💡 N'oubliez pas de configurer 'app_port: 1212' et 'sdk: docker' dans votre README.md !")
         print("="*50 + "\n")
         # L'utilisation de host='0.0.0.0' dans app.run() permet l'accès depuis l'extérieur
         app.run(host=API_HOST, port=API_PORT, debug=False)
     else:
+        print("❌ Impossible de démarrer le serveur. Veuillez vérifier les logs pour les erreurs d'initialisation.")