Spaces:

MathieuGAL
/

NOVA_API

Sleeping

App Files Files Community

MathieuGAL commited on Nov 13, 2025

Commit

f1231aa

verified ·

1 Parent(s): 8306651

Update app.py

Browse files

Files changed (1) hide show

app.py +21 -37

app.py CHANGED Viewed

@@ -1,15 +1,15 @@
 import os
 import pandas as pd
 import chromadb
-import requests # Ajouté pour l'API Telegram
-import json # Ajouté pour l'API Telegram
 from google import genai
 from sentence_transformers import SentenceTransformer, CrossEncoder
 from typing import List, Dict
 from flask import Flask, request, jsonify
 from flask_cors import CORS
 from datetime import datetime
-import time # Ajouté pour le timestamp Telegram
 # ======================================================================
 # ⚙️ CONFIGURATION TÉLÉGRAM
@@ -24,13 +24,12 @@ TELEGRAM_NOTIFICATIONS_ENABLED = True
 # ======================================================================
-# CONFIGURATION
 # ======================================================================
 DATA_FILE_PATH = "data/QR.csv"
 # CORRECTION CRITIQUE: Déplacement de la DB vers /tmp
-# Ce répertoire est le seul garanti en écriture sur Hugging Face Spaces.
 CHROMA_DB_PATH = "/tmp/bdd_ChromaDB"
 COLLECTION_NAME = "qr_data_dual_embeddings"
@@ -38,15 +37,13 @@ Q_COLUMN_NAME = "Question"
 R_COLUMN_NAME = "Reponse"
 SYSTEM_PROMPT_PATH = "data/system_prompt.txt"
-# Les chemins des modèles sont conservés (ils se mettront en cache dans /tmp grâce au Dockerfile)
 SRC_CROSS_ENCODER = "models/mmarco-mMiniLMv2-L12-H384-v1"
 SRC_PARAPHRASE = "models/paraphrase-mpnet-base-v2"
 N_RESULTS_RETRIEVAL = 10
 N_RESULTS_RERANK = 3
-# Récupération de la clé depuis l'environnement (Hugging Face Secrets)
-# Si non trouvée, utilise la clé de placeholder.
 GEMINI_API_KEY = os.getenv("GEMINI_API_KEY", "AIzaSyDXXY7uSXryTxZ51jQFsSLcPnC_Ivt9V1g")
 GEMINI_MODEL = "gemini-2.5-flash"
@@ -54,7 +51,7 @@ MAX_CONVERSATION_HISTORY = 10
 # Configuration pour l'accès externe (host et port)
 API_HOST = '0.0.0.0'
-API_PORT = 1212 # Le port 1212 est conservé, il doit être configuré dans le README.md
 # ======================================================================
 # VARIABLES GLOBALES
@@ -76,6 +73,7 @@ conversation_start_times: Dict[str, str] = {}
 def send_llm_interaction_to_telegram(question: str, reponse_llm: str, session_id: str, token: str, chat_id: str):
     """
     Envoie une notification d'interaction Question/Réponse à Telegram.
     """
     if not TELEGRAM_NOTIFICATIONS_ENABLED:
         return
@@ -90,7 +88,7 @@ def send_llm_interaction_to_telegram(question: str, reponse_llm: str, session_id
 {question}
 *Réponse (LLM - Début):*
-{reponse_llm[:200]}...
 """
     # Construction de l'URL pour la méthode 'sendMessage'
@@ -104,17 +102,18 @@ def send_llm_interaction_to_telegram(question: str, reponse_llm: str, session_id
     }
     try:
-        # Envoi de la requête POST (sans bloquer le processus principal)
         response = requests.post(url, params=params, timeout=5)
         response.raise_for_status()
         if response.json().get("ok"):
             print(f"✅ Notification Telegram envoyée pour la session {session_id}.")
         else:
             print(f"❌ Échec envoi Telegram: {response.json().get('description')}")
     except requests.exceptions.RequestException as e:
-        print(f"❌ Erreur connexion Telegram: {e}")
     except Exception as e:
         print(f"❌ Erreur inattendue Telegram: {e}")
@@ -127,7 +126,6 @@ def load_models():
     """Charge les modèles SentenceTransformer et CrossEncoder."""
     print("⏳ Chargement des modèles...")
     try:
-        # Tente de charger localement, sinon télécharge (le cache se fera dans /tmp)
         cross_encoder = CrossEncoder(
             SRC_CROSS_ENCODER if os.path.exists(SRC_CROSS_ENCODER)
             else "cross-encoder/mmarco-mMiniLMv2-L12-H384-v1"
@@ -140,7 +138,6 @@ def load_models():
         return cross_encoder, paraphrase
     except Exception as e:
         print(f"❌ Erreur chargement modèles: {e}")
-        # Note: L'erreur de PermissionError est maintenant gérée par le Dockerfile
         raise
 def load_data():
@@ -188,7 +185,6 @@ def setup_chromadb_collection(client, df, model_paraphrase):
     """Configure et remplit la collection ChromaDB."""
     total_docs = len(df) * 2
-    # S'assurer que le répertoire de la DB existe
     os.makedirs(CHROMA_DB_PATH, exist_ok=True)
     try:
@@ -224,7 +220,6 @@ def setup_chromadb_collection(client, df, model_paraphrase):
     embeddings = model_paraphrase.encode(docs, show_progress_bar=False).tolist()
-    # Nettoyage et recréation (pour le cas où les données CSV ont changé)
     try:
         client.delete_collection(name=COLLECTION_NAME)
     except:
@@ -290,12 +285,9 @@ def generate_rag_prompt(query_text, df_results, conversation_history):
     history_str = ""
     if conversation_history:
         history_str = "HISTORIQUE:\n"
-        # Ajout du contexte pour le LLM, mais on ne veut pas l'historique complet
-        # On va limiter l'historique à l'affichage si on dépasse MAX_CONVERSATION_HISTORY
         display_history = conversation_history[-(MAX_CONVERSATION_HISTORY * 2):]
         for msg in display_history:
             role = "USER" if msg["role"] == "user" else "ASSISTANT"
-            # On utilise 'content' pour le texte du message
             history_str += f"{role}: {msg['content']}\n"
         history_str += "\n"
@@ -363,7 +355,6 @@ def get_answer(query_text, collection, model_paraphrase, model_cross_encoder, co
     df_results = retrieve_and_rerank(query_text, collection, model_paraphrase, model_cross_encoder)
     final_prompt = generate_rag_prompt(query_text, df_results, conversation_history)
-    # On retourne le prompt final RAG pour référence, mais l'appel Gemini est fait après
     return final_prompt
 # ======================================================================
@@ -378,20 +369,16 @@ def initialize_global_resources():
     print("⚙️  INITIALISATION RAG")
     print("="*50)
-    # Le répertoire /tmp est géré par la variable CHROMA_DB_PATH
     try:
         model_cross_encoder, model_paraphrase = load_models()
         df = load_data()
         system_prompt = load_system_prompt()
         gemini_client = initialize_gemini_client()
     except Exception:
-        # L'erreur est déjà print dans les fonctions de chargement
         return False
     try:
         print(f"⏳ Initialisation de ChromaDB à l'emplacement: {CHROMA_DB_PATH}")
-        # Le PersistentClient créera les fichiers dans le chemin spécifié (maintenant dans /tmp)
         chroma_client = chromadb.PersistentClient(path=CHROMA_DB_PATH)
         collection = setup_chromadb_collection(chroma_client, df, model_paraphrase)
         print("✅ INITIALISATION COMPLÈTE\n")
@@ -405,7 +392,6 @@ def initialize_global_resources():
 # ======================================================================
 app = Flask(__name__)
-# CORS activé, permet les requêtes depuis n'importe quelle origine
 CORS(app)
 @app.route('/status', methods=['GET'])
@@ -415,18 +401,19 @@ def api_status():
 @app.route('/api/get_answer', methods=['POST'])
 def api_get_answer():
-    """Endpoint principal pour obtenir une réponse."""
     if any(x is None for x in [model_cross_encoder, model_paraphrase, collection, system_prompt, gemini_client]):
         return jsonify({"error": "Ressources non chargées. Veuillez vérifier les logs d'initialisation."}), 500
     try:
         data = request.get_json()
         query_text = data.get('query_text')
         session_id = data.get('session_id', 'archive')
         if not query_text:
-            generic_message = "Problème avec l'API, veuillez réessayer plus tard."
-            return jsonify({"error": generic_message}), 500
         # Récupère historique
         history = get_conversation_history(session_id)
@@ -437,11 +424,12 @@ def api_get_answer():
         # Appelle Gemini
         response = call_gemini(rag_prompt, system_prompt, gemini_client)
-        # Sauvegarde réponse
         add_to_history(session_id, "user", query_text)
         add_to_history(session_id, "assistant", response)
-        # 🚀 AJOUT DE LA NOTIFICATION TÉLÉGRAM
         send_llm_interaction_to_telegram(
             question=query_text,
             reponse_llm=response,
@@ -449,7 +437,7 @@ def api_get_answer():
             token=TELEGRAM_TOKEN,
             chat_id=TELEGRAM_CHAT_ID
         )
-        # ------------------------------------
         return jsonify({"generated_response": response})
@@ -479,24 +467,20 @@ if __name__ == '__main__':
     print("start app.py")
     if initialize_global_resources():
-        # Récupération de l'adresse IP si possible (pour l'affichage)
         try:
             import socket
             s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
-            s.connect(("8.8.8.8", 80)) # Connecte à un serveur externe pour trouver l'IP locale utilisée
             local_ip = s.getsockname()[0]
             s.close()
         except Exception:
-            local_ip = "127.0.0.1" # Fallback si échec
         print("\n" + "="*50)
         print("🌐 SERVEUR DÉMARRÉ")
         print(f"✅ API accessible à l'URL (via l'interface réseau locale): http://{local_ip}:{API_PORT}")
-        print(f"✅ Route Status: http://{local_ip}:{API_PORT}/status")
-        print(f"💡 N'oubliez pas de configurer 'app_port: 1212' et 'sdk: docker' dans votre README.md !")
         print("="*50 + "\n")
-        # L'utilisation de host='0.0.0.0' dans app.run() permet l'accès depuis l'extérieur
         app.run(host=API_HOST, port=API_PORT, debug=False)
     else:
         print("❌ Impossible de démarrer le serveur. Veuillez vérifier les logs pour les erreurs d'initialisation.")

 import os
 import pandas as pd
 import chromadb
+import requests
+import json
 from google import genai
 from sentence_transformers import SentenceTransformer, CrossEncoder
 from typing import List, Dict
 from flask import Flask, request, jsonify
 from flask_cors import CORS
 from datetime import datetime
+import time
 # ======================================================================
 # ⚙️ CONFIGURATION TÉLÉGRAM
 # ======================================================================
+# CONFIGURATION RAG
 # ======================================================================
 DATA_FILE_PATH = "data/QR.csv"
 # CORRECTION CRITIQUE: Déplacement de la DB vers /tmp
 CHROMA_DB_PATH = "/tmp/bdd_ChromaDB"
 COLLECTION_NAME = "qr_data_dual_embeddings"
 R_COLUMN_NAME = "Reponse"
 SYSTEM_PROMPT_PATH = "data/system_prompt.txt"
 SRC_CROSS_ENCODER = "models/mmarco-mMiniLMv2-L12-H384-v1"
 SRC_PARAPHRASE = "models/paraphrase-mpnet-base-v2"
 N_RESULTS_RETRIEVAL = 10
 N_RESULTS_RERANK = 3
+# Récupération de la clé depuis l'environnement
 GEMINI_API_KEY = os.getenv("GEMINI_API_KEY", "AIzaSyDXXY7uSXryTxZ51jQFsSLcPnC_Ivt9V1g")
 GEMINI_MODEL = "gemini-2.5-flash"
 # Configuration pour l'accès externe (host et port)
 API_HOST = '0.0.0.0'
+API_PORT = 1212
 # ======================================================================
 # VARIABLES GLOBALES
 def send_llm_interaction_to_telegram(question: str, reponse_llm: str, session_id: str, token: str, chat_id: str):
     """
     Envoie une notification d'interaction Question/Réponse à Telegram.
+    C'est la fonction principale pour l'archivage.
     """
     if not TELEGRAM_NOTIFICATIONS_ENABLED:
         return
 {question}
 *Réponse (LLM - Début):*
+{reponse_llm[:200]}... (Voir le log pour la réponse complète)
 """
     # Construction de l'URL pour la méthode 'sendMessage'
     }
     try:
+        # Envoi de la requête POST (avec un timeout pour ne pas ralentir l'API principale)
         response = requests.post(url, params=params, timeout=5)
         response.raise_for_status()
         if response.json().get("ok"):
+            # Affiche dans le log du serveur (pas dans le terminal)
             print(f"✅ Notification Telegram envoyée pour la session {session_id}.")
         else:
             print(f"❌ Échec envoi Telegram: {response.json().get('description')}")
     except requests.exceptions.RequestException as e:
+        print(f"❌ Erreur connexion Telegram (Vérifiez le TOKEN/Réseau): {e}")
     except Exception as e:
         print(f"❌ Erreur inattendue Telegram: {e}")
     """Charge les modèles SentenceTransformer et CrossEncoder."""
     print("⏳ Chargement des modèles...")
     try:
         cross_encoder = CrossEncoder(
             SRC_CROSS_ENCODER if os.path.exists(SRC_CROSS_ENCODER)
             else "cross-encoder/mmarco-mMiniLMv2-L12-H384-v1"
         return cross_encoder, paraphrase
     except Exception as e:
         print(f"❌ Erreur chargement modèles: {e}")
         raise
 def load_data():
     """Configure et remplit la collection ChromaDB."""
     total_docs = len(df) * 2
     os.makedirs(CHROMA_DB_PATH, exist_ok=True)
     try:
     embeddings = model_paraphrase.encode(docs, show_progress_bar=False).tolist()
     try:
         client.delete_collection(name=COLLECTION_NAME)
     except:
     history_str = ""
     if conversation_history:
         history_str = "HISTORIQUE:\n"
         display_history = conversation_history[-(MAX_CONVERSATION_HISTORY * 2):]
         for msg in display_history:
             role = "USER" if msg["role"] == "user" else "ASSISTANT"
             history_str += f"{role}: {msg['content']}\n"
         history_str += "\n"
     df_results = retrieve_and_rerank(query_text, collection, model_paraphrase, model_cross_encoder)
     final_prompt = generate_rag_prompt(query_text, df_results, conversation_history)
     return final_prompt
 # ======================================================================
     print("⚙️  INITIALISATION RAG")
     print("="*50)
     try:
         model_cross_encoder, model_paraphrase = load_models()
         df = load_data()
         system_prompt = load_system_prompt()
         gemini_client = initialize_gemini_client()
     except Exception:
         return False
     try:
         print(f"⏳ Initialisation de ChromaDB à l'emplacement: {CHROMA_DB_PATH}")
         chroma_client = chromadb.PersistentClient(path=CHROMA_DB_PATH)
         collection = setup_chromadb_collection(chroma_client, df, model_paraphrase)
         print("✅ INITIALISATION COMPLÈTE\n")
 # ======================================================================
 app = Flask(__name__)
 CORS(app)
 @app.route('/status', methods=['GET'])
 @app.route('/api/get_answer', methods=['POST'])
 def api_get_answer():
+    """Endpoint principal pour obtenir une réponse et envoyer la notification Telegram."""
     if any(x is None for x in [model_cross_encoder, model_paraphrase, collection, system_prompt, gemini_client]):
         return jsonify({"error": "Ressources non chargées. Veuillez vérifier les logs d'initialisation."}), 500
     try:
         data = request.get_json()
         query_text = data.get('query_text')
+        # Utiliser un ID par défaut si non fourni
         session_id = data.get('session_id', 'archive')
         if not query_text:
+            generic_message = "Requête vide."
+            return jsonify({"error": generic_message}), 400
         # Récupère historique
         history = get_conversation_history(session_id)
         # Appelle Gemini
         response = call_gemini(rag_prompt, system_prompt, gemini_client)
+        # Sauvegarde réponse dans l'historique de la session
         add_to_history(session_id, "user", query_text)
         add_to_history(session_id, "assistant", response)
+        # 🚀 ÉTAPE CRUCIALE : ENVOI DE LA NOTIFICATION TÉLÉGRAM
+        # Ceci archive l'interaction (Question + Réponse)
         send_llm_interaction_to_telegram(
             question=query_text,
             reponse_llm=response,
             token=TELEGRAM_TOKEN,
             chat_id=TELEGRAM_CHAT_ID
         )
+        # --------------------------------------------------------
         return jsonify({"generated_response": response})
     print("start app.py")
     if initialize_global_resources():
         try:
             import socket
             s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
+            s.connect(("8.8.8.8", 80))
             local_ip = s.getsockname()[0]
             s.close()
         except Exception:
+            local_ip = "127.0.0.1"
         print("\n" + "="*50)
         print("🌐 SERVEUR DÉMARRÉ")
         print(f"✅ API accessible à l'URL (via l'interface réseau locale): http://{local_ip}:{API_PORT}")
         print("="*50 + "\n")
         app.run(host=API_HOST, port=API_PORT, debug=False)
     else:
         print("❌ Impossible de démarrer le serveur. Veuillez vérifier les logs pour les erreurs d'initialisation.")