Spaces:

MathieuGAL
/

NOVA_API

Sleeping

App Files Files Community

MathieuGAL commited on Nov 16, 2025

Commit

349eb6e

verified ·

1 Parent(s): c2d7780

Update app.py

Browse files

Files changed (1) hide show

app.py +46 -46

app.py CHANGED Viewed

@@ -39,7 +39,7 @@ MAX_CONVERSATION_HISTORY = 10
 # Configuration pour l'accès externe (host et port)
 API_HOST = '0.0.0.0'
-API_PORT = 1212 # Le port 1212 est conservé, il doit être configuré dans le README.md
 # ======================================================================
 # VARIABLES GLOBALES
@@ -122,52 +122,52 @@ def initialize_gemini_client():
 def setup_chromadb_collection(client, df, model_paraphrase):
     """Configure et remplit la collection ChromaDB."""
     total_docs = len(df) * 2
     # S'assurer que le répertoire de la DB existe
     os.makedirs(CHROMA_DB_PATH, exist_ok=True)
     try:
         collection = client.get_or_create_collection(name=COLLECTION_NAME)
     except Exception as e:
         print(f"❌ Erreur lors de l'accès à la collection ChromaDB: {e}")
         raise
     if collection.count() == total_docs and total_docs > 0:
         print(f"✅ Collection déjà remplie ({collection.count()} docs) dans {CHROMA_DB_PATH}.")
         return collection
     if total_docs == 0:
         print("⚠️ DataFrame vide. Collection non remplie.")
         return collection
     print(f"⏳ Remplissage de ChromaDB ({len(df)} lignes) à l'emplacement: {CHROMA_DB_PATH}...")
     docs, metadatas, ids = [], [], []
     for i, row in df.iterrows():
         question = str(row[Q_COLUMN_NAME])
         reponse = str(row[R_COLUMN_NAME])
         meta = {Q_COLUMN_NAME: question, R_COLUMN_NAME: reponse, "source_row": i}
         docs.append(question)
         metadatas.append({**meta, "type": "question"})
         ids.append(f"id_{i}_Q")
         docs.append(reponse)
         metadatas.append({**meta, "type": "reponse"})
         ids.append(f"id_{i}_R")
     embeddings = model_paraphrase.encode(docs, show_progress_bar=False).tolist()
     # Nettoyage et recréation (pour le cas où les données CSV ont changé)
     try:
         client.delete_collection(name=COLLECTION_NAME)
     except:
         pass
     collection = client.get_or_create_collection(name=COLLECTION_NAME)
     collection.add(embeddings=embeddings, documents=docs, metadatas=metadatas, ids=ids)
     print(f"✅ Collection remplie: {collection.count()} documents.")
     return collection
@@ -178,21 +178,21 @@ def setup_chromadb_collection(client, df, model_paraphrase):
 def retrieve_and_rerank(query_text, collection, model_paraphrase, model_cross_encoder):
     """Récupère et rerank les résultats."""
     print(f"🔍 Récupération pour: '{query_text[:40]}...'")
     query_emb = model_paraphrase.encode([query_text]).tolist()
     results = collection.query(
         query_embeddings=query_emb,
         n_results=N_RESULTS_RETRIEVAL,
         include=['documents', 'metadatas', 'distances']
     )
     if not results['ids'][0]:
         print("⚠️ Aucun résultat trouvé.")
         return pd.DataFrame()
     candidates = []
     cross_input = []
     for i, doc in enumerate(results['documents'][0]):
         meta = results['metadatas'][0][i]
         candidates.append({
@@ -203,14 +203,14 @@ def retrieve_and_rerank(query_text, collection, model_paraphrase, model_cross_en
             'initial_distance': results['distances'][0][i]
         })
         cross_input.append([query_text, doc])
     scores = model_cross_encoder.predict(cross_input)
     for i, score in enumerate(scores):
         candidates[i]['rerank_score'] = score
     df = pd.DataFrame(candidates).sort_values('rerank_score', ascending=False)
     df = df.drop_duplicates(subset=['question', 'reponse'], keep='first')
     return df.head(N_RESULTS_RERANK)
 def generate_rag_prompt(query_text, df_results, conversation_history):
@@ -219,9 +219,9 @@ def generate_rag_prompt(query_text, df_results, conversation_history):
     if not df_results.empty:
         for _, row in df_results.iterrows():
             context.append(f"Q: {row['question']}\nR: {row['reponse']}")
     context_str = "\n---\n".join(context)
     history_str = ""
     if conversation_history:
         history_str = "HISTORIQUE:\n"
@@ -233,7 +233,7 @@ def generate_rag_prompt(query_text, df_results, conversation_history):
             # On utilise 'content' pour le texte du message
             history_str += f"{role}: {msg['content']}\n"
         history_str += "\n"
     return f"""{history_str}UTILISATEUR: {query_text}
 CONTEXTE (si utile):
@@ -258,9 +258,9 @@ def add_to_history(session_id, role, content):
     """Ajoute un message à l'historique."""
     if session_id not in conversation_histories:
         conversation_histories[session_id] = []
     conversation_histories[session_id].append({"role": role, "content": content})
     # Limiter la taille de l'historique conservé en mémoire
     if len(conversation_histories[session_id]) > MAX_CONVERSATION_HISTORY * 2:
         conversation_histories[session_id] = conversation_histories[session_id][-(MAX_CONVERSATION_HISTORY * 2):]
@@ -294,10 +294,10 @@ def get_answer(query_text, collection, model_paraphrase, model_cross_encoder, co
     print(f"\n{'='*50}")
     print(f"🚀 Traitement: '{query_text}'")
     print(f"{'='*50}")
     df_results = retrieve_and_rerank(query_text, collection, model_paraphrase, model_cross_encoder)
     final_prompt = generate_rag_prompt(query_text, df_results, conversation_history)
     # On retourne le prompt final RAG pour référence, mais l'appel Gemini est fait après
     return final_prompt
@@ -308,13 +308,13 @@ def get_answer(query_text, collection, model_paraphrase, model_cross_encoder, co
 def initialize_global_resources():
     """Initialise tous les modèles et ressources."""
     global model_cross_encoder, model_paraphrase, collection, system_prompt, gemini_client
     print("\n" + "="*50)
     print("⚙️  INITIALISATION RAG")
     print("="*50)
     # Le répertoire /tmp est géré par la variable CHROMA_DB_PATH
     try:
         model_cross_encoder, model_paraphrase = load_models()
         df = load_data()
@@ -323,7 +323,7 @@ def initialize_global_resources():
     except Exception:
         # L'erreur est déjà print dans les fonctions de chargement
         return False
     try:
         print(f"⏳ Initialisation de ChromaDB à l'emplacement: {CHROMA_DB_PATH}")
         # Le PersistentClient créera les fichiers dans le chemin spécifié (maintenant dans /tmp)
@@ -353,31 +353,31 @@ def api_get_answer():
     """Endpoint principal pour obtenir une réponse."""
     if any(x is None for x in [model_cross_encoder, model_paraphrase, collection, system_prompt, gemini_client]):
         return jsonify({"error": "Ressources non chargées. Veuillez vérifier les logs d'initialisation."}), 500
     try:
         data = request.get_json()
         query_text = data.get('query_text')
         session_id = data.get('session_id', 'archive')
         if not query_text:
             generic_message = "Problème avec l'API, veuillez réessayer plus tard."
             return jsonify({"error": generic_message}), 500
         # Récupère historique
         history = get_conversation_history(session_id)
         # Génère prompt RAG
         rag_prompt = get_answer(query_text, collection, model_paraphrase, model_cross_encoder, history)
         # Appelle Gemini
         response = call_gemini(rag_prompt, system_prompt, gemini_client)
         # Sauvegarde réponse
         add_to_history(session_id, "user", query_text)
         add_to_history(session_id, "assistant", response)
         return jsonify({"generated_response": response})
     except Exception as e:
         print(f"❌ Erreur générale de l'API: {e}")
         generic_message = "Problème avec l'API, veuillez réessayer plus tard."
@@ -390,7 +390,7 @@ def api_clear_history():
         data = request.get_json()
         session_id = data.get('session_id', 'archive')
         clear_history(session_id)
         return jsonify({"message": f"Historique effacé: {session_id}"})
     except Exception as e:
         generic_message = "Problème avec l'API, veuillez réessayer plus tard."
@@ -403,24 +403,24 @@ def api_clear_history():
 if __name__ == '__main__':
     print("start app.py")
     if initialize_global_resources():
         # Récupération de l'adresse IP si possible (pour l'affichage)
         try:
             import socket
             s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
-            s.connect(("8.8.8.8", 80)) # Connecte à un serveur externe pour trouver l'IP locale utilisée
             local_ip = s.getsockname()[0]
             s.close()
         except Exception:
-            local_ip = "127.0.0.1" # Fallback si échec
         print("\n" + "="*50)
         print("🌐 SERVEUR DÉMARRÉ")
         print(f"✅ API accessible à l'URL (via l'interface réseau locale): http://{local_ip}:{API_PORT}")
         print(f"✅ Route Status: http://{local_ip}:{API_PORT}/status")
         print(f"💡 N'oubliez pas de configurer 'app_port: 1212' et 'sdk: docker' dans votre README.md !")
         print("="*50 + "\n")
         # L'utilisation de host='0.0.0.0' dans app.run() permet l'accès depuis l'extérieur
         app.run(host=API_HOST, port=API_PORT, debug=False)
     else:

 # Configuration pour l'accès externe (host et port)
 API_HOST = '0.0.0.0'
+API_PORT = 1212  # Le port 1212 est conservé, il doit être configuré dans le README.md
 # ======================================================================
 # VARIABLES GLOBALES
 def setup_chromadb_collection(client, df, model_paraphrase):
     """Configure et remplit la collection ChromaDB."""
     total_docs = len(df) * 2
     # S'assurer que le répertoire de la DB existe
     os.makedirs(CHROMA_DB_PATH, exist_ok=True)
     try:
         collection = client.get_or_create_collection(name=COLLECTION_NAME)
     except Exception as e:
         print(f"❌ Erreur lors de l'accès à la collection ChromaDB: {e}")
         raise
     if collection.count() == total_docs and total_docs > 0:
         print(f"✅ Collection déjà remplie ({collection.count()} docs) dans {CHROMA_DB_PATH}.")
         return collection
     if total_docs == 0:
         print("⚠️ DataFrame vide. Collection non remplie.")
         return collection
     print(f"⏳ Remplissage de ChromaDB ({len(df)} lignes) à l'emplacement: {CHROMA_DB_PATH}...")
     docs, metadatas, ids = [], [], []
     for i, row in df.iterrows():
         question = str(row[Q_COLUMN_NAME])
         reponse = str(row[R_COLUMN_NAME])
         meta = {Q_COLUMN_NAME: question, R_COLUMN_NAME: reponse, "source_row": i}
         docs.append(question)
         metadatas.append({**meta, "type": "question"})
         ids.append(f"id_{i}_Q")
         docs.append(reponse)
         metadatas.append({**meta, "type": "reponse"})
         ids.append(f"id_{i}_R")
     embeddings = model_paraphrase.encode(docs, show_progress_bar=False).tolist()
     # Nettoyage et recréation (pour le cas où les données CSV ont changé)
     try:
         client.delete_collection(name=COLLECTION_NAME)
     except:
         pass
     collection = client.get_or_create_collection(name=COLLECTION_NAME)
     collection.add(embeddings=embeddings, documents=docs, metadatas=metadatas, ids=ids)
     print(f"✅ Collection remplie: {collection.count()} documents.")
     return collection
 def retrieve_and_rerank(query_text, collection, model_paraphrase, model_cross_encoder):
     """Récupère et rerank les résultats."""
     print(f"🔍 Récupération pour: '{query_text[:40]}...'")
     query_emb = model_paraphrase.encode([query_text]).tolist()
     results = collection.query(
         query_embeddings=query_emb,
         n_results=N_RESULTS_RETRIEVAL,
         include=['documents', 'metadatas', 'distances']
     )
     if not results['ids'][0]:
         print("⚠️ Aucun résultat trouvé.")
         return pd.DataFrame()
     candidates = []
     cross_input = []
     for i, doc in enumerate(results['documents'][0]):
         meta = results['metadatas'][0][i]
         candidates.append({
             'initial_distance': results['distances'][0][i]
         })
         cross_input.append([query_text, doc])
     scores = model_cross_encoder.predict(cross_input)
     for i, score in enumerate(scores):
         candidates[i]['rerank_score'] = score
     df = pd.DataFrame(candidates).sort_values('rerank_score', ascending=False)
     df = df.drop_duplicates(subset=['question', 'reponse'], keep='first')
     return df.head(N_RESULTS_RERANK)
 def generate_rag_prompt(query_text, df_results, conversation_history):
     if not df_results.empty:
         for _, row in df_results.iterrows():
             context.append(f"Q: {row['question']}\nR: {row['reponse']}")
     context_str = "\n---\n".join(context)
     history_str = ""
     if conversation_history:
         history_str = "HISTORIQUE:\n"
             # On utilise 'content' pour le texte du message
             history_str += f"{role}: {msg['content']}\n"
         history_str += "\n"
     return f"""{history_str}UTILISATEUR: {query_text}
 CONTEXTE (si utile):
     """Ajoute un message à l'historique."""
     if session_id not in conversation_histories:
         conversation_histories[session_id] = []
     conversation_histories[session_id].append({"role": role, "content": content})
     # Limiter la taille de l'historique conservé en mémoire
     if len(conversation_histories[session_id]) > MAX_CONVERSATION_HISTORY * 2:
         conversation_histories[session_id] = conversation_histories[session_id][-(MAX_CONVERSATION_HISTORY * 2):]
     print(f"\n{'='*50}")
     print(f"🚀 Traitement: '{query_text}'")
     print(f"{'='*50}")
     df_results = retrieve_and_rerank(query_text, collection, model_paraphrase, model_cross_encoder)
     final_prompt = generate_rag_prompt(query_text, df_results, conversation_history)
     # On retourne le prompt final RAG pour référence, mais l'appel Gemini est fait après
     return final_prompt
 def initialize_global_resources():
     """Initialise tous les modèles et ressources."""
     global model_cross_encoder, model_paraphrase, collection, system_prompt, gemini_client
     print("\n" + "="*50)
     print("⚙️  INITIALISATION RAG")
     print("="*50)
     # Le répertoire /tmp est géré par la variable CHROMA_DB_PATH
     try:
         model_cross_encoder, model_paraphrase = load_models()
         df = load_data()
     except Exception:
         # L'erreur est déjà print dans les fonctions de chargement
         return False
     try:
         print(f"⏳ Initialisation de ChromaDB à l'emplacement: {CHROMA_DB_PATH}")
         # Le PersistentClient créera les fichiers dans le chemin spécifié (maintenant dans /tmp)
     """Endpoint principal pour obtenir une réponse."""
     if any(x is None for x in [model_cross_encoder, model_paraphrase, collection, system_prompt, gemini_client]):
         return jsonify({"error": "Ressources non chargées. Veuillez vérifier les logs d'initialisation."}), 500
     try:
         data = request.get_json()
         query_text = data.get('query_text')
         session_id = data.get('session_id', 'archive')
         if not query_text:
             generic_message = "Problème avec l'API, veuillez réessayer plus tard."
             return jsonify({"error": generic_message}), 500
         # Récupère historique
         history = get_conversation_history(session_id)
         # Génère prompt RAG
         rag_prompt = get_answer(query_text, collection, model_paraphrase, model_cross_encoder, history)
         # Appelle Gemini
         response = call_gemini(rag_prompt, system_prompt, gemini_client)
         # Sauvegarde réponse
         add_to_history(session_id, "user", query_text)
         add_to_history(session_id, "assistant", response)
         return jsonify({"generated_response": response})
     except Exception as e:
         print(f"❌ Erreur générale de l'API: {e}")
         generic_message = "Problème avec l'API, veuillez réessayer plus tard."
         data = request.get_json()
         session_id = data.get('session_id', 'archive')
         clear_history(session_id)
         return jsonify({"message": f"Historique effacé: {session_id}"})
     except Exception as e:
         generic_message = "Problème avec l'API, veuillez réessayer plus tard."
 if __name__ == '__main__':
     print("start app.py")
     if initialize_global_resources():
         # Récupération de l'adresse IP si possible (pour l'affichage)
         try:
             import socket
             s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
+            s.connect(("8.8.8.8", 80))  # Connecte à un serveur externe pour trouver l'IP locale utilisée
             local_ip = s.getsockname()[0]
             s.close()
         except Exception:
+            local_ip = "127.0.0.1"  # Fallback si échec
         print("\n" + "="*50)
         print("🌐 SERVEUR DÉMARRÉ")
         print(f"✅ API accessible à l'URL (via l'interface réseau locale): http://{local_ip}:{API_PORT}")
         print(f"✅ Route Status: http://{local_ip}:{API_PORT}/status")
         print(f"💡 N'oubliez pas de configurer 'app_port: 1212' et 'sdk: docker' dans votre README.md !")
         print("="*50 + "\n")
         # L'utilisation de host='0.0.0.0' dans app.run() permet l'accès depuis l'extérieur
         app.run(host=API_HOST, port=API_PORT, debug=False)
     else: