Spaces:

Sacof
/

finanfa

Sleeping

App Files Files Community

Sacof commited on Oct 30, 2025

Commit

347a2cf

verified ·

1 Parent(s): 64a8e34

Update app.py

Browse files

Files changed (1) hide show

app.py +6 -12

app.py CHANGED Viewed

@@ -7,16 +7,14 @@ from sklearn.feature_extraction.text import TfidfVectorizer
 from sklearn.metrics.pairwise import cosine_similarity
 import numpy as np
-# === CONFIGURATION ===
 MODEL_NAME = "google/gemma-2b-it"
 INFO_FILE = "infos_medicaux.txt"
 MAX_TOKENS = 600
-TEMPERATURE = 0.6
-CHUNK_SIZE = 1000  # caractères par chunk
-TOP_K_CHUNKS = 3   # Nombre de chunks pertinents à inclure
-# === CHARGEMENT DU MODÈLE ===
-print("⏳ Chargement du modèle...")
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_NAME,
@@ -25,9 +23,8 @@ model = AutoModelForCausalLM.from_pretrained(
     low_cpu_mem_usage=True
 )
 model.eval()
-print("✅ Modèle chargé avec succès !")
-# === CHARGEMENT DU CONTEXTE MÉDICAL ET DÉCOUPAGE EN CHUNKS ===
 medical_context_chunks = []
 if os.path.exists(INFO_FILE):
     with open(INFO_FILE, "r", encoding="utf-8") as f:
@@ -35,9 +32,8 @@ if os.path.exists(INFO_FILE):
         medical_context_chunks = [medical_context[i:i+CHUNK_SIZE] for i in range(0, len(medical_context), CHUNK_SIZE)]
         print(f"📘 Contexte médical chargé ({len(medical_context)} caractères, {len(medical_context_chunks)} chunks)")
 else:
-    print("⚠️ Aucun fichier infos_medicaux.txt trouvé.")
-# === TF-IDF pour recherche de chunks pertinents ===
 if medical_context_chunks:
     vectorizer = TfidfVectorizer().fit(medical_context_chunks)
     chunk_vectors = vectorizer.transform(medical_context_chunks)
@@ -53,7 +49,6 @@ def get_relevant_chunks(question, top_k=TOP_K_CHUNKS):
     top_indices = np.argsort(similarities)[::-1][:top_k]
     return [medical_context_chunks[i] for i in top_indices]
-# === FONCTION DE CHAT OPTIMISÉE ===
 @spaces.GPU()
 def chat_with_finanfa(message, history=None):
     if history is None:
@@ -67,7 +62,6 @@ def chat_with_finanfa(message, history=None):
         "Donne des réponses claires, détaillées et adaptées au Bénin."
     )
-    # Récupération des chunks pertinents
     relevant_chunks = get_relevant_chunks(message)
     conversation = f"Système : {system_prompt}\n"

 from sklearn.metrics.pairwise import cosine_similarity
 import numpy as np
 MODEL_NAME = "google/gemma-2b-it"
 INFO_FILE = "infos_medicaux.txt"
 MAX_TOKENS = 600
+TEMPERATURE = 0.7
+CHUNK_SIZE = 1000
+TOP_K_CHUNKS = 5
+print("Chargement du modèle...")
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_NAME,
     low_cpu_mem_usage=True
 )
 model.eval()
+print("Modèle chargé avec succès !")
 medical_context_chunks = []
 if os.path.exists(INFO_FILE):
     with open(INFO_FILE, "r", encoding="utf-8") as f:
         medical_context_chunks = [medical_context[i:i+CHUNK_SIZE] for i in range(0, len(medical_context), CHUNK_SIZE)]
         print(f"📘 Contexte médical chargé ({len(medical_context)} caractères, {len(medical_context_chunks)} chunks)")
 else:
+    print("Aucun fichier infos_medicaux.txt trouvé.")
 if medical_context_chunks:
     vectorizer = TfidfVectorizer().fit(medical_context_chunks)
     chunk_vectors = vectorizer.transform(medical_context_chunks)
     top_indices = np.argsort(similarities)[::-1][:top_k]
     return [medical_context_chunks[i] for i in top_indices]
 @spaces.GPU()
 def chat_with_finanfa(message, history=None):
     if history is None:
         "Donne des réponses claires, détaillées et adaptées au Bénin."
     )
     relevant_chunks = get_relevant_chunks(message)
     conversation = f"Système : {system_prompt}\n"