Upload folder using huggingface_hub

Browse files

Files changed (15) hide show

README.md +12 -0
app/views/__pycache__/admin.cpython-311.pyc +0 -0
app/views/__pycache__/aide_telephonique.cpython-311.pyc +0 -0
app/views/__pycache__/dashboard.cpython-311.pyc +0 -0
app/views/__pycache__/home.cpython-311.pyc +0 -0
app/views/aide_telephonique.py +48 -17
app/views/dashboard.py +27 -32
database/db_logsv2.db +0 -0
database/embed_s1000_o100/dcf34afb-fc87-46fb-9704-f9f238154972/length.bin +1 -1
packages.txt +1 -0
requirements.txt +19 -115
src/__pycache__/speech_to_text.cpython-311.pyc +0 -0
src/security/__pycache__/security_check.cpython-311.pyc +0 -0
src/security/__pycache__/security_report.cpython-311.pyc +0 -0
src/security/security_report.py +4 -2

README.md CHANGED Viewed

@@ -1,3 +1,15 @@
 # SmartRescue
 SmartRescue est une application conçue pour assister les opérateurs d'urgence grâce à l'intégration d'un **LLM (Large Language Model)** et d'un **RAG (Retrieval-Augmented Generation)**. Cette technologie permet d'améliorer la prise de décision en temps réel et de fournir une assistance rapide et efficace lors des appels d'urgence.

+---
+title: "SmartRescue"
+emoji: "🚑"
+colorFrom: "red"
+colorTo: "blue"
+sdk: "streamlit"
+sdk_version: "1.41.1"
+app_file: app/app.py
+pinned: false
+---
 # SmartRescue
 SmartRescue est une application conçue pour assister les opérateurs d'urgence grâce à l'intégration d'un **LLM (Large Language Model)** et d'un **RAG (Retrieval-Augmented Generation)**. Cette technologie permet d'améliorer la prise de décision en temps réel et de fournir une assistance rapide et efficace lors des appels d'urgence.

app/views/__pycache__/admin.cpython-311.pyc CHANGED Viewed

Binary files a/app/views/__pycache__/admin.cpython-311.pyc and b/app/views/__pycache__/admin.cpython-311.pyc differ

app/views/__pycache__/aide_telephonique.cpython-311.pyc CHANGED Viewed

Binary files a/app/views/__pycache__/aide_telephonique.cpython-311.pyc and b/app/views/__pycache__/aide_telephonique.cpython-311.pyc differ

app/views/__pycache__/dashboard.cpython-311.pyc CHANGED Viewed

Binary files a/app/views/__pycache__/dashboard.cpython-311.pyc and b/app/views/__pycache__/dashboard.cpython-311.pyc differ

app/views/__pycache__/home.cpython-311.pyc CHANGED Viewed

Binary files a/app/views/__pycache__/home.cpython-311.pyc and b/app/views/__pycache__/home.cpython-311.pyc differ

app/views/aide_telephonique.py CHANGED Viewed

@@ -98,10 +98,9 @@ def summarize_conversation(messages, llm):
     llm_chain = prompt | llm
     start_time = time.time()
     summary = llm_chain.invoke({"conversation": conversation})
-    latency = (time.time() - start_time) * 1000  # Convertir en ms
-    token_count = len(summary.split())
-    track_metrics(latency, token_count)
-    return summary
 def aide_telephonique_page():
@@ -117,10 +116,8 @@ def aide_telephonique_page():
     Cela peut être gênant en faussant les résultats du LLM.
     """
-    st.title("Aide téléphonique pour les opérateurs du SAMU")
-    st.subheader(
-        "Interrogez l'IA durant votre appel pour obtenir des aides et conseils"
-    )
     # Initialisation de l'état de session
     if "recording" not in st.session_state:
@@ -139,6 +136,14 @@ def aide_telephonique_page():
         st.session_state.message_count = 0
     if "session_id" not in st.session_state:
         st.session_state.session_id = str(uuid.uuid4())
     # Contrôles d'enregistrement
     col1, col2 = st.columns(2)
@@ -166,7 +171,10 @@ def aide_telephonique_page():
         st.info("Enregistrement en cours...")
         template = """
-            Tu es une IA conçue pour assister les agents des urgences en analysant leurs appels.
             **Règles à respecter :**
             - Tu dois être **empathique, calme, direct et professionnel**.
@@ -177,22 +185,21 @@ def aide_telephonique_page():
             - **Tes réponses doivent toujours être en français, sauf si l'opérateur parle en anglais.**
             - **Formule tes réponses sous forme d’instructions précises pour l’opérateur.**
             - **Tes réponses doivent toujours être en français, correctes grammaticalement et sans faute de syntaxe.**
-            - **Tes réponses ne doivent jamais commencer par "réponse correcte". Réponds directement comme cela t'a été demandé.**
             **Important :** Tu n’as accès **qu'à la voix de l'opérateur**. Tu ne dois pas générer de contenu supplémentaire ni interpréter des éléments que tu ne peux pas entendre.
             ### **Exemple de réponse attendue :**
             **Opérateur :** "Il y a eu un accident, des blessés peut-être."
-            **Réponse correcte :** "Demandez à l'appelant combien de blessés il y a."
             **Opérateur :** "Où est l’accident ?"
-            **Réponse correcte :** "Demandez une adresse exacte ou un point de repère."
             **Voici la dernière déclaration ou question de l'opérateur :**
             {text_query}
-            **Voici le contexte dont tu auras besoin pour répondre au mieux aux questions:**
-            {context}
         """
         prompt = PromptTemplate(
@@ -233,8 +240,11 @@ def aide_telephonique_page():
                     recent_messages = all_messages[-5:]  # on garde les 5 derniers
                     # Résumé de la conversation via le LLM
-                    summary = summarize_conversation(old_messages, llm)
                     # Mettre à jour l'historique avec le résumé et les messages récents
                     st.session_state.history = ChatMessageHistory()
                     for msg in recent_messages:
@@ -362,6 +372,7 @@ def aide_telephonique_page():
                 # Appel du LLM si le test de sécurité est accepté
                 if filtre["status"] == "Accepté" and test_sim_cos:
                     response = llm_chain.invoke(
                         {
                             "text_query": st.session_state.history.messages,
@@ -370,6 +381,12 @@ def aide_telephonique_page():
                             ),
                         }
                     )
                     st.session_state.history.add_ai_message(response)
                     with st.chat_message("assistant"):
                         st.markdown(response)
@@ -406,5 +423,19 @@ def aide_telephonique_page():
             # Résumé de la conversation via le LLM
             st.write("Résumé de la conversation :")
             messages = st.session_state.history.messages
-            summary = summarize_conversation(messages, llm)
             st.write(summary)

     llm_chain = prompt | llm
     start_time = time.time()
     summary = llm_chain.invoke({"conversation": conversation})
+    latency_summary = (time.time() - start_time) * 1000  # Convertir en ms
+    tokens_summary = len(summary.split())
+    return summary, latency_summary, tokens_summary
 def aide_telephonique_page():
     Cela peut être gênant en faussant les résultats du LLM.
     """
+    st.title("Requête du modèle")
+    st.subheader("Interrogez le LLM via votre voix ou texte")
     # Initialisation de l'état de session
     if "recording" not in st.session_state:
         st.session_state.message_count = 0
     if "session_id" not in st.session_state:
         st.session_state.session_id = str(uuid.uuid4())
+    if "latency_summary_list" not in st.session_state:
+        st.session_state.latency_summary_list = []
+    if "tokens_summary_list" not in st.session_state:
+        st.session_state.tokens_summary_list = []
+    if "latency_response_list" not in st.session_state:
+        st.session_state.latency_response_list = []
+    if "tokens_response_list" not in st.session_state:
+        st.session_state.tokens_response_list = []
     # Contrôles d'enregistrement
     col1, col2 = st.columns(2)
         st.info("Enregistrement en cours...")
         template = """
+            Tu es une IA conçue pour assister les agents des urgences en analysant leurs appels.
+            **Voici le contexte dont tu auras besoin pour répondre au mieux aux questions:**
+            {context}
             **Règles à respecter :**
             - Tu dois être **empathique, calme, direct et professionnel**.
             - **Tes réponses doivent toujours être en français, sauf si l'opérateur parle en anglais.**
             - **Formule tes réponses sous forme d’instructions précises pour l’opérateur.**
             - **Tes réponses doivent toujours être en français, correctes grammaticalement et sans faute de syntaxe.**
+            - **Tes réponses ne doivent jamais commencer en introduisant la réponse (ex: "réponse :"). Réponds directement comme cela t'a été demandé.**
             **Important :** Tu n’as accès **qu'à la voix de l'opérateur**. Tu ne dois pas générer de contenu supplémentaire ni interpréter des éléments que tu ne peux pas entendre.
             ### **Exemple de réponse attendue :**
             **Opérateur :** "Il y a eu un accident, des blessés peut-être."
+            "Demandez à l'appelant combien de blessés il y a."
             **Opérateur :** "Où est l’accident ?"
+            "Demandez une adresse exacte ou un point de repère."
             **Voici la dernière déclaration ou question de l'opérateur :**
             {text_query}
+            **Pour rappel** tu dois absolument répondre uniquement en français avec des réponses les plus courtes possibles.
         """
         prompt = PromptTemplate(
                     recent_messages = all_messages[-5:]  # on garde les 5 derniers
                     # Résumé de la conversation via le LLM
+                    summary, latency_summary, tokens_summary = summarize_conversation(
+                        old_messages, llm
+                    )
+                    st.session_state.latency_summary_list.append(latency_summary)
+                    st.session_state.tokens_summary_list.append(tokens_summary)
                     # Mettre à jour l'historique avec le résumé et les messages récents
                     st.session_state.history = ChatMessageHistory()
                     for msg in recent_messages:
                 # Appel du LLM si le test de sécurité est accepté
                 if filtre["status"] == "Accepté" and test_sim_cos:
+                    start_time = time.time()
                     response = llm_chain.invoke(
                         {
                             "text_query": st.session_state.history.messages,
                             ),
                         }
                     )
+                    latency_response = (time.time() - start_time) * 1000  # ms
+                    tokens_response = len(response.split())
+                    st.session_state.latency_response_list.append(latency_response)
+                    st.session_state.tokens_response_list.append(tokens_response)
                     st.session_state.history.add_ai_message(response)
                     with st.chat_message("assistant"):
                         st.markdown(response)
             # Résumé de la conversation via le LLM
             st.write("Résumé de la conversation :")
             messages = st.session_state.history.messages
+            summary, latency_summary, tokens_summary = summarize_conversation(
+                messages, llm
+            )
+            st.session_state.latency_summary_list.append(latency_summary)
+            st.session_state.tokens_summary_list.append(tokens_summary)
+            total_latency_response = sum(st.session_state.latency_response_list)
+            total_tokens_response = sum(st.session_state.tokens_response_list)
+            total_latency_summary = sum(st.session_state.latency_summary_list)
+            total_tokens_summary = sum(st.session_state.tokens_summary_list)
+            track_metrics(
+                total_latency_response + total_latency_summary,
+                total_tokens_response + total_tokens_summary,
+            )
             st.write(summary)

app/views/dashboard.py CHANGED Viewed

@@ -1,5 +1,3 @@
-""" Tableau de bord des performances et de l'impact écologique et financier """
 import streamlit as st
 import plotly.express as px
@@ -13,6 +11,7 @@ CARBON_PER_QUERY = 0.8
 def track_metrics(latency, token_count):
     """Met à jour les métriques avec une nouvelle requête"""
     if "metrics" not in st.session_state:
         st.session_state.metrics = {
             "total_queries": 0,
@@ -40,23 +39,13 @@ def get_metrics():
 def dashboard_page():
-    """Page permettant de visualiser les métriques de performance et d'impact"""
     st.title("Tableau de Bord des Performances")
     st.subheader("Suivi des performances et de l'impact")
     # si enregistrement en cours, on l'arrête
     arret_enregistrement()
-    # Stocker les métriques globales
-    if "metrics" not in st.session_state:
-        st.session_state.metrics = {
-            "total_queries": 0,
-            "latency_history": [],
-            "cost_history": [],
-            "carbon_history": [],
-        }
     metrics = get_metrics()
     col1, col2, col3 = st.columns(3)
@@ -66,32 +55,38 @@ def dashboard_page():
     if st.session_state.metrics["total_queries"] == 0:
         st.warning(
-            "Aucune donnée disponible pour le moment. \
-            Posez des questions pour générer des métriques."
         )
         return
-    # if len(st.session_state.metrics["latency_history"]) > 0:
     st.subheader("📊 Visualisation des métriques")
     col1, col2 = st.columns(2)
     with col1:
-        fig1 = px.line(
-            x=list(range(1, len(st.session_state.metrics["latency_history"]) + 1)),
-            y=st.session_state.metrics["latency_history"],
-            labels={"x": "Numéro de la requête", "y": "Latence (ms)"},
-            title="Latence par requête",
-            color_discrete_sequence=["#1f8b4c"],
-        )
-        st.plotly_chart(fig1, use_container_width=True)
     with col2:
-        fig2 = px.line(
-            x=list(range(1, len(st.session_state.metrics["cost_history"]) + 1)),
-            y=st.session_state.metrics["cost_history"],
-            labels={"x": "Numéro de la requête", "y": "Coût (€)"},
-            title="Coût cumulé des requêtes",
-            color_discrete_sequence=["#1f8b4c"],
-        )
-        st.plotly_chart(fig2, use_container_width=True)

 import streamlit as st
 import plotly.express as px
 def track_metrics(latency, token_count):
     """Met à jour les métriques avec une nouvelle requête"""
+    # Initialiser les métriques globales si elles n'existent pas déja
     if "metrics" not in st.session_state:
         st.session_state.metrics = {
             "total_queries": 0,
 def dashboard_page():
+    """Affichage des métriques et graphiques"""
     st.title("Tableau de Bord des Performances")
     st.subheader("Suivi des performances et de l'impact")
     # si enregistrement en cours, on l'arrête
     arret_enregistrement()
     metrics = get_metrics()
     col1, col2, col3 = st.columns(3)
     if st.session_state.metrics["total_queries"] == 0:
         st.warning(
+            "Aucune donnée disponible pour le moment. Posez des questions pour générer des métriques."
         )
         return
     st.subheader("📊 Visualisation des métriques")
     col1, col2 = st.columns(2)
     with col1:
+        if st.session_state.metrics["latency_history"]:
+            fig1 = px.line(
+                x=list(range(1, len(st.session_state.metrics["latency_history"]) + 1)),
+                y=st.session_state.metrics["latency_history"],
+                labels={"x": "Numéro de la requête", "y": "Latence (ms)"},
+                title="Latence par requête",
+                color_discrete_sequence=["#1f8b4c"],
+            )
+            st.plotly_chart(fig1, use_container_width=True)
+        else:
+            st.warning(
+                "🚨 Aucune donnée de latence disponible pour générer le graphique."
+            )
     with col2:
+        if st.session_state.metrics["cost_history"]:
+            fig2 = px.line(
+                x=list(range(1, len(st.session_state.metrics["cost_history"]) + 1)),
+                y=st.session_state.metrics["cost_history"],
+                labels={"x": "Numéro de la requête", "y": "Coût (€)"},
+                title="Coût cumulé des requêtes",
+                color_discrete_sequence=["#1f8b4c"],
+            )
+            st.plotly_chart(fig2, use_container_width=True)
+        else:
+            st.warning("🚨 Aucune donnée de coût disponible pour générer le graphique.")

database/db_logsv2.db CHANGED Viewed

Binary files a/database/db_logsv2.db and b/database/db_logsv2.db differ

database/embed_s1000_o100/dcf34afb-fc87-46fb-9704-f9f238154972/length.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9f74697ebc9a797c33ddeedbee4a8b66e9b22d882f24bf4355c1fa77801824e8
 size 4000

 version https://git-lfs.github.com/spec/v1
+oid sha256:fc19b1997119425765295aeab72d76faa6927d4f83985d328c26f20468d6cc76
 size 4000

packages.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ portaudio19-dev

requirements.txt CHANGED Viewed

@@ -1,119 +1,23 @@
-accelerate==1.2.1
-aiohappyeyeballs==2.4.4
-aiohttp==3.11.11
-aiosignal==1.3.2
-asttokens
-async-timeout==5.0.1
-attrs==24.3.0
-audioread==3.0.1
-backcall
-certifi==2024.12.14
-cffi==1.17.1
-charset-normalizer==3.4.1
-click==8.1.8
-colorama
-comm
-contourpy==1.3.0
-cycler==0.12.1
-datasets==3.2.0
-debugpy
-decorator
-dill==0.3.8
-evaluate==0.4.3
-exceptiongroup
-executing
-fastapi
-filelock==3.16.1
-fonttools==4.55.3
-frozenlist==1.5.0
-fsspec==2024.9.0
-huggingface-hub==0.27.1
-idna==3.10
-importlib_metadata
-importlib_resources==6.5.2
-ipykernel
-ipython
-jedi
-Jinja2==3.1.5
-jiwer==3.0.5
-joblib==1.4.2
-jupyter_client
-jupyter_core
-kiwisolver==1.4.7
-langchain
-langchain_chroma
 langchain-community
-langchain_core
-langchain_huggingface
-langchain_mistralai
-# langchain_openai # passe par une api payante
-langgraph
-lazy_loader==0.4
-librosa==0.10.2.post1
-llvmlite==0.43.0
-MarkupSafe==3.0.2
-matplotlib==3.9.4
-matplotlib-inline
-mpmath==1.3.0
-msgpack==1.1.0
-multidict==6.1.0
-multiprocess==0.70.16
-nest-asyncio
-networkx==3.2.1
-numba==0.60.0
-# numpy==2.0.2
-packaging
 pandas==2.2.3
-parso
-pickleshare
-pillow==11.1.0
-platformdirs
-plotly
-pooch==1.8.2
-prompt-toolkit
-propcache==0.2.1
-psutil
-pure-eval
-pyarrow==18.1.0
-PyAudio==0.2.14
-pycparser==2.22
-pydantic
-Pygments
-pyparsing==3.2.1
-python-dateutil
-python-dotenv
-pytz==2024.2
-pywin32==308
-PyYAML==6.0.2
-pyzmq
-RapidFuzz==3.11.0
-regex==2024.11.6
-requests==2.32.3
-safetensors==0.5.2
-scikit-learn==1.6.1
-scipy==1.13.1
-seaborn==0.13.2
-sendgrid
-six
-sqlalchemy
-soundfile==0.13.0
-soxr==0.5.0.post1
-stack-data
-streamlit
-streamlit_option_menu
-sympy==1.13.1
-threadpoolctl==3.5.0
-tokenizers==0.21.0
 torch==2.5.1
-tornado
-tqdm==4.67.1
-traitlets
 transformers==4.48.0
-typing_extensions
-tzdata==2024.2
-urllib3==2.3.0
-uvicorn
-wcwidth
-xxhash==3.5.0
-yarl==1.18.3
-zipp

+fastapi==0.115.8
+langchain==0.3.17
+langchain_chroma==0.2.1
 langchain-community
+langchain_core==0.3.33
+langchain_huggingface==0.1.2
+langchain_mistralai==0.2.6
+matplotlib==3.10.0
+numpy
 pandas==2.2.3
+plotly==6.0.0
+pyaudio
+python-dotenv==1.0.1
+rapidfuzz==3.12.1
+Requests==2.32.3
+scikit_learn==1.6.1
+sendgrid==6.11.0
+SQLAlchemy==2.0.37
+streamlit==1.41.1
+streamlit_option_menu==0.4.0
 torch==2.5.1
 transformers==4.48.0
+uvicorn==0.34.0

src/__pycache__/speech_to_text.cpython-311.pyc CHANGED Viewed

Binary files a/src/__pycache__/speech_to_text.cpython-311.pyc and b/src/__pycache__/speech_to_text.cpython-311.pyc differ

src/security/__pycache__/security_check.cpython-311.pyc CHANGED Viewed

Binary files a/src/security/__pycache__/security_check.cpython-311.pyc and b/src/security/__pycache__/security_check.cpython-311.pyc differ

src/security/__pycache__/security_report.cpython-311.pyc CHANGED Viewed

Binary files a/src/security/__pycache__/security_report.cpython-311.pyc and b/src/security/__pycache__/security_report.cpython-311.pyc differ

src/security/security_report.py CHANGED Viewed

@@ -20,7 +20,7 @@ FROM_EMAIL = os.getenv("FROM_EMAIL")
 RECIPIENT_EMAIL = os.getenv("RECIPIENT_EMAIL")
 # Chemin vers la DB
-db_path = "sqlite:///../../database/db_logs.db"
 class SecurityReport:
@@ -65,7 +65,7 @@ class SecurityReport:
                 prompt.prompt AS prompt,
                 prompt.response AS response,
                 status.status AS status,
-                origin.response AS origin
             FROM log
             LEFT JOIN prompt ON log.id_prompt = prompt.id_prompt
             LEFT JOIN status ON log.id_status = status.id_status
@@ -84,6 +84,8 @@ class SecurityReport:
         # Logs récupérés au format DataFrame
         df = pd.read_sql_query(query, conn, params=params)
         conn.close()
         return df

 RECIPIENT_EMAIL = os.getenv("RECIPIENT_EMAIL")
 # Chemin vers la DB
+db_path = "sqlite:///../../database/db_logsv2.db"
 class SecurityReport:
                 prompt.prompt AS prompt,
                 prompt.response AS response,
                 status.status AS status,
+                origin.origin AS origin
             FROM log
             LEFT JOIN prompt ON log.id_prompt = prompt.id_prompt
             LEFT JOIN status ON log.id_status = status.id_status
         # Logs récupérés au format DataFrame
         df = pd.read_sql_query(query, conn, params=params)
         conn.close()
+        df["timestamp"] = df["timestamp"].astype(str)
+        df= df.fillna("unknow")
         return df