Spaces:

ColinceTatsa
/

SN_NLP

Sleeping

App Files Files Community

ColinceTatsa commited on Jun 25, 2025

Commit

c494a1f

verified ·

1 Parent(s): 3f5cf62

Update src/streamlit_app.py

Browse files

Files changed (1) hide show

src/streamlit_app.py +201 -38

src/streamlit_app.py CHANGED Viewed

@@ -1,40 +1,203 @@
-import altair as alt
-import numpy as np
-import pandas as pd
 import streamlit as st
-"""
-# Welcome to Streamlit!
-Edit `/streamlit_app.py` to customize this app to your heart's desire :heart:.
-If you have any questions, checkout our [documentation](https://docs.streamlit.io) and [community
-forums](https://discuss.streamlit.io).
-In the meantime, below is an example of what you can do with just a few lines of code:
-"""
-num_points = st.slider("Number of points in spiral", 1, 10000, 1100)
-num_turns = st.slider("Number of turns in spiral", 1, 300, 31)
-indices = np.linspace(0, 1, num_points)
-theta = 2 * np.pi * num_turns * indices
-radius = indices
-x = radius * np.cos(theta)
-y = radius * np.sin(theta)
-df = pd.DataFrame({
-    "x": x,
-    "y": y,
-    "idx": indices,
-    "rand": np.random.randn(num_points),
-})
-st.altair_chart(alt.Chart(df, height=700, width=700)
-    .mark_point(filled=True)
-    .encode(
-        x=alt.X("x", axis=None),
-        y=alt.Y("y", axis=None),
-        color=alt.Color("idx", legend=None, scale=alt.Scale()),
-        size=alt.Size("rand", legend=None, scale=alt.Scale(range=[1, 150])),
-    ))

 import streamlit as st
+import requests
+import re
+import tempfile
+import os
+from dotenv import load_dotenv
+# Nouveaux imports pour Groq et LangSmith
+from groq import Groq
+from langsmith import traceable
+# Charger les variables d'environnement
+load_dotenv()
+# ========= INTERFACE STREAMLIT =========
+st.set_page_config(page_title="nlp", layout="wide")
+st.title("SN NATURAL LANGUAGE PROCESSING")
+st.subheader('Etudiant MASTER II: TATSA TCHINDA Colince')
+# Sidebar logo
+# Assurez-vous que le fichier 'keyce.jpg' est dans le même dossier que votre script
+try:
+    image_path = 'src/keyce.jpg'
+    st.sidebar.image(image_path, caption="Keyce informatique et intelligence artificielle", use_container_width=True)
+except FileNotFoundError:
+    st.sidebar.warning("Image 'keyce.jpg' non trouvée.")
+# ========= GESTION DES CLÉS API (depuis .env) =========
+# Les clés sont chargées depuis le fichier .env. Assurez-vous d'av
+st.session_state["API_TOKEN_HF"] = os.getenv("HUGGINGFACE_API_KEY")
+st.session_state["API_TOKEN_GROQ"] = os.getenv("GROQ_API_KEY")
+api_token_langsmith = os.getenv("LANGCHAIN_API_KEY")
+# Configuration de LangSmith si la clé est fournie
+if api_token_langsmith:
+    st.session_state["LANGSMITH_CONFIGURED"] = True
+    os.environ["LANGCHAIN_TRACING_V2"] = "true"
+    os.environ["LANGCHAIN_ENDPOINT"] = "https://api.smith.langchain.com"
+    os.environ["LANGCHAIN_API_KEY"] = api_token_langsmith
+    os.environ["LANGCHAIN_PROJECT"] = "Mon App Streamlit NLP" # Nom du projet dans LangSmith
+    st.sidebar.info("Tracing LangSmith activé.")
+else:
+    st.session_state["LANGSMITH_CONFIGURED"] = False
+    # Désactiver le tracing si aucune clé n'est fournie
+    if "LANGCHAIN_TRACING_V2" in os.environ:
+        del os.environ["LANGCHAIN_TRACING_V2"]
+# ========= INITIALISATION DES CLIENTS =========
+# Le header d'autorisation est préparé si la clé HF est disponible.
+headers = {}
+if st.session_state.get("API_TOKEN_HF"):
+    headers = {"Authorization": f"Bearer {st.session_state['API_TOKEN_HF']}"}
+# ========= FONCTIONS UTILES =========
+# La fonction de nettoyage n'est plus nécessaire pour Groq, mais on la garde au cas où.
+def nettoyer_reponse(text):
+    cleaned = re.sub(r"<think>.*?</think>", "", text, flags=re.DOTALL)
+    return cleaned.strip()
+# --- NOUVELLE FONCTION DE GÉNÉRATION AVEC GROQ ET LANGSMITH ---
+@traceable(name="Groq Llama3 Generator") # Le décorateur @traceable active le suivi LangSmith
+def generate_with_groq_llama(prompt, api_key):
+    """
+    Génère du texte en utilisant l'API Groq avec un modèle Llama3 et trace l'appel avec LangSmith.
+    """
+    try:
+        client_groq = Groq(api_key=api_key)
+        chat_completion = client_groq.chat.completions.create(
+            messages=[
+                {
+                    "role": "user",
+                    "content": prompt,
+                }
+            ],
+            model="llama3-8b-8192",
+            temperature=0.7,
+            max_tokens=1024,
+        )
+        return chat_completion.choices[0].message.content
+    except Groq.APIConnectionError as e:
+        st.error(f"Erreur de connexion avec Groq: {e.__cause__}")
+        return "Impossible de se connecter à l'API Groq. Veuillez vérifier votre connexion réseau."
+    except Exception as e:
+        # Gérer d'autres erreurs potentielles de l'API
+        st.error(f"Une erreur inattendue est survenue avec Groq: {e}")
+        return "Une erreur est survenue lors de la génération de texte."
+# --- Fonctions existantes ---
+def transcribe_audio(path, content_type):
+    # Copie locale des en-têtes pour y ajouter le Content-Type
+    request_headers = headers.copy()
+    if not request_headers.get("Authorization"):
+        st.error("Veuillez entrer une clé API Hugging Face pour utiliser cette fonctionnalité.")
+        return "Erreur : clé API Hugging Face manquante."
+    # Ajout du Content-Type spécifique au fichier audio
+    request_headers["Content-Type"] = content_type
+    API_URL = "https://api-inference.huggingface.co/models/openai/whisper-large-v3"
+    try:
+        with open(path, "rb") as f:
+            data = f.read()
+        response = requests.post(API_URL, headers=request_headers, data=data)
+        response.raise_for_status()  # Lève une exception pour les codes d'erreur HTTP
+        result = response.json()
+        return result.get("text", "Erreur: 'text' non trouvé dans la réponse.")
+    except requests.exceptions.HTTPError as err:
+        st.error(f"Erreur lors de la transcription : {err.response.text}")
+        return "Erreur lors de la transcription."
+    except Exception as e:
+        st.error(f"Erreur lors de la transcription : {str(e)}")
+        return "Erreur lors de la transcription."
+def summarize_text(text):
+    """
+    Génère un résumé de texte en utilisant le modèle Groq Llama3.
+    """
+    if not st.session_state.get("API_TOKEN_GROQ"):
+        st.error("Veuillez configurer votre clé API Groq dans le fichier .env pour le résumé.")
+        return "Erreur : clé API Groq manquante."
+    # Prompt spécifique pour la tâche de résumé
+    prompt = f"Résume le texte suivant de manière concise en français :\n\nTexte : '''{text}'''\n\nRésumé :"
+    # Utilise la même fonction que pour la génération de texte
+    # La gestion des erreurs (connexion, etc.) est déjà dans generate_with_groq_llama
+    summary = generate_with_groq_llama(prompt, st.session_state["API_TOKEN_GROQ"])
+    return summary
+# ========= MENU =========
+option = st.sidebar.radio(
+    "Choisissez une fonctionnalité :",
+    ["📝 Générateur de texte", "🎙 Audio vers texte", "🧠 Résumeur de texte"]
+)
+# ========= GÉNÉRATEUR DE TEXTE (MODIFIÉ) =========
+if option == "📝 Générateur de texte":
+    st.subheader("📝 Génération de texte (Groq Llama3)")
+    st.markdown("Utilise le modèle `llama3-8b-8192` via l'API ultra-rapide de Groq.")
+    if st.session_state.get("LANGSMITH_CONFIGURED"):
+        st.info("Le suivi avec LangSmith est activé. [Voir le projet](https://smith.langchain.com/)", icon="🔗")
+    if not st.session_state.get("API_TOKEN_GROQ"):
+        st.warning("Veuillez entrer une clé API Groq dans la barre latérale pour utiliser le générateur de texte.")
+    else:
+        prompt = st.text_area("Entrez votre prompt :", key="prompt", height=150)
+        if st.button("Générer", key="gen"):
+            if prompt.strip():
+                with st.spinner("Génération en cours avec Groq..."):
+                    try:
+                        # Appel de la nouvelle fonction
+                        output = generate_with_groq_llama(prompt, st.session_state["API_TOKEN_GROQ"])
+                        st.success("Texte généré :")
+                        st.write(output)
+                    except Exception as e:
+                        st.error(f"Erreur lors de la génération avec Groq : {e}")
+            else:
+                st.warning("Veuillez entrer un prompt.")
+# ========= AUDIO VERS TEXTE =========
+elif option == "🎙 Audio vers texte":
+    if not st.session_state.get("API_TOKEN_HF"):
+        st.warning("Veuillez entrer une clé API Hugging Face dans la barre latérale pour utiliser cette fonctionnalité.")
+    else:
+        st.markdown('<div class="subheader">🎧 Transcription automatisée d’un fichier audio (30 sec max)</div>', unsafe_allow_html=True)
+        audio_file = st.file_uploader("🎵 Chargez un fichier audio", type=["wav", "mp3", "m4a"])
+        if audio_file is not None:
+            with tempfile.NamedTemporaryFile(delete=False, suffix='.wav') as tmp_file:
+                tmp_file.write(audio_file.getvalue())
+                audio_path = tmp_file.name
+            st.audio(audio_path)
+            if st.button("✍️ Transcrire"):
+                with st.spinner("Transcription en cours..."):
+                    # On passe le type MIME du fichier original à la fonction
+                    transcript = transcribe_audio(audio_path, audio_file.type)
+                st.markdown(f"**Transcription :**")
+                st.text_area("Résultat", transcript, height=150)
+# ========= RÉSUMEUR DE TEXTE =========
+elif option == "🧠 Résumeur de texte":
+    st.subheader("🧠 Résumé de texte (Groq Llama3)")
+    st.markdown("Utilise le modèle `llama3-8b-8192` pour générer un résumé.")
+    if not st.session_state.get("API_TOKEN_GROQ"):
+        st.warning("Veuillez vous assurer qu'une clé API Groq est configurée dans votre fichier .env pour utiliser cette fonctionnalité.")
+    else:
+        input_text = st.text_area("Texte à résumer :", height=300)
+        if st.button("Résumer"):
+            if input_text.strip():
+                with st.spinner("Résumé en cours avec Groq..."):
+                    summary = summarize_text(input_text)
+                    st.success("Résumé généré :")
+                    st.write(summary)
+            else:
+                st.warning("Veuillez entrer un texte à résumer.")