Spaces:

ahmadouna
/

dev_NLP

Sleeping

App Files Files Community

ahmadouna commited on Feb 1, 2024

Commit

f885769

verified ·

1 Parent(s): d4d20a6

Update app.py

Browse files

Files changed (1) hide show

app.py +51 -31

app.py CHANGED Viewed

@@ -1,12 +1,22 @@
 import pandas as pd
 import streamlit as st
 from transformers import pipeline
 from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, balanced_accuracy_score
 from PIL import Image
 # Charger le modèle pré-entraîné
 classifier_model = "morit/french_xlm_xnli"
-#classifier_model ="MoritzLaurer/mDeBERTa-v3-base-xnli-multilingual-nli-2mil7"
-classifier = pipeline("zero-shot-classification", model=classifier_model)
 # Charger les données depuis le fichier CSV
 df = pd.read_csv("fic.csv",sep=";")
@@ -16,7 +26,7 @@ comments = df["text"].tolist()
 # Afficher l'entête
 st.header("Analyse de Texte")
-st.subheader("Choisr les etiquettes a consideerer")
 col1, col2,col3= st.columns(3)  # Crée deux colonnes
 with col1:
@@ -35,52 +45,62 @@ if joie:
     candidate_labels.append("joie")  # Remplacer par le label exact pour "positif"
 if tristesse:
     candidate_labels.append("tristesse")  # Remplacer par le label exact pour "négatif"
-if peur:
     candidate_labels.append("surcharge")  # Remplacer par le label exact pour "négatif"
 # Créer une selectbox pour choisir un commentaire
-selected_comment = st.selectbox("Veuillez sélectionner un commentaire", comments)
 # Afficher le commentaire sélectionné dans l'input text
-text = st.text_area('Entrer le texte à analyser', value=selected_comment)
 # Modèle de phrase pour la formation de l'hypothèse
 hypothesis_template = "Cet exemple est un  {}."
-# Exécuter la classification seulement si du texte est entré
-if text and candidate_labels:
-    result = classifier(text, candidate_labels, hypothesis_template=hypothesis_template)
     #st.info(f"Résultat: {result['labels'][0]} avec une confiance de {result['scores'][0]*100:.2f}%")
-    if result['labels'][0]==1:
-        st.info(f"Résultat: commentaire positive avec une confiance de {result['scores'][0]*100:.2f}%")
-    if result['labels'][0]==0:
-        st.info(f"Résultat: commentaire negative avec une confiance de {result['scores'][0]*100:.2f}%")
-else:
-    st.write("Veuillez entrer du texte pour l'analyse.")
 st.header("Decoupage de notre dataset")
 image=Image.open("train_test.PNG")
 st.image(image, caption='Train_test_Split', use_column_width=True)
-# Calculer les métriques de performance (vous devez ajuster ces lignes selon votre tâche)
-inputs = df["text"].tolist()
-true_labels = df["label"].tolist()
-predictions = classifier(inputs, candidate_labels, hypothesis_template=hypothesis_template)
-predicted_labels = [result['labels'][0] for result in predictions]
-accuracy = accuracy_score(true_labels, predicted_labels)
-precision = precision_score(true_labels, predicted_labels, average='binary')
-recall = recall_score(true_labels, predicted_labels, average='binary')
-f1 = f1_score(true_labels, predicted_labels, average='binary')
-balanced_accuracy = balanced_accuracy_score(true_labels, predicted_labels)
-# Afficher les métriques sous forme de tableau
 st.header("Métriques de Performance")
 metrics_df = pd.DataFrame({
         "Métrique": ["Accuracy", "Precision", "Recall", "F1-score", "Balanced Accuracy"],
-        "Valeur": [accuracy, precision, recall, f1, balanced_accuracy]
     })
 st.table(metrics_df)
-# a continuer

+import streamlit as st
+import pandas as pd
+import matplotlib.pyplot as plt
 import pandas as pd
 import streamlit as st
 from transformers import pipeline
 from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, balanced_accuracy_score
 from PIL import Image
+from transformers import AutoTokenizer, AutoModelForSequenceClassification,pipeline
 # Charger le modèle pré-entraîné
 classifier_model = "morit/french_xlm_xnli"
+classifier_model ="MoritzLaurer/mDeBERTa-v3-base-xnli-multilingual-nli-2mil7"
+tokenizer=AutoTokenizer.from_pretrained(classifier_model)
+classifier=pipeline("zero-shot-classification",model=classifier_model,tokenizer=tokenizer)
 # Charger les données depuis le fichier CSV
 df = pd.read_csv("fic.csv",sep=";")
 # Afficher l'entête
 st.header("Analyse de Texte")
+st.subheader("Choisr les etiquettes a considerer")
 col1, col2,col3= st.columns(3)  # Crée deux colonnes
 with col1:
     candidate_labels.append("joie")  # Remplacer par le label exact pour "positif"
 if tristesse:
     candidate_labels.append("tristesse")  # Remplacer par le label exact pour "négatif"
+if surcharge:
     candidate_labels.append("surcharge")  # Remplacer par le label exact pour "négatif"
 # Créer une selectbox pour choisir un commentaire
 # Afficher le commentaire sélectionné dans l'input text
+text = st.text_area('Entrer le texte à analyser')
 # Modèle de phrase pour la formation de l'hypothèse
 hypothesis_template = "Cet exemple est un  {}."
+#sil ya du texte et les etiquettes sont choisies on affiche un histogramme avec les etiquettes(joie,tristesse,surcharge) et leur probabilité
+if text:
+    result = classifier(text, candidate_labels, hypothesis_template=hypothesis_template,truncation=True,max_length=1000)
     #st.info(f"Résultat: {result['labels'][0]} avec une confiance de {result['scores'][0]*100:.2f}%")
+    # if result['labels'][0]==1:
+    #     st.info(f"Résultat: commentaire positive avec une confiance de {result['scores'][0]*100:.2f}%")
+    # if result['labels'][0]==0:
+    #     st.info(f"Résultat: commentaire negative avec une confiance de {result['scores'][0]*100:.2f}%")
+    # if result['labels'][0]==2:
+    #     st.info(f"Résultat: commentaire neutre avec une confiance de {result['scores'][0]*100:.2f}%")
+    # Créer un dataframe pour l'affichage des résultats
+    df_result = pd.DataFrame({
+        "Etiquette": result["labels"],
+        "Probabilité": result["scores"]
+    })
+#bouton pour geerer le texte saisi
+if st.button("Analyser") :
+    # Afficher les résultats sous forme de tableau
+    st.header("Résultats")
+    #st.table(df_result)
+    # représenter les résultats sous forme d'histogramme
+    #taille de la figure
+    fig, ax = plt.subplots(figsize=(4, 2))
+    ax.bar(df_result["Etiquette"], df_result["Probabilité"])
+    ax.set_ylabel("Probabilité")
+    ax.set_title("Probabilité de chaque étiquette")
+    st.pyplot(fig)
+#traitement ded données:train_test_split
 st.header("Decoupage de notre dataset")
 image=Image.open("train_test.PNG")
 st.image(image, caption='Train_test_Split', use_column_width=True)
+# Faire un tableau explicatives de metriques de performance(accuarcy,precision,recall,f1-score,balanced accuracy)
 st.header("Métriques de Performance")
 metrics_df = pd.DataFrame({
         "Métrique": ["Accuracy", "Precision", "Recall", "F1-score", "Balanced Accuracy"],
+        "Valeur": ['Pourcentage de prédictions correctes', 'Pourcentage de prédictions positives correctes', 'Pourcentage de vrais positifs prédits', 'Moyenne pondérée de la précision et du rappel', 'Moyenne du rappel pour chaque classe']
     })
 st.table(metrics_df)
+#Ce matin, j'ai été submergé de joie en recevant la promotion tant attendue, un moment vraiment heureux. Cependant, l'annonce du départ soudain de mon collègue préféré a apporté une vague de tristesse. Face à ces nouvelles responsabilités, je me sens déjà surchargé, me demandant comment je vais gérer tout cela