Spaces:

arnaud66170
/

electra-app-p9v2

Sleeping

electra-app-p9v2 / src /utils /visualization_utils.py

nounouille

Initial commit - Deploy Electra app

9a9b2ea 10 months ago

5.06 kB

	# src/utils/visualization_utils.py

	import os
	import matplotlib.pyplot as plt
	from sklearn.metrics import roc_auc_score
	import numpy as np
	from sklearn.metrics import (
	confusion_matrix, ConfusionMatrixDisplay,
	roc_curve, auc, precision_recall_curve
	)
	import plotly.graph_objects as go
	import pandas as pd


	def plot_confusion_matrix(y_true, y_pred, labels=["Négatif", "Positif"], title="Matrice de confusion", save_path=None):
	"""
	Affiche et sauvegarde une matrice de confusion.
	"""
	cm = confusion_matrix(y_true, y_pred)
	disp = ConfusionMatrixDisplay(confusion_matrix=cm, display_labels=labels)
	disp.plot(cmap="Blues")
	plt.title(title)
	plt.grid(False)

	if save_path:
	os.makedirs(os.path.dirname(save_path), exist_ok=True)
	plt.savefig(save_path, bbox_inches='tight')

	plt.show()


	def plot_model_comparison_barplot(df, metric_col="F1-score", title="", save_path=None):
	"""
	Affiche un barplot comparatif pour la métrique fournie (F1-score ou Accuracy).
	"""
	plt.figure(figsize=(10, 6))
	bars = plt.bar(df["Modèle"], df[metric_col], edgecolor="black", color="#4C72B0")

	for bar in bars:
	height = bar.get_height()
	plt.text(bar.get_x() + bar.get_width() / 2, height + 0.002, f"{height:.3f}",
	ha="center", va="bottom", fontsize=10)

	plt.title(title or f"Comparaison des {metric_col}", fontsize=14)
	plt.ylabel(metric_col, fontsize=12)
	plt.ylim(0.70, 1.00)
	plt.grid(axis="y", linestyle="--", alpha=0.5)
	plt.xticks(rotation=15)
	plt.tight_layout()

	if save_path:
	os.makedirs(os.path.dirname(save_path), exist_ok=True)
	plt.savefig(save_path, bbox_inches='tight')

	plt.show()


	def plot_normalized_metrics(metrics: dict, model_name: str = "Modèle"):
	"""
	Affiche un barplot Plotly des métriques comprises entre 0 et 1.

	Args:
	metrics (dict): Dictionnaire des métriques du modèle.
	model_name (str): Nom du modèle affiché dans le titre.
	"""
	normalized_keys = [
	"f1_micro", "f1_macro", "f1_weighted", "accuracy",
	"roc_auc_micro", "roc_auc_macro", "pr_auc_macro", "lrap"
	]
	filtered = {k: v for k, v in metrics.items() if k in normalized_keys}

	if not filtered:
	raise ValueError("Aucune métrique normalisée (0-1) trouvée dans les données.")

	df = pd.DataFrame(filtered.items(), columns=["Métrique", "Valeur"])
	fig = go.Figure(go.Bar(
	x=df["Métrique"],
	y=df["Valeur"],
	text=df["Valeur"].round(3),
	textposition="auto"
	))
	fig.update_layout(
	title=f"Comparaison des scores (0 à 1) – {model_name}",
	yaxis=dict(range=[0, 1], title="Score"),
	xaxis=dict(title="Métriques")
	)
	fig.show()


	def plot_roc_curves(y_true, y_probs, class_names, max_classes=6):
	"""
	Affiche les courbes ROC AUC pour un sous-ensemble d'étiquettes.
	"""
	plt.figure(figsize=(12, 8))
	for i, name in enumerate(class_names[:max_classes]):
	fpr, tpr, _ = roc_curve(y_true[:, i], y_probs[:, i])
	roc_auc = auc(fpr, tpr)
	plt.plot(fpr, tpr, label=f"{name} (AUC = {roc_auc:.2f})")
	plt.plot([0, 1], [0, 1], linestyle="--", color="gray")
	plt.title("Courbes ROC AUC par émotion")
	plt.xlabel("Taux de faux positifs")
	plt.ylabel("Taux de vrais positifs")
	plt.legend()
	plt.grid()
	plt.tight_layout()
	plt.show()


	def plot_pr_curves(y_true, y_probs, class_names, max_classes=6):
	"""
	Affiche les courbes Precision-Recall pour un sous-ensemble d'étiquettes.
	"""
	plt.figure(figsize=(12, 8))
	for i, name in enumerate(class_names[:max_classes]):
	precision, recall, _ = precision_recall_curve(y_true[:, i], y_probs[:, i])
	pr_auc = auc(recall, precision)
	plt.plot(recall, precision, label=f"{name} (AP = {pr_auc:.2f})")
	plt.title("Courbes Precision-Recall par émotion")
	plt.xlabel("Recall")
	plt.ylabel("Precision")
	plt.legend()
	plt.grid()
	plt.tight_layout()
	plt.show()


	def top_k_auc_emotions(y_true, y_probs, class_names, k=6, worst=False):
	"""
	Retourne les k émotions avec les meilleurs ou pires AUC.

	Args:
	y_true (ndarray): array de shape (n_samples, n_classes)
	y_probs (ndarray): array de probabilités de shape identique
	class_names (list): noms des classes
	k (int): nombre de classes à retourner
	worst (bool): True → retourne les pires AUC, False → les meilleures

	Returns:
	List[str]: noms des émotions triées par AUC
	"""
	aucs = []
	for i in range(len(class_names)):
	try:
	auc_score = roc_auc_score(y_true[:, i], y_probs[:, i])
	except:
	auc_score = np.nan
	aucs.append((class_names[i], auc_score))

	# Filtrer NaN et trier
	aucs = [(cls, score) for cls, score in aucs if not np.isnan(score)]
	aucs_sorted = sorted(aucs, key=lambda x: x[1], reverse=not worst)

	return [cls for cls, _ in aucs_sorted[:k]]