Spaces:

Merwan611
/

classification-text

Sleeping

Merwan6 commited on Jun 16, 2025

Commit

719631b

1 Parent(s): 8f7bccf

modif doc

Files changed (1) hide show

app.py CHANGED Viewed

@@ -34,17 +34,18 @@ L’application est disponible ici :
 ## 🧠 Description des modèles utilisés
-1. **Base model**
-   Modèle BERT préentraîné `textattack/bert-base-uncased-ag-news` utilisé directement sans fine-tuning.
-2. **Zero-shot**
-   Modèle `facebook/bart-large-mnli` utilisé pour classification zero-shot via pipeline Hugging Face.
-3. **Few-shot**
-   Approche zero-shot avec exemples dans le prompt (prompt engineering).
-4. **Fine-tuned model**
-   Modèle BERT `bert-base-uncased` entraîné sur un sous-ensemble équilibré du dataset AG News (3000 exemples par classe), sauvegardé sur Hugging Face Hub sous `Merwan611/agnews-finetuned-bert`.
 ---

 ## 🧠 Description des modèles utilisés
+Base model
+Modèle BERT préentraîné textattack/bert-base-uncased-ag-news.
+Il est utilisé directement sans réentraînement. Le texte est tokenisé avec AutoTokenizer puis passé au modèle pour obtenir une distribution de probabilité via softmax.
+Zero-shot
+Modèle facebook/bart-large-mnli utilisé via la pipeline zero-shot-classification de Hugging Face.
+Le texte est comparé à une liste de labels cibles (World, Sports, Business, Sci/Tech) sans aucun entraînement préalable sur AG News. Ce modèle s’appuie sur la reconnaissance d’implications textuelles pour inférer la classe la plus probable.
+Few-shot
+Basé sur le modèle google/flan-t5-small avec la pipeline text2text-generation.
+Le prompt inclut quelques exemples de classification manuelle (prompt engineering). Le modèle génère ensuite une réponse textuelle correspondant à la catégorie. Les sorties sont nettoyées et validées par correspondance avec les labels autorisés.
+Fine-tuned model
+Modèle bert-base-uncased fine-tuné sur un sous-ensemble équilibré du dataset AG News (3000 exemples par classe) puis hébergé sur le Hugging Face Hub sous Merwan611/agnews-finetuned-bert.
+La prédiction utilise également AutoTokenizer et applique une couche softmax sur les logits du modèle. L’accès au modèle peut nécessiter un token d’authentification via une variable d’environnement CLE.
 ---