Update(README) : Ajout d'informations
Browse files
README.md
CHANGED
|
@@ -45,11 +45,12 @@ Les utilisateurs peuvent utiliser directement le modèle pour des tâches de cla
|
|
| 45 |
Users (both direct and downstream) should be made aware of the risks, biases and limitations of the model. More information needed for further recommendations.
|
| 46 |
|
| 47 |
## How to Get Started with the Model
|
| 48 |
-
|
| 49 |
-
|
| 50 |
-
2) Télécharger
|
| 51 |
-
3) Télécharger le fichier
|
| 52 |
-
4) Télécharger le fichier
|
|
|
|
| 53 |
|
| 54 |
## Training Details
|
| 55 |
|
|
@@ -130,8 +131,20 @@ Ce désequilibre induit un certains biais entre les classes.
|
|
| 130 |
|
| 131 |
### Model Architecture and Objective
|
| 132 |
|
| 133 |
-
|
| 134 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 135 |
|
| 136 |
## Model Card Authors
|
| 137 |
|
|
|
|
| 45 |
Users (both direct and downstream) should be made aware of the risks, biases and limitations of the model. More information needed for further recommendations.
|
| 46 |
|
| 47 |
## How to Get Started with the Model
|
| 48 |
+
1) Télécharger et installer le fichier requirements.txt pour les dépendances.
|
| 49 |
+
```pip install -r requirements.txt```
|
| 50 |
+
2) Télécharger les fichiers de poids contenu dans les dossiers .zip du modèle pré-entraîné pour la classification des commentaires.
|
| 51 |
+
3) Télécharger et installer le fichier requirements.txt pour les dépendances
|
| 52 |
+
4) Télécharger le fichier inference_script.py pour effectuer des prédictions avec le modèle pré-entraîné.
|
| 53 |
+
5) Télécharger le fichier avec les données d'entrées à prédire
|
| 54 |
|
| 55 |
## Training Details
|
| 56 |
|
|
|
|
| 131 |
|
| 132 |
### Model Architecture and Objective
|
| 133 |
|
| 134 |
+
Le notebook .ipynb a pour but la création, l'entraînement et l'évaluation du modèle.
|
| 135 |
+
Ce script comprend les étapes suivantes :
|
| 136 |
+
- Chargement et prétraitement du jeu de données annoté manuellement par Datactivist.
|
| 137 |
+
- Création d'un modèle Camembert et d'un tokenizer.
|
| 138 |
+
- Entraînement du premier modèle pour prédire les catégories.
|
| 139 |
+
- Évaluation des performances du premier modèle (catégories)
|
| 140 |
+
- Prétraitement des données pour le deuxième modèle, concaténation avec les prédictions du premier modèle.
|
| 141 |
+
- Entraînement du deuxième modèle pour prédire les sous-catégories.
|
| 142 |
+
- Évaluation des performances du deuxième modèle (sous-catégories).
|
| 143 |
+
|
| 144 |
+
L'architecture du modèle est basée sur Camembert et est conçue pour la classification de texte.
|
| 145 |
+
L'objectif principal est de catégoriser les discussions dans des classes prédéfinies.
|
| 146 |
+
Le premier modèle classifie sur 6 catégories et le second modèle sur 26 sous-catégories.
|
| 147 |
+
Et chaque catégorie comporte plusieurs sous-catégories d'appartenances mais le modèle ne prédit que des catégories et sous-catégories d'appartenances uniques.
|
| 148 |
|
| 149 |
## Model Card Authors
|
| 150 |
|