zwanto
commited on
Commit
·
0ea58e2
1
Parent(s):
4b9ec57
fix typo
Browse files
README.md
CHANGED
|
@@ -20,11 +20,11 @@ tags:
|
|
| 20 |
# Classification d'articles de presses avec Flaubert :fire:
|
| 21 |
|
| 22 |
Ce modèle ce base sur le modèle [`flaubert/flaubert_base_cased`](https://huggingface.co/flaubert/flaubert_base_cased) à et à été fine-tuné en utilisant des articles de presses issus de la base de données MLSUM.
|
| 23 |
-
Dans leur papier, les équipes de
|
| 24 |
|
| 25 |
-
Les topics ont été exraient à partir des URL et nous avons effectué une
|
| 26 |
|
| 27 |
-
Nous avons finalement utilisé la liste de
|
| 28 |
* Culture
|
| 29 |
* Economie
|
| 30 |
* Education
|
|
@@ -38,7 +38,7 @@ Nous avons finalement utilisé la liste de topic suivant:
|
|
| 38 |
|
| 39 |
## Entrainement
|
| 40 |
|
| 41 |
-
Nous avons benchmarké différents modèles en les entrainants sur différentes parties
|
| 42 |
|
| 43 |

|
| 44 |
|
|
@@ -47,7 +47,7 @@ Les modèles ont été entrainé sur un cloud Azure avec des Tesla V100.
|
|
| 47 |
## Résulats
|
| 48 |
|
| 49 |

|
| 50 |
-
*Les lignes correspondent aux labels
|
| 51 |
|
| 52 |
## Utilisation
|
| 53 |
|
|
|
|
| 20 |
# Classification d'articles de presses avec Flaubert :fire:
|
| 21 |
|
| 22 |
Ce modèle ce base sur le modèle [`flaubert/flaubert_base_cased`](https://huggingface.co/flaubert/flaubert_base_cased) à et à été fine-tuné en utilisant des articles de presses issus de la base de données MLSUM.
|
| 23 |
+
Dans leur papier, les équipes de reciTAL et de la Sorbonne ont proposé comme ouverture de faire de la détection de topic sur les articles de presses.
|
| 24 |
|
| 25 |
+
Les topics ont été exraient à partir des URL et nous avons effectué une étape de regroupement de topics pour éléminer ceux avec un trop faible volume et ceux qui paraissaient redondants.
|
| 26 |
|
| 27 |
+
Nous avons finalement utilisé la liste de topics suivant:
|
| 28 |
* Culture
|
| 29 |
* Economie
|
| 30 |
* Education
|
|
|
|
| 38 |
|
| 39 |
## Entrainement
|
| 40 |
|
| 41 |
+
Nous avons benchmarké différents modèles en les entrainants sur différentes parties des articles (titre, résumé, corps et titre+résumé) et avec des échantillons d'apprentissage de tailles différentes.
|
| 42 |
|
| 43 |

|
| 44 |
|
|
|
|
| 47 |
## Résulats
|
| 48 |
|
| 49 |

|
| 50 |
+
*Les lignes correspondent aux labels prédits et les colonnes aux véritables topics. Les pourcentages sont calculés sur les colonnes.*
|
| 51 |
|
| 52 |
## Utilisation
|
| 53 |
|