lincoln
/

flaubert-mlsum-topic-classification

Text Classification

Model card Files Files and versions

zwanto commited on Apr 29, 2021

Commit

a057400

·

1 Parent(s): 0ea58e2

fix typo

Files changed (1) hide show

README.md +6 -6

README.md CHANGED Viewed

@@ -17,14 +17,14 @@ tags:
 - flaubert
 ---
-# Classification d'articles de presses avec Flaubert :fire:
-Ce modèle ce base sur le modèle [`flaubert/flaubert_base_cased`](https://huggingface.co/flaubert/flaubert_base_cased) à et à été fine-tuné en utilisant des articles de presses issus de la base de données MLSUM.
-Dans leur papier, les équipes de reciTAL et de la Sorbonne ont proposé comme ouverture de faire de la détection de topic sur les articles de presses.
-Les topics ont été exraient à partir des URL et nous avons effectué une étape de regroupement de topics pour éléminer ceux avec un trop faible volume et ceux qui paraissaient redondants.
-Nous avons finalement utilisé la liste de topics suivant:
 * Culture
 * Economie
 * Education
@@ -38,7 +38,7 @@ Nous avons finalement utilisé la liste de topics suivant:
 ## Entrainement
-Nous avons benchmarké différents modèles en les entrainants sur différentes parties des articles (titre, résumé, corps et titre+résumé) et avec des échantillons d'apprentissage de tailles différentes.
 ![Performance](./assets/Accuracy_cat.png)

 - flaubert
 ---
+# Classification d'articles de presses avec Flaubert
+Ce modèle ce base sur le modèle [`flaubert/flaubert_base_cased`](https://huggingface.co/flaubert/flaubert_base_cased) et à été fine-tuné en utilisant des articles de presse issus de la base de données MLSUM.
+Dans leur papier, les équipes de reciTAL et de la Sorbonne ont proposé comme ouverture de réaliser un modèle de détection de topic sur les articles de presse.
+Les topics ont été extrait à partir des URL et nous avons effectué une étape de regroupement de topics pour éliminer ceux avec un trop faible volume et ceux qui paraissaient redondants.
+Nous avons finalement utilisé la liste de topics suivante:
 * Culture
 * Economie
 * Education
 ## Entrainement
+Nous avons benchmarké différents modèles en les entrainant sur différentes parties des articles (titre, résumé, corps et titre+résumé) et avec des échantillons d'apprentissage de tailles différentes.
 ![Performance](./assets/Accuracy_cat.png)