MARTINI_enrich_BERTopic_Damienrieu

This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.

Usage

To use this model, please install BERTopic:

pip install -U bertopic

You can use the model as follows:

from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_Damienrieu")

topic_model.get_topic_info()

Topic overview

  • Number of topics: 20
  • Number of training documents: 2488
Click here for an overview of all topics.
Topic ID Topic Keywords Topic Frequency Label
-1 islamistes - droite - pourquoi - afrique - nouvelle 20 -1_islamistes_droite_pourquoi_afrique
0 meurtrier - terroriste - algerien - julien - multirecidiviste 1655 0_meurtrier_terroriste_algerien_julien
1 telegram - rejoignez - supprimer - sociaux - damienrieu2 134 1_telegram_rejoignez_supprimer_sociaux
2 immigrationnistes - rapatriement - accueillir - demographie - europeenne 88 2_immigrationnistes_rapatriement_accueillir_demographie
3 electeurs - presidentielle - macron - proportionnelle - defaite 74 3_electeurs_presidentielle_macron_proportionnelle
4 policiers - montargis - lynchage - incroyables - terroriser 69 4_policiers_montargis_lynchage_incroyables
5 islamogauchisme - morsi - sunnites - alkhelaifi - aumoniers 59 5_islamogauchisme_morsi_sunnites_alkhelaifi
6 palestiniennes - hamas - israelo - apocalyptique - yahya 44 6_palestiniennes_hamas_israelo_apocalyptique
7 quarantaine - sars - vaccin - wuhan - nouveaux 38 7_quarantaine_sars_vaccin_wuhan
8 republique - religieuses - valeurs - jordaniens - gagnerait 38 8_republique_religieuses_valeurs_jordaniens
9 racisme - blanches - autoproclamees - victimes - scolaire 37 9_racisme_blanches_autoproclamees_victimes
10 bienvenue - remercie - soutenir - tristesse - demain 36 10_bienvenue_remercie_soutenir_tristesse
11 videos - vues - revelerai - youtubeur - suivre 29 11_videos_vues_revelerai_youtubeur
12 affiches - meeting4decembre - reconquete - meilleurs - zemmour2022 27 12_affiches_meeting4decembre_reconquete_meilleurs
13 gendarmes - republique - drieu - juridique - alpes 27 13_gendarmes_republique_drieu_juridique
14 islamistes - ibrahima - sarcelles - mosquee - communautariste 26 14_islamistes_ibrahima_sarcelles_mosquee
15 algerien - ambassadeur - daoud - driencourt - irreelle 23 15_algerien_ambassadeur_daoud_driencourt
16 demographiques - immigres - origine - bruxelles - domiciliee 22 16_demographiques_immigres_origine_bruxelles
17 immigres - irrecouvrables - millions - euros - departement 21 17_immigres_irrecouvrables_millions_euros
18 algeriens - nationalites - bundeskriminalamt - criminogenes - pourcentage 21 18_algeriens_nationalites_bundeskriminalamt_criminogenes

Training hyperparameters

  • calculate_probabilities: True
  • language: None
  • low_memory: False
  • min_topic_size: 10
  • n_gram_range: (1, 1)
  • nr_topics: None
  • seed_topic_list: None
  • top_n_words: 10
  • verbose: False
  • zeroshot_min_similarity: 0.7
  • zeroshot_topic_list: None

Framework versions

  • Numpy: 1.26.4
  • HDBSCAN: 0.8.40
  • UMAP: 0.5.7
  • Pandas: 2.2.3
  • Scikit-Learn: 1.5.2
  • Sentence-transformers: 3.3.1
  • Transformers: 4.46.3
  • Numba: 0.60.0
  • Plotly: 5.24.1
  • Python: 3.10.12
Downloads last month
-
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support