MARTINI_enrich_BERTopic_olayhaber

This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.

Usage

To use this model, please install BERTopic:

pip install -U bertopic

You can use the model as follows:

from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_olayhaber")

topic_model.get_topic_info()

Topic overview

  • Number of topics: 21
  • Number of training documents: 3345
Click here for an overview of all topics.
Topic ID Topic Keywords Topic Frequency Label
-1 erdogan - kılıcdaroglu - bakanı - mehmet - ataturk 22 -1_erdogan_kılıcdaroglu_bakanı_mehmet
0 saldırısına - kızına - sanlıurfa - babası - karaman 1998 0_saldırısına_kızına_sanlıurfa_babası
1 bayramlasmayacak - kılıcdaroglu - baskanlıgı - partisi - merkezi 166 1_bayramlasmayacak_kılıcdaroglu_baskanlıgı_partisi
2 yaptım - belasını - secimlerini - imamoglu - serdar 164 2_yaptım_belasını_secimlerini_imamoglu
3 rusya - cavusoglu - zelenski - nato - ukraynalı 133 3_rusya_cavusoglu_zelenski_nato
4 erdogan - sıkıntıları - cumhurbaskanı - devletleri - dunyanın 106 4_erdogan_sıkıntıları_cumhurbaskanı_devletleri
5 kurdistan - kuzeyindeki - teroristlere - hazırlıgında - saldıracagız 105 5_kurdistan_kuzeyindeki_teroristlere_hazırlıgında
6 agıralioglu - ittifakına - mustafa - partisi - basak 95 6_agıralioglu_ittifakına_mustafa_partisi
7 carpması - ambulansın - kazasında - trafik - otobus 78 7_carpması_ambulansın_kazasında_trafik
8 hamas - erdogan - netanyahu - insafına - iliskilerde 61 8_hamas_erdogan_netanyahu_insafına
9 fiyatı - bankası - yılın - 2021 - harcamalarının 57 9_fiyatı_bankası_yılın_2021
10 tiktok - altaylı - kanalını - paylasımı - kullanıcıları 53 10_tiktok_altaylı_kanalını_paylasımı
11 adaylıgını - ergenekon - kazanırız - bayramı - milliyetcilik 53 11_adaylıgını_ergenekon_kazanırız_bayramı
12 kılıcdaroglu - kırıklıgını - ihtiyacımız - kucaklasmıssa - saraylılara 47 12_kılıcdaroglu_kırıklıgını_ihtiyacımız_kucaklasmıssa
13 kaynaklı - bayraktar - enerji - denizlerdeki - gazı 47 13_kaynaklı_bayraktar_enerji_denizlerdeki
14 kursları - kaymakamlıkca - hekimliginden - kurallarına - fakultede 32 14_kursları_kaymakamlıkca_hekimliginden_kurallarına
15 doktoru - atasehir - calısanlarının - bayrakları - hizmetine 30 15_doktoru_atasehir_calısanlarının_bayrakları
16 durmasaydı - carptıgı - kahramanmaras - kızgın - kamarasından 28 16_durmasaydı_carptıgı_kahramanmaras_kızgın
17 erdogan - kılıcdaroglu - partiye - onaylıyorum - demokratik 25 17_erdogan_kılıcdaroglu_partiye_onaylıyorum
18 kararları - adaletsizlige - hukuk - demokrasisini - tartısmasız 23 18_kararları_adaletsizlige_hukuk_demokrasisini
19 dolarını - dolandırdı - altınını - baskınıyla - bankaların 22 19_dolarını_dolandırdı_altınını_baskınıyla

Training hyperparameters

  • calculate_probabilities: True
  • language: None
  • low_memory: False
  • min_topic_size: 10
  • n_gram_range: (1, 1)
  • nr_topics: None
  • seed_topic_list: None
  • top_n_words: 10
  • verbose: False
  • zeroshot_min_similarity: 0.7
  • zeroshot_topic_list: None

Framework versions

  • Numpy: 1.26.4
  • HDBSCAN: 0.8.40
  • UMAP: 0.5.7
  • Pandas: 2.2.3
  • Scikit-Learn: 1.5.2
  • Sentence-transformers: 3.3.1
  • Transformers: 4.46.3
  • Numba: 0.60.0
  • Plotly: 5.24.1
  • Python: 3.10.12
Downloads last month
1
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support