MARTINI_enrich_BERTopic_BkaHaber

This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.

Usage

To use this model, please install BERTopic:

pip install -U bertopic

You can use the model as follows:

from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_BkaHaber")

topic_model.get_topic_info()

Topic overview

  • Number of topics: 31
  • Number of training documents: 3733
Click here for an overview of all topics.
Topic ID Topic Keywords Topic Frequency Label
-1 erdogan - kılıcdaroglu - ataturk - mehmet - izmir 20 -1_erdogan_kılıcdaroglu_ataturk_mehmet
0 teroristleri - irak - operasyonlar - kuzeyindeki - silah 2280 0_teroristleri_irak_operasyonlar_kuzeyindeki
1 kılıcdaroglu - merkezi - partiye - basdanısman - saygısızlık 114 1_kılıcdaroglu_merkezi_partiye_basdanısman
2 hamas - netanyahu - basbakanı - kaynaklarına - bombardımanı 112 2_hamas_netanyahu_basbakanı_kaynaklarına
3 baslıgıyla - davrandıgını - twitter - hakkında - paylasımı 111 3_baslıgıyla_davrandıgını_twitter_hakkında
4 galatasaray - futbolcuların - takımlarından - kulubumuzun - federasyonu 79 4_galatasaray_futbolcuların_takımlarından_kulubumuzun
5 erdogan - evlatlarımızın - bayragımızı - yıldır - barısın 78 5_erdogan_evlatlarımızın_bayragımızı_yıldır
6 kılıcdaroglu - soracagım - kuranlarla - tercihimizi - kaptanın 74 6_kılıcdaroglu_soracagım_kuranlarla_tercihimizi
7 galatasaray - ludogorets - spartak - takımımız - sampiyonluga 62 7_galatasaray_ludogorets_spartak_takımımız
8 kızarık - bıcaklayarak - sıktı - yasemin - basından 51 8_kızarık_bıcaklayarak_sıktı_yasemin
9 imamoglu - korumasına - meydanın - sevgililer - istanbul 48 9_imamoglu_korumasına_meydanın_sevgililer
10 fiyatı - maliyeti - maasını - yukseltilmesini - ihtiyaclarının 48 10_fiyatı_maliyeti_maasını_yukseltilmesini
11 izmir - zeytinburnu - kaymakamı - depremzedelere - buyuklugundeki 46 11_izmir_zeytinburnu_kaymakamı_depremzedelere
12 zelensky - rusya - mykolaiv - medvedev - polonyalılara 44 12_zelensky_rusya_mykolaiv_medvedev
13 ergenekon - avukatın - saldırganların - oktay - malvarlıgı 44 13_ergenekon_avukatın_saldırganların_oktay
14 finansmanını - mehmet - bankası - ekonomisi - politikası 43 14_finansmanını_mehmet_bankası_ekonomisi
15 shoigu - savasıyoruz - voronezh - gerasimov - pmc 41 15_shoigu_savasıyoruz_voronezh_gerasimov
16 inanmıyorsunuz - kalbimizde - kızardım - fedakarlıklarınızı - guzelleyenlere 41 16_inanmıyorsunuz_kalbimizde_kızardım_fedakarlıklarınızı
17 erdogan - kılıcdaroglu - cumhurbaskanlıgı - calısanların - begenmiyorsanız 40 17_erdogan_kılıcdaroglu_cumhurbaskanlıgı_calısanların
18 zonguldak - kurtarıldı - calısmalarına - fabrikası - eroglu 38 18_zonguldak_kurtarıldı_calısmalarına_fabrikası
19 cumhuriyet - ilkelerimizden - buyuksehir - cıkartmayacagız - partisinden 38 19_cumhuriyet_ilkelerimizden_buyuksehir_cıkartmayacagız
20 istanbul - turkiyegonulluleri - sandıklarımızı - kagıdımda - havalimanları 36 20_istanbul_turkiyegonulluleri_sandıklarımızı_kagıdımda
21 ittifakı - partisi - milletvekili - bbp - 201807 34 21_ittifakı_partisi_milletvekili_bbp
22 erdogan - kılıcdaroglu - cumhurbaskanlıgı - sandık - 182853 34 22_erdogan_kılıcdaroglu_cumhurbaskanlıgı_sandık
23 taksiciler - karsılanacagını - izmir - dagıtımında - kaybetmesinin 33 23_taksiciler_karsılanacagını_izmir_dagıtımında
24 telefonlar - detayları - teknolojik - kameralı - indirilebiliyor 32 24_telefonlar_detayları_teknolojik_kameralı
25 ataturk - cumhuriyetimizin - osmanlıca - notları - marsı 23 25_ataturk_cumhuriyetimizin_osmanlıca_notları
26 trump - diktatorce - yasadıgınız - biden - iktidarımızdan 23 26_trump_diktatorce_yasadıgınız_biden
27 izmirdegundemhaberler - harekatcılar - kacırıldıgına - polisin - durumları 22 27_izmirdegundemhaberler_harekatcılar_kacırıldıgına_polisin
28 erdogan - davutoglu - emeklilerimizi - kandırmıyoruz - hegemonyası 22 28_erdogan_davutoglu_emeklilerimizi_kandırmıyoruz
29 twitleri - zuckerberg - takipci - goruntuleyebilecek - musabakanın 22 29_twitleri_zuckerberg_takipci_goruntuleyebilecek

Training hyperparameters

  • calculate_probabilities: True
  • language: None
  • low_memory: False
  • min_topic_size: 10
  • n_gram_range: (1, 1)
  • nr_topics: None
  • seed_topic_list: None
  • top_n_words: 10
  • verbose: False
  • zeroshot_min_similarity: 0.7
  • zeroshot_topic_list: None

Framework versions

  • Numpy: 1.26.4
  • HDBSCAN: 0.8.40
  • UMAP: 0.5.7
  • Pandas: 2.2.3
  • Scikit-Learn: 1.5.2
  • Sentence-transformers: 3.3.1
  • Transformers: 4.46.3
  • Numba: 0.60.0
  • Plotly: 5.24.1
  • Python: 3.10.12
Downloads last month
-
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support