MARTINI_enrich_BERTopic_GunlukHaber
This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.
Usage
To use this model, please install BERTopic:
pip install -U bertopic
You can use the model as follows:
from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_GunlukHaber")
topic_model.get_topic_info()
Topic overview
- Number of topics: 59
- Number of training documents: 7934
Click here for an overview of all topics.
| Topic ID | Topic Keywords | Topic Frequency | Label |
|---|---|---|---|
| -1 | erdogan - kılıcdaroglu - bakanı - ahmet - istanbul | 20 | -1_erdogan_kılıcdaroglu_bakanı_ahmet |
| 0 | retweet - kılıcdaroglu - attıgı - vermeyecegiz - fatih | 4801 | 0_retweet_kılıcdaroglu_attıgı_vermeyecegiz |
| 1 | rusya - donetsk - bombardımanın - ukraynalı - helikopterlerinin | 328 | 1_rusya_donetsk_bombardımanın_ukraynalı |
| 2 | fiyatları - petrol - kaynaklar - tarifelerinde - gazı | 181 | 2_fiyatları_petrol_kaynaklar_tarifelerinde |
| 3 | avukatı - cezası - sanıkların - karlıova - serdar | 105 | 3_avukatı_cezası_sanıkların_karlıova |
| 4 | zelenskiy - kremlin - medvedev - diplomatların - hazırız | 96 | 4_zelenskiy_kremlin_medvedev_diplomatların |
| 5 | olamadıgım - tartısacagımızı - koyuyorsunuz - yazmıstım - duzeltebileceginizi | 94 | 5_olamadıgım_tartısacagımızı_koyuyorsunuz_yazmıstım |
| 6 | basarıyla - nasa - helikopterlerimiz - komutanlıgımızın - pentagon | 85 | 6_basarıyla_nasa_helikopterlerimiz_komutanlıgımızın |
| 7 | yaralanmıstır - kolombiya - kuzeyindeki - narkotik - operasyonları | 83 | 7_yaralanmıstır_kolombiya_kuzeyindeki_narkotik |
| 8 | sorularından - paylasılmaktadır - yapılmayacaktır - yasasına - sosyal | 76 | 8_sorularından_paylasılmaktadır_yapılmayacaktır_yasasına |
| 9 | hamas - filistinlileri - netanyahu - bombardımanları - mısır | 74 | 9_hamas_filistinlileri_netanyahu_bombardımanları |
| 10 | bakanı - muhafazakarlıgın - avukatlıgını - suleyman - politikasında | 73 | 10_bakanı_muhafazakarlıgın_avukatlıgını_suleyman |
| 11 | erdogan - kaldıgımız - mustekbirlerin - caydırıcı - bulamazsın | 72 | 11_erdogan_kaldıgımız_mustekbirlerin_caydırıcı |
| 12 | erdogan - politikasını - kosova - beklentimiz - stoltenberg | 70 | 12_erdogan_politikasını_kosova_beklentimiz |
| 13 | kılıcdaroglu - calısanlarına - dilekcelerimizi - bulusmasında - katılacaksınız | 69 | 13_kılıcdaroglu_calısanlarına_dilekcelerimizi_bulusmasında |
| 14 | fiyatları - yılın - 2023 - aralık - ekonomimiz | 67 | 14_fiyatları_yılın_2023_aralık |
| 15 | videoları - youtube - montajladıgım - kanalın - yorum | 65 | 15_videoları_youtube_montajladıgım_kanalın |
| 16 | erdogan - anadolu - kılıcdaroglu - ahmet - cumhurbaskanlıgı | 62 | 16_erdogan_anadolu_kılıcdaroglu_ahmet |
| 17 | ramallah - israilli - bombaladıklarını - gazetecileri - bureij | 60 | 17_ramallah_israilli_bombaladıklarını_gazetecileri |
| 18 | finansmanını - yatırımcı - ekonomisinin - politikamız - sıfırlanıyor | 60 | 18_finansmanını_yatırımcı_ekonomisinin_politikamız |
| 19 | arabistan - zayed - abdullah - riyad - cumhurbaskanlıgı | 59 | 19_arabistan_zayed_abdullah_riyad |
| 20 | trabzonspor - sampiyonlar - mbappe - finali - samsunspor | 58 | 20_trabzonspor_sampiyonlar_mbappe_finali |
| 21 | erdogan - adaylıgımıza - cıkartacaksanız - secimlerinin - kampanyaları | 56 | 21_erdogan_adaylıgımıza_cıkartacaksanız_secimlerinin |
| 22 | politikası - bankaların - acıklanacak - fed - merkez | 53 | 22_politikası_bankaların_acıklanacak_fed |
| 23 | fiyatlarındaki - petrol - benzin - lpg - litresini | 52 | 23_fiyatlarındaki_petrol_benzin_lpg |
| 24 | doları - bitcoin - yatırımlar - brent - grivnası | 50 | 24_doları_bitcoin_yatırımlar_brent |
| 25 | cocukları - kızımız - cıkarıldı - sanlıurfa - ugradıgını | 50 | 25_cocukları_kızımız_cıkarıldı_sanlıurfa |
| 26 | dolarları - bulacagı - milyon - kaptırmayın - kampanyamızın | 50 | 26_dolarları_bulacagı_milyon_kaptırmayın |
| 27 | ogretmenlerimizi - tasıdık - mudurluklerimiz - universitesi - manisa | 49 | 27_ogretmenlerimizi_tasıdık_mudurluklerimiz_universitesi |
| 28 | yuzyılınkonutprojesi - istanbul - planlıyoruz - hektarı - hızlı | 48 | 28_yuzyılınkonutprojesi_istanbul_planlıyoruz_hektarı |
| 29 | fransız - azerbaycan - diplomatın - kampanyasıyla - gabonlu | 47 | 29_fransız_azerbaycan_diplomatın_kampanyasıyla |
| 30 | maymun - hastalıgından - koronavirus - enfeksiyon - kolera | 45 | 30_maymun_hastalıgından_koronavirus_enfeksiyon |
| 31 | taksiciler - sehirlerarası - fiyatı - otobuslerinin - tasımacılık | 40 | 31_taksiciler_sehirlerarası_fiyatı_otobuslerinin |
| 32 | doları - bankaların - rezervlerinin - korumalı - goldman | 40 | 32_doları_bankaların_rezervlerinin_korumalı |
| 33 | gazprom - naftogaz - gazın - pazarlarımız - yasaklanmıstı | 37 | 33_gazprom_naftogaz_gazın_pazarlarımız |
| 34 | motosikletliyi - motokuryelerin - kapatılmadıgını - hurriyetinden - trafikte | 35 | 34_motosikletliyi_motokuryelerin_kapatılmadıgını_hurriyetinden |
| 35 | yangınlara - kuzeydeki - golmarmara - olumsuzlugumuz - susurkoy | 35 | 35_yangınlara_kuzeydeki_golmarmara_olumsuzlugumuz |
| 36 | fiyatları - ekmekleri - kilogramı - kıymayı - balıkcıların | 35 | 36_fiyatları_ekmekleri_kilogramı_kıymayı |
| 37 | suriyelilerdir - abartıldıgı - libyalı - karsılasılan - temsilcilikler | 34 | 37_suriyelilerdir_abartıldıgı_libyalı_karsılasılan |
| 38 | davutoglu - acıklamaları - cumhuriyetimize - partisi - sultanbeylili | 33 | 38_davutoglu_acıklamaları_cumhuriyetimize_partisi |
| 39 | iklim - hızlandıgı - kuzey - haritasına - antarktika | 33 | 39_iklim_hızlandıgı_kuzey_haritasına |
| 40 | takılacaklar - tiktok - edebileceksiniz - yırttıgı - teyzecigim | 31 | 40_takılacaklar_tiktok_edebileceksiniz_yırttıgı |
| 41 | akbasoglu - teklifimizdeki - cıkardıklarını - memnuniyetsizliklerini - komisyonları | 31 | 41_akbasoglu_teklifimizdeki_cıkardıklarını_memnuniyetsizliklerini |
| 42 | gazeteci - hacısalioglu - televizyonlarında - yayımlanmayacagı - itibarsızlastırmasıdır | 29 | 42_gazeteci_hacısalioglu_televizyonlarında_yayımlanmayacagı |
| 43 | vatanımızın - kardeslerimizi - fedakarlıgı - turkiyeli - kutuplastırmanızdan | 29 | 43_vatanımızın_kardeslerimizi_fedakarlıgı_turkiyeli |
| 44 | bırakılacak - sırtımızı - calısmalarım - sokulmasıyla - diyebiliyorsunuz | 29 | 44_bırakılacak_sırtımızı_calısmalarım_sokulmasıyla |
| 45 | gaziantep - kahramanmaras - buyuklugundeki - tsunamilerin - saptanmıstı | 29 | 45_gaziantep_kahramanmaras_buyuklugundeki_tsunamilerin |
| 46 | biden - amerikalılar - kamala - imzalaması - depresyondaydım | 28 | 46_biden_amerikalılar_kamala_imzalaması |
| 47 | 2023 - bakanlıgı - yılı - fiyatlarla - merkezi | 26 | 47_2023_bakanlıgı_yılı_fiyatlarla |
| 48 | yahudilerin - hristiyanların - purim - bayramları - mezarların | 25 | 48_yahudilerin_hristiyanların_purim_bayramları |
| 49 | instagram - tiktok - kullandıgınızda - facebook - paylastıgım | 25 | 49_instagram_tiktok_kullandıgınızda_facebook |
| 50 | kayaların - hastalarımıza - paylasılacaktır - surukledigi - ambulanslarla | 25 | 50_kayaların_hastalarımıza_paylasılacaktır_surukledigi |
| 51 | uyardıgımız - kırıldıgında - denizinde - haritasında - mollakasım | 23 | 51_uyardıgımız_kırıldıgında_denizinde_haritasında |
| 52 | uyandıklarını - turkistan - azınlıklar - tartısılmasını - protesto | 22 | 52_uyandıklarını_turkistan_azınlıklar_tartısılmasını |
| 53 | afganları - taliban - tacikistan - kırgızistan - calıstırıldıklarını | 21 | 53_afganları_taliban_tacikistan_kırgızistan |
| 54 | bakanı - yaslılarımızı - degistirmeyeceklerini - basvurabilirler - emeklilerimizin | 21 | 54_bakanı_yaslılarımızı_degistirmeyeceklerini_basvurabilirler |
| 55 | borsa - istanbul - dolandırıcılıgına - kapanısa - 100 | 20 | 55_borsa_istanbul_dolandırıcılıgına_kapanısa |
| 56 | istanbul - okmeydanı - yasayamazsın - bosandıgı - ablamın | 20 | 56_istanbul_okmeydanı_yasayamazsın_bosandıgı |
| 57 | yazılmıs - site - tartısabilecegimiz - planlıyordum - acacagım | 20 | 57_yazılmıs_site_tartısabilecegimiz_planlıyordum |
Training hyperparameters
- calculate_probabilities: True
- language: None
- low_memory: False
- min_topic_size: 10
- n_gram_range: (1, 1)
- nr_topics: None
- seed_topic_list: None
- top_n_words: 10
- verbose: False
- zeroshot_min_similarity: 0.7
- zeroshot_topic_list: None
Framework versions
- Numpy: 1.26.4
- HDBSCAN: 0.8.40
- UMAP: 0.5.7
- Pandas: 2.2.3
- Scikit-Learn: 1.5.2
- Sentence-transformers: 3.3.1
- Transformers: 4.46.3
- Numba: 0.60.0
- Plotly: 5.24.1
- Python: 3.10.12
- Downloads last month
- -