MARTINI_enrich_BERTopic_haberpaylasim
This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.
Usage
To use this model, please install BERTopic:
pip install -U bertopic
You can use the model as follows:
from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_haberpaylasim")
topic_model.get_topic_info()
Topic overview
- Number of topics: 61
- Number of training documents: 7627
Click here for an overview of all topics.
| Topic ID | Topic Keywords | Topic Frequency | Label |
|---|---|---|---|
| -1 | erdogan - bakanlıgı - kılıcdaroglu - ankara - mehmet | 21 | -1_erdogan_bakanlıgı_kılıcdaroglu_ankara |
| 0 | rusya - mariupol - luhansk - zelenskiy - bakanlıgı | 4169 | 0_rusya_mariupol_luhansk_zelenskiy |
| 1 | instagram - sosyal - paylastıgı - kullanıcıları - whatsapp | 266 | 1_instagram_sosyal_paylastıgı_kullanıcıları |
| 2 | erdogan - kıbrıs - acıklayacagız - kurtulmalıdır - kapılarımızı | 221 | 2_erdogan_kıbrıs_acıklayacagız_kurtulmalıdır |
| 3 | kanalımız - kuponları - faydalı - trendyol - kazanabilirsiniz | 213 | 3_kanalımız_kuponları_faydalı_trendyol |
| 4 | sınırlaması - sonlandırılacak - cıkabilecek - sehirlerarası - baslayacak | 124 | 4_sınırlaması_sonlandırılacak_cıkabilecek_sehirlerarası |
| 5 | karantinayı - koronaviruse - yaptırdıgı - nevsehir - calısırken | 114 | 5_karantinayı_koronaviruse_yaptırdıgı_nevsehir |
| 6 | trabzonspor - fenerbahceli - psg - sampiyonlar - takımı | 95 | 6_trabzonspor_fenerbahceli_psg_sampiyonlar |
| 7 | egitimlerinin - okulların - kursları - kurumları - baslatılacak | 89 | 7_egitimlerinin_okulların_kursları_kurumları |
| 8 | izmir - ihbarın - kurtarıldı - seferihisar - yaralanmıstır | 88 | 8_izmir_ihbarın_kurtarıldı_seferihisar |
| 9 | fiyatı - degerlendirilecek - yukseltildi - akaryakıt - iceceklerde | 82 | 9_fiyatı_degerlendirilecek_yukseltildi_akaryakıt |
| 10 | kılıcdaroglu - muhtacız - ittifakı - basbakan - partisi | 78 | 10_kılıcdaroglu_muhtacız_ittifakı_basbakan |
| 11 | hastalıgın - calısanlarımızın - hastalarımızın - sayımızda - kapasitemiz | 78 | 11_hastalıgın_calısanlarımızın_hastalarımızın_sayımızda |
| 12 | doları - bankasının - lirası - cumhuriyet - edebilmektedir | 76 | 12_doları_bankasının_lirası_cumhuriyet |
| 13 | hizbullahı - hamas - netanyahu - filistin - davutoglu | 75 | 13_hizbullahı_hamas_netanyahu_filistin |
| 14 | carpması - taksici - istanbul - kazasında - yolcunun | 74 | 14_carpması_taksici_istanbul_kazasında |
| 15 | libya - misrata - cavusoglu - dısisleri - takınmaktan | 63 | 15_libya_misrata_cavusoglu_dısisleri |
| 16 | karsılıgında - sahısların - dolandırdı - kaymakamlık - kurdukları | 61 | 16_karsılıgında_sahısların_dolandırdı_kaymakamlık |
| 17 | benzin - fiyatı - petrolun - lpg - zamlanmısken | 61 | 17_benzin_fiyatı_petrolun_lpg |
| 18 | kovid - 24 - worldometers - devletleri - yaptırmayacagını | 61 | 18_kovid_24_worldometers_devletleri |
| 19 | cavusoglu - basbakanı - denizindeki - onkosullarımızda - konstantinos | 59 | 19_cavusoglu_basbakanı_denizindeki_onkosullarımızda |
| 20 | azerbaycan - haciyev - silahları - birliklerimiz - tankı | 59 | 20_azerbaycan_haciyev_silahları_birliklerimiz |
| 21 | yılın - pasaportları - erkekler - azalısla - 2019 | 56 | 21_yılın_pasaportları_erkekler_azalısla |
| 22 | koronaviruse - enfeksiyondur - gozlemlediklerini - doktor - wuhan | 55 | 22_koronaviruse_enfeksiyondur_gozlemlediklerini_doktor |
| 23 | franasız - karsılasacaktır - istihbaratının - karikaturlerinin - yataklarımız | 55 | 23_franasız_karsılasacaktır_istihbaratının_karikaturlerinin |
| 24 | kaldırıldım - ecdadımın - fındıkların - yakalananınca - hareketleriniz | 53 | 24_kaldırıldım_ecdadımın_fındıkların_yakalananınca |
| 25 | azerbaycanlı - basbakanı - topraklarımızdan - saygısızlıktır - kardeslerimizin | 51 | 25_azerbaycanlı_basbakanı_topraklarımızdan_saygısızlıktır |
| 26 | bayramımız - ataturk - mehmetakifersoy - canakkale - baslatıldıgı | 49 | 26_bayramımız_ataturk_mehmetakifersoy_canakkale |
| 27 | davutoglu - dolarizasyon - devamlılıgını - alınmasını - ekonomisini | 49 | 27_davutoglu_dolarizasyon_devamlılıgını_alınmasını |
| 28 | kılıcdaroglu - halkımızı - kandırmasın - cıkmayacagız - muhafazakarlıktan | 49 | 28_kılıcdaroglu_halkımızı_kandırmasın_cıkmayacagız |
| 29 | hizmetler - buyuksehir - vatandaslarımıza - kampanyasında - sagladıgımız | 48 | 29_hizmetler_buyuksehir_vatandaslarımıza_kampanyasında |
| 30 | test - 27 - agustos - temmuz - eylul | 47 | 30_test_27_agustos_temmuz |
| 31 | akdeniz - marmara - korvetler - sismik - calısmasının | 46 | 31_akdeniz_marmara_korvetler_sismik |
| 32 | suleyman - soracaklar - unsurlarıyla - bukulmeyen - sıgmaz | 46 | 32_suleyman_soracaklar_unsurlarıyla_bukulmeyen |
| 33 | donald - onayladıklarını - kazandıgımız - abd - diktatore | 41 | 33_donald_onayladıklarını_kazandıgımız_abd |
| 34 | mayıs - 25 - test - nisan - 58 | 41 | 34_mayıs_25_test_nisan |
| 35 | gazlastırma - kaynakların - enerjisinde - karsılayacak - petrolde | 40 | 35_gazlastırma_kaynakların_enerjisinde_karsılayacak |
| 36 | harekatın - yakalanmıstır - komandolarımızın - demirtepe - teroristi | 39 | 36_harekatın_yakalanmıstır_komandolarımızın_demirtepe |
| 37 | pfizer - biontech - enfeksiyonlarını - sinovac - firmasının | 37 | 37_pfizer_biontech_enfeksiyonlarını_sinovac |
| 38 | irak - harekatları - kuzeyindeki - hazırlıgında - pkk | 35 | 38_irak_harekatları_kuzeyindeki_hazırlıgında |
| 39 | biden - trump - kamala - sayılmaya - demokrat | 35 | 39_biden_trump_kamala_sayılmaya |
| 40 | taksicilerin - uber - tasıyacagız - sikayetlerin - uymaksızın | 34 | 40_taksicilerin_uber_tasıyacagız_sikayetlerin |
| 41 | anadolu - kılıcdaroglu - akıncı - imirzalıoglu - kazanırsa | 34 | 41_anadolu_kılıcdaroglu_akıncı_imirzalıoglu |
| 42 | yatırımcılarımıza - kredi - faydalanacak - firmamızın - borclarını | 34 | 42_yatırımcılarımıza_kredi_faydalanacak_firmamızın |
| 43 | ankara - teroristbası - dokunulmazlıgının - ısırmasına - bassavcılıgınca | 33 | 43_ankara_teroristbası_dokunulmazlıgının_ısırmasına |
| 44 | iphone - 256gb - samsung - redmi - gorunumleri | 32 | 44_iphone_256gb_samsung_redmi |
| 45 | kızına - kacırmıstı - yasındaydı - olamazsın - carptırıldı | 30 | 45_kızına_kacırmıstı_yasındaydı_olamazsın |
| 46 | yetkililerden - saruhanlı - yıgıldıgı - babanın - kızını | 28 | 46_yetkililerden_saruhanlı_yıgıldıgı_babanın |
| 47 | namazlı - muslumanlıktan - namazlarımızla - hanımefendilerin - baglamamız | 27 | 47_namazlı_muslumanlıktan_namazlarımızla_hanımefendilerin |
| 48 | kovid - basladıgımızı - kurtulalım - dayanısmanın - kaynaklıdır | 25 | 48_kovid_basladıgımızı_kurtulalım_dayanısmanın |
| 49 | turkiye - yapıldı - kovid - 28 - testi | 24 | 49_turkiye_yapıldı_kovid_28 |
| 50 | dokunulmazlıgını - saldırdıkları - agırlastırılmıs - cezalandırılması - murda | 24 | 50_dokunulmazlıgını_saldırdıkları_agırlastırılmıs_cezalandırılması |
| 51 | beyrut - limanında - kaynaklarına - hasarın - patlayıcıların | 23 | 51_beyrut_limanında_kaynaklarına_hasarın |
| 52 | diyarbakır - cankırı - gaziantep - sıfırlandıgı - basvurmamız | 23 | 52_diyarbakır_cankırı_gaziantep_sıfırlandıgı |
| 53 | trump - covid - doktorların - yasadıgınız - kapatmayacagız | 23 | 53_trump_covid_doktorların_yasadıgınız |
| 54 | elektrikleri - sirketleridir - fiyatların - kullanmayacagım - kwh | 23 | 54_elektrikleri_sirketleridir_fiyatların_kullanmayacagım |
| 55 | netflix - filmlerini - dizi - dolandırmadım - zenginlestirmek | 23 | 55_netflix_filmlerini_dizi_dolandırmadım |
| 56 | afganistanlı - taliban - militanına - burka - kaldırabiliriz | 23 | 56_afganistanlı_taliban_militanına_burka |
| 57 | polislerimizi - kaldıkları - arkadaslarımıza - izmirli - kadıkoy | 22 | 57_polislerimizi_kaldıkları_arkadaslarımıza_izmirli |
| 58 | bulastırmayacagını - egitimlerin - anlamlı - hastalıktan - bilemiyorum | 22 | 58_bulastırmayacagını_egitimlerin_anlamlı_hastalıktan |
| 59 | bırakmıs - ihtiyacımız - arzuladıgımız - cıkaracagımız - kursagında | 21 | 59_bırakmıs_ihtiyacımız_arzuladıgımız_cıkaracagımız |
Training hyperparameters
- calculate_probabilities: True
- language: None
- low_memory: False
- min_topic_size: 10
- n_gram_range: (1, 1)
- nr_topics: None
- seed_topic_list: None
- top_n_words: 10
- verbose: False
- zeroshot_min_similarity: 0.7
- zeroshot_topic_list: None
Framework versions
- Numpy: 1.26.4
- HDBSCAN: 0.8.40
- UMAP: 0.5.7
- Pandas: 2.2.3
- Scikit-Learn: 1.5.2
- Sentence-transformers: 3.3.1
- Transformers: 4.46.3
- Numba: 0.60.0
- Plotly: 5.24.1
- Python: 3.10.12
- Downloads last month
- -