MARTINI_enrich_BERTopic_olayhaber
This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.
Usage
To use this model, please install BERTopic:
pip install -U bertopic
You can use the model as follows:
from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_olayhaber")
topic_model.get_topic_info()
Topic overview
- Number of topics: 21
- Number of training documents: 3345
Click here for an overview of all topics.
| Topic ID | Topic Keywords | Topic Frequency | Label |
|---|---|---|---|
| -1 | erdogan - kılıcdaroglu - bakanı - mehmet - ataturk | 22 | -1_erdogan_kılıcdaroglu_bakanı_mehmet |
| 0 | saldırısına - kızına - sanlıurfa - babası - karaman | 1998 | 0_saldırısına_kızına_sanlıurfa_babası |
| 1 | bayramlasmayacak - kılıcdaroglu - baskanlıgı - partisi - merkezi | 166 | 1_bayramlasmayacak_kılıcdaroglu_baskanlıgı_partisi |
| 2 | yaptım - belasını - secimlerini - imamoglu - serdar | 164 | 2_yaptım_belasını_secimlerini_imamoglu |
| 3 | rusya - cavusoglu - zelenski - nato - ukraynalı | 133 | 3_rusya_cavusoglu_zelenski_nato |
| 4 | erdogan - sıkıntıları - cumhurbaskanı - devletleri - dunyanın | 106 | 4_erdogan_sıkıntıları_cumhurbaskanı_devletleri |
| 5 | kurdistan - kuzeyindeki - teroristlere - hazırlıgında - saldıracagız | 105 | 5_kurdistan_kuzeyindeki_teroristlere_hazırlıgında |
| 6 | agıralioglu - ittifakına - mustafa - partisi - basak | 95 | 6_agıralioglu_ittifakına_mustafa_partisi |
| 7 | carpması - ambulansın - kazasında - trafik - otobus | 78 | 7_carpması_ambulansın_kazasında_trafik |
| 8 | hamas - erdogan - netanyahu - insafına - iliskilerde | 61 | 8_hamas_erdogan_netanyahu_insafına |
| 9 | fiyatı - bankası - yılın - 2021 - harcamalarının | 57 | 9_fiyatı_bankası_yılın_2021 |
| 10 | tiktok - altaylı - kanalını - paylasımı - kullanıcıları | 53 | 10_tiktok_altaylı_kanalını_paylasımı |
| 11 | adaylıgını - ergenekon - kazanırız - bayramı - milliyetcilik | 53 | 11_adaylıgını_ergenekon_kazanırız_bayramı |
| 12 | kılıcdaroglu - kırıklıgını - ihtiyacımız - kucaklasmıssa - saraylılara | 47 | 12_kılıcdaroglu_kırıklıgını_ihtiyacımız_kucaklasmıssa |
| 13 | kaynaklı - bayraktar - enerji - denizlerdeki - gazı | 47 | 13_kaynaklı_bayraktar_enerji_denizlerdeki |
| 14 | kursları - kaymakamlıkca - hekimliginden - kurallarına - fakultede | 32 | 14_kursları_kaymakamlıkca_hekimliginden_kurallarına |
| 15 | doktoru - atasehir - calısanlarının - bayrakları - hizmetine | 30 | 15_doktoru_atasehir_calısanlarının_bayrakları |
| 16 | durmasaydı - carptıgı - kahramanmaras - kızgın - kamarasından | 28 | 16_durmasaydı_carptıgı_kahramanmaras_kızgın |
| 17 | erdogan - kılıcdaroglu - partiye - onaylıyorum - demokratik | 25 | 17_erdogan_kılıcdaroglu_partiye_onaylıyorum |
| 18 | kararları - adaletsizlige - hukuk - demokrasisini - tartısmasız | 23 | 18_kararları_adaletsizlige_hukuk_demokrasisini |
| 19 | dolarını - dolandırdı - altınını - baskınıyla - bankaların | 22 | 19_dolarını_dolandırdı_altınını_baskınıyla |
Training hyperparameters
- calculate_probabilities: True
- language: None
- low_memory: False
- min_topic_size: 10
- n_gram_range: (1, 1)
- nr_topics: None
- seed_topic_list: None
- top_n_words: 10
- verbose: False
- zeroshot_min_similarity: 0.7
- zeroshot_topic_list: None
Framework versions
- Numpy: 1.26.4
- HDBSCAN: 0.8.40
- UMAP: 0.5.7
- Pandas: 2.2.3
- Scikit-Learn: 1.5.2
- Sentence-transformers: 3.3.1
- Transformers: 4.46.3
- Numba: 0.60.0
- Plotly: 5.24.1
- Python: 3.10.12
- Downloads last month
- 1