MARTINI_enrich_BERTopic_incicapz
This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.
Usage
To use this model, please install BERTopic:
pip install -U bertopic
You can use the model as follows:
from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_incicapz")
topic_model.get_topic_info()
Topic overview
- Number of topics: 17
- Number of training documents: 1596
Click here for an overview of all topics.
| Topic ID | Topic Keywords | Topic Frequency | Label |
|---|---|---|---|
| -1 | kılıcdaroglu - koronavirus - buyuksehir - erdogan - sakarya | 25 | -1_kılıcdaroglu_koronavirus_buyuksehir_erdogan |
| 0 | fiyatları - lirası - ekmek - bankası - margarin | 792 | 0_fiyatları_lirası_ekmek_bankası |
| 1 | koronavirusu - karantinaya - hastalıgım - diyarbakır - taburcu | 121 | 1_koronavirusu_karantinaya_hastalıgım_diyarbakır |
| 2 | sarkıcı - suleyman - cumhurbaskanlıgı - salaksınız - erdogan | 92 | 2_sarkıcı_suleyman_cumhurbaskanlıgı_salaksınız |
| 3 | koronaviruse - bagısıklık - enfeksiyon - profesor - mehmet | 91 | 3_koronaviruse_bagısıklık_enfeksiyon_profesor |
| 4 | kovid - hastamızı - kaynaklı - sıfır - teskilatımızda | 60 | 4_kovid_hastamızı_kaynaklı_sıfır |
| 5 | pınar - zanlısı - kadın - dogubayazıt - manavgat | 56 | 5_pınar_zanlısı_kadın_dogubayazıt |
| 6 | putin - ukrayna - zelenskiy - bayraktar - aeroflot | 52 | 6_putin_ukrayna_zelenskiy_bayraktar |
| 7 | salonları - cıkabilecek - sehirler - saat - pazar | 49 | 7_salonları_cıkabilecek_sehirler_saat |
| 8 | instagram - kanalımızı - reklamını - kardashian - faydalanabilirsiniz | 49 | 8_instagram_kanalımızı_reklamını_kardashian |
| 9 | diyarbakır - yaralılarımızın - kasırgasında - irak - bombalı | 33 | 9_diyarbakır_yaralılarımızın_kasırgasında_irak |
| 10 | pfizer - koronavirusun - varyantına - ghebreyesus - kazanım | 33 | 10_pfizer_koronavirusun_varyantına_ghebreyesus |
| 11 | okulların - uzatılmasında - kalkacagını - sabahcı - planlamaları | 33 | 11_okulların_uzatılmasında_kalkacagını_sabahcı |
| 12 | koronavirus - hubei - sehirlerindeki - semptomları - yayılımının | 29 | 12_koronavirus_hubei_sehirlerindeki_semptomları |
| 13 | polisi - korumalıgını - polisimizin - istanbul - kanunlar | 27 | 13_polisi_korumalıgını_polisimizin_istanbul |
| 14 | italya - koronavirus - lombardiya - vakalarında - 270 | 27 | 14_italya_koronavirus_lombardiya_vakalarında |
| 15 | israilli - hamas - filistinisrailsavası - gazetelerinin - kanalı | 27 | 15_israilli_hamas_filistinisrailsavası_gazetelerinin |
Training hyperparameters
- calculate_probabilities: True
- language: None
- low_memory: False
- min_topic_size: 10
- n_gram_range: (1, 1)
- nr_topics: None
- seed_topic_list: None
- top_n_words: 10
- verbose: False
- zeroshot_min_similarity: 0.7
- zeroshot_topic_list: None
Framework versions
- Numpy: 1.26.4
- HDBSCAN: 0.8.40
- UMAP: 0.5.7
- Pandas: 2.2.3
- Scikit-Learn: 1.5.2
- Sentence-transformers: 3.3.1
- Transformers: 4.46.3
- Numba: 0.60.0
- Plotly: 5.24.1
- Python: 3.10.12
- Downloads last month
- -