MARTINI_enrich_BERTopic_TAAtelegram
This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.
Usage
To use this model, please install BERTopic:
pip install -U bertopic
You can use the model as follows:
from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_TAAtelegram")
topic_model.get_topic_info()
Topic overview
- Number of topics: 12
- Number of training documents: 944
Click here for an overview of all topics.
| Topic ID | Topic Keywords | Topic Frequency | Label |
|---|---|---|---|
| -1 | kazananlar - yapılacak - cekilisi - ataturk - bakanı | 20 | -1_kazananlar_yapılacak_cekilisi_ataturk |
| 0 | erdogan - kılıcdaroglu - bakanı - mehmet - saglayacagız | 338 | 0_erdogan_kılıcdaroglu_bakanı_mehmet |
| 1 | iphone - fiyatları - 512gb - 999 - max | 147 | 1_iphone_fiyatları_512gb_999 |
| 2 | bıraktım - seviliyorsunuz - ayakkabıyı - selam - yazın | 79 | 2_bıraktım_seviliyorsunuz_ayakkabıyı_selam |
| 3 | yazacaksiniz - reelsi - instagram - ısmarlıycam - telegramdan | 60 | 3_yazacaksiniz_reelsi_instagram_ısmarlıycam |
| 4 | bırakıldı - istanbul - gaziantep - esenyurt - ankara | 53 | 4_bırakıldı_istanbul_gaziantep_esenyurt |
| 5 | coinleri - binance - solanium - satısımız - token | 52 | 5_coinleri_binance_solanium_satısımız |
| 6 | galatasaray - demirspor - takımımız - sultanları - sampiyonası | 51 | 6_galatasaray_demirspor_takımımız_sultanları |
| 7 | harekatı - canakkale - saldırısında - catısmada - teroristlerin | 48 | 7_harekatı_canakkale_saldırısında_catısmada |
| 8 | cumhuriyetimizin - kahramanlarını - canakkale - bayramı - ataturk | 42 | 8_cumhuriyetimizin_kahramanlarını_canakkale_bayramı |
| 9 | erdogan - anadolu - kılıcdaroglu - sandıkların - anketi | 28 | 9_erdogan_anadolu_kılıcdaroglu_sandıkların |
| 10 | hamas - netanyahu - israilliler - basbakanı - kılınacak | 26 | 10_hamas_netanyahu_israilliler_basbakanı |
Training hyperparameters
- calculate_probabilities: True
- language: None
- low_memory: False
- min_topic_size: 10
- n_gram_range: (1, 1)
- nr_topics: None
- seed_topic_list: None
- top_n_words: 10
- verbose: False
- zeroshot_min_similarity: 0.7
- zeroshot_topic_list: None
Framework versions
- Numpy: 1.26.4
- HDBSCAN: 0.8.40
- UMAP: 0.5.7
- Pandas: 2.2.3
- Scikit-Learn: 1.5.2
- Sentence-transformers: 3.3.1
- Transformers: 4.46.3
- Numba: 0.60.0
- Plotly: 5.24.1
- Python: 3.10.12
- Downloads last month
- -