MARTINI_enrich_BERTopic_sahinozkan0
This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.
Usage
To use this model, please install BERTopic:
pip install -U bertopic
You can use the model as follows:
from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_sahinozkan0")
topic_model.get_topic_info()
Topic overview
- Number of topics: 28
- Number of training documents: 3753
Click here for an overview of all topics.
| Topic ID | Topic Keywords | Topic Frequency | Label |
|---|---|---|---|
| -1 | ahmet - kılıcdaroglu - ataturk - istanbul - erdogan | 20 | -1_ahmet_kılıcdaroglu_ataturk_istanbul |
| 0 | koronavirusten - karantinaya - cıktı - basbakanı - 2020 | 2397 | 0_koronavirusten_karantinaya_cıktı_basbakanı |
| 1 | kadın - babasını - yurttasın - izmir - kızının | 188 | 1_kadın_babasını_yurttasın_izmir |
| 2 | galatasaray - samsunspor - sampiyonlar - takımımızın - federasyonu | 126 | 2_galatasaray_samsunspor_sampiyonlar_takımımızın |
| 3 | ergenekon - kılıcdaroglu - attıramazsınız - partiyi - kampanyasını | 90 | 3_ergenekon_kılıcdaroglu_attıramazsınız_partiyi |
| 4 | rusya - donetsk - ukraynalı - tankını - vladimir | 89 | 4_rusya_donetsk_ukraynalı_tankını |
| 5 | adaylıktan - fazlasıyım - insanız - mayıs - balık | 75 | 5_adaylıktan_fazlasıyım_insanız_mayıs |
| 6 | kanalıma - kullanıcılar - olabilirsiniz - paylastıgım - instagram | 70 | 6_kanalıma_kullanıcılar_olabilirsiniz_paylastıgım |
| 7 | biden - putin - ukrayna - bagımsızlıgını - teroristlerin | 69 | 7_biden_putin_ukrayna_bagımsızlıgını |
| 8 | harekatı - irak - kuzeyindeki - terorist - operasyonuyla | 54 | 8_harekatı_irak_kuzeyindeki_terorist |
| 9 | fiyatı - dolar - borsalarında - salatalıgın - litrelik | 45 | 9_fiyatı_dolar_borsalarında_salatalıgın |
| 10 | kasıntıları - harekatcılar - ihbarında - karapınar - polisin | 45 | 10_kasıntıları_harekatcılar_ihbarında_karapınar |
| 11 | kriptosefiri - binance - bitexen - borsalarından - dolarlık | 43 | 11_kriptosefiri_binance_bitexen_borsalarından |
| 12 | kuponlar - kanalımızda - fiyatların - indirimlerin - urunleri | 43 | 12_kuponlar_kanalımızda_fiyatların_indirimlerin |
| 13 | incelemelerimiz - hikayelerinin - sosyal - mesajında - kullanıcısının | 41 | 13_incelemelerimiz_hikayelerinin_sosyal_mesajında |
| 14 | guneydekilere - akdeniz - gaziantep - kahramanmaras - kuzeyinde | 39 | 14_guneydekilere_akdeniz_gaziantep_kahramanmaras |
| 15 | erdogan - devletimiz - hazırladıgımız - hanımefendi - politikaların | 36 | 15_erdogan_devletimiz_hazırladıgımız_hanımefendi |
| 16 | erdogan - erdiriyoruz - bırakmayacagız - sıkıntıların - sukranlarımı | 36 | 16_erdogan_erdiriyoruz_bırakmayacagız_sıkıntıların |
| 17 | politikamızın - ekonomisinin - bankası - yiyecegiz - korumalı | 32 | 17_politikamızın_ekonomisinin_bankası_yiyecegiz |
| 18 | taliban - afgan - turkiyeyi - kandahar - cıkarılacak | 31 | 18_taliban_afgan_turkiyeyi_kandahar |
| 19 | karısının - bıcaklandı - trafikte - patlamasıyla - motosikletli | 31 | 19_karısının_bıcaklandı_trafikte_patlamasıyla |
| 20 | israilin - hamas - harekatını - kurtulmalıyız - filistinliyi | 28 | 20_israilin_hamas_harekatını_kurtulmalıyız |
| 21 | zelenskiy - akrabalarımızdır - sovyetlerin - gazetecilerle - hissediyoruz | 24 | 21_zelenskiy_akrabalarımızdır_sovyetlerin_gazetecilerle |
| 22 | diyarbakır - kacakcısının - kartel - narkotik - escobar | 21 | 22_diyarbakır_kacakcısının_kartel_narkotik |
| 23 | sayılarını - soyleyebildiler - suleyman - kaldırmalıyız - fedakarlıgın | 20 | 23_sayılarını_soyleyebildiler_suleyman_kaldırmalıyız |
| 24 | faturasına - akenerji - kwh - elektrigin - kalacagım | 20 | 24_faturasına_akenerji_kwh_elektrigin |
| 25 | israil - yasamadıgını - cocuklarım - bombaların - filistinlilere | 20 | 25_israil_yasamadıgını_cocuklarım_bombaların |
| 26 | tweetlere - tasarımı - inandıgımız - hukumetlerden - cagırıldıgından | 20 | 26_tweetlere_tasarımı_inandıgımız_hukumetlerden |
Training hyperparameters
- calculate_probabilities: True
- language: None
- low_memory: False
- min_topic_size: 10
- n_gram_range: (1, 1)
- nr_topics: None
- seed_topic_list: None
- top_n_words: 10
- verbose: False
- zeroshot_min_similarity: 0.7
- zeroshot_topic_list: None
Framework versions
- Numpy: 1.26.4
- HDBSCAN: 0.8.40
- UMAP: 0.5.7
- Pandas: 2.2.3
- Scikit-Learn: 1.5.2
- Sentence-transformers: 3.3.1
- Transformers: 4.46.3
- Numba: 0.60.0
- Plotly: 5.24.1
- Python: 3.10.12
- Downloads last month
- -