MARTINI_enrich_BERTopic_taghaber
This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.
Usage
To use this model, please install BERTopic:
pip install -U bertopic
You can use the model as follows:
from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_taghaber")
topic_model.get_topic_info()
Topic overview
- Number of topics: 24
- Number of training documents: 2336
Click here for an overview of all topics.
| Topic ID | Topic Keywords | Topic Frequency | Label |
|---|---|---|---|
| -1 | kızılay - kılıcdaroglu - erdogan - mehmet - kahramanmaras | 20 | -1_kızılay_kılıcdaroglu_erdogan_mehmet |
| 0 | hamas - israillilere - netanyahu - mossad - basbakanı | 1467 | 0_hamas_israillilere_netanyahu_mossad |
| 1 | anlatacagım - buradayız - vatandasımızı - kararları - yazıklar | 80 | 1_anlatacagım_buradayız_vatandasımızı_kararları |
| 2 | bayragını - polisi - irak - saldırdıgı - silahıyla | 70 | 2_bayragını_polisi_irak_saldırdıgı |
| 3 | erdogan - sayısal - gecebilir - farkındayız - kuklacıları | 58 | 3_erdogan_sayısal_gecebilir_farkındayız |
| 4 | cıkarmamızı - kılıcdaroglu - kandırmalarına - dokunulmazlıgının - karıstırmayın | 58 | 4_cıkarmamızı_kılıcdaroglu_kandırmalarına_dokunulmazlıgının |
| 5 | bankasının - doların - cumhuriyet - lirası - banknot | 52 | 5_bankasının_doların_cumhuriyet_lirası |
| 6 | olsaydı - imamoglu - olmayıp - mahkemelerim - dagıtıyordunuz | 50 | 6_olsaydı_imamoglu_olmayıp_mahkemelerim |
| 7 | fiyatlarını - tasınabilecek - denetimlerimizi - buyukbas - yukseltildi | 47 | 7_fiyatlarını_tasınabilecek_denetimlerimizi_buyukbas |
| 8 | gazeteci - haberiniz - sosyal - kullanıcıları - medya | 45 | 8_gazeteci_haberiniz_sosyal_kullanıcıları |
| 9 | milyonlarca - yayınlamadı - albayrak - doları - baslanacagı | 44 | 9_milyonlarca_yayınlamadı_albayrak_doları |
| 10 | galatasaray - konyaspor - sampiyonlar - cumhuriyetimizin - kupası | 36 | 10_galatasaray_konyaspor_sampiyonlar_cumhuriyetimizin |
| 11 | kurultayında - kaldıracagımız - devlet - destekleyebiliriz - gorevleridir | 30 | 11_kurultayında_kaldıracagımız_devlet_destekleyebiliriz |
| 12 | hizbullahcıların - davutoglu - partisi - karısmamalı - destekledigimizi | 30 | 12_hizbullahcıların_davutoglu_partisi_karısmamalı |
| 13 | hastalıgının - bakanlıgı - sayısının - istatistiklerimizde - vakalarının | 29 | 13_hastalıgının_bakanlıgı_sayısının_istatistiklerimizde |
| 14 | erdogan - kandırmasın - farklılıklarımızı - meydanında - secimlerini | 29 | 14_erdogan_kandırmasın_farklılıklarımızı_meydanında |
| 15 | fiyatı - benzin - motorinde - litre - gazın | 28 | 15_fiyatı_benzin_motorinde_litre |
| 16 | turkakım - kremlin - ukrayna - zelenskiy - donetsk | 26 | 16_turkakım_kremlin_ukrayna_zelenskiy |
| 17 | cumhuriyetimizin - ataturk - 24kasımogretmenlergunu - izmir - basındayken | 25 | 17_cumhuriyetimizin_ataturk_24kasımogretmenlergunu_izmir |
| 18 | haklarıdır - basımızı - kurallarına - maliye - kararlılıkla | 24 | 18_haklarıdır_basımızı_kurallarına_maliye |
| 19 | kurtarıldı - antakya - turkmenbası - kahramanmaras - apartmanı | 24 | 19_kurtarıldı_antakya_turkmenbası_kahramanmaras |
| 20 | yaralandıgını - malatya - zonguldak - kuzeyindeki - sıcaklıkları | 24 | 20_yaralandıgını_malatya_zonguldak_kuzeyindeki |
| 21 | sokacagız - tahminlerinizi - meslekler - hizmetleri - baslamamız | 20 | 21_sokacagız_tahminlerinizi_meslekler_hizmetleri |
| 22 | anadolu - kılıcdaroglu - sandıkların - acıklanmadı - oylarımızın | 20 | 22_anadolu_kılıcdaroglu_sandıkların_acıklanmadı |
Training hyperparameters
- calculate_probabilities: True
- language: None
- low_memory: False
- min_topic_size: 10
- n_gram_range: (1, 1)
- nr_topics: None
- seed_topic_list: None
- top_n_words: 10
- verbose: False
- zeroshot_min_similarity: 0.7
- zeroshot_topic_list: None
Framework versions
- Numpy: 1.26.4
- HDBSCAN: 0.8.40
- UMAP: 0.5.7
- Pandas: 2.2.3
- Scikit-Learn: 1.5.2
- Sentence-transformers: 3.3.1
- Transformers: 4.46.3
- Numba: 0.60.0
- Plotly: 5.24.1
- Python: 3.10.12
- Downloads last month
- -