MARTINI_enrich_BERTopic_taghaber

This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.

Usage

To use this model, please install BERTopic:

pip install -U bertopic

You can use the model as follows:

from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_taghaber")

topic_model.get_topic_info()

Topic overview

  • Number of topics: 24
  • Number of training documents: 2336
Click here for an overview of all topics.
Topic ID Topic Keywords Topic Frequency Label
-1 kızılay - kılıcdaroglu - erdogan - mehmet - kahramanmaras 20 -1_kızılay_kılıcdaroglu_erdogan_mehmet
0 hamas - israillilere - netanyahu - mossad - basbakanı 1467 0_hamas_israillilere_netanyahu_mossad
1 anlatacagım - buradayız - vatandasımızı - kararları - yazıklar 80 1_anlatacagım_buradayız_vatandasımızı_kararları
2 bayragını - polisi - irak - saldırdıgı - silahıyla 70 2_bayragını_polisi_irak_saldırdıgı
3 erdogan - sayısal - gecebilir - farkındayız - kuklacıları 58 3_erdogan_sayısal_gecebilir_farkındayız
4 cıkarmamızı - kılıcdaroglu - kandırmalarına - dokunulmazlıgının - karıstırmayın 58 4_cıkarmamızı_kılıcdaroglu_kandırmalarına_dokunulmazlıgının
5 bankasının - doların - cumhuriyet - lirası - banknot 52 5_bankasının_doların_cumhuriyet_lirası
6 olsaydı - imamoglu - olmayıp - mahkemelerim - dagıtıyordunuz 50 6_olsaydı_imamoglu_olmayıp_mahkemelerim
7 fiyatlarını - tasınabilecek - denetimlerimizi - buyukbas - yukseltildi 47 7_fiyatlarını_tasınabilecek_denetimlerimizi_buyukbas
8 gazeteci - haberiniz - sosyal - kullanıcıları - medya 45 8_gazeteci_haberiniz_sosyal_kullanıcıları
9 milyonlarca - yayınlamadı - albayrak - doları - baslanacagı 44 9_milyonlarca_yayınlamadı_albayrak_doları
10 galatasaray - konyaspor - sampiyonlar - cumhuriyetimizin - kupası 36 10_galatasaray_konyaspor_sampiyonlar_cumhuriyetimizin
11 kurultayında - kaldıracagımız - devlet - destekleyebiliriz - gorevleridir 30 11_kurultayında_kaldıracagımız_devlet_destekleyebiliriz
12 hizbullahcıların - davutoglu - partisi - karısmamalı - destekledigimizi 30 12_hizbullahcıların_davutoglu_partisi_karısmamalı
13 hastalıgının - bakanlıgı - sayısının - istatistiklerimizde - vakalarının 29 13_hastalıgının_bakanlıgı_sayısının_istatistiklerimizde
14 erdogan - kandırmasın - farklılıklarımızı - meydanında - secimlerini 29 14_erdogan_kandırmasın_farklılıklarımızı_meydanında
15 fiyatı - benzin - motorinde - litre - gazın 28 15_fiyatı_benzin_motorinde_litre
16 turkakım - kremlin - ukrayna - zelenskiy - donetsk 26 16_turkakım_kremlin_ukrayna_zelenskiy
17 cumhuriyetimizin - ataturk - 24kasımogretmenlergunu - izmir - basındayken 25 17_cumhuriyetimizin_ataturk_24kasımogretmenlergunu_izmir
18 haklarıdır - basımızı - kurallarına - maliye - kararlılıkla 24 18_haklarıdır_basımızı_kurallarına_maliye
19 kurtarıldı - antakya - turkmenbası - kahramanmaras - apartmanı 24 19_kurtarıldı_antakya_turkmenbası_kahramanmaras
20 yaralandıgını - malatya - zonguldak - kuzeyindeki - sıcaklıkları 24 20_yaralandıgını_malatya_zonguldak_kuzeyindeki
21 sokacagız - tahminlerinizi - meslekler - hizmetleri - baslamamız 20 21_sokacagız_tahminlerinizi_meslekler_hizmetleri
22 anadolu - kılıcdaroglu - sandıkların - acıklanmadı - oylarımızın 20 22_anadolu_kılıcdaroglu_sandıkların_acıklanmadı

Training hyperparameters

  • calculate_probabilities: True
  • language: None
  • low_memory: False
  • min_topic_size: 10
  • n_gram_range: (1, 1)
  • nr_topics: None
  • seed_topic_list: None
  • top_n_words: 10
  • verbose: False
  • zeroshot_min_similarity: 0.7
  • zeroshot_topic_list: None

Framework versions

  • Numpy: 1.26.4
  • HDBSCAN: 0.8.40
  • UMAP: 0.5.7
  • Pandas: 2.2.3
  • Scikit-Learn: 1.5.2
  • Sentence-transformers: 3.3.1
  • Transformers: 4.46.3
  • Numba: 0.60.0
  • Plotly: 5.24.1
  • Python: 3.10.12
Downloads last month
-
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support