MARTINI_enrich_BERTopic_incicapz

This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.

Usage

To use this model, please install BERTopic:

pip install -U bertopic

You can use the model as follows:

from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_incicapz")

topic_model.get_topic_info()

Topic overview

  • Number of topics: 17
  • Number of training documents: 1596
Click here for an overview of all topics.
Topic ID Topic Keywords Topic Frequency Label
-1 kılıcdaroglu - koronavirus - buyuksehir - erdogan - sakarya 25 -1_kılıcdaroglu_koronavirus_buyuksehir_erdogan
0 fiyatları - lirası - ekmek - bankası - margarin 792 0_fiyatları_lirası_ekmek_bankası
1 koronavirusu - karantinaya - hastalıgım - diyarbakır - taburcu 121 1_koronavirusu_karantinaya_hastalıgım_diyarbakır
2 sarkıcı - suleyman - cumhurbaskanlıgı - salaksınız - erdogan 92 2_sarkıcı_suleyman_cumhurbaskanlıgı_salaksınız
3 koronaviruse - bagısıklık - enfeksiyon - profesor - mehmet 91 3_koronaviruse_bagısıklık_enfeksiyon_profesor
4 kovid - hastamızı - kaynaklı - sıfır - teskilatımızda 60 4_kovid_hastamızı_kaynaklı_sıfır
5 pınar - zanlısı - kadın - dogubayazıt - manavgat 56 5_pınar_zanlısı_kadın_dogubayazıt
6 putin - ukrayna - zelenskiy - bayraktar - aeroflot 52 6_putin_ukrayna_zelenskiy_bayraktar
7 salonları - cıkabilecek - sehirler - saat - pazar 49 7_salonları_cıkabilecek_sehirler_saat
8 instagram - kanalımızı - reklamını - kardashian - faydalanabilirsiniz 49 8_instagram_kanalımızı_reklamını_kardashian
9 diyarbakır - yaralılarımızın - kasırgasında - irak - bombalı 33 9_diyarbakır_yaralılarımızın_kasırgasında_irak
10 pfizer - koronavirusun - varyantına - ghebreyesus - kazanım 33 10_pfizer_koronavirusun_varyantına_ghebreyesus
11 okulların - uzatılmasında - kalkacagını - sabahcı - planlamaları 33 11_okulların_uzatılmasında_kalkacagını_sabahcı
12 koronavirus - hubei - sehirlerindeki - semptomları - yayılımının 29 12_koronavirus_hubei_sehirlerindeki_semptomları
13 polisi - korumalıgını - polisimizin - istanbul - kanunlar 27 13_polisi_korumalıgını_polisimizin_istanbul
14 italya - koronavirus - lombardiya - vakalarında - 270 27 14_italya_koronavirus_lombardiya_vakalarında
15 israilli - hamas - filistinisrailsavası - gazetelerinin - kanalı 27 15_israilli_hamas_filistinisrailsavası_gazetelerinin

Training hyperparameters

  • calculate_probabilities: True
  • language: None
  • low_memory: False
  • min_topic_size: 10
  • n_gram_range: (1, 1)
  • nr_topics: None
  • seed_topic_list: None
  • top_n_words: 10
  • verbose: False
  • zeroshot_min_similarity: 0.7
  • zeroshot_topic_list: None

Framework versions

  • Numpy: 1.26.4
  • HDBSCAN: 0.8.40
  • UMAP: 0.5.7
  • Pandas: 2.2.3
  • Scikit-Learn: 1.5.2
  • Sentence-transformers: 3.3.1
  • Transformers: 4.46.3
  • Numba: 0.60.0
  • Plotly: 5.24.1
  • Python: 3.10.12
Downloads last month
-
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support