MARTINI_enrich_BERTopic_tahirsimsektv

This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.

Usage

To use this model, please install BERTopic:

pip install -U bertopic

You can use the model as follows:

from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_tahirsimsektv")

topic_model.get_topic_info()

Topic overview

  • Number of topics: 20
  • Number of training documents: 3150
Click here for an overview of all topics.
Topic ID Topic Keywords Topic Frequency Label
-1 bakanlıgı - erdogan - cumhurbaskanı - tahirsimsek - istanbul 20 -1_bakanlıgı_erdogan_cumhurbaskanı_tahirsimsek
0 agırlastırılmıs - saldırısına - carptırıldı - babası - tartıstıgı 2014 0_agırlastırılmıs_saldırısına_carptırıldı_babası
1 fiyatların - lirayı - ekmek - dolar - milyon 244 1_fiyatların_lirayı_ekmek_dolar
2 sayfamızın - takipcimiz - aklı - parmagını - ahlaksızlık 95 2_sayfamızın_takipcimiz_aklı_parmagını
3 erdogan - bakanı - cumhurbaskanlıgı - davutoglu - mehmet 76 3_erdogan_bakanı_cumhurbaskanlıgı_davutoglu
4 harekatı - irak - kuzeyindeki - suleymaniye - teroristlerin 68 4_harekatı_irak_kuzeyindeki_suleymaniye
5 videoları - dediklerimi - olacaksınız - atacagım - tıklayın 65 5_videoları_dediklerimi_olacaksınız_atacagım
6 istanbul - kameralarına - saldırganın - bassavcılıgı - polisevi 65 6_istanbul_kameralarına_saldırganın_bassavcılıgı
7 carpması - kaldırılırken - taksici - diyarbakır - motosikletli 65 7_carpması_kaldırılırken_taksici_diyarbakır
8 kharkov - mariupol - ukraynalı - rusya - tankına 58 8_kharkov_mariupol_ukraynalı_rusya
9 donetsk - putin - cavusoglu - federasyonu - sergey 57 9_donetsk_putin_cavusoglu_federasyonu
10 hamas - netanyahu - basbakanı - filistinlileri - saygısızlıga 46 10_hamas_netanyahu_basbakanı_filistinlileri
11 insallah - namaz - fatiha - ramazan - gunahlarını 44 11_insallah_namaz_fatiha_ramazan
12 ramazanaltug_ - tahirsimsekislam - instagramdaki - danısmanlarımız - paylasacagım 42 12_ramazanaltug__tahirsimsekislam_instagramdaki_danısmanlarımız
13 israillinin - bombardıman - sıgınırken - evladına - kampına 42 13_israillinin_bombardıman_sıgınırken_evladına
14 kovid - karantinaya - hastalıktır - enfeksiyon - olmayacagı 37 14_kovid_karantinaya_hastalıktır_enfeksiyon
15 cumhuriyet - sayfalarının - platformları - bassavcılıgınca - sosyal 32 15_cumhuriyet_sayfalarının_platformları_bassavcılıgınca
16 ihbarına - saldırdıgı - kacırılıp - izmir - magandaları 31 16_ihbarına_saldırdıgı_kacırılıp_izmir
17 enkazında - hasarın - diyarbakır - sanlıurfa - yasadıgımız 25 17_enkazında_hasarın_diyarbakır_sanlıurfa
18 yıldızın - astrofizikci - tsunamisi - mars - sensorlerimiz 24 18_yıldızın_astrofizikci_tsunamisi_mars

Training hyperparameters

  • calculate_probabilities: True
  • language: None
  • low_memory: False
  • min_topic_size: 10
  • n_gram_range: (1, 1)
  • nr_topics: None
  • seed_topic_list: None
  • top_n_words: 10
  • verbose: False
  • zeroshot_min_similarity: 0.7
  • zeroshot_topic_list: None

Framework versions

  • Numpy: 1.26.4
  • HDBSCAN: 0.8.40
  • UMAP: 0.5.7
  • Pandas: 2.2.3
  • Scikit-Learn: 1.5.2
  • Sentence-transformers: 3.3.1
  • Transformers: 4.46.3
  • Numba: 0.60.0
  • Plotly: 5.24.1
  • Python: 3.10.12
Downloads last month
-
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support