MARTINI_enrich_BERTopic_ZoroKanalas

This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.

Usage

To use this model, please install BERTopic:

pip install -U bertopic

You can use the model as follows:

from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_ZoroKanalas")

topic_model.get_topic_info()

Topic overview

  • Number of topics: 32
  • Number of training documents: 3720
Click here for an overview of all topics.
Topic ID Topic Keywords Topic Frequency Label
-1 lietuva - skaicius - pasaulyje - visiskai - vakcinos 20 -1_lietuva_skaicius_pasaulyje_visiskai
0 milteliai - produktu - kolageno - alergija - aliuminio 2424 0_milteliai_produktu_kolageno_alergija
1 policijai - priezasciai - sulaikytas - protestuotoju - komisariato 138 1_policijai_priezasciai_sulaikytas_protestuotoju
2 pasakyti - garsiai - sunkiausias - ignoruoti - stiklaini 100 2_pasakyti_garsiai_sunkiausias_ignoruoti
3 zelenskiui - volodymyru - prezidentu - rusija - oleksandras 75 3_zelenskiui_volodymyru_prezidentu_rusija
4 palestinieciai - izraeliui - netanyahu - protestai - ispuoliai 60 4_palestinieciai_izraeliui_netanyahu_protestai
5 bankininkystes - bankroto - hsbc - natwest - lloyds 60 5_bankininkystes_bankroto_hsbc_natwest
6 transseksualu - pedofilijos - propagandos - europride - klubai 53 6_transseksualu_pedofilijos_propagandos_europride
7 prancuzijai - protestuotojus - reformos - tukstanciai - pensiju 52 7_prancuzijai_protestuotojus_reformos_tukstanciai
8 automobilis - moters - elektriniai - vairuotoja - mozhaisko 50 8_automobilis_moters_elektriniai_vairuotoja
9 gatesas - billo - pandemijai - milijonu - patentas 49 9_gatesas_billo_pandemijai_milijonu
10 ukrainietiskas - nacionalistai - slava - lietu - grybavo 47 10_ukrainietiskas_nacionalistai_slava_lietu
11 pfizer - revakcinacijos - koronavirusa - mutacijas - nukreiptos 43 11_pfizer_revakcinacijos_koronavirusa_mutacijas
12 ukrainieciu - rusija - raketiniu - novoselkovkos - armijos 41 12_ukrainieciu_rusija_raketiniu_novoselkovkos
13 vakcinuotiems - antivaksere - covid - daktarai - dasigyvenome 40 13_vakcinuotiems_antivaksere_covid_daktarai
14 trumpas - clinton - respublikonus - prisiekusiuju - 2016 35 14_trumpas_clinton_respublikonus_prisiekusiuju
15 bidenas - prezidento - kandidatuodamas - joe - jubiliejui 33 15_bidenas_prezidento_kandidatuodamas_joe
16 britanijos - banko - ekonomini - sterlingu - pirmininkui 33 16_britanijos_banko_ekonomini_sterlingu
17 putinu - vladimira - preobrazhensky - aleksandras - siberia 33 17_putinu_vladimira_preobrazhensky_aleksandras
18 imigrantai - vietiniai - dublino - nekontroliuojama - patruliu 32 18_imigrantai_vietiniai_dublino_nekontroliuojama
19 schwabas - ekonomistas - wef - globalistu - privaziavimo 30 19_schwabas_ekonomistas_wef_globalistu
20 suksniai - tatuiruotemis - apipjaustymas - praktikuojama - beginkli 29 20_suksniai_tatuiruotemis_apipjaustymas_praktikuojama
21 kanadieciu - trudeau - ontarijo - eutanazuoja - tironiskaja 28 21_kanadieciu_trudeau_ontarijo_eutanazuoja
22 gravitacijos - skysciai - antarktida - meteoritas - zemelapyje 27 22_gravitacijos_skysciai_antarktida_meteoritas
23 pmc - ivanovskoje - minosvaidziai - bakhmuto - wagneriui 26 23_pmc_ivanovskoje_minosvaidziai_bakhmuto
24 vakcinacijos - koronaviruso - astrazeneca - 2021 - meningitas 26 24_vakcinacijos_koronaviruso_astrazeneca_2021
25 internetiniuose - dezinformacija - facebook - komentarus - apgaudinetojus 23 25_internetiniuose_dezinformacija_facebook_komentarus
26 televizoriaus - lietuvisku - filmuojancios - dinozaurai - tv3 23 26_televizoriaus_lietuvisku_filmuojancios_dinozaurai
27 klimatas - atmosferoje - greenpeace - dioksido - priesingai 23 27_klimatas_atmosferoje_greenpeace_dioksido
28 karaliskieji - princese - britanijos - elizabeth - charleso 23 28_karaliskieji_princese_britanijos_elizabeth
29 italija - sicilijoje - giuseppe - itariamieji - federica 22 29_italija_sicilijoje_giuseppe_itariamieji
30 turkija - kılıcdaroglu - putinu - milijonu - sirijos 22 30_turkija_kılıcdaroglu_putinu_milijonu

Training hyperparameters

  • calculate_probabilities: True
  • language: None
  • low_memory: False
  • min_topic_size: 10
  • n_gram_range: (1, 1)
  • nr_topics: None
  • seed_topic_list: None
  • top_n_words: 10
  • verbose: False
  • zeroshot_min_similarity: 0.7
  • zeroshot_topic_list: None

Framework versions

  • Numpy: 1.26.4
  • HDBSCAN: 0.8.40
  • UMAP: 0.5.7
  • Pandas: 2.2.3
  • Scikit-Learn: 1.5.2
  • Sentence-transformers: 3.3.1
  • Transformers: 4.46.3
  • Numba: 0.60.0
  • Plotly: 5.24.1
  • Python: 3.10.12
Downloads last month
-
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support