JGamonalHML commited on
Commit
717c8fa
verified
1 Parent(s): 25e9b46

Add BERTopic model

Browse files
README.md ADDED
@@ -0,0 +1,119 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+
2
+ ---
3
+ tags:
4
+ - bertopic
5
+ library_name: bertopic
6
+ pipeline_tag: text-classification
7
+ ---
8
+
9
+ # FondoEsperanzav1
10
+
11
+ This is a [BERTopic](https://github.com/MaartenGr/BERTopic) model.
12
+ BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.
13
+
14
+ ## Usage
15
+
16
+ To use this model, please install BERTopic:
17
+
18
+ ```
19
+ pip install -U bertopic
20
+ ```
21
+
22
+ You can use the model as follows:
23
+
24
+ ```python
25
+ from bertopic import BERTopic
26
+ topic_model = BERTopic.load("JGamonalHML/FondoEsperanzav1")
27
+
28
+ topic_model.get_topic_info()
29
+ ```
30
+
31
+ ## Topic overview
32
+
33
+ * Number of topics: 50
34
+ * Number of training documents: 12530
35
+
36
+ <details>
37
+ <summary>Click here for an overview of all topics.</summary>
38
+
39
+ | Topic ID | Topic Keywords | Topic Frequency | Label |
40
+ |----------|----------------|-----------------|-------|
41
+ | -1 | entendieron - ideado - n4gocios - nuesttos - profecialismo | 14 | -1_entendieron_ideado_n4gocios_nuesttos |
42
+ | 0 | emprendedores - ayuda - negocio - crecer - gran | 4 | 0_emprendedores_ayuda_negocio_crecer |
43
+ | 1 | recomiendo - recomendar铆a - emprendimiento - recomendaria - si | 2533 | 1_recomiendo_recomendar铆a_emprendimiento_recomendaria |
44
+ | 2 | financiamiento - econ贸mica - econ贸mico - alternativa - buena | 655 | 2_financiamiento_econ贸mica_econ贸mico_alternativa |
45
+ | 3 | intereses - bajos - bajo - inter茅s - interes | 491 | 3_intereses_bajos_bajo_inter茅s |
46
+ | 4 | confiable - transparencia - seguro - transparente - confianza | 528 | 4_confiable_transparencia_seguro_transparente |
47
+ | 5 | ayuda - gran - emprender - apoyo - pymes | 380 | 5_ayuda_gran_emprender_apoyo |
48
+ | 6 | ayudado - sido - negocio - emprendimiento - crecer | 782 | 6_ayudado_sido_negocio_emprendimiento |
49
+ | 7 | socios - pagar - socio - si - solo | 365 | 7_socios_pagar_socio_si |
50
+ | 8 | esperanza - fondo - gracias - a帽os - da | 347 | 8_esperanza_fondo_gracias_a帽os |
51
+ | 9 | emprender - oportunidad - buena - bueno - opci贸n | 568 | 9_emprender_oportunidad_buena_bueno |
52
+ | 10 | credito - facilidad - cr茅dito - obtener - pr茅stamo | 589 | 10_credito_facilidad_cr茅dito_obtener |
53
+ | 11 | cuotas - pago - mensual - pagar - mes | 361 | 11_cuotas_pago_mensual_pagar |
54
+ | 12 | grupo - agradecida - gracias - contenta - equipo | 296 | 12_grupo_agradecida_gracias_contenta |
55
+ | 13 | bancos - personas - pueden - podemos - optar | 305 | 13_bancos_personas_pueden_podemos |
56
+ | 14 | experiencia - buena - sido - general - mala | 333 | 14_experiencia_buena_sido_general |
57
+ | 15 | banco - comunal - buen - serio - asesora | 324 | 15_banco_comunal_buen_serio |
58
+ | 16 | pago - pagos - facilidad - flexibilidad - facilidades | 460 | 16_pago_pagos_facilidad_flexibilidad |
59
+ | 17 | instituci贸n - seria - institucion - confiable - entidad | 228 | 17_instituci贸n_seria_institucion_confiable |
60
+ | 18 | tasa - baja - inter茅s - taza - interes | 187 | 18_tasa_baja_inter茅s_taza |
61
+ | 19 | seguir - emprendiendo - creciendo - crecer - ayuda | 222 | 19_seguir_emprendiendo_creciendo_crecer |
62
+ | 20 | eficiente - simple - sirve - eficaz - rapido | 179 | 20_eficiente_simple_sirve_eficaz |
63
+ | 21 | reuniones - presenciales - online - asistir - reuni贸n | 135 | 21_reuniones_presenciales_online_asistir |
64
+ | 22 | asesora - grupo - socios - relaci贸n - excelente | 190 | 22_asesora_grupo_socios_relaci贸n |
65
+ | 23 | asesora - asesor - mala - cambio - asesoras | 171 | 23_asesora_asesor_mala_cambio |
66
+ | 24 | caja - chica - dijo - asesora - mal | 146 | 24_caja_chica_dijo_asesora |
67
+ | 25 | servido - ayudado - bastante - ayud贸 - sirvi贸 | 112 | 25_servido_ayudado_bastante_ayud贸 |
68
+ | 26 | responsabilidad - responsable - seriedad - responsables - ser | 136 | 26_responsabilidad_responsable_seriedad_responsables |
69
+ | 27 | recomendar - mal - persona - gusta - miedo | 195 | 27_recomendar_mal_persona_gusta |
70
+ | 28 | servicio - sistema - excelente - buen - amigable | 97 | 28_servicio_sistema_excelente_buen |
71
+ | 29 | porq - pq - emprendedores - bueno - da | 116 | 29_porq_pq_emprendedores_bueno |
72
+ | 30 | interes - habiamos - excente - facilitan - reunion | 96 | 30_interes_habiamos_excente_facilitan |
73
+ | 31 | socios - beneficios - relaci贸n - compromiso - responsables | 48 | 31_socios_beneficios_relaci贸n_compromiso |
74
+ | 32 | xq - esbuna - recomiendo - ayuda - xk | 137 | 32_xq_esbuna_recomiendo_ayuda |
75
+ | 33 | comerciantes - peque帽os - comerciante - peque帽o - ayuda | 47 | 33_comerciantes_peque帽os_comerciante_peque帽o |
76
+ | 34 | seguro - contrat茅 - seguros - contrate - cubre | 41 | 34_seguro_contrat茅_seguros_contrate |
77
+ | 35 | mujeres - casa - due帽as - mujer - hijos | 57 | 35_mujeres_casa_due帽as_mujer |
78
+ | 36 | independiente - independientes - trabajadores - ser - cuentan | 41 | 36_independiente_independientes_trabajadores_ser |
79
+ | 37 | esperanza - fondo - momento - verdad - problema | 38 | 37_esperanza_fondo_momento_verdad |
80
+ | 38 | firma - digital - funciona - aplicaci贸n - complicado | 42 | 38_firma_digital_funciona_aplicaci贸n |
81
+ | 39 | f谩cil - facil - acceso - accesible - acceder | 40 | 39_f谩cil_facil_acceso_accesible |
82
+ | 40 | 100 - ciento - recomendable - recomiendo - recomendado | 83 | 40_100_ciento_recomendable_recomiendo |
83
+ | 41 | familia - familias - levantar - opinar - pura | 36 | 41_familia_familias_levantar_opinar |
84
+ | 42 | poca - empat铆a - empatia - falta - tolerancia | 37 | 42_poca_empat铆a_empatia_falta |
85
+ | 43 | bien - gracias - claro - anteriores - todas | 39 | 43_bien_gracias_claro_anteriores |
86
+ | 44 | flexibilidad - flexible - poca - flexibles - cr茅ditos | 88 | 44_flexibilidad_flexible_poca_flexibles |
87
+ | 45 | proceso - informaci贸n - falta - procesos - lento | 82 | 45_proceso_informaci贸n_falta_procesos |
88
+ | 46 | piden - documentos - expedito - papeleo - tantos | 55 | 46_piden_documentos_expedito_papeleo |
89
+ | 47 | comunicaci贸n - comunicacion - poca - claridad - transparentes | 33 | 47_comunicaci贸n_comunicacion_poca_claridad |
90
+ | 48 | pork - ke - porke - porqe - factivilidad | 41 | 48_pork_ke_porke_porqe |
91
+
92
+ </details>
93
+
94
+ ## Training hyperparameters
95
+
96
+ * calculate_probabilities: False
97
+ * language: multilingual
98
+ * low_memory: False
99
+ * min_topic_size: 10
100
+ * n_gram_range: (1, 1)
101
+ * nr_topics: 50
102
+ * seed_topic_list: None
103
+ * top_n_words: 10
104
+ * verbose: False
105
+ * zeroshot_min_similarity: 0.7
106
+ * zeroshot_topic_list: None
107
+
108
+ ## Framework versions
109
+
110
+ * Numpy: 2.2.5
111
+ * HDBSCAN: 0.8.40
112
+ * UMAP: 0.5.7
113
+ * Pandas: 2.2.3
114
+ * Scikit-Learn: 1.6.1
115
+ * Sentence-transformers: 4.1.0
116
+ * Transformers: 4.51.3
117
+ * Numba: 0.61.2
118
+ * Plotly: 6.0.1
119
+ * Python: 3.12.1
config.json ADDED
@@ -0,0 +1,17 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "calculate_probabilities": false,
3
+ "language": "multilingual",
4
+ "low_memory": false,
5
+ "min_topic_size": 10,
6
+ "n_gram_range": [
7
+ 1,
8
+ 1
9
+ ],
10
+ "nr_topics": 50,
11
+ "seed_topic_list": null,
12
+ "top_n_words": 10,
13
+ "verbose": false,
14
+ "zeroshot_min_similarity": 0.7,
15
+ "zeroshot_topic_list": null,
16
+ "embedding_model": "sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2"
17
+ }
ctfidf.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:bd5caa27d55a90fd5754327a031cb91438452aa03926756f4db13ffbc1df9e87
3
+ size 498724
ctfidf_config.json ADDED
The diff for this file is too large to render. See raw diff
 
topic_embeddings.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:e5eb490e9841c4207660a6a1c70cbd0543dcc377f557faae87e402901b781054
3
+ size 76888
topics.json ADDED
The diff for this file is too large to render. See raw diff