Add BERTopic model
Browse files- README.md +119 -0
- config.json +17 -0
- ctfidf.safetensors +3 -0
- ctfidf_config.json +0 -0
- topic_embeddings.safetensors +3 -0
- topics.json +0 -0
README.md
ADDED
|
@@ -0,0 +1,119 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
|
| 2 |
+
---
|
| 3 |
+
tags:
|
| 4 |
+
- bertopic
|
| 5 |
+
library_name: bertopic
|
| 6 |
+
pipeline_tag: text-classification
|
| 7 |
+
---
|
| 8 |
+
|
| 9 |
+
# FondoEsperanzav1
|
| 10 |
+
|
| 11 |
+
This is a [BERTopic](https://github.com/MaartenGr/BERTopic) model.
|
| 12 |
+
BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.
|
| 13 |
+
|
| 14 |
+
## Usage
|
| 15 |
+
|
| 16 |
+
To use this model, please install BERTopic:
|
| 17 |
+
|
| 18 |
+
```
|
| 19 |
+
pip install -U bertopic
|
| 20 |
+
```
|
| 21 |
+
|
| 22 |
+
You can use the model as follows:
|
| 23 |
+
|
| 24 |
+
```python
|
| 25 |
+
from bertopic import BERTopic
|
| 26 |
+
topic_model = BERTopic.load("JGamonalHML/FondoEsperanzav1")
|
| 27 |
+
|
| 28 |
+
topic_model.get_topic_info()
|
| 29 |
+
```
|
| 30 |
+
|
| 31 |
+
## Topic overview
|
| 32 |
+
|
| 33 |
+
* Number of topics: 50
|
| 34 |
+
* Number of training documents: 12530
|
| 35 |
+
|
| 36 |
+
<details>
|
| 37 |
+
<summary>Click here for an overview of all topics.</summary>
|
| 38 |
+
|
| 39 |
+
| Topic ID | Topic Keywords | Topic Frequency | Label |
|
| 40 |
+
|----------|----------------|-----------------|-------|
|
| 41 |
+
| -1 | entendieron - ideado - n4gocios - nuesttos - profecialismo | 14 | -1_entendieron_ideado_n4gocios_nuesttos |
|
| 42 |
+
| 0 | emprendedores - ayuda - negocio - crecer - gran | 4 | 0_emprendedores_ayuda_negocio_crecer |
|
| 43 |
+
| 1 | recomiendo - recomendar铆a - emprendimiento - recomendaria - si | 2533 | 1_recomiendo_recomendar铆a_emprendimiento_recomendaria |
|
| 44 |
+
| 2 | financiamiento - econ贸mica - econ贸mico - alternativa - buena | 655 | 2_financiamiento_econ贸mica_econ贸mico_alternativa |
|
| 45 |
+
| 3 | intereses - bajos - bajo - inter茅s - interes | 491 | 3_intereses_bajos_bajo_inter茅s |
|
| 46 |
+
| 4 | confiable - transparencia - seguro - transparente - confianza | 528 | 4_confiable_transparencia_seguro_transparente |
|
| 47 |
+
| 5 | ayuda - gran - emprender - apoyo - pymes | 380 | 5_ayuda_gran_emprender_apoyo |
|
| 48 |
+
| 6 | ayudado - sido - negocio - emprendimiento - crecer | 782 | 6_ayudado_sido_negocio_emprendimiento |
|
| 49 |
+
| 7 | socios - pagar - socio - si - solo | 365 | 7_socios_pagar_socio_si |
|
| 50 |
+
| 8 | esperanza - fondo - gracias - a帽os - da | 347 | 8_esperanza_fondo_gracias_a帽os |
|
| 51 |
+
| 9 | emprender - oportunidad - buena - bueno - opci贸n | 568 | 9_emprender_oportunidad_buena_bueno |
|
| 52 |
+
| 10 | credito - facilidad - cr茅dito - obtener - pr茅stamo | 589 | 10_credito_facilidad_cr茅dito_obtener |
|
| 53 |
+
| 11 | cuotas - pago - mensual - pagar - mes | 361 | 11_cuotas_pago_mensual_pagar |
|
| 54 |
+
| 12 | grupo - agradecida - gracias - contenta - equipo | 296 | 12_grupo_agradecida_gracias_contenta |
|
| 55 |
+
| 13 | bancos - personas - pueden - podemos - optar | 305 | 13_bancos_personas_pueden_podemos |
|
| 56 |
+
| 14 | experiencia - buena - sido - general - mala | 333 | 14_experiencia_buena_sido_general |
|
| 57 |
+
| 15 | banco - comunal - buen - serio - asesora | 324 | 15_banco_comunal_buen_serio |
|
| 58 |
+
| 16 | pago - pagos - facilidad - flexibilidad - facilidades | 460 | 16_pago_pagos_facilidad_flexibilidad |
|
| 59 |
+
| 17 | instituci贸n - seria - institucion - confiable - entidad | 228 | 17_instituci贸n_seria_institucion_confiable |
|
| 60 |
+
| 18 | tasa - baja - inter茅s - taza - interes | 187 | 18_tasa_baja_inter茅s_taza |
|
| 61 |
+
| 19 | seguir - emprendiendo - creciendo - crecer - ayuda | 222 | 19_seguir_emprendiendo_creciendo_crecer |
|
| 62 |
+
| 20 | eficiente - simple - sirve - eficaz - rapido | 179 | 20_eficiente_simple_sirve_eficaz |
|
| 63 |
+
| 21 | reuniones - presenciales - online - asistir - reuni贸n | 135 | 21_reuniones_presenciales_online_asistir |
|
| 64 |
+
| 22 | asesora - grupo - socios - relaci贸n - excelente | 190 | 22_asesora_grupo_socios_relaci贸n |
|
| 65 |
+
| 23 | asesora - asesor - mala - cambio - asesoras | 171 | 23_asesora_asesor_mala_cambio |
|
| 66 |
+
| 24 | caja - chica - dijo - asesora - mal | 146 | 24_caja_chica_dijo_asesora |
|
| 67 |
+
| 25 | servido - ayudado - bastante - ayud贸 - sirvi贸 | 112 | 25_servido_ayudado_bastante_ayud贸 |
|
| 68 |
+
| 26 | responsabilidad - responsable - seriedad - responsables - ser | 136 | 26_responsabilidad_responsable_seriedad_responsables |
|
| 69 |
+
| 27 | recomendar - mal - persona - gusta - miedo | 195 | 27_recomendar_mal_persona_gusta |
|
| 70 |
+
| 28 | servicio - sistema - excelente - buen - amigable | 97 | 28_servicio_sistema_excelente_buen |
|
| 71 |
+
| 29 | porq - pq - emprendedores - bueno - da | 116 | 29_porq_pq_emprendedores_bueno |
|
| 72 |
+
| 30 | interes - habiamos - excente - facilitan - reunion | 96 | 30_interes_habiamos_excente_facilitan |
|
| 73 |
+
| 31 | socios - beneficios - relaci贸n - compromiso - responsables | 48 | 31_socios_beneficios_relaci贸n_compromiso |
|
| 74 |
+
| 32 | xq - esbuna - recomiendo - ayuda - xk | 137 | 32_xq_esbuna_recomiendo_ayuda |
|
| 75 |
+
| 33 | comerciantes - peque帽os - comerciante - peque帽o - ayuda | 47 | 33_comerciantes_peque帽os_comerciante_peque帽o |
|
| 76 |
+
| 34 | seguro - contrat茅 - seguros - contrate - cubre | 41 | 34_seguro_contrat茅_seguros_contrate |
|
| 77 |
+
| 35 | mujeres - casa - due帽as - mujer - hijos | 57 | 35_mujeres_casa_due帽as_mujer |
|
| 78 |
+
| 36 | independiente - independientes - trabajadores - ser - cuentan | 41 | 36_independiente_independientes_trabajadores_ser |
|
| 79 |
+
| 37 | esperanza - fondo - momento - verdad - problema | 38 | 37_esperanza_fondo_momento_verdad |
|
| 80 |
+
| 38 | firma - digital - funciona - aplicaci贸n - complicado | 42 | 38_firma_digital_funciona_aplicaci贸n |
|
| 81 |
+
| 39 | f谩cil - facil - acceso - accesible - acceder | 40 | 39_f谩cil_facil_acceso_accesible |
|
| 82 |
+
| 40 | 100 - ciento - recomendable - recomiendo - recomendado | 83 | 40_100_ciento_recomendable_recomiendo |
|
| 83 |
+
| 41 | familia - familias - levantar - opinar - pura | 36 | 41_familia_familias_levantar_opinar |
|
| 84 |
+
| 42 | poca - empat铆a - empatia - falta - tolerancia | 37 | 42_poca_empat铆a_empatia_falta |
|
| 85 |
+
| 43 | bien - gracias - claro - anteriores - todas | 39 | 43_bien_gracias_claro_anteriores |
|
| 86 |
+
| 44 | flexibilidad - flexible - poca - flexibles - cr茅ditos | 88 | 44_flexibilidad_flexible_poca_flexibles |
|
| 87 |
+
| 45 | proceso - informaci贸n - falta - procesos - lento | 82 | 45_proceso_informaci贸n_falta_procesos |
|
| 88 |
+
| 46 | piden - documentos - expedito - papeleo - tantos | 55 | 46_piden_documentos_expedito_papeleo |
|
| 89 |
+
| 47 | comunicaci贸n - comunicacion - poca - claridad - transparentes | 33 | 47_comunicaci贸n_comunicacion_poca_claridad |
|
| 90 |
+
| 48 | pork - ke - porke - porqe - factivilidad | 41 | 48_pork_ke_porke_porqe |
|
| 91 |
+
|
| 92 |
+
</details>
|
| 93 |
+
|
| 94 |
+
## Training hyperparameters
|
| 95 |
+
|
| 96 |
+
* calculate_probabilities: False
|
| 97 |
+
* language: multilingual
|
| 98 |
+
* low_memory: False
|
| 99 |
+
* min_topic_size: 10
|
| 100 |
+
* n_gram_range: (1, 1)
|
| 101 |
+
* nr_topics: 50
|
| 102 |
+
* seed_topic_list: None
|
| 103 |
+
* top_n_words: 10
|
| 104 |
+
* verbose: False
|
| 105 |
+
* zeroshot_min_similarity: 0.7
|
| 106 |
+
* zeroshot_topic_list: None
|
| 107 |
+
|
| 108 |
+
## Framework versions
|
| 109 |
+
|
| 110 |
+
* Numpy: 2.2.5
|
| 111 |
+
* HDBSCAN: 0.8.40
|
| 112 |
+
* UMAP: 0.5.7
|
| 113 |
+
* Pandas: 2.2.3
|
| 114 |
+
* Scikit-Learn: 1.6.1
|
| 115 |
+
* Sentence-transformers: 4.1.0
|
| 116 |
+
* Transformers: 4.51.3
|
| 117 |
+
* Numba: 0.61.2
|
| 118 |
+
* Plotly: 6.0.1
|
| 119 |
+
* Python: 3.12.1
|
config.json
ADDED
|
@@ -0,0 +1,17 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"calculate_probabilities": false,
|
| 3 |
+
"language": "multilingual",
|
| 4 |
+
"low_memory": false,
|
| 5 |
+
"min_topic_size": 10,
|
| 6 |
+
"n_gram_range": [
|
| 7 |
+
1,
|
| 8 |
+
1
|
| 9 |
+
],
|
| 10 |
+
"nr_topics": 50,
|
| 11 |
+
"seed_topic_list": null,
|
| 12 |
+
"top_n_words": 10,
|
| 13 |
+
"verbose": false,
|
| 14 |
+
"zeroshot_min_similarity": 0.7,
|
| 15 |
+
"zeroshot_topic_list": null,
|
| 16 |
+
"embedding_model": "sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2"
|
| 17 |
+
}
|
ctfidf.safetensors
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:bd5caa27d55a90fd5754327a031cb91438452aa03926756f4db13ffbc1df9e87
|
| 3 |
+
size 498724
|
ctfidf_config.json
ADDED
|
The diff for this file is too large to render.
See raw diff
|
|
|
topic_embeddings.safetensors
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:e5eb490e9841c4207660a6a1c70cbd0543dcc377f557faae87e402901b781054
|
| 3 |
+
size 76888
|
topics.json
ADDED
|
The diff for this file is too large to render.
See raw diff
|
|
|