bdplazo
/

opinion_classifier

@@ -1,31 +1,35 @@
----
-tags:
-- opinion-classifier
-- text-classification
-- transformers
-- gradio
----
 # Clasificador de Opiniones Multietiqueta
-Este módulo utiliza modelos de Transformers para preprocesar y clasificar opiniones en múltiples etiquetas como queja, sugerencia, agradecimiento, felicitación, ninguna y cambio positivo personal.
 ## Descripción
-Explica brevemente qué hace tu modelo, los datos en los que fue entrenado, y cualquier otra información relevante.
-## Cómo usar
-Aquí hay un ejemplo de cómo cargar y usar el modelo:
 ```python
-import pickle
 from huggingface_hub import hf_hub_download
 import ftfy
 import re
 import torch
 import numpy as np
 from transformers import DistilBertTokenizer, DistilBertModel
 def corregir_codificacion(texto):
     if isinstance(texto, str):
@@ -41,7 +45,7 @@ def preprocesar_texto(texto):
 class ClasificadorOpiniones:
     def __init__(self):
         model_path = hf_hub_download(repo_id="begoach1/opinion_classifier", filename="modelo_clasificador_reentrenado_lp_ros.pkl")
-        self.clf_combined = pickle.load(open(model_path, 'rb'))
         self.tokenizer = DistilBertTokenizer.from_pretrained('distilbert-base-multilingual-cased')
         self.model = DistilBertModel.from_pretrained('distilbert-base-multilingual-cased')
@@ -57,6 +61,17 @@ class ClasificadorOpiniones:
         resultado = dict(zip(etiquetas, prediccion[0]))
         return resultado
-clasificador = ClasificadorOpiniones()
-texto = "me gustó mucho, tengo más confianza en mí misma, ¡gracias!"
-print(clasificador.clasificar_opinion(texto))

 # Clasificador de Opiniones Multietiqueta
+Este modelo clasifica opiniones en múltiples etiquetas como queja, sugerencia, agradecimiento, felicitación, ninguna y cambio positivo personal.
 ## Descripción
+El modelo utiliza `DistilBERT` para la representación de textos y un `Logistic Regression` multietiqueta entrenado con `MultiOutputClassifier`. Se han aplicado técnicas de sobremuestreo (LP-ROS) para manejar el desbalance de clases.
+## Uso
+### Cargar el modelo con `huggingface_hub`
 ```python
 from huggingface_hub import hf_hub_download
+import joblib
+# Descargar y cargar el modelo
+model_path = hf_hub_download(repo_id="begoach1/opinion_classifier", filename="modelo_clasificador_reentrenado_lp_ros.pkl")
+clf_combined = joblib.load(model_path)
+Interfaz Gradio
+El modelo se puede probar directamente en una interfaz de Gradio. La interfaz toma un texto de opinión como entrada y devuelve las etiquetas correspondientes.
+python
+Copiar código
+import gradio as gr
+import joblib
 import ftfy
 import re
 import torch
 import numpy as np
 from transformers import DistilBertTokenizer, DistilBertModel
+from huggingface_hub import hf_hub_download
 def corregir_codificacion(texto):
     if isinstance(texto, str):
 class ClasificadorOpiniones:
     def __init__(self):
         model_path = hf_hub_download(repo_id="begoach1/opinion_classifier", filename="modelo_clasificador_reentrenado_lp_ros.pkl")
+        self.clf_combined = joblib.load(model_path)
         self.tokenizer = DistilBertTokenizer.from_pretrained('distilbert-base-multilingual-cased')
         self.model = DistilBertModel.from_pretrained('distilbert-base-multilingual-cased')
         resultado = dict(zip(etiquetas, prediccion[0]))
         return resultado
+def clasificar(texto):
+    clasificador = ClasificadorOpiniones()
+    resultado = clasificador.clasificar_opinion(texto)
+    return resultado
+iface = gr.Interface(
+    fn=clasificar,
+    inputs=gr.Textbox(lines=2, placeholder="Escribe tu opinión aquí..."),
+    outputs=gr.JSON(),
+    title="Clasificador de Opiniones Multietiqueta",
+    description="Ingresa un texto de opinión para obtener las etiquetas correspondientes."
+)
+iface.launch()