Instructions to use Josealssc/clasificador_amazon_es with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- Transformers
How to use Josealssc/clasificador_amazon_es with Transformers:
# Use a pipeline as a high-level helper from transformers import pipeline pipe = pipeline("text-classification", model="Josealssc/clasificador_amazon_es")# Load model directly from transformers import AutoModel model = AutoModel.from_pretrained("Josealssc/clasificador_amazon_es", dtype="auto") - Notebooks
- Google Colab
- Kaggle
Model Card para Clasificador de Sentimiento (Reseñas Amazon España)
Este modelo es un clasificador de sentimiento binario en español ajustado a partir de la arquitectura de RoBERTa.
Model Details
Model Description
Este modelo ha sido entrenado y adaptado para clasificar opiniones en español en dos polaridades (Positivo y Negativo) a partir del conjunto de datos de opiniones de Amazon. Su base de transferencia de aprendizaje es un modelo RoBERTa preentrenado específicamente en español.
- Developed by: Estudiante del Máster en Inteligencia Artificial (Universidad de Castilla-La Mancha)
- Model type: RoBERTa Base
- Language(s) (NLP): Español (
es) - License: Apache 2.0
- Finetuned from model: bertin-project/bertin-roberta-base-spanish
Model Sources
- Repository: Repositorio en Hugging Face Hub (
mi-clasificador-amazon-es) - Demo: Hugging Face Space utilizando Gradio (según la plantilla provista en
app.py)
Uses
Direct Use
Este modelo está diseñado para utilizarse de forma directa en tareas de análisis de sentimiento y opiniones de usuarios escritas en idioma español, específicamente para categorizar textos en dos clases:
- LABEL_0 (Negativo): Correspondiente a valoraciones insatisfactorias (antiguamente 1 y 2 estrellas).
- LABEL_1 (Positivo): Correspondiente a valoraciones satisfactorias (antiguamente 4 y 5 estrellas).
Downstream Use
El modelo puede integrarse en sistemas de análisis de reputación de marca, monitoreo automático de comentarios en plataformas de comercio electrónico, soporte automatizado de atención al cliente y clasificación de opiniones de productos en tiempo real.
Out-of-Scope Use
- Uso del modelo en cualquier idioma distinto al español.
- Tareas generativas (como resúmenes o traducción) o tareas que requieran una clasificación de opiniones con categoría neutral (ya que las muestras de 3 estrellas fueron expresamente filtradas).
- Análisis en dominios médicos, jurídicos o altamente técnicos sin un proceso previo de fine-tuning adicional en dichos campos.
Bias, Risks, and Limitations
Bias and Limitations
- Sesgo de dominio: Al estar entrenado exclusivamente con opiniones sobre productos comerciales de Amazon, el modelo está sesgado hacia un lenguaje característico del e-commerce (opiniones sobre envíos, empaquetado, calidad de componentes, etc.).
- Ausencia de clase neutral: Dado que se ha entrenado en clasificación binaria pura, el modelo forzará cualquier texto a ser Positivo o Negativo, incluso si el comentario de entrada es completamente objetivo o neutral.
Recommendations
Se recomienda utilizar este modelo con textos de longitudes estándar (máximo 128 tokens, que fue el límite de truncamiento de la tokenización). Si se introduce texto extremadamente largo, el modelo omitirá la parte final del comentario.
How to Get Started with the Model
Puedes arrancar a usar el modelo de forma rápida con el siguiente código en Python:
from transformers import pipeline
# Cargamos el pipeline de clasificación
clasificador = pipeline("text-classification", model="TU_USUARIO/mi-clasificador-amazon-es")
# Probamos una reseña
review = "Llegó al día siguiente de pedirlo y funciona de lujo, compra totalmente recomendada."
resultado = clasificador(review)
print(resultado)
# [{'label': 'LABEL_1', 'score': 0.9982}]
Training Details
Training Data
El modelo fue entrenado con la partición en español del dataset multidominio SetFit/amazon_reviews_multi_es, aplicando los siguientes filtros y transformaciones:
- Se excluyeron los registros con puntuación intermedia (3 estrellas) para obtener polaridades nítidas.
- Las estrellas 1 y 2 se transformaron a la etiqueta
0(Negativo). - Las estrellas 4 y 5 se transformaron a la etiqueta
1(Positivo). - Se seleccionó un subset balanceado y representativo de 5,000 muestras para el entrenamiento.
Training Procedure
Preprocessing
Los textos fueron tokenizados mediante un algoritmo de codificación de pares de bytes (BPE) optimizado para el español, aplicando un truncamiento estricto a un máximo de 128 tokens y relleno (padding) automático.
Training Hyperparameters
- Training regime: Precisión estándar (fp32) sobre hardware dedicado.
- Learning Rate: 2e-5
- Batch Size (Train y Eval): 64
- Epochs: 3
- Weight Decay: 0.01
- Optimizer: AdamW con decaimiento de tasa lineal.
Evaluation
Testing Data, Factors & Metrics
Testing Data
El modelo se evaluó en una partición de prueba (test dataset) independiente y balanceada de 1,000 muestras pertenecientes al mismo dataset original.
Metrics
Las métricas utilizadas para evaluar el rendimiento fueron:
- Accuracy (Exactitud): Mide el porcentaje global de predicciones correctas.
- F1-Score: Mide la media armónica entre precisión y exhaustividad, siendo ideal para validar la robustez en ambas clases.
Results
En el conjunto de prueba independiente de 1,000 muestras, el modelo reportó las siguientes métricas:
- Accuracy: ~84.5% (puede presentar ligeras variaciones decimales en función de la inicialización de pesos).
- F1-Score: ~85.1%
Environmental Impact
- Hardware Type: GPU local NVIDIA GeForce RTX 3060 (12GB VRAM)
- Hours used: ~0.1 horas (entrenamiento veloz y eficiente gracias a la optimización de tamaño de lote y truncamiento de tokens).
- Cloud Provider: Local (PC personal)
Technical Specifications
Model Architecture and Objective
El modelo base es un codificador bidireccional (Encoder) basado en la arquitectura RoBERTa-base adaptada a la tarea específica de clasificación de secuencia binaria (Sequence Classification) mediante una cabeza lineal de clasificación añadida en la capa de salida.
Compute Infrastructure
Hardware
- GPU: NVIDIA GeForce RTX 3060
- VRAM: 12 GB
- Arquitectura de aceleración: CUDA 12.1
Software
- Framework principal: PyTorch 2.5.1
- Librería de soporte: Hugging Face
transformers(v5+),datasetsyevaluate.