Model Card para Clasificador de Sentimiento (Reseñas Amazon España)

Este modelo es un clasificador de sentimiento binario en español ajustado a partir de la arquitectura de RoBERTa.

Model Details

Model Description

Este modelo ha sido entrenado y adaptado para clasificar opiniones en español en dos polaridades (Positivo y Negativo) a partir del conjunto de datos de opiniones de Amazon. Su base de transferencia de aprendizaje es un modelo RoBERTa preentrenado específicamente en español.

Developed by: Estudiante del Máster en Inteligencia Artificial (Universidad de Castilla-La Mancha)
Model type: RoBERTa Base
Language(s) (NLP): Español (es)
License: Apache 2.0
Finetuned from model: bertin-project/bertin-roberta-base-spanish

Model Sources

Repository: Repositorio en Hugging Face Hub (mi-clasificador-amazon-es)
Demo: Hugging Face Space utilizando Gradio (según la plantilla provista en app.py)

Uses

Direct Use

Este modelo está diseñado para utilizarse de forma directa en tareas de análisis de sentimiento y opiniones de usuarios escritas en idioma español, específicamente para categorizar textos en dos clases:

LABEL_0 (Negativo): Correspondiente a valoraciones insatisfactorias (antiguamente 1 y 2 estrellas).
LABEL_1 (Positivo): Correspondiente a valoraciones satisfactorias (antiguamente 4 y 5 estrellas).

Downstream Use

El modelo puede integrarse en sistemas de análisis de reputación de marca, monitoreo automático de comentarios en plataformas de comercio electrónico, soporte automatizado de atención al cliente y clasificación de opiniones de productos en tiempo real.

Out-of-Scope Use

Uso del modelo en cualquier idioma distinto al español.
Tareas generativas (como resúmenes o traducción) o tareas que requieran una clasificación de opiniones con categoría neutral (ya que las muestras de 3 estrellas fueron expresamente filtradas).
Análisis en dominios médicos, jurídicos o altamente técnicos sin un proceso previo de fine-tuning adicional en dichos campos.

Bias, Risks, and Limitations

Bias and Limitations

Sesgo de dominio: Al estar entrenado exclusivamente con opiniones sobre productos comerciales de Amazon, el modelo está sesgado hacia un lenguaje característico del e-commerce (opiniones sobre envíos, empaquetado, calidad de componentes, etc.).
Ausencia de clase neutral: Dado que se ha entrenado en clasificación binaria pura, el modelo forzará cualquier texto a ser Positivo o Negativo, incluso si el comentario de entrada es completamente objetivo o neutral.

Recommendations

Se recomienda utilizar este modelo con textos de longitudes estándar (máximo 128 tokens, que fue el límite de truncamiento de la tokenización). Si se introduce texto extremadamente largo, el modelo omitirá la parte final del comentario.

How to Get Started with the Model

Puedes arrancar a usar el modelo de forma rápida con el siguiente código en Python:

from transformers import pipeline

# Cargamos el pipeline de clasificación
clasificador = pipeline("text-classification", model="TU_USUARIO/mi-clasificador-amazon-es")

# Probamos una reseña
review = "Llegó al día siguiente de pedirlo y funciona de lujo, compra totalmente recomendada."
resultado = clasificador(review)

print(resultado)
# [{'label': 'LABEL_1', 'score': 0.9982}]

Training Details

Training Data

El modelo fue entrenado con la partición en español del dataset multidominio SetFit/amazon_reviews_multi_es, aplicando los siguientes filtros y transformaciones:

Se excluyeron los registros con puntuación intermedia (3 estrellas) para obtener polaridades nítidas.
Las estrellas 1 y 2 se transformaron a la etiqueta 0 (Negativo).
Las estrellas 4 y 5 se transformaron a la etiqueta 1 (Positivo).
Se seleccionó un subset balanceado y representativo de 5,000 muestras para el entrenamiento.

Training Procedure

Preprocessing

Los textos fueron tokenizados mediante un algoritmo de codificación de pares de bytes (BPE) optimizado para el español, aplicando un truncamiento estricto a un máximo de 128 tokens y relleno (padding) automático.

Training Hyperparameters

Training regime: Precisión estándar (fp32) sobre hardware dedicado.
Learning Rate: 2e-5
Batch Size (Train y Eval): 64
Epochs: 3
Weight Decay: 0.01
Optimizer: AdamW con decaimiento de tasa lineal.

Evaluation

Testing Data, Factors & Metrics

Testing Data

El modelo se evaluó en una partición de prueba (test dataset) independiente y balanceada de 1,000 muestras pertenecientes al mismo dataset original.

Metrics

Las métricas utilizadas para evaluar el rendimiento fueron:

Accuracy (Exactitud): Mide el porcentaje global de predicciones correctas.
F1-Score: Mide la media armónica entre precisión y exhaustividad, siendo ideal para validar la robustez en ambas clases.

Results

En el conjunto de prueba independiente de 1,000 muestras, el modelo reportó las siguientes métricas:

Accuracy: ~84.5% (puede presentar ligeras variaciones decimales en función de la inicialización de pesos).
F1-Score: ~85.1%

Environmental Impact

Hardware Type: GPU local NVIDIA GeForce RTX 3060 (12GB VRAM)
Hours used: ~0.1 horas (entrenamiento veloz y eficiente gracias a la optimización de tamaño de lote y truncamiento de tokens).
Cloud Provider: Local (PC personal)

Technical Specifications

Model Architecture and Objective

El modelo base es un codificador bidireccional (Encoder) basado en la arquitectura RoBERTa-base adaptada a la tarea específica de clasificación de secuencia binaria (Sequence Classification) mediante una cabeza lineal de clasificación añadida en la capa de salida.

Compute Infrastructure

Hardware

GPU: NVIDIA GeForce RTX 3060
VRAM: 12 GB
Arquitectura de aceleración: CUDA 12.1

Software

Framework principal: PyTorch 2.5.1
Librería de soporte: Hugging Face transformers (v5+), datasets y evaluate.

Downloads last month: -; Downloads are not tracked for this model. How to track

Josealssc
/

clasificador_amazon_es