ViT afinado para clasificación de residuos sólidos (9 clases)

Modelo Vision Transformer base afinado para clasificar imágenes de residuos sólidos en 9 categorías. Trabajo realizado para el Quiz 02 del curso de Aprendizaje Automático del Programa de Ciencia de Datos del Instituto Tecnológico de Costa Rica (ITCR).

Clases

Cardboard, Food Organics, Glass, Metal, Miscellaneous Trash, Paper, Plastic, Textile Trash, Vegetation.

Datos

Dataset: jalvarezra/waste-segregation-9classes (re-empaquetado del dataset Waste Segregation de Kaggle por smarthkaushal).

  • Train: 3234 imágenes (se filtraron 2 archivos JPG corruptos).
  • Validation: 572 imágenes (15% del train original, estratificado).
  • Test: 957 imágenes (split de Kaggle, sin modificar).

Resumen metodológico

  • Modelo base: google/vit-base-patch16-224-in21k (ViT preentrenado en ImageNet-21k).
  • Procesador: ViTImageProcessor (resize 224x224, normalización media/desv = 0.5).
  • Optimizador: AdamW (por defecto del Trainer de Hugging Face).
  • Tasa de aprendizaje: 2e-4.
  • Tamaño de lote: 16 (train y eval).
  • Épocas máximas: 5.
  • Terminación anticipada: EarlyStoppingCallback con paciencia 2 sobre eval_f1_macro.
  • Selección del mejor modelo: load_best_model_at_end=True, métrica = F1 macro.
  • Precisión: FP32 (FP16 inestable en MPS para esta combinación).
  • Hardware: Apple M3 Max (MPS).

Resultados en validación (mejor modelo)

Métrica Valor
Accuracy 0.9161
Precision (macro) 0.9292
Recall (macro) 0.9182
F1 (macro) 0.9228
Loss 0.3567

Las métricas finales en el conjunto de prueba se reportan en el cuaderno del Quiz 02.

Cita

Si usás este modelo, citá al autor original del dataset:

smarthkaushal. Waste Segregation. Kaggle. https://www.kaggle.com/datasets/smarthkaushal/waste-segregation

Downloads last month
-
Safetensors
Model size
85.8M params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for jalvarezra/vit-waste-segregation

Finetuned
(2530)
this model

Dataset used to train jalvarezra/vit-waste-segregation