File size: 2,465 Bytes
d89a635
 
 
 
 
 
 
 
 
 
 
 
d5a9236
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
61db543
d5a9236
 
 
 
 
 
 
 
 
 
 
61db543
d5a9236
 
 
32e9df7
 
d5a9236
 
61db543
d5a9236
 
 
61db543
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
---
title: Proyecto Transformers
emoji: 🌖
colorFrom: blue
colorTo: purple
sdk: streamlit
sdk_version: 1.17.0
app_file: app.py
pinned: false
license: mit
---

## Características

Este modelo es utilizado para la clasificación de descripciones de trabajos, a traves de una arquitectura de transformers, el usuario tiene la capacidad de introducir un texto en ingles sobre la descripcion de algunos de los siguientes trabajos:
* Accountant
* Actuary
* Biologist
* Chemist
* Civil engineer
* Computer programmer
* Data scientist
* Database administrator
* Dentist
* Economist
* Environmental engineer
* Financial analyst
* IT manager
* Mathematician
* Mechanical engineer
* Physician assistant
* Psychologist
* Statistician
* Systems analyst
* Technical writer
* Web developer

El modelo mostrará la predicción con mayor probabilidad de ser correcta.


## Construcción del modelo

Este modelo es una versión de distilbert-base-uncased, donde se utilizó la tecnica de 'fine-tuning', reentrenando el modelo con los datos de entrenamiento relacionados a nuestro fin, en este caso se tienen 21 categorias a clasificar, donde se obtuvieron los siguientes resultados:
* Train Loss: 1.3322
* Train Accuracy: 0.5469
* Validation Loss: 2.5269
* Validation Accuracy: 0.2944
* Epoch: 4

Se utilizo como optimizador 'Adam' con un 'learning_rate = 5e-5' y una metrica basada en precision.

El modelo fue subido directamente a huggingface el cual se encuentra en: https://huggingface.co/lfernandopg/Proyecto-Transformers

El notebook donde fue desarrolado el modelo es el siguiente: https://huggingface.co/spaces/lfernandopg/Proyecto-Transformers/blob/main/Model.ipynb

## Fuente de Datos

El dataset utilizado fue recolectado haciendo uso de la siguiente pagina web: 'https://www.onetonline.org/find/all' en donde se encuentran detalles acerca de las tareas y deberes que se deben desempeñar en los trabajo que forman parte de la lista. El archivo csv donde se encuetran los datos de entranamiento que se usaron para reentrenar el modelo es el siguiente: https://huggingface.co/spaces/lfernandopg/Proyecto-Transformers/blob/main/train_data.csv

## Propuesta de valor

Este modelo puede ser de utilidad para empresas o personas que deseen conocer si alguna habilidad, tarea o deber pertenece a algún trabajo u ocupación en especifico, además puede ser usado para consultar de algun curriculum vitae cumple con realmente con los requerimiento para encargo en cuestión.