File size: 4,602 Bytes
5674d2f
 
 
 
 
 
 
 
 
 
 
 
 
 
9260197
5674d2f
 
 
 
 
 
 
62b6dba
5674d2f
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
6e21dfe
 
 
 
 
 
 
5674d2f
 
 
6e21dfe
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
---
datasets:
- jhovany/Homomex2024
language:
- es
metrics:
- accuracy
base_model:
- LaProfeClaudis/LGBeTO_detection_Model
pipeline_tag: text-classification
---
# Model Card for Model ID

Trans / No Trans text clasifier in spanish

Clasificador de textos trans / no trans en español

## Model Details

### Model Description

Trans / No Trans text clasifier in spanish

Clasificador de textos trans / no trans en español

- **Developed by:** Carlos Villalobos
- **Model type:** Binary
- **Language:** Spanish
- **License:** Free
- **Finetuned from model:** LaProfeClaudis/LGBeTO_detection_Model

## Training Details

### Training Data

A partir de 10,963 tweets LGBT se filtraron aquellos que hablan sobre temas "trans" (3,747) utilizando la lista de palabras clave:

Palabras clave: "personas trans", "población trans", "transgénero", "transexual", "transexuales", "travesti",
  "travestis", "transvesti", "transvestis", "cambio de sexo", "reasignación de sexo", "sexo asignado",
  "reasignación de género", "género autopercibido", "cirugía de cambio de sexo", "disforia de género",
  "identidad trans", "identidad de género", "derechos trans", "derechos de los trans", "transfobia",
  "discriminación trans", "odio trans", "violencia trans", "feminicidio trans", "personas no binarias",
  "no binario", "no binaria", "no binarie", "género no binario", "género fluido", "genderqueer", "queer",
  "tercer género", "magistrade", "pronombres no binarios", "representación trans", "visibilidad trans",
  "marchas trans", "orgullo trans", "movimiento trans", "activismo trans", "colectivos trans", "ONG trans",
  "Pride", "Marcha del Orgullo", "Orgullo Gay", "expresión de género", "reconocimiento legal trans",
  "cambio de identidad de género", "ley de identidad de género", "mujeres trans", "hombres trans",
  "infancias trans", "salud trans", "hormonización trans", "terapia de reemplazo hormonal",
  "Clínica Condesa", "Grupo Eon", "Inteligencia Transgenérica", "Frente Pro Derechos Transgénero y Transexuales",
  "Red de Trabajo Trans", "Coalisión T47", "Almas Cautivas", "Impulso Trans", "Kenya Cuevas", "Paolita Suárez",
  "Casa de las Muñecas Tiresias", "trabajadoras sexuales trans", "transincluyente", "transexcluyente",
  "trans en prisión", "TERF", "migración trans", "diversidad sexual",
  
  "trans", "transgénero", "transgéneros", "transexual", "transexualidad", "transexuales", "travesti",
  "travestista", "trasvestista", "travestis", "transvesti", "transvestis", "reasignación", "transfeminicidio",
  "autopercibido", "disforia", "transfobia", "transfóbica", "genderqueer", "queer", "magistrade", "binario",
  "transincluyente", "transexcluyente", "TERF", "muxe", "LGBT", "LGBT+", "LGBTI", "LGBTI+", "LGBTT", "LGBTT+", 
  "LGBTTT", "LGBTTT+", "LGBTTTI", "LGBTTTI+", "LGBTTTIQ", "LGBTTTIQ+", "LGBTTTIQA", "LGBTTTIQA+", "LGBTQ", 
  "LGBTQ+", "LGBTQI", "LGBTQI+", "LGBTQIA", "LGBTQIA+", "Drag"

Los tweets trans (3,747) fueron etiquetados con 1
Los tweets no-trans (7,216) fueron etiquetados con 0

Se afinó utilizando 520 frases sintéticas que resolvieran ambiguedades como "maiz transgénico" o "película de transformers"

####  Tweets training 

Epoch	Training Loss	Validation Loss	Accuracy	F1
1	            0.042100	0.036335	0.994529	0.991928
2	            0.049300	0.032004	0.994529	0.991928
3	            0.031900	0.027946	0.995137	0.992832

### Evaluation

              precision    recall  f1-score   support

    no trans       1.00      0.99      1.00      1089
       trans       0.99      1.00      0.99       556

    accuracy                           1.00      1645
   macro avg       0.99      1.00      0.99      1645
weighted avg       1.00      1.00      1.00      1645


### Synthetic fine-tunning 

Epoch	Training Loss	Validation Loss	Accuracy	F1
1	            0.146800	0.148145	0.948718	0.953488
2	            0.048600	0.015481	1.000000	1.000000
3	            0.064000	0.020288	0.987179	0.988764

### Evaluation

              precision    recall  f1-score   support

    no trans       0.97      1.00      0.99        33
       trans       1.00      0.98      0.99        45

    accuracy                           0.99        78
   macro avg       0.99      0.99      0.99        78
weighted avg       0.99      0.99      0.99        78


## Citation

**BibTeX:**

@misc{villalobos2025bertrans,
  author = {Villalobos, Carlos},
  title = {BERTrans},
  year = {2025},
  publisher = {Hugging Face},
  url = {https://huggingface.co/carevies/BERTrans}
}

**APA:**

Villalobos, C. (2025). BERTrans [Modelo de lenguaje]. Hugging Face.