File size: 4,692 Bytes
b911348
 
 
 
 
 
 
 
 
 
 
709bce9
b911348
 
 
 
 
 
 
 
 
 
 
 
 
 
 
709bce9
 
 
 
 
b911348
 
 
 
 
79ea18d
 
 
 
 
 
b911348
 
a2ab63c
b911348
 
 
 
 
 
 
 
 
 
 
 
5e420a6
b911348
 
 
 
 
 
 
 
fa5943c
 
 
 
 
 
 
 
 
b911348
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
---
language:
- es
metrics:
- accuracy
base_model:
- distlibert-base-uncased
pipeline_tag: text-classification
---
# Model Card for Model ID

BERTrans_topics, se diseñó para categorizar los textos trans en seis temas específicos (salud, documentación, congreso, violencia, performance y protesta) (Anexo 1 – Diccionario). Se entrenó con 2,300 frases sintéticas generadas por modelos de lenguaje (Gemini y ChatGPT), creados a partir de prompts que combinaban palabras clave ‘trans’ (Anexo 2) con términos propios de cada categoría 

## Model Details

### Model Description

- **Developed by:** Carlos Villalobos
- **Model type:** Multilabel
- **Language:** Spanish
- **License:** Free
- **Finetuned from model:** distlibert-base-uncased

## Training Details

### Training Data


    Epoch	         Training Loss	Validation Loss	Accuracy	F1
      1	            0.042100	0.036335	0.994529	0.991928
      2	            0.029300	0.032004	0.994529	0.991928
      3	            0.001900	0.027946	0.995137	0.992832

### Evaluation

              precision    recall  f1-score   support

                health      	0.933	   0.764	0.840	   55
                documentation   0.938	   0.804	0.865	   56
                congress       	0.957	   0.865	0.909	   52
                violence       	0.978	   0.759	0.854	   58
                performance     0.930	   0.816	0.870	   49
                protest       	0.976	   0.804	0.882	   51


## Prompt con el que se originaron las frases para cada variable

Genera 10 frases que sitúen a las personas trans (trans, transgénero, transexual, travesti, persona trans, mujer trans, infancias trans, LGBT, queer, no binario, entre otras) en el contexto de la salud con palabras como: vacuna, paciente, medicamento, enfermedad, tratamiento, diagnostico, medicamento, condón, clínica, entre otras.”

## Citation

**BibTeX:**

@misc{villalobos2025bertrans,
  author = {Villalobos, Carlos},
  title = {BERTrans},
  year = {2025},
  publisher = {Hugging Face},
  url = {https://huggingface.co/carevies/BERTrans_Topics}
}

**APA:**

Villalobos, C. (2025). BERTrans_Topics [Modelo de lenguaje]. Hugging Face. 

**Anexo 1 - Diccionario**


              Variable          Description

                health      	Tratamiento a problemas de salud de personas trans
                documentation   Documentos de identidad de personas trans
                congress       	Debate parlamentario e inciativas sobre personas trans
                violence       	Describe actos de violencia hacia personas trans 
                performance     Actividades culturales y artícticas de personas trans 
                protest       	Protesta de personas trans o uso del espacio público

**Anexo 2 - Palabras trans**

"trans", "transgénero", "transgéneros", "transexual", "transexualidad", "transexuales", "travesti", "travestista", "trasvestista", "travestis", "transvesti", "transvestis", "reasignación",  "autopercibido", "magistrade", "disforia", "transfobia", "transfóbica", "genderqueer", "queer", "binario", "transincluyente", "transexcluyente", "TERF", "muxe", "LGBT", "LGBT+", "LGBTI", "LGBTI+", "LGBTT", "LGBTT+", "LGBTTT", "LGBTTT+", "LGBTTTI", "LGBTTTI+", "LGBTTTIQ", "LGBTTTIQ+", "LGBTTTIQA", "LGBTTTIQA+", "LGBTQ",   "LGBTQ+", "LGBTQI", "LGBTQI+", "LGBTQIA", "LGBTQIA+", "Drag", "personas trans", "población trans", "cambio de sexo", "reasignación de sexo", "sexo asignado",  "reasignación de género", "género autopercibido", "cirugía de cambio de sexo", "disforia de género",  "identidad trans", "identidad de género", "derechos trans", "derechos de los trans",  "discriminación trans", "odio trans", "violencia trans", "feminicidio trans", "personas no binarias",  "no binario", "no binaria", "no binarie", "género no binario", "género fluido", "genderqueer", "queer", "tercer género", "pronombres no binarios", "representación trans", "visibilidad trans", "marchas trans", "orgullo trans", "movimiento trans", "activismo trans", "colectivos trans", "ONG trans",  "Pride", "Marcha del Orgullo", "Orgullo Gay", "expresión de género", "reconocimiento legal trans",  "cambio de identidad de género", "ley de identidad de género", "mujeres trans", "hombres trans", "infancias trans", "salud trans", "hormonización trans", "terapia de reemplazo hormonal", "Clínica Condesa", "Grupo Eon", "Inteligencia Transgenérica", "Frente Pro Derechos Transgénero y Transexuales", "Red de Trabajo Trans", "Coalisión T47", "Almas Cautivas", "Impulso Trans", "Kenya Cuevas", "Paolita Suárez", "Casa de las Muñecas Tiresias", "trabajadoras sexuales trans",  "trans en prisión", "TERF", "migración trans", "diversidad sexual".