IzanMoya commited on
Commit
6f93fa4
verified
1 Parent(s): 83c30e8

Create README

Browse files
Files changed (1) hide show
  1. README.md +58 -0
README.md ADDED
@@ -0,0 +1,58 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - es
4
+ - en
5
+ tags:
6
+ - finance
7
+ - credit-scoring
8
+ - risk-assessment
9
+ - tabular-classification
10
+ - bank-marketing
11
+ license: apache-2.0
12
+ metrics:
13
+ - roc_auc
14
+ - recall
15
+ ---
16
+
17
+ # 馃彟 Credit Risk Scoring Model (TFM)
18
+
19
+ ## 馃搵 Ficha T茅cnica del Proyecto
20
+
21
+ | Campo | Descripci贸n |
22
+ | :--- | :--- |
23
+ | **Autor** | Izan Moya Romero |
24
+ | **Tipo de Modelo** | Clasificaci贸n Binaria Supervisada (Riesgo de Impago) |
25
+ | **Algoritmo** | Random Forest / XGBoost (En desarrollo) |
26
+ | **Dataset Original** | [Home Credit Default Risk](https://www.kaggle.com/c/home-credit-default-risk) |
27
+ | **Entorno** | Banca / Fintech / An谩lisis de Riesgos |
28
+ | **Input** | Datos tabulares (Ingresos, Edad, Historial, Ratios Financieros) |
29
+ | **Output** | Probabilidad de Default (0 - 1) |
30
+ | **Estado** | 馃毀 MVP (Fase de Validaci贸n y Limpieza) |
31
+
32
+ ## 馃摉 Descripci贸n del Proyecto
33
+ Este modelo es parte del Trabajo de Fin de M谩ster (TFM) en **Big Data e Inteligencia Artificial**.
34
+
35
+ El objetivo es desarrollar una herramienta de soporte a la decisi贸n para entidades bancarias que permita estimar la probabilidad de que un cliente no pueda cumplir con sus obligaciones de pago (Default). El proyecto pone 茅nfasis no solo en la precisi贸n predictiva, sino en la **explicabilidad (XAI)** para cumplir con normativas financieras (Basilea III/IV).
36
+
37
+ ## 鈿欙笍 Metodolog铆a y Pipeline
38
+ El flujo de trabajo sigue los est谩ndares de la industria bancaria:
39
+
40
+ 1. **Ingenier铆a de Datos:**
41
+ * Tratamiento de *Thin Files* (clientes con poco historial) mediante imputaci贸n sem谩ntica (Flag + Mediana).
42
+ * Correcci贸n de anomal铆as de dominio (ej. errores en antig眉edad laboral).
43
+ * Codificaci贸n h铆brida: `LabelEncoding` para binarias y `One-Hot Encoding` para categ贸ricas complejas.
44
+ 2. **Feature Engineering:**
45
+ * Creaci贸n de ratios financieros clave (Ratio Deuda/Ingresos, Capacidad de Anualidad).
46
+ 3. **Manejo de Desbalanceo:**
47
+ * Aplicaci贸n de t茅cnicas de sobremuestreo sint茅tico (**SMOTE**) para mejorar la detecci贸n de la clase minoritaria (Morosos).
48
+
49
+ ## 馃搳 M茅tricas Preliminares
50
+ *Se actualizar谩 tras el entrenamiento final.*
51
+ * **Target:** 1 (Impago) / 0 (Pago)
52
+ * **AUC-ROC Esperado:** > 0.75
53
+
54
+ ## 鈿狅笍 Limitaciones y Descargo de Responsabilidad
55
+ Este modelo ha sido entrenado con datos hist贸ricos anonimizados para fines acad茅micos. No debe utilizarse para la concesi贸n real de cr茅ditos sin una validaci贸n adicional y auditor铆a de sesgos (Fairness).
56
+
57
+ ---
58
+ *Proyecto desarrollado con Python, Scikit-Learn y Pandas.*