IzanMoya's picture
Create README
6f93fa4 verified
---
language:
- es
- en
tags:
- finance
- credit-scoring
- risk-assessment
- tabular-classification
- bank-marketing
license: apache-2.0
metrics:
- roc_auc
- recall
---
# 馃彟 Credit Risk Scoring Model (TFM)
## 馃搵 Ficha T茅cnica del Proyecto
| Campo | Descripci贸n |
| :--- | :--- |
| **Autor** | Izan Moya Romero |
| **Tipo de Modelo** | Clasificaci贸n Binaria Supervisada (Riesgo de Impago) |
| **Algoritmo** | Random Forest / XGBoost (En desarrollo) |
| **Dataset Original** | [Home Credit Default Risk](https://www.kaggle.com/c/home-credit-default-risk) |
| **Entorno** | Banca / Fintech / An谩lisis de Riesgos |
| **Input** | Datos tabulares (Ingresos, Edad, Historial, Ratios Financieros) |
| **Output** | Probabilidad de Default (0 - 1) |
| **Estado** | 馃毀 MVP (Fase de Validaci贸n y Limpieza) |
## 馃摉 Descripci贸n del Proyecto
Este modelo es parte del Trabajo de Fin de M谩ster (TFM) en **Big Data e Inteligencia Artificial**.
El objetivo es desarrollar una herramienta de soporte a la decisi贸n para entidades bancarias que permita estimar la probabilidad de que un cliente no pueda cumplir con sus obligaciones de pago (Default). El proyecto pone 茅nfasis no solo en la precisi贸n predictiva, sino en la **explicabilidad (XAI)** para cumplir con normativas financieras (Basilea III/IV).
## 鈿欙笍 Metodolog铆a y Pipeline
El flujo de trabajo sigue los est谩ndares de la industria bancaria:
1. **Ingenier铆a de Datos:**
* Tratamiento de *Thin Files* (clientes con poco historial) mediante imputaci贸n sem谩ntica (Flag + Mediana).
* Correcci贸n de anomal铆as de dominio (ej. errores en antig眉edad laboral).
* Codificaci贸n h铆brida: `LabelEncoding` para binarias y `One-Hot Encoding` para categ贸ricas complejas.
2. **Feature Engineering:**
* Creaci贸n de ratios financieros clave (Ratio Deuda/Ingresos, Capacidad de Anualidad).
3. **Manejo de Desbalanceo:**
* Aplicaci贸n de t茅cnicas de sobremuestreo sint茅tico (**SMOTE**) para mejorar la detecci贸n de la clase minoritaria (Morosos).
## 馃搳 M茅tricas Preliminares
*Se actualizar谩 tras el entrenamiento final.*
* **Target:** 1 (Impago) / 0 (Pago)
* **AUC-ROC Esperado:** > 0.75
## 鈿狅笍 Limitaciones y Descargo de Responsabilidad
Este modelo ha sido entrenado con datos hist贸ricos anonimizados para fines acad茅micos. No debe utilizarse para la concesi贸n real de cr茅ditos sin una validaci贸n adicional y auditor铆a de sesgos (Fairness).
---
*Proyecto desarrollado con Python, Scikit-Learn y Pandas.*