brunaaaz's picture
Update README.md
b33fa60 verified

A newer version of the Streamlit SDK is available: 1.52.2

Upgrade
metadata
title: CrediFast Risk Analysis
emoji: 🚀
colorFrom: red
colorTo: red
sdk: streamlit
app_port: 8501
tags:
  - streamlit
pinned: false
short_description: Streamlit template space
license: mit
sdk_version: 1.51.0

💰 Dashboard de Análise de Risco de Crédito - CrediFast

Prova Final - Disciplina SIEP Análise Preditiva, Diagnóstico e Estratégia de Negócio

📋 Sobre o Projeto

Este painel interativo foi desenvolvido como requisito para a avaliação final da disciplina SIEP. O objetivo é fornecer uma solução completa de Data Science para a fintech CrediFast, abordando desde o diagnóstico do problema de inadimplência até a implementação de modelos de Machine Learning explicáveis (XAI) para suporte à decisão.

🎯 Objetivos Atendidos

Diagnóstico: Identificação de desbalanceamento de classes e aplicação de SMOTE.

Modelagem: Comparação de múltiplos algoritmos e seleção do XGBoost (focado em Recall para mitigar prejuízos).

Explicabilidade (SHAP): Análise global e local (waterfall plots) para entender o "porquê" de cada decisão.

Clusterização: Segmentação não supervisionada (KMeans) e detecção de anomalias (DBSCAN).

Simulação: Ferramenta interativa para simular novos pedidos de empréstimo em tempo real.

🚀 Como Executar (Deploy)

Opção 1: Hugging Face Spaces (Recomendado para Entrega)

Este projeto está pronto para rodar na nuvem. Siga os passos:

Crie um novo Space no Hugging Face.

Selecione o SDK Streamlit.

Faça o upload dos seguintes arquivos na aba "Files":

app.py (Código da aplicação)

requirements.txt (Lista de dependências)

credit_risk_dataset.csv (Base de dados do Kaggle)

O sistema irá construir o ambiente automaticamente. Aguarde o status mudar para "Running".

Opção 2: Execução Local

Para rodar em sua máquina:

Instale as dependências:

pip install -r requirements.txt

Execute o app:

streamlit run app.py

📂 Estrutura dos Arquivos

app.py: O "cérebro" da aplicação. Contém todo o pipeline (limpeza, treino, dashboard).

requirements.txt: Garante que as versões corretas das bibliotecas (xgboost, shap, plotly) sejam instaladas.

credit_risk_dataset.csv: O conjunto de dados original utilizado para treino e teste.

📊 Funcionalidades do Dashboard

O aplicativo é dividido em 5 abas estratégicas + Barra Lateral:

Simulador (Sidebar): Permite inserir dados de um cliente fictício (Renda, Idade, Valor) e receber a probabilidade de calote na hora.

Aba 1 - Diagnóstico: Visualização da distribuição dos dados e prova do desbalanceamento original.

Aba 2 - Performance: Métricas técnicas (AUC, Recall, Matriz de Confusão) do modelo vencedor.

Aba 3 - SHAP (Explicabilidade): Gráficos que abrem a "caixa preta" do modelo, mostrando quais variáveis pesaram na decisão.

Aba 4 - Segmentação: Mapa 2D (PCA) mostrando os grupos de clientes (KMeans) e outliers (DBSCAN).

Aba 5 - Relatório Gerencial: Texto automático com insights de negócio e plano de ação para a diretoria.

Autor: Bruna Campos Bernardes Data: Dezembro/2025