Spaces:
Sleeping
A newer version of the Streamlit SDK is available:
1.52.2
title: CrediFast Risk Analysis
emoji: 🚀
colorFrom: red
colorTo: red
sdk: streamlit
app_port: 8501
tags:
- streamlit
pinned: false
short_description: Streamlit template space
license: mit
sdk_version: 1.51.0
💰 Dashboard de Análise de Risco de Crédito - CrediFast
Prova Final - Disciplina SIEP Análise Preditiva, Diagnóstico e Estratégia de Negócio
📋 Sobre o Projeto
Este painel interativo foi desenvolvido como requisito para a avaliação final da disciplina SIEP. O objetivo é fornecer uma solução completa de Data Science para a fintech CrediFast, abordando desde o diagnóstico do problema de inadimplência até a implementação de modelos de Machine Learning explicáveis (XAI) para suporte à decisão.
🎯 Objetivos Atendidos
Diagnóstico: Identificação de desbalanceamento de classes e aplicação de SMOTE.
Modelagem: Comparação de múltiplos algoritmos e seleção do XGBoost (focado em Recall para mitigar prejuízos).
Explicabilidade (SHAP): Análise global e local (waterfall plots) para entender o "porquê" de cada decisão.
Clusterização: Segmentação não supervisionada (KMeans) e detecção de anomalias (DBSCAN).
Simulação: Ferramenta interativa para simular novos pedidos de empréstimo em tempo real.
🚀 Como Executar (Deploy)
Opção 1: Hugging Face Spaces (Recomendado para Entrega)
Este projeto está pronto para rodar na nuvem. Siga os passos:
Crie um novo Space no Hugging Face.
Selecione o SDK Streamlit.
Faça o upload dos seguintes arquivos na aba "Files":
app.py (Código da aplicação)
requirements.txt (Lista de dependências)
credit_risk_dataset.csv (Base de dados do Kaggle)
O sistema irá construir o ambiente automaticamente. Aguarde o status mudar para "Running".
Opção 2: Execução Local
Para rodar em sua máquina:
Instale as dependências:
pip install -r requirements.txt
Execute o app:
streamlit run app.py
📂 Estrutura dos Arquivos
app.py: O "cérebro" da aplicação. Contém todo o pipeline (limpeza, treino, dashboard).
requirements.txt: Garante que as versões corretas das bibliotecas (xgboost, shap, plotly) sejam instaladas.
credit_risk_dataset.csv: O conjunto de dados original utilizado para treino e teste.
📊 Funcionalidades do Dashboard
O aplicativo é dividido em 5 abas estratégicas + Barra Lateral:
Simulador (Sidebar): Permite inserir dados de um cliente fictício (Renda, Idade, Valor) e receber a probabilidade de calote na hora.
Aba 1 - Diagnóstico: Visualização da distribuição dos dados e prova do desbalanceamento original.
Aba 2 - Performance: Métricas técnicas (AUC, Recall, Matriz de Confusão) do modelo vencedor.
Aba 3 - SHAP (Explicabilidade): Gráficos que abrem a "caixa preta" do modelo, mostrando quais variáveis pesaram na decisão.
Aba 4 - Segmentação: Mapa 2D (PCA) mostrando os grupos de clientes (KMeans) e outliers (DBSCAN).
Aba 5 - Relatório Gerencial: Texto automático com insights de negócio e plano de ação para a diretoria.
Autor: Bruna Campos Bernardes Data: Dezembro/2025