--- title: CrediFast Risk Analysis emoji: 🚀 colorFrom: red colorTo: red sdk: streamlit app_port: 8501 tags: - streamlit pinned: false short_description: Streamlit template space license: mit sdk_version: 1.51.0 --- 💰 Dashboard de Análise de Risco de Crédito - CrediFast Prova Final - Disciplina SIEP Análise Preditiva, Diagnóstico e Estratégia de Negócio 📋 Sobre o Projeto Este painel interativo foi desenvolvido como requisito para a avaliação final da disciplina SIEP. O objetivo é fornecer uma solução completa de Data Science para a fintech CrediFast, abordando desde o diagnóstico do problema de inadimplência até a implementação de modelos de Machine Learning explicáveis (XAI) para suporte à decisão. 🎯 Objetivos Atendidos Diagnóstico: Identificação de desbalanceamento de classes e aplicação de SMOTE. Modelagem: Comparação de múltiplos algoritmos e seleção do XGBoost (focado em Recall para mitigar prejuízos). Explicabilidade (SHAP): Análise global e local (waterfall plots) para entender o "porquê" de cada decisão. Clusterização: Segmentação não supervisionada (KMeans) e detecção de anomalias (DBSCAN). Simulação: Ferramenta interativa para simular novos pedidos de empréstimo em tempo real. 🚀 Como Executar (Deploy) Opção 1: Hugging Face Spaces (Recomendado para Entrega) Este projeto está pronto para rodar na nuvem. Siga os passos: Crie um novo Space no Hugging Face. Selecione o SDK Streamlit. Faça o upload dos seguintes arquivos na aba "Files": app.py (Código da aplicação) requirements.txt (Lista de dependências) credit_risk_dataset.csv (Base de dados do Kaggle) O sistema irá construir o ambiente automaticamente. Aguarde o status mudar para "Running". Opção 2: Execução Local Para rodar em sua máquina: Instale as dependências: pip install -r requirements.txt Execute o app: streamlit run app.py 📂 Estrutura dos Arquivos app.py: O "cérebro" da aplicação. Contém todo o pipeline (limpeza, treino, dashboard). requirements.txt: Garante que as versões corretas das bibliotecas (xgboost, shap, plotly) sejam instaladas. credit_risk_dataset.csv: O conjunto de dados original utilizado para treino e teste. 📊 Funcionalidades do Dashboard O aplicativo é dividido em 5 abas estratégicas + Barra Lateral: Simulador (Sidebar): Permite inserir dados de um cliente fictício (Renda, Idade, Valor) e receber a probabilidade de calote na hora. Aba 1 - Diagnóstico: Visualização da distribuição dos dados e prova do desbalanceamento original. Aba 2 - Performance: Métricas técnicas (AUC, Recall, Matriz de Confusão) do modelo vencedor. Aba 3 - SHAP (Explicabilidade): Gráficos que abrem a "caixa preta" do modelo, mostrando quais variáveis pesaram na decisão. Aba 4 - Segmentação: Mapa 2D (PCA) mostrando os grupos de clientes (KMeans) e outliers (DBSCAN). Aba 5 - Relatório Gerencial: Texto automático com insights de negócio e plano de ação para a diretoria. Autor: Bruna Campos Bernardes Data: Dezembro/2025