aedi-provafinal / README.md
Vinícius dos Santos Moreira
Metadatas update
b85cbeb

A newer version of the Streamlit SDK is available: 1.52.2

Upgrade
metadata
title: Credit Risk Dashboard (Questão 4)
emoji: 🏦
colorFrom: blue
colorTo: green
sdk: streamlit
sdk_version: 1.51.0
app_file: dashboard.py
pinned: false
license: mit

Dashboard de Análise de Risco de Crédito 💰

Este projeto é uma aplicação web interativa desenvolvida em Python utilizando Streamlit. Ele representa a solução da Questão 4 da Prova Final da disciplina de Análise Estatística de Dados e Informações (PPCA/UnB).

O objetivo é aplicar técnicas de Ciência de Dados supervisionadas e não supervisionadas para prever e mitigar a inadimplência bancária.

📋 Funcionalidades

O dashboard está dividido em 6 seções estratégicas:

  1. Discussão do Problema: Contextualização econômica sobre risco de crédito e impacto da inadimplência.
  2. Análise Descritiva (EDA): Visualização de distribuições, correlações, boxplots e análise de silhueta (separabilidade das classes).
  3. Modelagem Preditiva: Comparação de modelos (Random Forest, XGBoost, Regressão Logística) com métricas como Acurácia, F1-Score e AUC-ROC.
  4. Explicabilidade (SHAP): Interpretação do modelo "Black Box" para entender quais variáveis (ex: saldo, idade) mais influenciam na decisão de crédito.
  5. Análise Não Supervisionada:
    • K-Means: Segmentação de clientes (Clusterização) com visualização interativa (Plotly).
    • DBSCAN: Detecção de anomalias e perfis atípicos (outliers).
  6. Tomada de Decisão: Sugestões estratégicas baseadas nos dados para concessão de crédito.

🔧 Como Executar Localmente

  1. Clone este repositório:
    git clone https://huggingface.co/spaces/vsmoreira/aedi-provafinal
    
  2. Instale as dependências:
    pip install -r requirements.txt
    
  3. Execute a aplicação:
    streamlit run app.py
    

Dados

Os dados são obtidos automaticamente via biblioteca kagglehub a partir do dataset: Credit Risk Customers. Caso ocorra erro de download no Space, certifique-se de que o arquivo credit_customers.csv esteja na raiz do projeto.

🛠 Tecnologias Utilizadas

  • Streamlit: Interface Web
  • Pandas & Numpy: Manipulação de dados
  • Scikit-Learn: Modelagem e Métricas
  • XGBoost: Algoritmo de Gradient Boosting
  • SHAP: Explicabilidade de modelos
  • Plotly Express: Gráficos interativos
  • Seaborn & Matplotlib: Visualização estática

Arquivo Obrigatório: requirements.txt

Para que o seu Space funcione, você deve criar um arquivo chamado requirements.txt na mesma pasta do README.md e do app.py com o seguinte conteúdo:

streamlit
pandas
numpy
matplotlib
seaborn
scikit-learn
shap
xgboost
kagglehub
plotly

Desenvolvido como parte da avaliação da disciplina de AEDI - UnB.