Spaces:

brunaaaz
/

CrediFast-Risk-Analysis

Sleeping

App Files Files Community

brunaaaz commited on 30 days ago

Commit

ba4c97c

verified ·

1 Parent(s): 5bfaac6

Update app.py

Browse files

Files changed (1) hide show

app.py +56 -54

app.py CHANGED Viewed

@@ -18,9 +18,7 @@ import warnings
 # Configuração da Página
 st.set_page_config(page_title="CrediFast - Risco de Crédito", layout="wide", page_icon="💰")
-# REMOVIDA A LINHA QUE CAUSAVA O ERRO:
-# st.set_option('deprecation.showPyplotGlobalUse', False)
 warnings.filterwarnings('ignore')
 # Título e Cabeçalho
@@ -30,16 +28,13 @@ st.markdown("---")
 # --- FUNÇÕES DE CACHE (Para performance) ---
 @st.cache_data
-def carregar_dados(uploaded_file):
-    if uploaded_file is not None:
-        df = pd.read_csv(uploaded_file)
-    else:
-        # Tenta carregar localmente se nenhum arquivo for enviado
-        try:
-            df = pd.read_csv('credit_risk_dataset.csv')
-        except:
-            return None
-    return df
 @st.cache_data
 def processar_dados(df):
@@ -83,26 +78,28 @@ def treinar_modelo(X, y):
     X_test_final = pd.DataFrame(X_test_scaled, columns=feature_names)
     # Treinamento XGBoost
-    model = XGBClassifier(use_label_encoder=False, eval_metric='logloss', random_state=42)
     model.fit(X_train_final, y_train_bal)
     return model, scaler, X_test_final, y_test, X_train_final, feature_names
-# --- SIDEBAR (Upload e Simulador) ---
-st.sidebar.header("📂 Configuração")
-uploaded_file = st.sidebar.file_uploader("Upload do CSV (credit_risk_dataset.csv)", type="csv")
-df_raw = carregar_dados(uploaded_file)
 if df_raw is not None:
-    # Processamento
-    with st.spinner('Processando dados e treinando modelo...'):
         X, y, df_clean = processar_dados(df_raw)
         model, scaler, X_test, y_test, X_train, feature_names = treinar_modelo(X, y)
-    st.sidebar.success("Modelo Treinado!")
-    # Simulador (Bônus)
     st.sidebar.markdown("---")
     st.sidebar.subheader("🎲 Simulador de Crédito")
     st.sidebar.info("Simule um perfil para ver a probabilidade de calote.")
@@ -116,7 +113,7 @@ if df_raw is not None:
     # Botão Simular
     if st.sidebar.button("Calcular Risco"):
-        # Lógica simplificada de simulação (cria um vetor zerado e preenche o que temos)
         input_data = pd.DataFrame(0, index=[0], columns=feature_names)
         input_data['person_income'] = sim_income
         input_data['person_age'] = sim_age
@@ -189,35 +186,39 @@ if df_raw is not None:
     with tab3:
         st.subheader("Por que o modelo toma essas decisões?")
-        # Calcular SHAP
-        explainer = shap.TreeExplainer(model)
-        shap_values = explainer.shap_values(X_test)
-        st.markdown("**1. Visão Global (Quais variáveis importam mais?)**")
-        # Correção para exibir o gráfico sem warning: criar figura explícita e passar para st.pyplot
-        fig_summary, ax = plt.subplots()
-        shap.summary_plot(shap_values, X_test, show=False)
-        st.pyplot(plt.gcf())
-        plt.clf() # Limpar figura atual
-        st.markdown("---")
-        st.markdown("**2. Visão Local (Análise caso a caso)**")
-        # Seletor de índice
-        idx = st.number_input("Selecione o ID do Cliente para auditar:", min_value=0, max_value=len(X_test)-1, value=0)
-        real_val = y_test.iloc[idx]
-        pred_val = y_pred[idx]
-        st.write(f"Cliente ID {idx} | Real: {'Bad' if real_val==1 else 'Good'} | Predito: {'Bad' if pred_val==1 else 'Good'}")
-        # Waterfall Plot
-        fig_waterfall = plt.figure()
-        shap.plots.waterfall(shap.Explanation(values=shap_values[idx],
-                                              base_values=explainer.expected_value,
-                                              data=X_test.iloc[idx],
-                                              feature_names=X_test.columns.tolist()),
-                             max_display=10, show=False)
-        st.pyplot(fig_waterfall)
     # TAB 4: Clusters
     with tab4:
@@ -278,5 +279,6 @@ if df_raw is not None:
         """)
 else:
-    st.info("Aguardando upload do arquivo 'credit_risk_dataset.csv' na barra lateral.")
-    st.write("Se estiver rodando localmente e o arquivo estiver na pasta, ele será carregado automaticamente.")

 # Configuração da Página
 st.set_page_config(page_title="CrediFast - Risco de Crédito", layout="wide", page_icon="💰")
+# Desativar avisos
 warnings.filterwarnings('ignore')
 # Título e Cabeçalho
 # --- FUNÇÕES DE CACHE (Para performance) ---
 @st.cache_data
+def carregar_dados():
+    # Carrega diretamente o arquivo local
+    try:
+        df = pd.read_csv('credit_risk_dataset.csv')
+        return df
+    except FileNotFoundError:
+        return None
 @st.cache_data
 def processar_dados(df):
     X_test_final = pd.DataFrame(X_test_scaled, columns=feature_names)
     # Treinamento XGBoost
+    # FIX: base_score=0.5 ajuda a evitar o erro '[5E-1]' no SHAP com XGBoost novos
+    model = XGBClassifier(use_label_encoder=False, eval_metric='logloss', random_state=42, base_score=0.5)
     model.fit(X_train_final, y_train_bal)
     return model, scaler, X_test_final, y_test, X_train_final, feature_names
+# --- LOGICA PRINCIPAL ---
+# Tenta carregar os dados automaticamente
+df_raw = carregar_dados()
 if df_raw is not None:
+    # Processamento Automático
+    # Mostra um spinner enquanto carrega para o usuário saber que está trabalhando
+    with st.spinner('Inicializando sistema: Processando dados e treinando IA...'):
         X, y, df_clean = processar_dados(df_raw)
         model, scaler, X_test, y_test, X_train, feature_names = treinar_modelo(X, y)
+    # --- SIDEBAR (Simulador) ---
+    st.sidebar.header("📂 Menu")
+    st.sidebar.success("✅ Modelo Carregado e Pronto")
     st.sidebar.markdown("---")
     st.sidebar.subheader("🎲 Simulador de Crédito")
     st.sidebar.info("Simule um perfil para ver a probabilidade de calote.")
     # Botão Simular
     if st.sidebar.button("Calcular Risco"):
+        # Lógica simplificada de simulação
         input_data = pd.DataFrame(0, index=[0], columns=feature_names)
         input_data['person_income'] = sim_income
         input_data['person_age'] = sim_age
     with tab3:
         st.subheader("Por que o modelo toma essas decisões?")
+        try:
+            # Calcular SHAP
+            explainer = shap.TreeExplainer(model)
+            shap_values = explainer.shap_values(X_test)
+            st.markdown("**1. Visão Global (Quais variáveis importam mais?)**")
+            # Correção para exibir o gráfico sem warning: criar figura explícita e passar para st.pyplot
+            fig_summary, ax = plt.subplots()
+            shap.summary_plot(shap_values, X_test, show=False)
+            st.pyplot(plt.gcf())
+            plt.clf() # Limpar figura atual
+            st.markdown("---")
+            st.markdown("**2. Visão Local (Análise caso a caso)**")
+            # Seletor de índice
+            idx = st.number_input("Selecione o ID do Cliente para auditar:", min_value=0, max_value=len(X_test)-1, value=0)
+            real_val = y_test.iloc[idx]
+            pred_val = y_pred[idx]
+            st.write(f"Cliente ID {idx} | Real: {'Bad' if real_val==1 else 'Good'} | Predito: {'Bad' if pred_val==1 else 'Good'}")
+            # Waterfall Plot
+            fig_waterfall = plt.figure()
+            shap.plots.waterfall(shap.Explanation(values=shap_values[idx],
+                                                  base_values=explainer.expected_value,
+                                                  data=X_test.iloc[idx],
+                                                  feature_names=X_test.columns.tolist()),
+                                 max_display=10, show=False)
+            st.pyplot(fig_waterfall)
+        except Exception as e:
+            st.error(f"Erro ao calcular SHAP: {e}")
+            st.warning("Dica: Tente recarregar a página ou verifique compatibilidade de versões.")
     # TAB 4: Clusters
     with tab4:
         """)
 else:
+    # Caso o arquivo não seja encontrado
+    st.error("🚨 Arquivo `credit_risk_dataset.csv` não encontrado no diretório.")
+    st.info("Por favor, adicione o arquivo csv na aba 'Files' do Hugging Face Spaces junto com este app.py.")