Spaces:

alicetport
/

siep-t4

Sleeping

App Files Files Community

alicetport commited on Nov 21, 2025

Commit

b35ed0b

verified ·

1 Parent(s): 7eb616f

Create app.py

Browse files

Files changed (1) hide show

app.py +646 -0

app.py ADDED Viewed

	@@ -0,0 +1,646 @@

+#!/usr/bin/env python
+# coding: utf-8
+import streamlit as st
+import pandas as pd
+import numpy as np
+from sklearn.linear_model import LogisticRegression
+from sklearn.feature_selection import RFE
+from sklearn.model_selection import train_test_split, GridSearchCV
+from sklearn.metrics import (
+    accuracy_score, roc_auc_score, precision_score,
+    recall_score, f1_score, confusion_matrix, roc_curve, classification_report
+)
+from sklearn.preprocessing import StandardScaler, LabelEncoder
+from sklearn.neighbors import KNeighborsClassifier
+from sklearn.svm import SVC
+from sklearn.tree import DecisionTreeClassifier
+from sklearn.ensemble import RandomForestClassifier, AdaBoostClassifier, GradientBoostingClassifier
+from sklearn.neural_network import MLPClassifier
+import plotly.express as px
+import plotly.graph_objects as go
+import statsmodels.api as sm
+import matplotlib.pyplot as plt
+import seaborn as sns
+import warnings
+warnings.filterwarnings('ignore')
+# Tentar importar bibliotecas com fallback
+try:
+    from imblearn.over_sampling import SMOTE
+    SMOTE_AVAILABLE = True
+except ImportError:
+    SMOTE_AVAILABLE = False
+try:
+    from xgboost import XGBClassifier
+    XGB_AVAILABLE = True
+except ImportError:
+    XGB_AVAILABLE = False
+try:
+    from lightgbm import LGBMClassifier
+    LGBM_AVAILABLE = True
+except ImportError:
+    LGBM_AVAILABLE = False
+# Configuração da página
+st.set_page_config(
+    page_title="Sistema de Previsão de Reclamações - Tarefa 4",
+    layout="wide",
+    initial_sidebar_state="expanded"
+)
+# CSS personalizado
+st.markdown("""
+    <style>
+    .main-header {
+        font-size: 2.5rem;
+        color: #2E86AB;
+        text-align: center;
+        margin-bottom: 1rem;
+        font-weight: bold;
+    }
+    .sub-header {
+        font-size: 1.5rem;
+        color: #A23B72;
+        text-align: center;
+        margin-bottom: 2rem;
+    }
+    .metric-card {
+        background-color: #f0f2f6;
+        padding: 15px;
+        border-radius: 10px;
+        border-left: 5px solid #2E86AB;
+        margin: 10px 0;
+    }
+    </style>
+    """, unsafe_allow_html=True)
+# Cabeçalho
+st.markdown('<p class="main-header">🔍 Sistema de Previsão de Reclamações de Clientes</p>', unsafe_allow_html=True)
+st.markdown('<p class="sub-header">Tarefa 4 - Modelos Supervisionados para Previsão de Reclamações</p>', unsafe_allow_html=True)
+st.markdown("---")
+# Descrição da Tarefa 4
+with st.expander("🎯 OBJETIVOS DA TAREFA 4 - CONFORME ENUNCIADO"):
+    st.markdown("""
+    **I. Análise Preditiva com Múltiplos Modelos Supervisionados**
+    a) **Balanceamento da Base:** Verificar desbalanceamento e aplicar SMOTE
+    b) **Seleção de Variáveis:** Utilizar RFE (Recursive Feature Elimination)
+    c) **Treinamento de Modelos:** Aplicar, comparar e discutir desempenho dos grupos:
+    - Modelos baseados em distância: KNN, SVM
+    - Modelos de Bagging: Árvore de Decisão, Random Forest
+    - Modelos de Boosting: AdaBoost, Gradient Boosting, XGBoost, LightGBM
+    - Redes Neurais
+    d) **Sensibilidade aos Hiperparâmetros:** Analisar impacto dos ajustes
+    e) **Tomada de Decisão e Aplicação Gerencial:** Analisar fatores que influenciam reclamações
+    **Avaliar com métricas:** AUC, Curva ROC, Precisão, Recall, F1-score, Matriz de Confusão
+    """)
+# Carregar dados
+@st.cache_data
+def load_data():
+    try:
+        data = pd.read_csv('marketing_campaign.csv', sep='\t')
+        return data
+    except Exception as e:
+        st.error(f"❌ ERRO: Não foi possível carregar o arquivo 'marketing_campaign.csv'")
+        st.error(f"Detalhes: {e}")
+        st.stop()
+data = load_data()
+# Sidebar para configurações
+with st.sidebar:
+    st.header("⚙️ CONFIGURAÇÕES - TAREFA 4")
+    st.subheader("I.a) Balanceamento")
+    aplicar_smote = st.checkbox("Aplicar SMOTE para balanceamento", value=True)
+    st.subheader("I.b) Seleção de Variáveis")
+    aplicar_rfe = st.checkbox("Aplicar RFE para seleção de variáveis", value=True)
+    if aplicar_rfe:
+        n_features = st.slider("Número de variáveis via RFE", 8, 15, 12)
+    st.subheader("I.c) Modelos Supervisionados")
+    st.write("**Selecione os modelos para comparação:**")
+    st.write("📏 **Baseados em Distância:**")
+    use_knn = st.checkbox("K-Nearest Neighbors (KNN)", value=True)
+    use_svm = st.checkbox("Support Vector Machine (SVM)", value=True)
+    st.write("🌳 **Modelos de Bagging:**")
+    use_tree = st.checkbox("Árvore de Decisão", value=True)
+    use_rf = st.checkbox("Random Forest", value=True)
+    st.write("🚀 **Modelos de Boosting:**")
+    use_ada = st.checkbox("AdaBoost", value=True)
+    use_gb = st.checkbox("Gradient Boosting", value=True)
+    use_xgb = st.checkbox("XGBoost", value=XGB_AVAILABLE)
+    use_lgbm = st.checkbox("LightGBM", value=LGBM_AVAILABLE)
+    st.write("🧠 **Redes Neurais:**")
+    use_nn = st.checkbox("Rede Neural (MLP)", value=True)
+    st.subheader("I.d) Sensibilidade Hiperparâmetros")
+    tunar_hiperparametros = st.checkbox("Ajustar hiperparâmetros (GridSearchCV)", value=False)
+    st.subheader("Divisão dos Dados")
+    test_size = st.slider("Proporção teste", 0.1, 0.5, 0.3, 0.05)
+# =============================================================================
+# PRÉ-PROCESSAMENTO (IGUAL AO SEU CÓDIGO)
+# =============================================================================
+st.header("🔧 PRÉ-PROCESSAMENTO DOS DADOS")
+# Criar cópia para processamento
+df_clean = data.copy()
+# Remover valores nulos
+initial_shape = df_clean.shape
+df_clean = df_clean.dropna()
+st.write(f"✅ Dados limpos: {initial_shape[0]} → {df_clean.shape[0]} linhas")
+# Remover colunas desnecessárias
+cols_to_remove = ['ID', 'Z_CostContact', 'Z_Revenue']
+df_clean = df_clean.drop(columns=[col for col in cols_to_remove if col in df_clean.columns])
+# Transformar Year_Birth em Idade
+df_clean['Age'] = 2023 - df_clean['Year_Birth']
+df_clean = df_clean.drop('Year_Birth', axis=1)
+# Transformar Dt_Customer em tempo como cliente
+df_clean['Dt_Customer'] = pd.to_datetime(df_clean['Dt_Customer'], format='%d-%m-%Y')
+df_clean['Customer_Days'] = (df_clean['Dt_Customer'].max() - df_clean['Dt_Customer']).dt.days
+df_clean = df_clean.drop('Dt_Customer', axis=1)
+# Encoding de variáveis categóricas
+education_map = {'Basic': 1, '2n Cycle': 2, 'Graduation': 3, 'Master': 4, 'PhD': 5}
+df_clean['Education'] = df_clean['Education'].map(education_map)
+marital_mapping = {
+    'Single': 'Single', 'Together': 'Married', 'Married': 'Married',
+    'Divorced': 'Divorced', 'Widow': 'Other', 'Alone': 'Other',
+    'Absurd': 'Other', 'YOLO': 'Other'
+}
+df_clean['Marital_Status'] = df_clean['Marital_Status'].map(marital_mapping)
+marital_dummies = pd.get_dummies(df_clean['Marital_Status'], prefix='Marital')
+marital_dummies = marital_dummies[['Marital_Single', 'Marital_Married', 'Marital_Divorced']]
+df_clean = pd.concat([df_clean, marital_dummies], axis=1)
+df_clean = df_clean.drop('Marital_Status', axis=1)
+st.success("✅ Pré-processamento concluído!")
+# =============================================================================
+# I.a) ANÁLISE DE BALANCEAMENTO
+# =============================================================================
+st.header("📊 I.a) ANÁLISE DO BALANCEAMENTO DA BASE")
+col1, col2 = st.columns(2)
+with col1:
+    # Distribuição da target
+    fig_target = px.pie(
+        values=df_clean['Complain'].value_counts().values,
+        names=['Não Reclamou', 'Reclamou'],
+        title='Distribuição Original da Variável Complain'
+    )
+    st.plotly_chart(fig_target)
+with col2:
+    count_no_complain = (df_clean['Complain']==0).sum()
+    count_complain = (df_clean['Complain']==1).sum()
+    total = len(df_clean)
+    st.markdown('<div class="metric-card">', unsafe_allow_html=True)
+    st.metric("Total de Clientes", total)
+    st.metric("Clientes sem Reclamações", f"{count_no_complain} ({count_no_complain/total*100:.1f}%)")
+    st.metric("Clientes com Reclamações", f"{count_complain} ({count_complain/total*100:.1f}%)")
+    st.markdown('</div>', unsafe_allow_html=True)
+# =============================================================================
+# APLICAÇÃO DO SMOTE
+# =============================================================================
+st.header("⚖️ APLICAÇÃO DO SMOTE")
+# Separar features e target
+X = df_clean.drop('Complain', axis=1)
+y = df_clean['Complain']
+# Dividir em treino e teste
+X_train, X_test, y_train, y_test = train_test_split(
+    X, y, test_size=test_size, random_state=42, stratify=y
+)
+if aplicar_smote and SMOTE_AVAILABLE:
+    smote = SMOTE(random_state=42)
+    X_train_bal, y_train_bal = smote.fit_resample(X_train, y_train)
+    st.success("✅ SMOTE aplicado com sucesso!")
+    col1, col2 = st.columns(2)
+    with col1:
+        st.write("**ANTES do SMOTE:**")
+        st.write(f"Classe 0: {(y_train==0).sum()} ({(y_train==0).sum()/len(y_train)*100:.1f}%)")
+        st.write(f"Classe 1: {(y_train==1).sum()} ({(y_train==1).sum()/len(y_train)*100:.1f}%)")
+    with col2:
+        st.write("**APÓS o SMOTE:**")
+        st.write(f"Classe 0: {(y_train_bal==0).sum()} ({(y_train_bal==0).sum()/len(y_train_bal)*100:.1f}%)")
+        st.write(f"Classe 1: {(y_train_bal==1).sum()} ({(y_train_bal==1).sum()/len(y_train_bal)*100:.1f}%)")
+elif aplicar_smote and not SMOTE_AVAILABLE:
+    st.error("❌ SMOTE não disponível - usando oversampling manual")
+    from sklearn.utils import resample
+    # Oversampling manual
+    X_train_combined = pd.concat([X_train, y_train], axis=1)
+    majority = X_train_combined[X_train_combined.Complain==0]
+    minority = X_train_combined[X_train_combined.Complain==1]
+    minority_oversampled = resample(minority, replace=True, n_samples=len(majority), random_state=42)
+    oversampled = pd.concat([majority, minority_oversampled])
+    X_train_bal = oversampled.drop('Complain', axis=1)
+    y_train_bal = oversampled['Complain']
+else:
+    X_train_bal, y_train_bal = X_train, y_train
+    st.warning("⚠️ SMOTE não aplicado")
+# =============================================================================
+# I.b) SELEÇÃO DE VARIÁVEIS COM RFE
+# =============================================================================
+st.header("🎯 I.b) SELEÇÃO DE VARIÁVEIS COM RFE")
+if aplicar_rfe:
+    # Abordagem híbrida para garantir variáveis importantes
+    core_vars = ['Income', 'Recency', 'Customer_Days', 'MntWines', 'Age', 'NumWebPurchases']
+    available_core_vars = [var for var in core_vars if var in X_train_bal.columns]
+    # RFE para variáveis restantes
+    remaining_vars = [col for col in X_train_bal.columns if col not in available_core_vars]
+    n_additional = max(1, n_features - len(available_core_vars))
+    if len(remaining_vars) > n_additional:
+        rfe = RFE(estimator=LogisticRegression(max_iter=1000, random_state=42),
+                 n_features_to_select=n_additional)
+        rfe.fit(X_train_bal[remaining_vars], y_train_bal)
+        rfe_selected = [remaining_vars[i] for i in range(len(remaining_vars)) if rfe.support_[i]]
+        selected_features = available_core_vars + rfe_selected
+    else:
+        selected_features = available_core_vars + remaining_vars
+    st.success(f"✅ RFE aplicado - {len(selected_features)} variáveis selecionadas")
+else:
+    selected_features = X_train_bal.columns.tolist()
+st.write("**Variáveis selecionadas:**")
+for i, feature in enumerate(selected_features, 1):
+    st.write(f"{i}. {feature}")
+# Preparar dados finais
+X_train_final = X_train_bal[selected_features]
+X_test_final = X_test[selected_features]
+# =============================================================================
+# I.c) TREINAMENTO DOS MODELOS SUPERVISIONADOS
+# =============================================================================
+st.header("🤖 I.c) TREINAMENTO E COMPARAÇÃO DOS MODELOS")
+# Dicionário de modelos conforme grupos da tarefa
+models = {}
+# Modelos baseados em distância
+if use_knn: models['K-Nearest Neighbors'] = KNeighborsClassifier()
+if use_svm: models['Support Vector Machine'] = SVC(probability=True, random_state=42)
+# Modelos de Bagging
+if use_tree: models['Decision Tree'] = DecisionTreeClassifier(random_state=42)
+if use_rf: models['Random Forest'] = RandomForestClassifier(random_state=42)
+# Modelos de Boosting
+if use_ada: models['AdaBoost'] = AdaBoostClassifier(random_state=42)
+if use_gb: models['Gradient Boosting'] = GradientBoostingClassifier(random_state=42)
+if use_xgb and XGB_AVAILABLE: models['XGBoost'] = XGBClassifier(random_state=42, eval_metric='logloss')
+if use_lgbm and LGBM_AVAILABLE: models['LightGBM'] = LGBMClassifier(random_state=42)
+# Redes Neurais
+if use_nn: models['Neural Network'] = MLPClassifier(random_state=42, max_iter=1000)
+if not models:
+    st.error("❌ Selecione pelo menos um modelo para treinamento")
+    st.stop()
+# Treinar modelos e coletar resultados
+results = {}
+progress_bar = st.progress(0)
+status_text = st.empty()
+for i, (name, model) in enumerate(models.items()):
+    status_text.text(f"Treinando {name}...")
+    try:
+        model.fit(X_train_final, y_train_bal)
+        y_pred = model.predict(X_test_final)
+        y_proba = model.predict_proba(X_test_final)[:, 1] if hasattr(model, "predict_proba") else None
+        # Calcular métricas
+        auc = roc_auc_score(y_test, y_proba) if y_proba is not None else 0
+        accuracy = accuracy_score(y_test, y_pred)
+        precision = precision_score(y_test, y_pred)
+        recall = recall_score(y_test, y_pred)
+        f1 = f1_score(y_test, y_pred)
+        results[name] = {
+            'model': model,
+            'auc': auc,
+            'accuracy': accuracy,
+            'precision': precision,
+            'recall': recall,
+            'f1': f1,
+            'y_pred': y_pred,
+            'y_proba': y_proba
+        }
+    except Exception as e:
+        st.error(f"Erro no modelo {name}: {e}")
+    progress_bar.progress((i + 1) / len(models))
+status_text.text("✅ Todos os modelos treinados!")
+# =============================================================================
+# COMPARAÇÃO DOS MODELOS
+# =============================================================================
+st.subheader("📊 COMPARAÇÃO DOS MODELOS - MÉTRICAS")
+# Tabela de comparação
+results_df = pd.DataFrame([
+    {
+        'Modelo': name,
+        'AUC': result['auc'],
+        'Acurácia': result['accuracy'],
+        'Precisão': result['precision'],
+        'Recall': result['recall'],
+        'F1-Score': result['f1']
+    }
+    for name, result in results.items()
+]).sort_values('AUC', ascending=False)
+st.dataframe(results_df.style.format({
+    'AUC': '{:.3f}', 'Acurácia': '{:.3f}', 'Precisão': '{:.3f}',
+    'Recall': '{:.3f}', 'F1-Score': '{:.3f}'
+}).background_gradient(subset=['AUC', 'F1-Score'], cmap='Blues'))
+# Identificar melhor modelo
+best_model_name = results_df.iloc[0]['Modelo']
+best_model = results[best_model_name]
+st.success(f"🏆 MELHOR MODELO: {best_model_name} (AUC: {best_model['auc']:.3f})")
+# =============================================================================
+# I.d) SENSIBILIDADE AOS HIPERPARÂMETROS
+# =============================================================================
+st.header("🎛️ I.d) SENSIBILIDADE AOS HIPERPARÂMETROS")
+if tunar_hiperparametros and len(models) >= 2:
+    st.write("**Ajuste de hiperparâmetros para dois modelos selecionados:**")
+    # Selecionar dois modelos para tuning
+    models_to_tune = list(models.keys())[:2]
+    for model_name in models_to_tune:
+        with st.expander(f"🔧 Ajuste de {model_name}"):
+            if model_name == 'Random Forest':
+                param_grid = {
+                    'n_estimators': [50, 100, 200],
+                    'max_depth': [5, 10, None],
+                    'min_samples_split': [2, 5, 10]
+                }
+                base_model = RandomForestClassifier(random_state=42)
+            elif model_name == 'K-Nearest Neighbors':
+                param_grid = {
+                    'n_neighbors': [3, 5, 7, 10],
+                    'weights': ['uniform', 'distance'],
+                    'metric': ['euclidean', 'manhattan']
+                }
+                base_model = KNeighborsClassifier()
+            else:
+                continue
+            grid_search = GridSearchCV(base_model, param_grid, cv=5, scoring='roc_auc', n_jobs=-1)
+            grid_search.fit(X_train_final, y_train_bal)
+            st.write(f"**Melhores parâmetros:** {grid_search.best_params_}")
+            st.write(f"**Melhor score (validação):** {grid_search.best_score_:.3f}")
+            # Comparar com modelo padrão
+            original_auc = results[model_name]['auc']
+            tuned_auc = roc_auc_score(y_test, grid_search.best_estimator_.predict_proba(X_test_final)[:, 1])
+            st.write(f"**Comparação de AUC:**")
+            st.write(f"- Original: {original_auc:.3f}")
+            st.write(f"- Com tuning: {tuned_auc:.3f}")
+            st.write(f"- Melhoria: {tuned_auc - original_auc:.3f}")
+# =============================================================================
+# ANÁLISE DO MELHOR MODELO
+# =============================================================================
+st.header("🔍 ANÁLISE DETALHADA DO MELHOR MODELO")
+col1, col2 = st.columns(2)
+with col1:
+    # Curva ROC
+    if best_model['y_proba'] is not None:
+        fpr, tpr, _ = roc_curve(y_test, best_model['y_proba'])
+        fig_roc = go.Figure()
+        fig_roc.add_trace(go.Scatter(x=fpr, y=tpr, mode='lines',
+                                   name=f'{best_model_name} (AUC = {best_model["auc"]:.3f})',
+                                   line=dict(width=3)))
+        fig_roc.add_trace(go.Scatter(x=[0, 1], y=[0, 1], mode='lines',
+                                   name='Classificador Aleatório', line=dict(dash='dash', color='red')))
+        fig_roc.update_layout(title='Curva ROC', xaxis_title='Taxa de Falsos Positivos',
+                             yaxis_title='Taxa de Verdadeiros Positivos', showlegend=True)
+        st.plotly_chart(fig_roc)
+with col2:
+    # Matriz de Confusão
+    cm = confusion_matrix(y_test, best_model['y_pred'])
+    fig_cm = px.imshow(cm, text_auto=True, title='Matriz de Confusão',
+                      labels=dict(x="Predito", y="Real", color="Quantidade"),
+                      x=['Não Reclamou', 'Reclamou'],
+                      y=['Não Reclamou', 'Reclamou'],
+                      color_continuous_scale="Blues")
+    st.plotly_chart(fig_cm)
+# Relatório de classificação
+st.subheader("📋 Relatório de Classificação Detalhado")
+st.text(classification_report(y_test, best_model['y_pred'], target_names=['Não Reclamou', 'Reclamou']))
+# =============================================================================
+# I.e) TOMADA DE DECISÃO E APLICAÇÃO GERENCIAL
+# =============================================================================
+st.header("💡 I.e) TOMADA DE DECISÃO E APLICAÇÃO GERENCIAL")
+st.subheader("📈 ANÁLISE DE IMPORTÂNCIA DAS VARIÁVEIS")
+if hasattr(best_model['model'], 'feature_importances_'):
+    # Modelos baseados em árvore
+    importances = best_model['model'].feature_importances_
+    feature_imp_df = pd.DataFrame({
+        'feature': selected_features,
+        'importance': importances
+    }).sort_values('importance', ascending=True)
+    fig_imp = px.bar(feature_imp_df.tail(10), x='importance', y='feature',
+                     orientation='h', title='Top 10 Variáveis Mais Importantes - Feature Importance')
+    st.plotly_chart(fig_imp)
+    # Análise gerencial
+    st.subheader("🎯 INTERPRETAÇÃO GERENCIAL")
+    top_features = feature_imp_df.tail(5)
+    st.write("**Variáveis com maior impacto nas reclamações:**")
+    for _, row in top_features.iterrows():
+        st.write(f"• **{row['feature']}**: {row['importance']:.3f}")
+elif hasattr(best_model['model'], 'coef_'):
+    # Modelos lineares
+    coefficients = best_model['model'].coef_[0]
+    coef_df = pd.DataFrame({
+        'feature': selected_features,
+        'coefficient': coefficients,
+        'odds_ratio': np.exp(coefficients)
+    }).sort_values('odds_ratio', ascending=True)
+    fig_coef = px.bar(coef_df, x='odds_ratio', y='feature',
+                      orientation='h', title='Importância das Variáveis - Odds Ratios')
+    fig_coef.add_vline(x=1, line_dash="dash", line_color="red", annotation_text="Linha Neutra")
+    st.plotly_chart(fig_coef)
+    # Análise gerencial
+    st.subheader("🎯 INTERPRETAÇÃO GERENCIAL")
+    st.write("**Variáveis que AUMENTAM a probabilidade de reclamação (Odds Ratio > 1):**")
+    positive_impact = coef_df[coef_df['odds_ratio'] > 1].sort_values('odds_ratio', ascending=False)
+    for _, row in positive_impact.head(3).iterrows():
+        increase = (row['odds_ratio'] - 1) * 100
+        st.write(f"• **{row['feature']}**: {row['odds_ratio']:.2f} (aumento de {increase:.1f}%)")
+    st.write("**Variáveis que DIMINUEM a probabilidade de reclamação (Odds Ratio < 1):**")
+    negative_impact = coef_df[coef_df['odds_ratio'] < 1].sort_values('odds_ratio', ascending=True)
+    for _, row in negative_impact.head(3).iterrows():
+        decrease = (1 - row['odds_ratio']) * 100
+        st.write(f"• **{row['feature']}**: {row['odds_ratio']:.2f} (redução de {decrease:.1f}%)")
+# =============================================================================
+# MODELO STATSMODELS (ESTILO PROFESSOR)
+# =============================================================================
+st.header("📊 MODELO STATSMODELS - REGRESSÃO LOGÍSTICA")
+if 'Logistic Regression' in [name for name in models.keys() if 'Logistic' in name]:
+    X_train_sm = sm.add_constant(X_train_final)
+    logit_model = sm.Logit(y_train_bal, X_train_sm)
+    result = logit_model.fit(disp=0)
+    st.subheader("Resumo Estatístico")
+    st.text(result.summary().as_text())
+    # Tabela de coeficientes
+    st.subheader("Coeficientes e Odds Ratios")
+    coefficients_df = pd.DataFrame({
+        'Variável': X_train_sm.columns,
+        'Coeficiente': result.params,
+        'Odds Ratio': np.exp(result.params),
+        'P-valor': result.pvalues
+    }).round(4)
+    st.dataframe(coefficients_df[coefficients_df['Variável'] != 'const']
+                .sort_values('Odds Ratio', ascending=False)
+                .style.format({'Coeficiente': '{:.4f}', 'Odds Ratio': '{:.4f}', 'P-valor': '{:.4f}'}))
+# =============================================================================
+# VISUALIZAÇÃO E INTERPRETAÇÃO (ESTILO PROFESSOR)
+# =============================================================================
+st.header("📈 VISUALIZAÇÃO E INTERPRETAÇÃO")
+# Gráfico de importância estilo professor
+if 'coefficients_df' in locals():
+    coefficients_plot = coefficients_df[coefficients_df['Variável'] != 'const'].sort_values('Odds Ratio', ascending=True)
+    fig, ax = plt.subplots(figsize=(10, 8))
+    y_pos = np.arange(len(coefficients_plot))
+    ax.barh(y_pos, coefficients_plot['Odds Ratio'], color=['#1f77b4' if x < 1 else '#ff7f0e' for x in coefficients_plot['Odds Ratio']])
+    ax.set_yticks(y_pos)
+    ax.set_yticklabels(coefficients_plot['Variável'])
+    ax.set_xlabel('Odds Ratio')
+    ax.set_title('Importância das Variáveis - Odds Ratios')
+    ax.axvline(x=1, color='red', linestyle='--', alpha=0.7, label='Linha Neutra')
+    ax.legend()
+    # Adicionar valores nas barras
+    for i, v in enumerate(coefficients_plot['Odds Ratio']):
+        ax.text(v + 0.01, i, f'{v:.2f}', va='center', fontweight='bold')
+    st.pyplot(fig)
+# =============================================================================
+# RECOMENDAÇÕES ESTRATÉGICAS
+# =============================================================================
+st.header("🚀 RECOMENDAÇÕES ESTRATÉGICAS")
+st.markdown("""
+**Baseado na análise do melhor modelo, recomenda-se:**
+1. **Segmentação de Clientes:** Identificar perfis com maior propensão a reclamações
+2. **Ações Proativas:** Contatar clientes de alto risco antes que reclamem
+3. **Otimização de Recursos:** Alocar mais recursos de suporte para segmentos problemáticos
+4. **Melhoria Contínua:** Monitorar continuamente os fatores que influenciam reclamações
+**Exemplo de insight acionável:**
+*"Clientes com maior gasto em vinhos, presença de filhos e maior tempo desde a última compra tendem a apresentar maior propensão a reclamações."*
+""")
+# =============================================================================
+# EXPORTAÇÃO DE RESULTADOS
+# =============================================================================
+st.header("💾 EXPORTAÇÃO DE RESULTADOS")
+# Criar relatório final
+relatorio_final = pd.DataFrame({
+    'Modelo': results_df['Modelo'],
+    'AUC': results_df['AUC'],
+    'Acurácia': results_df['Acurácia'],
+    'Precisão': results_df['Precisão'],
+    'Recall': results_df['Recall'],
+    'F1-Score': results_df['F1-Score']
+})
+csv = relatorio_final.to_csv(index=False)
+st.download_button(
+    label="📥 Baixar Resultados em CSV",
+    data=csv,
+    file_name="resultados_tarefa4_reclamacoes.csv",
+    mime="text/csv"
+)
+# Footer
+st.markdown("---")
+st.markdown(
+    "<p style='text-align: center; color: gray;'>Tarefa 4 - Previsão de Reclamações com Modelos Supervisionados | "
+    "Aplicação contempla todos os requisitos: Balanceamento (SMOTE), RFE, Múltiplos Modelos, Análise de Hiperparâmetros, Interpretação Gerencial</p>",
+    unsafe_allow_html=True
+)