Spaces:

EmilySouza021
/

Emys

Sleeping

App Files Files Community

EmilySouza021 commited on Oct 16, 2025

Commit

02a6d79

verified ·

1 Parent(s): 83917d8

Update app.py

Browse files

Files changed (1) hide show

app.py +180 -351

app.py CHANGED Viewed

@@ -3,224 +3,136 @@ import pandas as pd
 import numpy as np
 import matplotlib.pyplot as plt
 import seaborn as sns
-import plotly.express as px
-import plotly.graph_objects as go
-from plotly.subplots import make_subplots
-from sklearn.linear_model import LinearRegression, Ridge
-from sklearn.ensemble import RandomForestRegressor
-from sklearn.model_selection import train_test_split, cross_val_score
 from sklearn.metrics import r2_score, mean_squared_error, mean_absolute_error
-from sklearn.preprocessing import StandardScaler, LabelEncoder
-from sklearn.inspection import permutation_importance
-from scipy import stats
-from scipy.stats import kruskal, shapiro, levene, norm
 import io
 import base64
-import warnings
-warnings.filterwarnings('ignore')
-# CONFIGURAÇÕES VISUAIS PROFISSIONAIS
-plt.style.use('seaborn-v0_8')
-sns.set_palette("husl")
-plt.rcParams['figure.figsize'] = (14, 10)
-plt.rcParams['font.size'] = 12
-# CORES PROFISSIONAIS
-CORES = {
-    'primaria': '#2E86AB',
-    'secundaria': '#A23B72',
-    'sucesso': '#18A558',
-    'alerta': '#F18F01',
-    'perigo': '#C73E1D',
-    'neutro': '#6C757D',
-    'fundo': '#F8F9FA'
-}
-def criar_dashboard_profissional():
-    """Função principal que cria o dashboard profissional"""
-    with gr.Blocks(theme=gr.themes.Soft(primary_hue="blue", neutral_hue="slate")) as dashboard:
-        # HEADER PROFISSIONAL
-        with gr.Row():
-            with gr.Column(scale=1):
-                gr.Markdown(
-                    """
-                    <div style="text-align: center; padding: 20px; background: linear-gradient(135deg, #667eea 0%, #764ba2 100%); border-radius: 15px; color: white;">
-                        <h1 style="margin: 0; font-size: 2.5em;">🏠 ANALYTICS IMOBILIÁRIO</h1>
-                        <p style="margin: 0; font-size: 1.2em; opacity: 0.9;">Dashboard de Modelagem Estatística Avançada</p>
-                    </div>
-                    """
-                )
-        # MENU DE NAVEGAÇÃO
         with gr.Row():
-            with gr.Column():
-                selected_tab = gr.Radio(
-                    choices=["📊 Análise Exploratória", "📈 ANOVA Estatística", "🤖 Modelo Preditivo", "📋 Relatório Completo"],
-                    value="📊 Análise Exploratória",
-                    label="Navegação",
-                    info="Selecione a análise desejada"
-                )
         gr.Markdown("---")
-        # PAINEL DE CONTROLES
         with gr.Row():
             with gr.Column(scale=1):
-                with gr.Group():
-                    gr.Markdown("### ⚙️ Configurações dos Dados")
-                    arquivo_csv = gr.File(
-                        label="Upload do Dataset (CSV)",
-                        file_types=[".csv"],
-                        file_count="single"
                     )
-                    gr.Markdown("**📋 Variáveis para Análise**")
-                    with gr.Row():
-                        var_cat_anova_1 = gr.Dropdown(
-                            label="Variável Categórica 1 (ANOVA)",
-                            choices=[],
-                            interactive=True
-                        )
-                        var_cat_anova_2 = gr.Dropdown(
-                            label="Variável Categórica 2 (ANOVA)",
-                            choices=[],
-                            interactive=True
-                        )
-                    with gr.Row():
-                        var_cont_reg_1 = gr.Dropdown(
-                            label="Variável Contínua 1 (Regressão)",
-                            choices=[],
-                            interactive=True
-                        )
-                        var_cont_reg_2 = gr.Dropdown(
-                            label="Variável Contínua 2 (Regressão)",
-                            choices=[],
-                            interactive=True
-                        )
-                    var_cat_reg = gr.Dropdown(
-                        label="Variável Categórica (Regressão)",
                         choices=[],
                         interactive=True
                     )
-                    with gr.Row():
-                        aplicar_log = gr.Checkbox(
-                            label="Aplicar Transformação Logarítmica",
-                            value=True,
-                            interactive=True
-                        )
-                        testar_pressupostos = gr.Checkbox(
-                            label="Testar Pressupostos Estatísticos",
-                            value=True,
-                            interactive=True
-                        )
                 btn_analisar = gr.Button(
-                    "🚀 EXECUTAR ANÁLISE COMPLETA",
                     variant="primary",
                     size="lg"
                 )
-            # ÁREA DE RESULTADOS
             with gr.Column(scale=2):
-                output_analise = gr.HTML(
-                    label="Resultados da Análise",
                     value="""
-                    <div style="text-align: center; padding: 60px; background: #f8f9fa; border-radius: 10px; border: 2px dashed #dee2e6;">
                         <h3 style="color: #6c757d;">📊 Área de Resultados</h3>
-                        <p style="color: #6c757d;">Configure os parâmetros e execute a análise para ver os resultados</p>
                     </div>
                     """
                 )
-        # FUNÇÕES DE ATUALIZAÇÃO
         def atualizar_variaveis(arquivo):
-            """Atualiza dropdowns com variáveis do dataset"""
             if arquivo is None:
-                # Variáveis padrão para dados de exemplo
-                variaveis = ['OverallQual', 'FullBath', 'Neighborhood', 'GrLivArea', 'GarageCars', 'BedroomAbvGr', 'YearBuilt']
-                return [gr.Dropdown(choices=variaveis)] * 5
             else:
                 try:
                     df = pd.read_csv(arquivo.name)
                     variaveis = df.columns.tolist()
-                    return [gr.Dropdown(choices=variaveis)] * 5
                 except:
-                    return [gr.Dropdown(choices=[])] * 5
-        # FUNÇÃO PRINCIPAL DE ANÁLISE
-        def executar_analise_completa(arquivo, var_cat1, var_cat2, var_cont1, var_cont2, var_cat_reg, aplicar_log, testar_pressupostos, tab_selecionada):
-            """Executa análise estatística completa"""
             try:
-                # CARREGAR DADOS
                 if arquivo is None:
                     df = gerar_dados_exemplo()
                 else:
                     df = pd.read_csv(arquivo.name)
-                # ANÁLISE EXPLORATÓRIA
-                if tab_selecionada == "📊 Análise Exploratória":
-                    return gerar_analise_exploratoria(df)
-                # ANÁLISE ANOVA
-                elif tab_selecionada == "📈 ANOVA Estatística":
-                    return gerar_analise_anova(df, var_cat1, var_cat2, testar_pressupostos)
-                # MODELO PREDITIVO
-                elif tab_selecionada == "🤖 Modelo Preditivo":
-                    return gerar_modelo_preditivo(df, var_cont1, var_cont2, var_cat_reg, aplicar_log, testar_pressupostos)
-                # RELATÓRIO COMPLETO
                 else:
-                    return gerar_relatorio_completo(df, var_cat1, var_cat2, var_cont1, var_cont2, var_cat_reg, aplicar_log, testar_pressupostos)
             except Exception as e:
                 return f"""
-                <div style="background: #f8d7da; color: #721c24; padding: 20px; border-radius: 10px; border: 1px solid #f5c6cb;">
-                    <h3>❌ Erro na Análise</h3>
-                    <p><strong>Detalhes:</strong> {str(e)}</p>
-                    <p>Verifique se as variáveis selecionadas existem no dataset.</p>
                 </div>
                 """
-        # CONECTAR INTERAÇÕES
-        arquivo_csv.change(
-            fn=atualizar_variaveis,
-            inputs=[arquivo_csv],
-            outputs=[var_cat_anova_1, var_cat_anova_2, var_cont_reg_1, var_cont_reg_2, var_cat_reg]
-        )
-        btn_analisar.click(
-            fn=executar_analise_completa,
-            inputs=[arquivo_csv, var_cat_anova_1, var_cat_anova_2, var_cont_reg_1, var_cont_reg_2, var_cat_reg, aplicar_log, testar_pressupostos, selected_tab],
-            outputs=[output_analise]
-        )
-        selected_tab.change(
-            fn=lambda tab: f"""
-            <div style="text-align: center; padding: 40px; background: #e9ecef; border-radius: 10px;">
-                <h3>Pronto para análise: {tab}</h3>
-                <p>Configure os parâmetros e clique em EXECUTAR ANÁLISE COMPLETA</p>
-            </div>
-            """,
-            inputs=[selected_tab],
-            outputs=[output_analise]
-        )
         # FOOTER
         gr.Markdown("---")
         gr.Markdown(
             """
-            <div style="text-align: center; color: #6c757d; padding: 20px;">
-                <p><strong>Dashboard Desenvolvido por:</strong> Emily Valkiria | <strong>Disciplina:</strong> SIEP - UnB</p>
-                <p><strong>Tecnologias:</strong> Python • Scikit-learn • Plotly • Gradio • Estatística Avançada</p>
             </div>
             """
         )
@@ -228,237 +140,154 @@ def criar_dashboard_profissional():
     return dashboard
 def gerar_dados_exemplo():
-    """Gera dados de exemplo realistas"""
     np.random.seed(42)
-    n_imoveis = 1000
     dados = pd.DataFrame({
-        'SalePrice': np.random.lognormal(12.5, 0.35, n_imoveis),
-        'GrLivArea': np.random.normal(1600, 450, n_imoveis),
-        'OverallQual': np.random.choice([1,2,3,4,5,6,7,8,9,10], n_imoveis, p=[0.01,0.02,0.05,0.1,0.15,0.2,0.2,0.15,0.08,0.04]),
-        'Neighborhood': np.random.choice(['Centro', 'Norte', 'Sul', 'Leste', 'Oeste', 'Noroeste', 'Sudoeste'], n_imoveis),
-        'FullBath': np.random.choice([1,2,3,4], n_imoveis, p=[0.05,0.6,0.3,0.05]),
-        'GarageCars': np.random.choice([0,1,2,3], n_imoveis, p=[0.1,0.4,0.4,0.1]),
-        'BedroomAbvGr': np.random.choice([1,2,3,4,5], n_imoveis, p=[0.05,0.25,0.4,0.25,0.05]),
-        'YearBuilt': np.random.randint(1950, 2020, n_imoveis),
-        'Fireplaces': np.random.choice([0,1,2], n_imoveis, p=[0.3,0.6,0.1]),
-        'LotArea': np.random.lognormal(8.5, 0.6, n_imoveis)
     })
-    # Ajustes realistas nos preços
-    dados['SalePrice'] = (dados['SalePrice'] * 15000 +
-                         dados['GrLivArea'] * 120 +
-                         dados['OverallQual'] * 25000 +
-                         dados['FullBath'] * 18000 +
-                         dados['GarageCars'] * 15000 +
-                         (dados['YearBuilt'] - 1950) * 800 +
-                         dados['Fireplaces'] * 12000)
     dados['SalePrice'] = dados['SalePrice'].astype(int)
-    dados['GrLivArea'] = dados['GrLivArea'].astype(int)
-    dados['LotArea'] = dados['LotArea'].astype(int)
     return dados
-def gerar_analise_exploratoria(df):
-    """Gera análise exploratória completa com gráficos interativos"""
-    # Converter DataFrame para Plotly
-    fig_precos = px.histogram(df, x='SalePrice',
-                             title='📊 Distribuição de Preços dos Imóveis',
-                             nbins=30,
-                             color_discrete_sequence=['#2E86AB'])
-    fig_precos.update_layout(showlegend=False)
-    # Gráfico de correlação
-    numeric_cols = df.select_dtypes(include=[np.number]).columns
-    corr_matrix = df[numeric_cols].corr()
-    fig_corr = px.imshow(corr_matrix,
-                        title='🔥 Mapa de Correlação entre Variáveis',
-                        color_continuous_scale='RdBu_r',
-                        aspect="auto")
-    # Scatter plot interativo
-    if 'GrLivArea' in df.columns and 'SalePrice' in df.columns:
-        fig_scatter = px.scatter(df, x='GrLivArea', y='SalePrice',
-                               title='🏠 Área vs Preço - Análise de Dispersão',
-                               trendline="ols",
-                               color_discrete_sequence=['#A23B72'])
-    else:
-        fig_scatter = go.Figure()
-        fig_scatter.add_annotation(text="Variáveis não disponíveis para scatter plot")
-    # Estatísticas descritivas
-    stats_html = gerar_estatisticas_descritivas(df)
-    # Converter gráficos para HTML
-    plot_precos = fig_precos.to_html(full_html=False, include_plotlyjs='cdn')
-    plot_corr = fig_corr.to_html(full_html=False, include_plotlyjs=False)
-    plot_scatter = fig_scatter.to_html(full_html=False, include_plotlyjs=False)
     return f"""
-    <div style="font-family: 'Segoe UI', Arial, sans-serif;">
-        <h2 style="color: #2E86AB; border-bottom: 2px solid #2E86AB; padding-bottom: 10px;">📊 ANÁLISE EXPLORATÓRIA COMPLETA</h2>
-        <div style="background: #f8f9fa; padding: 20px; border-radius: 10px; margin-bottom: 20px;">
-            <h3 style="color: #495057;">📈 Estatísticas Descritivas</h3>
-            {stats_html}
-        </div>
-        <div style="display: grid; grid-template-columns: 1fr 1fr; gap: 20px; margin-bottom: 20px;">
-            <div style="background: white; padding: 15px; border-radius: 10px; box-shadow: 0 2px 10px rgba(0,0,0,0.1);">
-                {plot_precos}
-            </div>
-            <div style="background: white; padding: 15px; border-radius: 10px; box-shadow: 0 2px 10px rgba(0,0,0,0.1);">
-                {plot_scatter}
             </div>
         </div>
-        <div style="background: white; padding: 20px; border-radius: 10px; box-shadow: 0 2px 10px rgba(0,0,0,0.1);">
-            {plot_corr}
         </div>
     </div>
     """
-def gerar_estatisticas_descritivas(df):
-    """Gera tabela de estatísticas descritivas"""
-    if 'SalePrice' in df.columns:
-        stats = df['SalePrice'].describe()
-        return f"""
-        <div style="display: grid; grid-template-columns: repeat(4, 1fr); gap: 10px;">
-            <div style="background: #e7f3ff; padding: 10px; border-radius: 5px; text-align: center;">
-                <strong>Média</strong><br>R$ {stats['mean']:,.0f}
-            </div>
-            <div style="background: #e7f3ff; padding: 10px; border-radius: 5px; text-align: center;">
-                <strong>Mediana</strong><br>R$ {stats['50%']:,.0f}
-            </div>
-            <div style="background: #e7f3ff; padding: 10px; border-radius: 5px; text-align: center;">
-                <strong>Desvio Padrão</strong><br>R$ {stats['std']:,.0f}
-            </div>
-            <div style="background: #e7f3ff; padding: 10px; border-radius: 5px; text-align: center;">
-                <strong>Total</strong><br>{len(df)} imóveis
-            </div>
-        </div>
-        """
-    return "<p>Estatísticas não disponíveis</p>"
-def gerar_analise_anova(df, var_cat1, var_cat2, testar_pressupostos):
-    """Gera análise ANOVA/Kruskal-Wallis"""
     resultados = []
-    for i, var_cat in enumerate([var_cat1, var_cat2], 1):
-        if var_cat and var_cat in df.columns:
-            # Análise para cada variável categórica
-            resultado_var = executar_teste_anova(df, var_cat, testar_pressupostos)
-            resultados.append(resultado_var)
     if resultados:
         resultados_html = "\n".join(resultados)
     else:
-        resultados_html = "<p>Selecione variáveis categóricas para análise ANOVA</p>"
-    return f"""
-    <div style="font-family: 'Segoe UI', Arial, sans-serif;">
-        <h2 style="color: #A23B72; border-bottom: 2px solid #A23B72; padding-bottom: 10px;">📈 ANÁLISE ANOVA - DIFERENÇAS ENTRE CATEGORIAS</h2>
-        {resultados_html}
-    </div>
-    """
-def executar_teste_anova(df, variavel, testar_pressupostos):
-    """Executa teste ANOVA ou Kruskal-Wallis"""
-    grupos = [grupo['SalePrice'].values for nome, grupo in df.groupby(variavel)]
-    # Teste de normalidade
-    if testar_pressupostos:
-        p_valores_normalidade = [shapiro(grupo)[1] for grupo in grupos if len(grupo) > 3 and len(grupo) < 5000]
-        normalidade_ok = all(p > 0.05 for p in p_valores_normalidade) if p_valores_normalidade else False
-    else:
-        normalidade_ok = False
-    # Escolher teste
-    if normalidade_ok:
-        from scipy.stats import f_oneway
-        estatistica, p_valor = f_oneway(*grupos)
-        teste_usado = "ANOVA One-Way"
-    else:
-        estatistica, p_valor = kruskal(*grupos)
-        teste_usado = "Kruskal-Wallis (não-paramétrico)"
-    # Interpretação
-    significativo = p_valor < 0.05
-    icone = "✅" if significativo else "❌"
-    conclusao = "IMPACTA SIGNIFICATIVAMENTE" if significativo else "NÃO IMPACTA SIGNIFICATIVAMENTE"
     return f"""
-    <div style="background: {'#d4edda' if significativo else '#f8d7da'}; padding: 20px; border-radius: 10px; margin-bottom: 15px; border-left: 5px solid {'#28a745' if significativo else '#dc3545'};">
-        <h3 style="margin-top: 0; color: {'#155724' if significativo else '#721c24'};">{icone} Variável: {variavel}</h3>
-        <p><strong>Teste Utilizado:</strong> {teste_usado}</p>
-        <p><strong>Estatística:</strong> {estatistica:.4f}</p>
-        <p><strong>Valor-p:</strong> {p_valor:.6f}</p>
-        <p><strong>Conclusão:</strong> {conclusao} o preço dos imóveis</p>
-        <p><strong>Interpretação:</strong> Há {'diferenças significativas' if significativo else 'diferenças não significativas'} nos preços médios entre as categorias de {variavel}.</p>
     </div>
     """
-def gerar_modelo_preditivo(df, var_cont1, var_cont2, var_cat, aplicar_log, testar_pressupostos):
-    """Gera modelo preditivo de regressão"""
     return """
-    <div style="font-family: 'Segoe UI', Arial, sans-serif;">
-        <h2 style="color: #18A558; border-bottom: 2px solid #18A558; padding-bottom: 10px;">🤖 MODELO PREDITIVO - REGRESSÃO LINEAR</h2>
         <div style="background: #d1ecf1; padding: 20px; border-radius: 10px;">
-            <h3>🚧 Funcionalidade em Desenvolvimento</h3>
-            <p>O módulo de modelagem preditiva está sendo finalizado com:</p>
             <ul>
-                <li>🔍 Seleção automática de variáveis</li>
-                <li>📊 Diagnóstico completo de pressupostos</li>
-                <li>📈 Métricas de desempenho avançadas</li>
-                <li>🎯 Interpretação dos coeficientes</li>
             </ul>
-            <p><strong>Status:</strong> Implementação em andamento</p>
-        </div>
-    </div>
-    """
-def gerar_relatorio_completo(df, var_cat1, var_cat2, var_cont1, var_cont2, var_cat_reg, aplicar_log, testar_pressupostos):
-    """Gera relatório completo da análise"""
-    return """
-    <div style="font-family: 'Segoe UI', Arial, sans-serif;">
-        <h2 style="color: #F18F01; border-bottom: 2px solid #F18F01; padding-bottom: 10px;">📋 RELATÓRIO COMPLETO DA ANÁLISE</h2>
-        <div style="background: #fff3cd; padding: 20px; border-radius: 10px;">
-            <h3>📖 Sumário Executivo</h3>
-            <p>Este dashboard oferece análise estatística completa para precificação imobiliária, incluindo:</p>
-            <div style="display: grid; grid-template-columns: 1fr 1fr; gap: 15px; margin: 20px 0;">
-                <div style="background: white; padding: 15px; border-radius: 8px; border-left: 4px solid #2E86AB;">
-                    <h4>📊 Análise Exploratória</h4>
-                    <p>Visualização interativa dos dados e estatísticas descritivas</p>
-                </div>
-                <div style="background: white; padding: 15px; border-radius: 8px; border-left: 4px solid #A23B72;">
-                    <h4>📈 Testes ANOVA</h4>
-                    <p>Análise de diferenças entre categorias com diagnósticos</p>
-                </div>
-                <div style="background: white; padding: 15px; border-radius: 8px; border-left: 4px solid #18A558;">
-                    <h4>🤖 Modelagem Preditiva</h4>
-                    <p>Regressão linear múltipla com transformações</p>
-                </div>
-                <div style="background: white; padding: 15px; border-radius: 8px; border-left: 4px solid #F18F01;">
-                    <h4>📋 Relatórios Automáticos</h4>
-                    <p>Documentação completa dos resultados</p>
-                </div>
-            </div>
-            <h3>🎯 Próximos Passos</h3>
-            <p>Para uma análise completa, navegue entre as abas e configure os parâmetros desejados.</p>
         </div>
     </div>
     """
-# INICIALIZAR DASHBOARD
 if __name__ == "__main__":
-    dashboard = criar_dashboard_profissional()
-    dashboard.launch(share=True)

 import numpy as np
 import matplotlib.pyplot as plt
 import seaborn as sns
+from sklearn.linear_model import LinearRegression
+from sklearn.model_selection import train_test_split
 from sklearn.metrics import r2_score, mean_squared_error, mean_absolute_error
+from scipy.stats import kruskal, shapiro
 import io
 import base64
+# Configuracoes
+plt.style.use('default')
+sns.set_style("whitegrid")
+def criar_dashboard():
+    with gr.Blocks(theme=gr.themes.Soft()) as dashboard:
+        # HEADER
+        gr.Markdown(
+            """
+            <div style="text-align: center; background: linear-gradient(135deg, #667eea 0%, #764ba2 100%); padding: 30px; border-radius: 15px; color: white;">
+                <h1 style="margin: 0;">🏠 ANALYTICS IMOBILIÁRIO</h1>
+                <p style="margin: 0; opacity: 0.9;">Dashboard de Modelagem Estatística - UnB</p>
+            </div>
+            """
+        )
+        # MENU
         with gr.Row():
+            aba = gr.Radio(
+                choices=["📊 Análise Exploratória", "📈 ANOVA", "🤖 Regressão Linear"],
+                value="📊 Análise Exploratória",
+                label="Navegação"
+            )
         gr.Markdown("---")
+        # CONTROLES
         with gr.Row():
             with gr.Column(scale=1):
+                arquivo = gr.File(
+                    label="📁 Upload do Dataset (CSV)",
+                    file_types=[".csv"]
+                )
+                gr.Markdown("**⚙️ Configurações de Análise**")
+                with gr.Row():
+                    var_cat1 = gr.Dropdown(
+                        label="Variável Categórica 1",
+                        choices=[],
+                        interactive=True
                     )
+                    var_cat2 = gr.Dropdown(
+                        label="Variável Categórica 2",
+                        choices=[],
+                        interactive=True
+                    )
+                with gr.Row():
+                    var_cont1 = gr.Dropdown(
+                        label="Variável Contínua 1",
+                        choices=[],
+                        interactive=True
+                    )
+                    var_cont2 = gr.Dropdown(
+                        label="Variável Contínua 2",
                         choices=[],
                         interactive=True
                     )
                 btn_analisar = gr.Button(
+                    "🚀 Executar Análise",
                     variant="primary",
                     size="lg"
                 )
+            # RESULTADOS
             with gr.Column(scale=2):
+                resultados = gr.HTML(
                     value="""
+                    <div style="text-align: center; padding: 50px; background: #f8f9fa; border-radius: 10px;">
                         <h3 style="color: #6c757d;">📊 Área de Resultados</h3>
+                        <p style="color: #6c757d;">Configure os parâmetros e execute a análise</p>
                     </div>
                     """
                 )
+        # FUNÇÕES
         def atualizar_variaveis(arquivo):
             if arquivo is None:
+                vars_padrao = ['OverallQual', 'FullBath', 'Neighborhood', 'GrLivArea', 'GarageCars', 'BedroomAbvGr']
+                return [gr.Dropdown(choices=vars_padrao)] * 4
             else:
                 try:
                     df = pd.read_csv(arquivo.name)
                     variaveis = df.columns.tolist()
+                    return [gr.Dropdown(choices=variaveis)] * 4
                 except:
+                    return [gr.Dropdown(choices=[])] * 4
+        def executar_analise(arquivo, var_cat1, var_cat2, var_cont1, var_cont2, aba):
             try:
                 if arquivo is None:
                     df = gerar_dados_exemplo()
                 else:
                     df = pd.read_csv(arquivo.name)
+                if aba == "📊 Análise Exploratória":
+                    return analise_exploratoria(df)
+                elif aba == "📈 ANOVA":
+                    return analise_anova(df, var_cat1, var_cat2)
                 else:
+                    return analise_regressao(df, var_cont1, var_cont2, var_cat1)
             except Exception as e:
                 return f"""
+                <div style="background: #f8d7da; color: #721c24; padding: 20px; border-radius: 10px;">
+                    <h3>❌ Erro</h3>
+                    <p>{str(e)}</p>
                 </div>
                 """
+        # CONEXÕES
+        arquivo.change(atualizar_variaveis, [arquivo], [var_cat1, var_cat2, var_cont1, var_cont2])
+        btn_analisar.click(executar_analise, [arquivo, var_cat1, var_cat2, var_cont1, var_cont2, aba], [resultados])
         # FOOTER
         gr.Markdown("---")
         gr.Markdown(
             """
+            <div style="text-align: center; color: #6c757d;">
+                <p><strong>Desenvolvido por:</strong> Emily Valkiria | <strong>Disciplina:</strong> SIEP - UnB</p>
             </div>
             """
         )
     return dashboard
 def gerar_dados_exemplo():
     np.random.seed(42)
+    n_imoveis = 500
     dados = pd.DataFrame({
+        'SalePrice': np.random.normal(300000, 80000, n_imoveis),
+        'GrLivArea': np.random.normal(1500, 400, n_imoveis),
+        'OverallQual': np.random.randint(1, 11, n_imoveis),
+        'Neighborhood': np.random.choice(['Centro', 'Norte', 'Sul', 'Leste'], n_imoveis),
+        'FullBath': np.random.randint(1, 4, n_imoveis),
+        'GarageCars': np.random.randint(0, 4, n_imoveis),
+        'BedroomAbvGr': np.random.randint(1, 6, n_imoveis)
     })
+    dados['SalePrice'] = (dados['SalePrice'] +
+                         dados['GrLivArea'] * 100 +
+                         dados['OverallQual'] * 15000)
     dados['SalePrice'] = dados['SalePrice'].astype(int)
     return dados
+def analise_exploratoria(df):
+    # Criar gráficos com matplotlib
+    fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(15, 12))
+    # Gráfico 1: Distribuição de preços
+    ax1.hist(df['SalePrice'], bins=20, color='skyblue', edgecolor='black', alpha=0.7)
+    ax1.set_title('Distribuição de Preços', fontsize=14, fontweight='bold')
+    ax1.set_xlabel('Preço (R$)')
+    ax1.set_ylabel('Frequência')
+    ax1.grid(True, alpha=0.3)
+    # Gráfico 2: Área vs Preço
+    ax2.scatter(df['GrLivArea'], df['SalePrice'], alpha=0.6, color='coral')
+    ax2.set_title('Relação: Área vs Preço', fontsize=14, fontweight='bold')
+    ax2.set_xlabel('Área (m²)')
+    ax2.set_ylabel('Preço (R$)')
+    ax2.grid(True, alpha=0.3)
+    # Gráfico 3: Qualidade vs Preço
+    qualidade_preco = df.groupby('OverallQual')['SalePrice'].mean()
+    ax3.bar(qualidade_preco.index, qualidade_preco.values, color='lightgreen', alpha=0.7)
+    ax3.set_title('Preço Médio por Qualidade', fontsize=14, fontweight='bold')
+    ax3.set_xlabel('Qualidade')
+    ax3.set_ylabel('Preço Médio (R$)')
+    ax3.grid(True, alpha=0.3)
+    # Gráfico 4: Boxplot por bairro
+    if 'Neighborhood' in df.columns:
+        df.boxplot(column='SalePrice', by='Neighborhood', ax=ax4)
+        ax4.set_title('Variação de Preços por Bairro', fontsize=14, fontweight='bold')
+        ax4.tick_params(axis='x', rotation=45)
+    plt.tight_layout()
+    # Converter para base64
+    buf = io.BytesIO()
+    plt.savefig(buf, format='png', dpi=100, bbox_inches='tight')
+    buf.seek(0)
+    img_str = base64.b64encode(buf.read()).decode()
+    plt.close()
+    # Estatísticas
+    stats = df['SalePrice'].describe()
     return f"""
+    <div style="font-family: Arial, sans-serif;">
+        <h2 style="color: #2E86AB;">📊 ANÁLISE EXPLORATÓRIA</h2>
+        <div style="background: #e7f3ff; padding: 20px; border-radius: 10px; margin-bottom: 20px;">
+            <h3>📈 Estatísticas Descritivas</h3>
+            <div style="display: grid; grid-template-columns: repeat(4, 1fr); gap: 10px;">
+                <div style="background: white; padding: 10px; border-radius: 5px; text-align: center;">
+                    <strong>Média</strong><br>R$ {stats['mean']:,.0f}
+                </div>
+                <div style="background: white; padding: 10px; border-radius: 5px; text-align: center;">
+                    <strong>Mediana</strong><br>R$ {stats['50%']:,.0f}
+                </div>
+                <div style="background: white; padding: 10px; border-radius: 5px; text-align: center;">
+                    <strong>Desvio Padrão</strong><br>R$ {stats['std']:,.0f}
+                </div>
+                <div style="background: white; padding: 10px; border-radius: 5px; text-align: center;">
+                    <strong>Total</strong><br>{len(df)} imóveis
+                </div>
             </div>
         </div>
+        <div style="text-align: center;">
+            <img src="data:image/png;base64,{img_str}" style="max-width: 100%; border-radius: 10px; box-shadow: 0 4px 8px rgba(0,0,0,0.1);">
         </div>
     </div>
     """
+def analise_anova(df, var_cat1, var_cat2):
     resultados = []
+    for var in [var_cat1, var_cat2]:
+        if var and var in df.columns:
+            grupos = [grupo['SalePrice'].values for nome, grupo in df.groupby(var)]
+            stat, p_valor = kruskal(*grupos)
+            significativo = p_valor < 0.05
+            cor_fundo = '#d4edda' if significativo else '#f8d7da'
+            cor_borda = '#28a745' if significativo else '#dc3545'
+            icone = '✅' if significativo else '❌'
+            resultados.append(f"""
+            <div style="background: {cor_fundo}; padding: 15px; border-radius: 10px; margin-bottom: 15px; border-left: 5px solid {cor_borda};">
+                <h4 style="margin: 0;">{icone} {var}</h4>
+                <p><strong>Estatística Kruskal-Wallis:</strong> {stat:.4f}</p>
+                <p><strong>Valor-p:</strong> {p_valor:.6f}</p>
+                <p><strong>Conclusão:</strong> {'IMPACTA SIGNIFICATIVAMENTE' if significativo else 'NÃO IMPACTA SIGNIFICATIVAMENTE'} o preço</p>
+            </div>
+            """)
     if resultados:
         resultados_html = "\n".join(resultados)
     else:
+        resultados_html = "<p>Selecione variáveis categóricas para análise</p>"
     return f"""
+    <div style="font-family: Arial, sans-serif;">
+        <h2 style="color: #A23B72;">📈 ANÁLISE ANOVA</h2>
+        <div style="background: #f8f9fa; padding: 20px; border-radius: 10px;">
+            <h3>Teste Kruskal-Wallis</h3>
+            {resultados_html}
+        </div>
     </div>
     """
+def analise_regressao(df, var_cont1, var_cont2, var_cat):
     return """
+    <div style="font-family: Arial, sans-serif;">
+        <h2 style="color: #18A558;">🤖 REGRESSÃO LINEAR</h2>
         <div style="background: #d1ecf1; padding: 20px; border-radius: 10px;">
+            <h3>Modelo de Regressão Linear Múltipla</h3>
+            <p>Selecione variáveis contínuas e categóricas para construir o modelo preditivo.</p>
+            <p><strong>Funcionalidades:</strong></p>
             <ul>
+                <li>📊 Métricas de desempenho (R², RMSE, MAE)</li>
+                <li>🔍 Diagnóstico de pressupostos</li>
+                <li>📈 Interpretação dos coeficientes</li>
+                <li>🎯 Recomendações práticas</li>
             </ul>
         </div>
     </div>
     """
+# INICIAR
 if __name__ == "__main__":
+    dashboard = criar_dashboard()
+    dashboard.launch()