Spaces:

ricardoadriano
/

Atividade3

Sleeping

App Files Files Community

ricardoadriano commited on Sep 24, 2025

Commit

053faec

verified ·

1 Parent(s): 9f22e36

Update src/streamlit_app.py

Browse files

Files changed (1) hide show

src/streamlit_app.py +33 -15

src/streamlit_app.py CHANGED Viewed

@@ -36,7 +36,7 @@ st.markdown("---")
 tabs = st.tabs(["Simulações Teóricas", "Análise AmesHousing"])
 # -----------------------------------------------------
-# Aba 1: Simulações Teóricas (mantida)
 # -----------------------------------------------------
 with tabs[0]:
     st.subheader("Teste de Hipótese para Proporção de Testes Positivos de COVID-19")
@@ -67,33 +67,48 @@ with tabs[1]:
     # Leitura fixa do CSV dentro da pasta Dados
     casa_data = pd.read_csv("../Dados/AmesHousing.csv")
-    # Renomear colunas para evitar problemas com espaços
     casa_data.columns = casa_data.columns.str.strip().str.replace(" ", "_")
     # -------------------------------------------------
     # Análise Exploratória
     # -------------------------------------------------
     st.markdown("### Distribuição do Preço de Venda")
     fig, ax = plt.subplots(figsize=(8,5))
-    sns.histplot(casa_data['SalePrice'], kde=True, ax=ax)
     ax.set_title("Distribuição do Preço de Venda")
     st.pyplot(fig)
     # Boxplots
     st.markdown("### Boxplots das Variáveis Selecionadas")
-    variavel = st.selectbox("Escolha a variável categórica para comparar preços:",
-                            ["Neighborhood","Garage_Type","Fireplaces"])
     fig2, ax2 = plt.subplots(figsize=(12,6))
-    sns.boxplot(x=variavel, y="SalePrice", data=casa_data, ax=ax2)
     plt.xticks(rotation=90)
     ax2.set_title(f"Preço de Venda por {variavel}")
     st.pyplot(fig2)
     # Scatter interativo (média de preço por bairro)
     st.markdown("### Preço Médio de Venda por Bairro")
-    bairro_grouped = casa_data.groupby('Neighborhood').agg(
         count=('SalePrice','size'),
         mean_price=('SalePrice','mean')
     ).reset_index()
@@ -115,13 +130,16 @@ with tabs[1]:
     # ANOVA
     # -------------------------------------------------
     st.markdown("### ANOVA para Neighborhood, Garage_Type e Fireplaces")
-    alpha = st.sidebar.slider("Nível de significância (α) - ANOVA AmesHousing",
-                              0.01,0.10,0.05,0.01,key="alpha_ames")
     modelos = {
-        "Neighborhood": ols('SalePrice ~ C(Neighborhood)', data=casa_data).fit(),
-        "Garage_Type": ols('SalePrice ~ C(Garage_Type)', data=casa_data).fit(),
-        "Fireplaces": ols('SalePrice ~ C(Fireplaces)', data=casa_data).fit()
     }
     for nome, modelo in modelos.items():
@@ -143,7 +161,7 @@ with tabs[1]:
     st.markdown("#### Teste de Homocedasticidade (Levene)")
     for nome in ["Neighborhood","Garage_Type","Fireplaces"]:
-        grupos = [grupo["SalePrice"].dropna() for _, grupo in casa_data.groupby(nome)]
         stat, p = levene(*grupos)
         st.write(f"{nome}: estatística={stat:.3f}, p={p:.3f}  "
                  + ("variâncias iguais" if p >= alpha else "variâncias diferentes"))
@@ -153,7 +171,7 @@ with tabs[1]:
     # -------------------------------------------------
     st.markdown("### Teste não-paramétrico (Kruskal-Wallis)")
     for nome in ["Neighborhood","Garage_Type","Fireplaces"]:
-        grupos = [grupo["SalePrice"].dropna() for _, grupo in casa_data.groupby(nome)]
         stat, p = kruskal(*grupos)
         st.write(f"{nome}: estatística={stat:.3f}, p={p:.3f}  "
                  + ("diferenças significativas" if p < alpha else "sem diferença significativa"))

 tabs = st.tabs(["Simulações Teóricas", "Análise AmesHousing"])
 # -----------------------------------------------------
+# Aba 1: Simulações Teóricas
 # -----------------------------------------------------
 with tabs[0]:
     st.subheader("Teste de Hipótese para Proporção de Testes Positivos de COVID-19")
     # Leitura fixa do CSV dentro da pasta Dados
     casa_data = pd.read_csv("../Dados/AmesHousing.csv")
     casa_data.columns = casa_data.columns.str.strip().str.replace(" ", "_")
+    # ---------------------------
+    # NOVO: Proporção de amostra
+    # ---------------------------
+    st.sidebar.markdown("### Parâmetros do AmesHousing")
+    prop_sample = st.sidebar.slider(
+        "Proporção da amostra usada nos gráficos",
+        0.1, 1.0, 1.0, 0.05,
+        key="prop_ames"
+    )
+    if prop_sample < 1.0:
+        dados = casa_data.sample(frac=prop_sample, random_state=42)
+    else:
+        dados = casa_data.copy()
     # -------------------------------------------------
     # Análise Exploratória
     # -------------------------------------------------
     st.markdown("### Distribuição do Preço de Venda")
     fig, ax = plt.subplots(figsize=(8,5))
+    sns.histplot(dados['SalePrice'], kde=True, ax=ax)
     ax.set_title("Distribuição do Preço de Venda")
     st.pyplot(fig)
     # Boxplots
     st.markdown("### Boxplots das Variáveis Selecionadas")
+    variavel = st.selectbox(
+        "Escolha a variável categórica para comparar preços:",
+        ["Neighborhood","Garage_Type","Fireplaces"]
+    )
     fig2, ax2 = plt.subplots(figsize=(12,6))
+    sns.boxplot(x=variavel, y="SalePrice", data=dados, ax=ax2)
     plt.xticks(rotation=90)
     ax2.set_title(f"Preço de Venda por {variavel}")
     st.pyplot(fig2)
     # Scatter interativo (média de preço por bairro)
     st.markdown("### Preço Médio de Venda por Bairro")
+    bairro_grouped = dados.groupby('Neighborhood').agg(
         count=('SalePrice','size'),
         mean_price=('SalePrice','mean')
     ).reset_index()
     # ANOVA
     # -------------------------------------------------
     st.markdown("### ANOVA para Neighborhood, Garage_Type e Fireplaces")
+    alpha = st.sidebar.slider(
+        "Nível de significância (α) - ANOVA AmesHousing",
+        0.01,0.10,0.05,0.01,
+        key="alpha_ames"
+    )
     modelos = {
+        "Neighborhood": ols('SalePrice ~ C(Neighborhood)', data=dados).fit(),
+        "Garage_Type": ols('SalePrice ~ C(Garage_Type)', data=dados).fit(),
+        "Fireplaces": ols('SalePrice ~ C(Fireplaces)', data=dados).fit()
     }
     for nome, modelo in modelos.items():
     st.markdown("#### Teste de Homocedasticidade (Levene)")
     for nome in ["Neighborhood","Garage_Type","Fireplaces"]:
+        grupos = [grupo["SalePrice"].dropna() for _, grupo in dados.groupby(nome)]
         stat, p = levene(*grupos)
         st.write(f"{nome}: estatística={stat:.3f}, p={p:.3f}  "
                  + ("variâncias iguais" if p >= alpha else "variâncias diferentes"))
     # -------------------------------------------------
     st.markdown("### Teste não-paramétrico (Kruskal-Wallis)")
     for nome in ["Neighborhood","Garage_Type","Fireplaces"]:
+        grupos = [grupo["SalePrice"].dropna() for _, grupo in dados.groupby(nome)]
         stat, p = kruskal(*grupos)
         st.write(f"{nome}: estatística={stat:.3f}, p={p:.3f}  "
                  + ("diferenças significativas" if p < alpha else "sem diferença significativa"))