Spaces:

AEDIUnB
/

Teste_Hipoteses

Sleeping

App Files Files Community

joaogabrielsouza commited on Apr 24, 2025

Commit

ae43eb7

1 Parent(s): 7b49dc1

Nova Correção: sincroniza local com Teste_Hipoteses

Browse files

Files changed (3) hide show

Dashboard_Teste_de_Hipoteses.py +0 -130
Dashboard_Teste_de_Hipoteses_online.py +204 -0
README.md +1 -1

Dashboard_Teste_de_Hipoteses.py DELETED Viewed

@@ -1,130 +0,0 @@
-#!/usr/bin/env python
-# coding: utf-8
-# ![MARCADOR.png](attachment:MARCADOR.png)
-# # BI - Teste de Hipóteses
-# ## Bibliotecas
-# In[1]:
-import streamlit as st
-import pandas as pd
-import numpy as np
-import plotly.express as px
-import plotly.graph_objects as go
-from PIL import Image
-import seaborn as sns
-import matplotlib.pyplot as plt
-from scipy import stats
-from statsmodels.formula.api import ols
-import statsmodels.api as sm
-from bioinfokit.analys import stat
-import subprocess
-# ### Dashboard
-# In[2]:
-# Configuração da página
-st.set_page_config(page_title="Teste de Hipótese - Exemplo Interativo",
-                   layout="wide",
-                   initial_sidebar_state="expanded")
-# Slider CSS customization for green color
-st.markdown(
-    """
-    <style>
-    .stSlider > div > div > div > div > div > div {
-        background-color: #4CAF50 !important;  /* Verde para o slider */
-    }
-    </style>
-    """,
-    unsafe_allow_html=True,
-)
-# Carregar as logos
-logo_unb = Image.open("Logo/MARCADOR.png")
-# Título e Logos
-col1, col2, col3 = st.columns([1, 6, 1])
-with col1:
-    st.image(logo_unb, use_column_width=True)
-with col2:
-    st.markdown("<h1 style='text-align: center; color: #003366;'>Simulador Acadêmico de Testes de Hipótese</h1>",
-                unsafe_allow_html=True)
-    st.markdown("<h3 style='text-align: center; color: #003366;'>Professor João Gabriel de Moraes Souza</h3>",
-                unsafe_allow_html=True)  # Inserir nome do professor
-with col3:
-    st.image(logo_unb, use_column_width=True)
-st.markdown("---")
-# Criação de abas
-tabs = st.tabs(["Simulações Teóricas"])
-# Aba 1: Simulações Teóricas
-with tabs[0]:
-    st.subheader("Teste de Hipótese para Proporção de Testes Positivos de COVID-19")
-    # Sliders para definir os parâmetros do teste (apenas na aba de simulações teóricas)
-    st.sidebar.markdown("### Parâmetros do Teste de Hipótese")
-    p_pop = st.sidebar.slider("Proporção populacional esperada (H0)", min_value=0.0, max_value=1.0, value=0.1, step=0.01)
-    p_sample = st.sidebar.slider("Proporção observada na amostra", min_value=0.0, max_value=1.0, value=0.12, step=0.01)
-    n = st.sidebar.slider("Tamanho da amostra", min_value=100, max_value=10000, value=1000, step=10)
-    alpha = st.sidebar.slider("Nível de significância (α)", min_value=0.01, max_value=0.10, value=0.05, step=0.01)
-    # Cálculo do teste z para proporção
-    se = np.sqrt(p_pop * (1 - p_pop) / n)
-    z = (p_sample - p_pop) / se
-    p_value = 2 * (1 - stats.norm.cdf(abs(z)))  # Teste bilateral
-    # Resultados
-    st.write(f"**Estatística Z**: {z:.4f}")
-    st.write(f"**Valor-p**: {p_value:.4f}")
-    if p_value < alpha:
-        st.write("**Conclusão**: Rejeitamos H0. A proporção observada é significativamente diferente da proporção esperada.")
-    else:
-        st.write("**Conclusão**: Não rejeitamos H0. A proporção observada não é significativamente diferente da proporção esperada.")
-    # Gráfico da distribuição normal com regiões de aceitação/rejeição
-    x = np.linspace(p_pop - 4*se, p_pop + 4*se, 1000)
-    y = stats.norm.pdf(x, p_pop, se)
-    fig = go.Figure()
-    # Linha de densidade da distribuição
-    fig.add_trace(go.Scatter(x=x, y=y, mode='lines', line=dict(color='blue'), name='Distribuição Normal'))
-    # Adicionar linha para a proporção da amostra
-    fig.add_vline(x=p_sample, line=dict(color='red', width=2), name='Proporção Observada')
-    # Região crítica (baseado em alpha)
-    z_critical = stats.norm.ppf(1 - alpha / 2)
-    left_critical_value = p_pop - z_critical * se
-    right_critical_value = p_pop + z_critical * se
-    fig.add_vrect(x0=left_critical_value, x1=-4*se+p_pop, fillcolor="red", opacity=0.2, line_width=0)
-    fig.add_vrect(x0=right_critical_value, x1=4*se+p_pop, fillcolor="red", opacity=0.2, line_width=0)
-    # Layout do gráfico
-    fig.update_layout(title="Distribuição Normal e Região Crítica",
-                      xaxis_title="Valores",
-                      yaxis_title="Densidade",
-                      showlegend=False,
-                      plot_bgcolor="white")
-    st.plotly_chart(fig, use_container_width=True)
-    # Exibir explicações
-    st.markdown("### Explicação:")
-    st.write("O teste de hipótese avalia se a proporção de testes positivos de COVID-19 na amostra difere significativamente da proporção esperada na população.")
-    st.write("Usamos o valor-p para decidir se rejeitamos ou não a hipótese nula (H0). Se o valor-p for menor que o nível de significância (α), rejeitamos H0.")

Dashboard_Teste_de_Hipoteses_online.py ADDED Viewed

	@@ -0,0 +1,204 @@

+#!/usr/bin/env python
+# coding: utf-8
+# ![MARCADOR.png](attachment:6a5bbf7a-f8d3-47a9-ba39-ab0469dd97f3.png)
+# # BI - Teste de Hipóteses
+# ## Bibliotecas
+# In[1]:
+import streamlit as st
+import pandas as pd
+import geopandas as gpd
+import matplotlib.pyplot as plt
+import seaborn as sns
+import plotly.express as px
+import plotly.graph_objects as go
+from PIL import Image
+from scipy import stats
+from scipy.stats import shapiro, levene, kruskal, mannwhitneyu, wilcoxon
+from statsmodels.formula.api import ols
+import statsmodels.api as sm
+from statsmodels.stats.multicomp import pairwise_tukeyhsd
+from wordcloud import WordCloud
+import numpy as np
+import subprocess
+# ### Dashboard
+# In[2]:
+# Configuração da página
+st.set_page_config(
+    page_title="Teste de Hipótese & Chocolate",
+    layout="wide",
+    initial_sidebar_state="expanded"
+)
+# CSS para slider verde
+st.markdown("""
+    <style>
+    .stSlider > div > div > div > div > div > div {
+        background-color: #4CAF50 !important;
+    }
+    </style>
+    """, unsafe_allow_html=True)
+# Carregar logo
+logo = Image.open("Logo/MARCADOR.png")
+# Cabeçalho
+col1, col2, col3 = st.columns([1,6,1])
+with col1:
+    st.image(logo, use_column_width=True)
+with col2:
+    st.markdown("<h1 style='text-align:center;color:#003366;'>Simulador de Testes de Hipótese</h1>", unsafe_allow_html=True)
+    st.markdown("<h3 style='text-align:center;color:#003366;'>Professor João Gabriel de Moraes Souza</h3>", unsafe_allow_html=True)
+with col3:
+    st.image(logo, use_column_width=True)
+st.markdown("---")
+# Abas
+tabs = st.tabs(["Simulações Teóricas", "Análise de Chocolate"])
+# Aba 1: Simulações Teóricas
+with tabs[0]:
+    st.subheader("Teste de Hipótese para Proporção de Testes Positivos de COVID-19")
+    st.sidebar.markdown("### Parâmetros do Teste")
+    p_pop    = st.sidebar.slider("Proporção populacional (H0)", 0.0, 1.0, 0.1, 0.01)
+    p_sample = st.sidebar.slider("Proporção amostral",            0.0, 1.0, 0.12,0.01)
+    n        = st.sidebar.slider("Tamanho da amostra",          100, 10000, 1000, 10)
+    alpha    = st.sidebar.slider("Nível de significância (α)",  0.01, 0.10, 0.05, 0.01)
+    se      = np.sqrt(p_pop*(1-p_pop)/n)
+    z       = (p_sample - p_pop)/se
+    p_value = 2*(1 - stats.norm.cdf(abs(z)))
+    st.write(f"**Z** = {z:.4f}")
+    st.write(f"**p-valor** = {p_value:.4f}")
+    if p_value < alpha:
+        st.write("**Rejeitamos H0**: diferença significativa.")
+    else:
+        st.write("**Não rejeitamos H0**: sem diferença significativa.")
+    # Gráfico
+    x = np.linspace(p_pop-4*se, p_pop+4*se, 1000)
+    y = stats.norm.pdf(x, p_pop, se)
+    fig = go.Figure()
+    fig.add_trace(go.Scatter(x=x, y=y, mode="lines", line=dict(color="blue")))
+    fig.add_vline(x=p_sample, line=dict(color="red", width=2))
+    zc = stats.norm.ppf(1-alpha/2)
+    fig.add_vrect(x0=p_pop-zc*se, x1=p_pop+zc*se, fillcolor="red", opacity=0.2, line_width=0)
+    fig.update_layout(
+        title="Distribuição Normal e Região Crítica",
+        xaxis_title="Proporção", yaxis_title="Densidade",
+        showlegend=False, plot_bgcolor="white"
+    )
+    st.plotly_chart(fig, use_container_width=True)
+    st.markdown("**Descrição**: Teste bilateral de proporções usando valor-p.")
+# Aba 2: Análise de Chocolate
+with tabs[1]:
+    st.subheader("Testes de Hipótese e ANOVA em Dados de Chocolate")
+    st.markdown("---")
+    # 1) Carregar dados
+    df = pd.read_csv("Dados/flavors_of_cacao.csv")
+    st.markdown("#### Dados Brutos")
+    st.dataframe(df)
+    # 2) Renomear colunas
+    df.columns = [
+        "company","bean_bar_origin","ref","date",
+        "percent","location","rating","beantype","origin"
+    ]
+    st.markdown("#### Colunas Renomeadas")
+    st.dataframe(df.head())
+    # 3) Mapa: empresas por país
+    grp_loc = df.groupby("location").size().reset_index(name="count")
+    url = "https://raw.githubusercontent.com/datasets/geo-countries/master/data/countries.geojson"
+    world = gpd.read_file(url).rename(columns={"ADMIN":"name"})
+    mapa = world.merge(grp_loc, how="left", left_on="name", right_on="location")
+    fig_map, ax_map = plt.subplots(figsize=(8,4))
+    mapa.boundary.plot(ax=ax_map, edgecolor="gray", linewidth=0.5)
+    mapa.plot(column="count", ax=ax_map, cmap="OrRd", legend=True,
+              missing_kwds={"color":"lightgrey"})
+    ax_map.axis("off")
+    st.pyplot(fig_map)
+    # 4) Scatter: média por origem (count>=5)
+    grp_ori = (
+        df.groupby("origin")
+          .agg(count=("rating","size"), mean_rating=("rating","mean"))
+          .reset_index()
+    )
+    fil_ori = grp_ori.query("count>=5")
+    fig_sc, ax_sc = plt.subplots()
+    fig_sc = px.scatter(
+        fil_ori, x="mean_rating", y="origin",
+        size="count", color="origin",
+        title="Avaliação Média vs Origem",
+        labels={"mean_rating":"Avaliação Média","origin":"Origem"}
+    )
+    st.plotly_chart(fig_sc, use_container_width=True)
+    # 5) WordCloud de empresas
+    wc = WordCloud(width=800, height=300, background_color="white")
+    freqs = df["company"].value_counts().to_dict()
+    wc_img = wc.generate_from_frequencies(freqs)
+    fig_wc, ax_wc = plt.subplots(figsize=(8,3))
+    ax_wc.imshow(wc_img, interpolation="bilinear")
+    ax_wc.axis("off")
+    st.pyplot(fig_wc)
+    # 6) ANOVA e Tukey
+    paises = ["Brazil","France","U.S.A.","Canada","Ecuador","Peru","Venezuela"]
+    filt = df[df.location.isin(paises)]
+    melt = pd.melt(filt, id_vars=["location"], value_vars=["rating"])
+    model = ols("value ~ C(location)", data=melt).fit()
+    anova = sm.stats.anova_lm(model, typ=2)
+    st.markdown("#### ANOVA")
+    st.dataframe(anova)
+    tukey = pairwise_tukeyhsd(endog=melt.value, groups=melt.location, alpha=0.05)
+    st.markdown("#### Tukey HSD")
+    st.text(tukey.summary())
+    # 7) Diagnóstico de resíduos
+    std_res = model.get_influence().resid_studentized_internal
+    fig_qq = sm.qqplot(std_res, line="45", fit=True)
+    plt.title("QQ-plot Resíduos Padronizados")
+    st.pyplot(fig_qq)
+    fig_h, ax_h = plt.subplots()
+    ax_h.hist(model.resid, bins="auto", ec="black")
+    ax_h.set_title("Histograma dos Resíduos")
+    ax_h.set_xlabel("Resíduos"); ax_h.set_ylabel("Frequência")
+    st.pyplot(fig_h)
+    # 8) Testes de premissas
+    st.markdown("#### Testes de Premissas")
+    w, p_sh = shapiro(model.resid)
+    st.write(f"Shapiro-Wilk: estatística={w:.3f}, p-valor={p_sh:.3f}")
+    grupos = [filt.query("location==@loc").rating for loc in paises]
+    w_lev, p_lev = levene(*grupos)
+    st.write(f"Levene: estatística={w_lev:.3f}, p-valor={p_lev:.3f}")
+    kw_stat, kw_p = kruskal(*grupos)
+    st.write(f"Kruskal-Wallis: estatística={kw_stat:.3f}, p-valor={kw_p:.3f}")
+# In[3]:
+# Converte o notebook 'Dashboard_Distribuições.ipynb' para um script Python
+subprocess.run(["jupyter", "nbconvert", "--to", "script", "Dashboard_Teste_de_Hipoteses.ipynb"])

README.md CHANGED Viewed

@@ -5,6 +5,6 @@ colorFrom: green
 colorTo: blue
 sdk: streamlit
 sdk_version: "1.32.0"
-app_file: Dashboard_Teste_de_Hipoteses.py
 pinned: false
 ---

 colorTo: blue
 sdk: streamlit
 sdk_version: "1.32.0"
+app_file: Dashboard_Teste_de_Hipoteses_online.py
 pinned: false
 ---