Spaces:

Pegumenezes
/

siep

Sleeping

App Files Files Community

Pegumenezes commited on Jun 5, 2025

Commit

436a2b3

verified ·

1 Parent(s): 3a7f746

Update src/streamlit_app.py

Browse files

Files changed (1) hide show

src/streamlit_app.py +20 -15

src/streamlit_app.py CHANGED Viewed

@@ -13,6 +13,7 @@ from scipy.stats import shapiro, levene, kruskal
 import kagglehub
 import os
 # --- Configuração da Página do Streamlit ---
 st.set_page_config(layout="wide", page_title="Análise de Precificação de Imóveis")
 # A linha st.set_option foi removida pois não é mais necessária.
@@ -27,32 +28,36 @@ o preço de venda dos imóveis. O dashboard está dividido em duas etapas princi
 """)
 # --- Download e Carregamento do Dataset (com cache para performance) ---
 @st.cache_data
 def load_data():
-    # Define um diretório de cache em um local com permissão de escrita (/tmp/)
-    # Isso resolve o erro de permissão em ambientes de nuvem.
-    cache_dir = "/tmp/kagglehub"
-    os.makedirs(cache_dir, exist_ok=True)
-    os.environ['KAGGLE_CACHE_DIR'] = cache_dir
-    # O resto da função continua igual
-    dataset_path = kagglehub.dataset_download("prevek18/ames-housing-dataset")
-    csv_file_path = next(
-        os.path.join(root, file)
-        for root, _, files in os.walk(dataset_path)
-        for file in files if file.endswith(".csv")
-    )
-    df = pd.read_csv(csv_file_path)
     df.columns = df.columns.str.replace('[^A-Za-z0-9_]+', '', regex=True).str.lower()
     if 'grlivarea' in df.columns:
         bins = [0, 1000, 1500, 2000, 2500, 3000, 4000, df['grlivarea'].max() + 1]
         labels = ['<1000', '1000-1500', '1500-2000', '2000-2500', '2500-3000', '3000-4000', '4000+']
         df['area_faixa'] = pd.cut(df['grlivarea'], bins=bins, labels=labels, include_lowest=True)
     return df
 df = load_data()
 # Exibir uma amostra dos dados
 if st.checkbox("Mostrar amostra dos dados brutos"):
     st.write("Amostra dos dados carregados:", df.head())

 import kagglehub
 import os
 # --- Configuração da Página do Streamlit ---
 st.set_page_config(layout="wide", page_title="Análise de Precificação de Imóveis")
 # A linha st.set_option foi removida pois não é mais necessária.
 """)
 # --- Download e Carregamento do Dataset (com cache para performance) ---
+# --- Funções de Carregamento de Dados ---
 @st.cache_data
 def load_data():
+    """
+    Carrega o Ames Housing Dataset a partir de uma URL do GitHub para evitar
+    problemas de permissão em ambientes de nuvem.
+    """
+    url = "https://raw.githubusercontent.com/Viniciusalgueiro/Ameshousing/refs/heads/main/AmesHousing.csv"
+    try:
+        df = pd.read_csv(url)
+    except Exception as e:
+        st.error(f"Erro ao carregar os dados da URL: {e}")
+        return None # Retorna None em caso de falha
+    # --- Preparação dos dados (mesma lógica de antes) ---
     df.columns = df.columns.str.replace('[^A-Za-z0-9_]+', '', regex=True).str.lower()
     if 'grlivarea' in df.columns:
         bins = [0, 1000, 1500, 2000, 2500, 3000, 4000, df['grlivarea'].max() + 1]
         labels = ['<1000', '1000-1500', '1500-2000', '2000-2500', '2500-3000', '3000-4000', '4000+']
         df['area_faixa'] = pd.cut(df['grlivarea'], bins=bins, labels=labels, include_lowest=True)
     return df
 df = load_data()
+# Adicione esta verificação para o caso de falha no download
+if df is None:
+    st.stop() # Interrompe a execução do app se os dados não puderam ser carregados
 # Exibir uma amostra dos dados
 if st.checkbox("Mostrar amostra dos dados brutos"):
     st.write("Amostra dos dados carregados:", df.head())