Spaces:

hedtorresca
/

ExploratorioVasculitis

Build error

App Files Files Community

hedtorresca commited on Mar 26, 2025

Commit

60f7cb1

verified ·

1 Parent(s): 22c1195

Update app.py

Browse files

Files changed (1) hide show

app.py +75 -151

app.py CHANGED Viewed

@@ -9,21 +9,16 @@ import folium
 from folium.plugins import HeatMap
 from shapely.geometry import Point
 from sklearn.cluster import DBSCAN
-import os
 import warnings
 warnings.filterwarnings("ignore")
-# =========================
-# 1. CARGA DE DATOS
-# =========================
 data = pd.read_csv("VasculitisAsociadasA-BDD10jul24_DATA_2025-03-19_1033.csv")
 data.columns = data.columns.str.strip().str.lower()
 data = data.dropna(subset=['latitud', 'longitud'])
 data['geometry'] = data.apply(lambda row: Point(row['longitud'], row['latitud']), axis=1)
 data = gpd.GeoDataFrame(data, geometry='geometry', crs='EPSG:4326')
-# Localidades
 geo_localidades = gpd.read_file("loca.json")
 geo_localidades.columns = geo_localidades.columns.str.lower()
 geo_localidades = geo_localidades.rename(columns={"locnombre": "localidad"})
@@ -31,7 +26,7 @@ geo_localidades['localidad'] = geo_localidades['localidad'].str.upper()
 data = gpd.sjoin(data.to_crs(geo_localidades.crs), geo_localidades[['localidad', 'geometry']], how='left', predicate='within')
 data.drop(columns='index_right', inplace=True)
-# Cargar capas ambientales
 def cargar_geojson(filepath):
     gdf = gpd.read_file(filepath).to_crs("EPSG:4326")
     for col in gdf.columns:
@@ -48,9 +43,7 @@ capas_ambientales = {
     "Estaciones Aire": cargar_geojson("estacion_calidad_aire.geojson")
 }
-# =========================
-# 2. VARIABLES DERIVADAS
-# =========================
 data = data.assign(
     genero_cat=data['genero'].map({0: 'Masculino', 1: 'Femenino'}),
     regimen_cat=data['regimen'].map({1: 'Contributivo', 2: 'Subsidiado'}),
@@ -63,9 +56,7 @@ biopsia_cols = [col for col in data.columns if col.startswith('biopsia___')]
 data['biopsia_positiva'] = data[biopsia_cols].sum(axis=1).apply(lambda x: 'Sí' if x > 0 else 'No')
 data['anca_y_renal'] = np.where((data['ancas'] == 1) & (data['biopsia_positiva'] == 'Sí'), 'Sí', 'No')
-# =========================
-# 3. FUNCIONES AUXILIARES
-# =========================
 def aplicar_filtros(df, genero, edad_rango, localidades, compromiso_renal, antecedentes):
     df_filtrado = df.copy()
     if genero != "Todos":
@@ -80,165 +71,98 @@ def aplicar_filtros(df, genero, edad_rango, localidades, compromiso_renal, antec
             df_filtrado = df_filtrado[df_filtrado[ant] == 1]
     return df_filtrado
-def generar_mapa_calor(df, capas):
-    m = folium.Map(location=[4.65, -74.1], zoom_start=11)
-    heat_data = df[['latitud', 'longitud']].dropna().values.tolist()
-    HeatMap(heat_data, radius=12).add_to(m)
-    for _, row in df.iterrows():
-        folium.Marker(
-            location=(row['latitud'], row['longitud']),
-            popup=f"{row['genero_cat']}<br>Edad: {row['edad']}<br>Estrato: {row['estrato_cat']}<br>Creatinina: {row.get('creatinina', '')}"
-        ).add_to(m)
-    for capa in capas:
-        if capa in capas_ambientales:
-            gdf = capas_ambientales[capa]
-            folium.GeoJson(gdf, name=capa, tooltip=folium.GeoJsonTooltip(fields=gdf.columns[:2].tolist())).add_to(m)
-    folium.LayerControl().add_to(m)
-    return m._repr_html_()
-def generar_mapa_coropletico(df, capas):
-    df_grouped = df.groupby('localidad').size().reset_index(name='casos')
-    geo_local_copy = geo_localidades.merge(df_grouped, on='localidad', how='left').fillna({'casos': 0})
-    m = folium.Map(location=[4.65, -74.1], zoom_start=11)
-    folium.Choropleth(
-        geo_data=geo_local_copy,
-        name='Casos por localidad',
-        data=geo_local_copy,
-        columns=['localidad', 'casos'],
-        key_on='feature.properties.localidad',
-        fill_color='YlOrRd',
-        fill_opacity=0.6,
-        line_opacity=0.4,
-        legend_name='Casos'
-    ).add_to(m)
-    for _, row in geo_local_copy.iterrows():
-        if row['casos'] > 0:
-            folium.Marker(
-                location=row['geometry'].centroid.coords[0][::-1],
-                icon=folium.DivIcon(html=f"<div style='font-size:12px;color:black;'>{row['localidad']}<br>{int(row['casos'])} casos</div>")
-            ).add_to(m)
-    for capa in capas:
-        if capa in capas_ambientales:
-            gdf = capas_ambientales[capa]
-            folium.GeoJson(gdf, name=capa, tooltip=folium.GeoJsonTooltip(fields=gdf.columns[:2].tolist())).add_to(m)
-    folium.LayerControl().add_to(m)
-    return m._repr_html_()
-def generar_clusters(df_filtrado):
-    coords = df_filtrado[['latitud', 'longitud']].dropna().values
-    if len(coords) < 2:
         return None
-    coords_rad = np.radians(coords)
-    db = DBSCAN(eps=0.01, min_samples=3, metric='haversine').fit(coords_rad)
-    df_filtrado['cluster'] = db.labels_
-    m = folium.Map(location=[4.65, -74.1], zoom_start=11)
-    for _, row in df_filtrado.iterrows():
-        color = 'red' if row['cluster'] != -1 else 'gray'
-        folium.CircleMarker(location=(row['latitud'], row['longitud']), color=color, radius=4).add_to(m)
-    return m._repr_html_()
-# =========================
-# 4. GRAFICOS UNIVARIADOS Y BIVARIADOS
-# =========================
-def obtener_columnas_validas(df):
-    excluidas = ['id', 'documento', 'latitud', 'longitud', 'geometry']
-    return [col for col in df.columns if col not in excluidas and df[col].nunique() > 1]
-columnas_validas = obtener_columnas_validas(data)
-def tipo_variable(col):
-    if pd.api.types.is_numeric_dtype(data[col]):
-        return 'numérica'
-    else:
-        return 'categórica'
-def graficar_univariado(col):
     plt.figure(figsize=(6, 4))
-    if tipo_variable(col) == 'numérica':
-        sns.histplot(data[col], kde=True)
     else:
-        orden = data[col].value_counts().index
-        sns.countplot(data=data, x=col, order=orden)
-        plt.xticks(rotation=30)
-    plt.title(f"Distribución de {col}")
-    path = f"uni_{col}.png"
     plt.tight_layout()
     plt.savefig(path)
     plt.close()
     return path
-def graficar_bivariado(x, y):
     plt.figure(figsize=(6, 4))
-    tipo_x = tipo_variable(x)
-    tipo_y = tipo_variable(y)
-    if tipo_x == 'numérica' and tipo_y == 'numérica':
-        sns.scatterplot(data=data, x=x, y=y)
-    elif tipo_x == 'categórica' and tipo_y == 'numérica':
-        sns.boxplot(data=data, x=x, y=y)
-    elif tipo_x == 'numérica' and tipo_y == 'categórica':
-        sns.boxplot(data=data, x=y, y=x)
-    elif tipo_x == 'categórica' and tipo_y == 'categórica':
-        sns.countplot(data=data, x=x, hue=y)
-    plt.xticks(rotation=30)
-    plt.title(f"{x} vs {y}")
-    path = f"bi_{x}_{y}.png"
     plt.tight_layout()
     plt.savefig(path)
     plt.close()
     return path
-# =========================
-# 5. INTERFAZ
-# =========================
 def lanzar_app():
     with gr.Blocks() as demo:
-        gr.Markdown("## 🧭 Tablero Interactivo - Vasculitis ANCA con Compromiso Renal")
         with gr.Row():
             genero = gr.Dropdown(label="Género", choices=["Todos", "Masculino", "Femenino"], value="Todos")
-            edad = gr.Slider(label="Edad", minimum=0, maximum=100, value=(20, 80), step=1)
-            localidades = gr.Dropdown(label="Localidad", choices=sorted(data['localidad'].dropna().unique()), multiselect=True)
-            compromiso_renal = gr.Dropdown(label="Compromiso Renal", choices=["Todos", "Sí", "No"], value="Todos")
-            antecedentes = gr.CheckboxGroup(label="Antecedentes", choices=["diabetes", "hta", "epoc", "falla_cardiaca"])
-            capas = gr.CheckboxGroup(label="Capas Ambientales", choices=list(capas_ambientales.keys()))
-        with gr.Row():
-            btn_kernel = gr.Button("Mapa de Calor")
-            salida_kernel = gr.HTML()
-            btn_kernel.click(fn=lambda *args: generar_mapa_calor(aplicar_filtros(data, *args[:5]), args[5]),
-                             inputs=[genero, edad, localidades, compromiso_renal, antecedentes, capas],
-                             outputs=salida_kernel)
-        with gr.Row():
-            btn_coropletico = gr.Button("Mapa Coroplético")
-            salida_coropletico = gr.HTML()
-            btn_coropletico.click(fn=lambda *args: generar_mapa_coropletico(aplicar_filtros(data, *args[:5]), args[5]),
-                                  inputs=[genero, edad, localidades, compromiso_renal, antecedentes, capas],
-                                  outputs=salida_coropletico)
         with gr.Row():
-            btn_clust = gr.Button("Clúster DBSCAN")
-            salida_clust = gr.HTML()
-            btn_clust.click(fn=lambda *args: generar_clusters(aplicar_filtros(data, *args)),
-                            inputs=[genero, edad, localidades, compromiso_renal, antecedentes],
-                            outputs=salida_clust)
-        gr.Markdown("### 📊 Gráficos Univariados y Bivariados")
-        with gr.Row():
-            variable_uni = gr.Dropdown(label="Variable Univariada", choices=columnas_validas)
-            btn_uni = gr.Button("Mostrar Univariado")
-            salida_uni = gr.Image()
-            btn_uni.click(fn=graficar_univariado, inputs=variable_uni, outputs=salida_uni)
-        with gr.Row():
-            var_x = gr.Dropdown(label="Variable X", choices=columnas_validas)
-            var_y = gr.Dropdown(label="Variable Y", choices=columnas_validas)
-            btn_bi = gr.Button("Mostrar Bivariado")
-            salida_bi = gr.Image()
-            btn_bi.click(fn=graficar_bivariado, inputs=[var_x, var_y], outputs=salida_bi)
     demo.launch()
-if __name__ == "__main__":
-    lanzar_app()

 from folium.plugins import HeatMap
 from shapely.geometry import Point
 from sklearn.cluster import DBSCAN
 import warnings
 warnings.filterwarnings("ignore")
+# Carga de datos
 data = pd.read_csv("VasculitisAsociadasA-BDD10jul24_DATA_2025-03-19_1033.csv")
 data.columns = data.columns.str.strip().str.lower()
 data = data.dropna(subset=['latitud', 'longitud'])
 data['geometry'] = data.apply(lambda row: Point(row['longitud'], row['latitud']), axis=1)
 data = gpd.GeoDataFrame(data, geometry='geometry', crs='EPSG:4326')
 geo_localidades = gpd.read_file("loca.json")
 geo_localidades.columns = geo_localidades.columns.str.lower()
 geo_localidades = geo_localidades.rename(columns={"locnombre": "localidad"})
 data = gpd.sjoin(data.to_crs(geo_localidades.crs), geo_localidades[['localidad', 'geometry']], how='left', predicate='within')
 data.drop(columns='index_right', inplace=True)
+# Capas ambientales
 def cargar_geojson(filepath):
     gdf = gpd.read_file(filepath).to_crs("EPSG:4326")
     for col in gdf.columns:
     "Estaciones Aire": cargar_geojson("estacion_calidad_aire.geojson")
 }
+# Variables derivadas
 data = data.assign(
     genero_cat=data['genero'].map({0: 'Masculino', 1: 'Femenino'}),
     regimen_cat=data['regimen'].map({1: 'Contributivo', 2: 'Subsidiado'}),
 data['biopsia_positiva'] = data[biopsia_cols].sum(axis=1).apply(lambda x: 'Sí' if x > 0 else 'No')
 data['anca_y_renal'] = np.where((data['ancas'] == 1) & (data['biopsia_positiva'] == 'Sí'), 'Sí', 'No')
+# Filtros
 def aplicar_filtros(df, genero, edad_rango, localidades, compromiso_renal, antecedentes):
     df_filtrado = df.copy()
     if genero != "Todos":
             df_filtrado = df_filtrado[df_filtrado[ant] == 1]
     return df_filtrado
+# Univariado
+def generar_univariado(variable, genero, edad, localidades, compromiso_renal, antecedentes):
+    df_filtrado = aplicar_filtros(data, genero, edad, localidades, compromiso_renal, antecedentes)
+    if df_filtrado.empty:
         return None
     plt.figure(figsize=(6, 4))
+    if df_filtrado[variable].dtype == 'object':
+        sns.countplot(data=df_filtrado, x=variable)
     else:
+        sns.histplot(df_filtrado[variable], kde=True)
+    plt.title(f"Distribución de {variable}")
+    path = f"uni_{variable}.png"
     plt.tight_layout()
     plt.savefig(path)
     plt.close()
     return path
+# Bivariado
+def generar_bivariado(xvar, yvar, genero, edad, localidades, compromiso_renal, antecedentes):
+    df_filtrado = aplicar_filtros(data, genero, edad, localidades, compromiso_renal, antecedentes)
+    if df_filtrado.empty:
+        return None
     plt.figure(figsize=(6, 4))
+    if df_filtrado[xvar].dtype == 'object' or df_filtrado[yvar].dtype == 'object':
+        sns.countplot(data=df_filtrado, x=xvar, hue=yvar)
+    else:
+        sns.scatterplot(data=df_filtrado, x=xvar, y=yvar)
+    plt.title(f"{xvar} vs {yvar}")
+    path = f"bi_{xvar}_{yvar}.png"
     plt.tight_layout()
     plt.savefig(path)
     plt.close()
     return path
+# Interfaz con pestañas
 def lanzar_app():
     with gr.Blocks() as demo:
+        gr.Markdown("## Tablero Interactivo: Vasculitis ANCA")
         with gr.Row():
             genero = gr.Dropdown(label="Género", choices=["Todos", "Masculino", "Femenino"], value="Todos")
+            edad = gr.Slider(label="Edad", minimum=0, maximum=100, value=(20, 80))
         with gr.Row():
+            localidades = gr.Dropdown(label="Localidades", choices=sorted(data['localidad'].dropna().unique()), multiselect=True)
+            compromiso_renal = gr.Dropdown(label="Compromiso Renal", choices=["Todos", "Sí", "No"], value="Todos")
+        antecedentes = gr.CheckboxGroup(label="Antecedentes", choices=["diabetes", "hta", "epoc", "falla_cardiaca"])
+        with gr.Tab("Mapa Coroplético"):
+            capas = gr.CheckboxGroup(label="Capas Ambientales", choices=list(capas_ambientales.keys()))
+            btn_coro = gr.Button("Generar Mapa")
+            mapa_html = gr.HTML()
+            def mostrar_mapa(genero, edad, localidades, compromiso_renal, antecedentes, capas):
+                df_f = aplicar_filtros(data, genero, edad, localidades, compromiso_renal, antecedentes)
+                return generar_mapa_coropletico(df_f, capas)
+            btn_coro.click(mostrar_mapa, inputs=[genero, edad, localidades, compromiso_renal, antecedentes, capas], outputs=mapa_html)
+        with gr.Tab("Mapa de Calor"):
+            btn_heat = gr.Button("Generar Mapa de Calor")
+            mapa_heat = gr.HTML()
+            def mostrar_heat(genero, edad, localidades, compromiso_renal, antecedentes):
+                df_f = aplicar_filtros(data, genero, edad, localidades, compromiso_renal, antecedentes)
+                return generar_mapa_calor(df_f)
+            btn_heat.click(mostrar_heat, inputs=[genero, edad, localidades, compromiso_renal, antecedentes], outputs=mapa_heat)
+        with gr.Tab("Univariado"):
+            variable_uni = gr.Dropdown(label="Variable", choices=['edad', 'genero_cat', 'estrato_cat', 'anca_y_renal', 'sindrome'])
+            btn_uni = gr.Button("Graficar")
+            img_uni = gr.Image()
+            btn_uni.click(generar_univariado, inputs=[variable_uni, genero, edad, localidades, compromiso_renal, antecedentes], outputs=img_uni)
+        with gr.Tab("Bivariado"):
+            xvar = gr.Dropdown(label="Variable X", choices=['genero_cat', 'estrato_cat', 'edad', 'mpo_cat'])
+            yvar = gr.Dropdown(label="Variable Y", choices=['anca_y_renal', 'biopsia_positiva', 'creatinina'])
+            btn_bi = gr.Button("Graficar")
+            img_bi = gr.Image()
+            btn_bi.click(generar_bivariado, inputs=[xvar, yvar, genero, edad, localidades, compromiso_renal, antecedentes], outputs=img_bi)
+        with gr.Tab("Ayuda"):
+            gr.Markdown("""
+            **Guía de uso:**
+            - Seleccione los filtros para género, edad, localidad y antecedentes clínicos.
+            - Vaya a cada pestaña para generar los gráficos correspondientes.
+            - Mapa de calor: muestra concentración espacial de casos.
+            - Mapa coroplético: muestra número de casos por localidad, con opción de superponer factores ambientales.
+            - Gráficos univariados: muestra distribución de una variable.
+            - Gráficos bivariados: relación entre dos variables relevantes.
+            """)
     demo.launch()
+lanzar_app()