# -*- coding: utf-8 -*- """Untitled0.ipynb Automatically generated by Colab. Original file is located at https://colab.research.google.com/drive/1lA4vvx9sbWFfjQHAmGs8ADgwhNOypfsM """ import pandas as pd import numpy as np import matplotlib.pyplot as plt import gradio as gr import io import base64 from datetime import datetime from sklearn.ensemble import RandomForestClassifier from sklearn.model_selection import train_test_split from sklearn.metrics import classification_report, accuracy_score import tempfile import os print("🚀 Iniciando CorrosionPredict en Hugging Face...") # ============================================================================== # BLOQUE 1: CARGA Y ENTRENAMIENTO DEL MODELO # ============================================================================== print("📂 Cargando y entrenando modelo de corrosión...") try: # Cargar datos df = pd.read_excel("Acero_bajo_OFICIAL.xlsx") print(f"✅ Datos cargados: {len(df)} registros") # Limpiar datos df['Humedad relativa (%)'] = df['Humedad relativa (%)'].astype(str).str.replace('%', '').astype(float) df['Clasificacion ISO 9223'] = df['Clasificacion ISO 9223'].str.upper() # Preparar variables X = df[['Distancia al mar (km)', 'Altitud (msnm)', 'Humedad relativa (%)']] y = df['Clasificacion ISO 9223'] # Añadir ruido controlado para robustez np.random.seed(42) X_noisy = X.copy() X_noisy['Distancia al mar (km)'] += np.random.uniform(-2, 2, size=len(X)) X_noisy['Altitud (msnm)'] += np.random.uniform(-10, 10, size=len(X)) X_noisy['Humedad relativa (%)'] += np.random.uniform(-3, 3, size=len(X)) # Asegurar rangos razonables X_noisy['Distancia al mar (km)'] = X_noisy['Distancia al mar (km)'].clip(lower=0, upper=25) X_noisy['Altitud (msnm)'] = X_noisy['Altitud (msnm)'].clip(lower=0, upper=400) X_noisy['Humedad relativa (%)'] = X_noisy['Humedad relativa (%)'].clip(lower=65, upper=95) # Entrenar modelo final con todos los datos modelo = RandomForestClassifier(n_estimators=100, random_state=42, class_weight='balanced') modelo.fit(X_noisy, y) print("✅ Modelo entrenado correctamente") except Exception as e: print(f"❌ Error cargando datos: {e}") # Crear datos de ejemplo para demo modelo = None # ============================================================================== # BLOQUE 2: CONFIGURACIÓN Y DATOS # ============================================================================== # Configuración profesional de matplotlib plt.rcParams['font.size'] = 12 plt.rcParams['axes.grid'] = True plt.rcParams['grid.alpha'] = 0.3 # Diccionario mejorado de recomendaciones RECOMENDACIONES = { "C1": { "nivel": "MUY BAJA", "color": "#2E8B57", # Verde "ejemplos": "Oficinas climatizadas, escuelas, museos, bibliotecas, hospitales.", "descripcion": "Ambientes interiores controlados con baja contaminación.", "protecciones": [ {"proteccion": "Pintura anticorrosiva básica", "costo": "30-45", "vida_util": "5-8", "frecuencia": "Cada 5-10 años", "notas": "Protección adecuada para ambiente controlado"}, {"proteccion": "Recubrimiento ligero", "costo": "15-25", "vida_util": "3-5", "frecuencia": "Cada 3 años", "notas": "Opción económica para baja exposición"} ] }, "C2": { "nivel": "BAJA", "color": "#9ACD32", # Amarillo verdoso "ejemplos": "Zonas rurales, áreas suburbanas, almacenamiento techado, interiores no climatizados.", "descripcion": "Ambientes con exposición mínima a contaminantes corrosivos.", "protecciones": [ {"proteccion": "Pintura anticorrosiva estándar", "costo": "35-50", "vida_util": "5-8", "frecuencia": "Cada 3-4 años", "notas": "Balance óptimo costo-beneficio"}, {"proteccion": "Galvanizado ligero", "costo": "60-80", "vida_util": "10-15", "frecuencia": "Inspección cada 5 años", "notas": "Mayor durabilidad con inversión moderada"} ] }, "C3": { "nivel": "MODERADA", "color": "#FFA500", # Naranja "ejemplos": "Zonas urbanas, áreas costeras con baja salinidad, plantas de procesamiento de alimentos.", "descripcion": "Ambientes urbanos y semi-industriales con exposición moderada.", "protecciones": [ {"proteccion": "Galvanizado en caliente", "costo": "80-120", "vida_util": "15-20", "frecuencia": "Inspección cada 5 años", "notas": "Protección robusta y duradera"}, {"proteccion": "Pintura epóxica industrial", "costo": "50-70", "vida_util": "8-12", "frecuencia": "Cada 4-6 años", "notas": "Excelente resistencia química"} ] }, "C4": { "nivel": "ALTA", "color": "#FF4500", # Rojo naranja "ejemplos": "Áreas industriales, zonas costeras sin rociado de sal, plantas químicas.", "descripcion": "Ambientes industriales y costeros con alta contaminación.", "protecciones": [ {"proteccion": "Sistema duplex (galvanizado + pintura)", "costo": "120-180", "vida_util": "20-25", "frecuencia": "Inspección cada 5-7 años", "notas": "Máxima protección sin acero inoxidable"}, {"proteccion": "Recubrimiento de zinc-aleación", "costo": "100-150", "vida_util": "15-20", "frecuencia": "Inspección cada 5 años", "notas": "Alta resistencia a la corrosión"} ] }, "C5": { "nivel": "MUY ALTA", "color": "#DC143C", # Rojo "ejemplos": "Áreas costeras con rociado de sal, industrias pesadas, plataformas costeras.", "descripcion": "Ambientes marinos e industriales extremadamente agresivos.", "protecciones": [ {"proteccion": "Acero inoxidable 316", "costo": "300-500", "vida_util": "50+", "frecuencia": "Limpieza periódica", "notas": "Solución premium para ambientes severos"}, {"proteccion": "Sistema de protección catódica", "costo": "200-350", "vida_util": "25-30", "frecuencia": "Mantenimiento anual", "notas": "Ideal para estructuras fijas"} ] }, "CX": { "nivel": "EXTREMA", "color": "#8B008B", # Púrpura "ejemplos": "Zonas tropicales con humedad permanente, industrias extremas, offshore.", "descripcion": "Ambientes tropicales y offshore con exposición constante.", "protecciones": [ {"proteccion": "Acero inoxidable superduplex", "costo": "400-600", "vida_util": "50+", "frecuencia": "Limpieza periódica", "notas": "Máxima resistencia para ambientes extremos"}, {"proteccion": "Recubrimientos especiales marinos", "costo": "250-400", "vida_util": "20-30", "frecuencia": "Inspección cada 3-5 años", "notas": "Tecnología avanzada de protección"} ] } } # ============================================================================== # BLOQUE 3: FUNCIONES PRINCIPALES # ============================================================================== def generar_graficos(clase_predicha, estacion): """Genera gráficos profesionales para el reporte""" graficos_base64 = [] try: # 1. Gráfico de Barras: Vida Útil fig, ax = plt.subplots(figsize=(10, 6)) protecciones = RECOMENDACIONES[clase_predicha]["protecciones"] sistemas = [p['proteccion'] for p in protecciones] vida_util = [float(p['vida_util'].split('-')[1].replace('+', '')) if '-' in p['vida_util'] else float(p['vida_util'].replace('+', '')) for p in protecciones] bars = ax.bar(sistemas, vida_util, color=[RECOMENDACIONES[clase_predicha]["color"], '#FFD700']) ax.set_title('Comparación de Vida Útil entre Sistemas de Protección', fontsize=14, fontweight='bold') ax.set_ylabel('Vida Útil (años)', fontsize=12) ax.set_xlabel('Sistemas de Protección', fontsize=12) # Añadir valores en las barras for bar in bars: height = bar.get_height() ax.text(bar.get_x() + bar.get_width()/2., height + 0.5, f'{height} años', ha='center', va='bottom', fontweight='bold') plt.xticks(rotation=15) plt.tight_layout() # Convertir a base64 buf = io.BytesIO() plt.savefig(buf, format='png', dpi=120, bbox_inches='tight') buf.seek(0) graficos_base64.append(base64.b64encode(buf.getvalue()).decode('utf-8')) plt.close() # 2. Gráfico Circular: Distribución de Costos fig, ax = plt.subplots(figsize=(8, 8)) costos = [float(p['costo'].split('-')[0]) for p in protecciones] colors = [RECOMENDACIONES[clase_predicha]["color"], '#FFD700'] wedges, texts, autotexts = ax.pie(costos, labels=sistemas, autopct='%1.1f%%', colors=colors, startangle=90) for autotext in autotexts: autotext.set_color('white') autotext.set_fontweight('bold') ax.set_title('Distribución de Costos Iniciales\n(S/ m²)', fontsize=14, fontweight='bold') plt.tight_layout() buf = io.BytesIO() plt.savefig(buf, format='png', dpi=120, bbox_inches='tight') buf.seek(0) graficos_base64.append(base64.b64encode(buf.getvalue()).decode('utf-8')) plt.close() # 3. Gráfico de Líneas: Degradación fig, ax = plt.subplots(figsize=(10, 6)) tiempo = np.arange(0, 26, 5) # 0 a 25 años for i, proteccion in enumerate(protecciones): vida = float(proteccion['vida_util'].split('-')[1].replace('+', '')) if '-' in proteccion['vida_util'] else float(proteccion['vida_util'].replace('+', '')) eficacia = [100 - (100/vida) * t for t in tiempo] eficacia = [max(0, e) for e in eficacia] # No menor que 0 ax.plot(tiempo, eficacia, marker='o', linewidth=2, label=proteccion['proteccion'], color=colors[i]) ax.set_title('Degradación de Protección en el Tiempo', fontsize=14, fontweight='bold') ax.set_xlabel('Años', fontsize=12) ax.set_ylabel('Eficacia de Protección (%)', fontsize=12) ax.legend() ax.grid(True, alpha=0.3) plt.tight_layout() buf = io.BytesIO() plt.savefig(buf, format='png', dpi=120, bbox_inches='tight') buf.seek(0) graficos_base64.append(base64.b64encode(buf.getvalue()).decode('utf-8')) plt.close() # 4. NUEVO GRÁFICO: Real vs Predicho grafico_comparativo = generar_grafico_real_vs_predicho() if grafico_comparativo: graficos_base64.append(grafico_comparativo) except Exception as e: print(f"Error generando gráficos: {e}") return graficos_base64 def generar_grafico_real_vs_predicho(): """Genera gráfico comparativo entre valores reales y predichos""" try: print("🔄 Generando gráfico real vs predicho...") # Obtener datos reales del Excel df_real = pd.read_excel("Acero_bajo_OFICIAL.xlsx") print(f"✅ Datos cargados: {len(df_real)} registros") # Preparar datos para predicción X_real = df_real[['Distancia al mar (km)', 'Altitud (msnm)', 'Humedad relativa (%)']] y_real = df_real['Clasificacion ISO 9223'] # Generar predicciones para todos los datos reales y_pred = modelo.predict(X_real) # Crear gráfico comparativo fig, ax = plt.subplots(figsize=(12, 8)) # Convertir clases categóricas a numéricas para gráfico clases_ordenadas = ['C1', 'C2', 'C3', 'C4', 'C5', 'CX'] y_real_num = [clases_ordenadas.index(clase) for clase in y_real] y_pred_num = [clases_ordenadas.index(clase) for clase in y_pred] # Gráfico de dispersión scatter = ax.scatter(y_real_num, y_pred_num, alpha=0.6, c=y_real_num, cmap='viridis', s=60) # Línea de perfecta predicción min_val = min(min(y_real_num), min(y_pred_num)) max_val = max(max(y_real_num), max(y_pred_num)) ax.plot([min_val, max_val], [min_val, max_val], 'r--', alpha=0.8, label='Predicción Perfecta') ax.set_xlabel('Valores Reales', fontsize=12, fontweight='bold') ax.set_ylabel('Valores Predichos', fontsize=12, fontweight='bold') ax.set_title('Comparación: Valores Reales vs Predichos\nModelo Random Forest', fontsize=14, fontweight='bold') # Configurar ejes con etiquetas de clases ax.set_xticks(range(len(clases_ordenadas))) ax.set_yticks(range(len(clases_ordenadas))) ax.set_xticklabels(clases_ordenadas) ax.set_yticklabels(clases_ordenadas) # Añadir grid y leyenda ax.grid(True, alpha=0.3) ax.legend() # Añadir barra de color cbar = plt.colorbar(scatter) cbar.set_label('Nivel de Corrosión', rotation=270, labelpad=15) # Calcular y mostrar precisión accuracy = accuracy_score(y_real, y_pred) ax.text(0.05, 0.95, f'Precisión del Modelo: {accuracy:.2%}', transform=ax.transAxes, fontsize=12, bbox=dict(boxstyle="round,pad=0.3", facecolor="white", alpha=0.8)) plt.tight_layout() # Convertir a base64 para HTML buf = io.BytesIO() plt.savefig(buf, format='png', dpi=120, bbox_inches='tight') buf.seek(0) img_base64 = base64.b64encode(buf.getvalue()).decode('utf-8') plt.close() print("✅ Gráfico real vs predicho generado exitosamente") return img_base64 except Exception as e: print(f"❌ Error generando gráfico real vs predicho: {e}") return None def predecir_corrosion(estacion, distancia, altitud, humedad, nombre_ing, proyecto, ubicacion): """Función principal para predecir corrosión""" try: # Validaciones if not all([estacion, nombre_ing, proyecto, ubicacion]): return "❌ Complete todos los campos obligatorios", "", "", "" distancia = float(distancia) altitud = float(altitud) humedad = float(humedad) # Validar rangos if not (0 <= distancia <= 25): return "❌ Distancia al mar debe estar entre 0-25 km", "", "", "" if not (0 <= altitud <= 400): return "❌ Altitud debe estar entre 0-400 msnm", "", "", "" if not (65 <= humedad <= 95): return "❌ Humedad relativa debe estar entre 65-95%", "", "", "" if modelo is None: return "❌ Modelo no disponible. Verifique los datos de entrenamiento.", "", "", "" # Realizar predicción nuevo_dato = pd.DataFrame({ 'Distancia al mar (km)': [distancia], 'Altitud (msnm)': [altitud], 'Humedad relativa (%)': [humedad] }) prediccion = modelo.predict(nuevo_dato)[0].upper() probabilidades = modelo.predict_proba(nuevo_dato)[0] clases = modelo.classes_ # Generar gráficos graficos_base64 = generar_graficos(prediccion, estacion) # Generar reporte COMPLETO reporte_completo_html = generar_reporte_completo( estacion, distancia, altitud, humedad, prediccion, probabilidades, clases, graficos_base64, nombre_ing, proyecto, ubicacion ) # Generar reporte SOLO GRÁFICOS reporte_graficos_html = generar_reporte_solo_graficos( estacion, distancia, altitud, humedad, prediccion, probabilidades, clases, graficos_base64, nombre_ing, proyecto, ubicacion ) # Resultados para mostrar en interfaz resultados_html = generar_resultados_html( estacion, distancia, altitud, humedad, prediccion, probabilidades, clases ) graficas_html = generar_graficas_html(graficos_base64) return resultados_html, graficas_html, reporte_completo_html, reporte_graficos_html except Exception as e: return f"❌ Error en la predicción: {str(e)}", "", "", "" # ============================================================================== # BLOQUE 4: GENERACIÓN DE HTML Y REPORTES # ============================================================================== def generar_resultados_html(estacion, distancia, altitud, humedad, prediccion, probabilidades, clases): """Genera HTML para mostrar resultados en la interfaz""" info_clase = RECOMENDACIONES.get(prediccion, {}) # Tabla de probabilidades prob_table = "" for clase, prob in zip(clases, probabilidades): prob_table += f"
{estacion} | {datetime.now().strftime('%d/%m/%Y %H:%M')}
| Clase | Probabilidad |
|---|
No se pudieron generar las gráficas
" graficas_html = "No se pudo generar el gráfico de validación
" html_content = f"""Análisis Real vs Predicho - CorrosionPredict Pro
{estacion} | {datetime.now().strftime('%d/%m/%Y %H:%M')}
Reporte de validación generado el {datetime.now().strftime('%d/%m/%Y')}
Sistema de Predicción de Corrosión ISO 9223
{estacion} | {datetime.now().strftime('%d/%m/%Y %H:%M')}
| Proyecto: | {proyecto} |
|---|---|
| Ubicación: | {ubicacion} |
| Ingeniero: | {nombre_ing} |
| Estación/Distrito: | {estacion} |
| Fecha: | {datetime.now().strftime('%d/%m/%Y %H:%M')} |
{distancia} km
{altitud} msnm
{humedad}%
Corrosión {info_clase.get('nivel', 'N/A')}
| Clase ISO 9223 | Probabilidad |
|---|
Descripción del ambiente: {info_clase.get('descripcion', 'N/A')}
Ejemplos típicos: {info_clase.get('ejemplos', 'N/A')}
| Sistema de Protección | Costo (S/ m²) | Vida Útil | Mantenimiento | Notas |
|---|
Sistema de predicción de corrosión basado en Machine Learning
Reporte generado automáticamente el {datetime.now().strftime('%d/%m/%Y')}
📄 Ejecuta una predicción para generar los reportes