Spaces:

nakas
/

dynamicalWeather

Sleeping

nakas Claude commited on Sep 30, 2025

Commit

75fd269

1 Parent(s): 48e63c4

Add comprehensive logging throughout the app

- Detailed logging for dataset loading
- Log all data operations and transformations
- Track errors with full tracebacks
- Log variable shapes, dimensions, and value ranges
- Help debug data loading issues

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>

Files changed (1) hide show

app.py +90 -11

app.py CHANGED Viewed

@@ -5,8 +5,18 @@ import numpy as np
 import plotly.graph_objects as go
 from datetime import datetime, timedelta
 import warnings
 warnings.filterwarnings('ignore')
 # Catalog configuration with correct zarr store URLs
 CATALOG = {
     "NOAA GFS Analysis (Hourly)": {
@@ -41,51 +51,88 @@ dataset_cache = {}
 def load_dataset(dataset_name, use_cache=True):
     """Load a dataset from the Dynamical catalog"""
     if use_cache and dataset_name in dataset_cache:
-        return dataset_cache[dataset_name]
     try:
         url = CATALOG[dataset_name]["url"]
         ds = xr.open_zarr(url)
         if use_cache:
             dataset_cache[dataset_name] = ds
-        return ds
     except Exception as e:
-        return None
 def create_map_visualization(dataset_name, variable, time_index=0):
     """Create an interactive map visualization of the selected variable"""
     try:
-        ds = load_dataset(dataset_name)
         if ds is None:
-            return None, f"Error loading dataset: {dataset_name}"
         # Check if variable exists
         if variable not in ds.variables:
             available_vars = list(ds.data_vars)
             return None, f"Variable '{variable}' not found. Available: {available_vars}"
         # Get the data
         data_var = ds[variable]
         # Handle time dimension
         if 'time' in data_var.dims:
             if time_index >= len(ds.time):
                 time_index = 0
             data_var = data_var.isel(time=time_index)
         # Handle ensemble dimension if present
         if 'ensemble' in data_var.dims:
             data_var = data_var.isel(ensemble=0)
         # Load data into memory (subsample for performance)
         step = max(1, len(ds.latitude) // 200)  # Limit to ~200 points per dimension
         data_var = data_var.isel(latitude=slice(None, None, step), longitude=slice(None, None, step))
         data_values = data_var.compute().values
         # Get coordinates
         lats = ds.latitude.isel(latitude=slice(None, None, step)).values
         lons = ds.longitude.isel(longitude=slice(None, None, step)).values
         # Create plotly figure
         fig = go.Figure(data=go.Heatmap(
@@ -109,34 +156,53 @@ def create_map_visualization(dataset_name, variable, time_index=0):
             hovermode='closest'
         )
         return fig, f"Successfully loaded {dataset_name}"
     except Exception as e:
-        return None, f"Error creating visualization: {str(e)}"
 def get_point_forecast(dataset_name, lat, lon, variable):
     """Get forecast data for a specific point"""
     try:
-        ds = load_dataset(dataset_name)
         if ds is None:
-            return None, "Error loading dataset"
         if variable not in ds.variables:
             return None, f"Variable '{variable}' not found in dataset"
         # Find nearest point
         data_var = ds[variable].sel(latitude=lat, longitude=lon, method='nearest')
         # Handle ensemble dimension
         if 'ensemble' in data_var.dims:
             data_var = data_var.isel(ensemble=0)
         # Load data
         data_values = data_var.compute().values
         # Create time series plot
         if 'time' in ds[variable].dims:
             times = pd.to_datetime(ds.time.values)
             fig = go.Figure()
             fig.add_trace(go.Scatter(
@@ -160,23 +226,36 @@ def get_point_forecast(dataset_name, lat, lon, variable):
                 variable: data_values
             })
             return fig, df.to_html(index=False)
         else:
             return None, f"No time dimension found for {variable}"
     except Exception as e:
-        return None, f"Error getting point forecast: {str(e)}"
 def update_available_variables(dataset_name):
     """Update the variable dropdown based on selected dataset"""
     try:
-        ds = load_dataset(dataset_name, use_cache=False)
         if ds is None:
             return gr.Dropdown(choices=CATALOG[dataset_name]["variables"], value=CATALOG[dataset_name]["variables"][0])
         available_vars = list(ds.data_vars)
         return gr.Dropdown(choices=available_vars, value=available_vars[0] if available_vars else None)
-    except:
         return gr.Dropdown(choices=CATALOG[dataset_name]["variables"], value=CATALOG[dataset_name]["variables"][0])
 # Create Gradio interface

 import plotly.graph_objects as go
 from datetime import datetime, timedelta
 import warnings
+import logging
+import traceback
 warnings.filterwarnings('ignore')
+# Set up detailed logging
+logging.basicConfig(
+    level=logging.INFO,
+    format='%(asctime)s - %(name)s - %(levelname)s - %(message)s'
+)
+logger = logging.getLogger(__name__)
 # Catalog configuration with correct zarr store URLs
 CATALOG = {
     "NOAA GFS Analysis (Hourly)": {
 def load_dataset(dataset_name, use_cache=True):
     """Load a dataset from the Dynamical catalog"""
+    logger.info(f"=== Loading dataset: {dataset_name} ===")
     if use_cache and dataset_name in dataset_cache:
+        logger.info(f"Dataset found in cache: {dataset_name}")
+        return dataset_cache[dataset_name], None
     try:
         url = CATALOG[dataset_name]["url"]
+        logger.info(f"Opening zarr store at: {url}")
         ds = xr.open_zarr(url)
+        logger.info(f"Successfully opened zarr store")
+        logger.info(f"Dataset dimensions: {dict(ds.dims)}")
+        logger.info(f"Dataset variables: {list(ds.data_vars)}")
+        logger.info(f"Dataset coordinates: {list(ds.coords)}")
         if use_cache:
             dataset_cache[dataset_name] = ds
+            logger.info(f"Dataset cached: {dataset_name}")
+        return ds, None
     except Exception as e:
+        error_msg = f"Error loading dataset: {str(e)}"
+        logger.error(f"=== ERROR loading {dataset_name} ===")
+        logger.error(f"URL: {CATALOG[dataset_name]['url']}")
+        logger.error(f"Exception type: {type(e).__name__}")
+        logger.error(f"Exception message: {str(e)}")
+        logger.error(f"Traceback:\n{traceback.format_exc()}")
+        return None, error_msg
 def create_map_visualization(dataset_name, variable, time_index=0):
     """Create an interactive map visualization of the selected variable"""
+    logger.info(f"=== Creating map visualization ===")
+    logger.info(f"Dataset: {dataset_name}, Variable: {variable}, Time index: {time_index}")
     try:
+        ds, error = load_dataset(dataset_name)
         if ds is None:
+            logger.error(f"Dataset loading returned None: {error}")
+            return None, f"Error loading dataset: {dataset_name}\n{error}"
+        logger.info(f"Dataset loaded successfully")
         # Check if variable exists
         if variable not in ds.variables:
             available_vars = list(ds.data_vars)
+            logger.error(f"Variable '{variable}' not found. Available: {available_vars}")
             return None, f"Variable '{variable}' not found. Available: {available_vars}"
+        logger.info(f"Variable '{variable}' found in dataset")
         # Get the data
         data_var = ds[variable]
+        logger.info(f"Variable shape: {data_var.shape}, dims: {data_var.dims}")
         # Handle time dimension
         if 'time' in data_var.dims:
+            logger.info(f"Time dimension found, length: {len(ds.time)}")
             if time_index >= len(ds.time):
                 time_index = 0
             data_var = data_var.isel(time=time_index)
+            logger.info(f"Selected time index: {time_index}")
         # Handle ensemble dimension if present
         if 'ensemble' in data_var.dims:
+            logger.info(f"Ensemble dimension found, selecting ensemble 0")
             data_var = data_var.isel(ensemble=0)
+        logger.info(f"Data variable shape after slicing: {data_var.shape}")
         # Load data into memory (subsample for performance)
         step = max(1, len(ds.latitude) // 200)  # Limit to ~200 points per dimension
+        logger.info(f"Subsampling with step: {step}")
         data_var = data_var.isel(latitude=slice(None, None, step), longitude=slice(None, None, step))
+        logger.info(f"Computing data values...")
         data_values = data_var.compute().values
+        logger.info(f"Data values shape: {data_values.shape}, min: {data_values.min()}, max: {data_values.max()}")
         # Get coordinates
         lats = ds.latitude.isel(latitude=slice(None, None, step)).values
         lons = ds.longitude.isel(longitude=slice(None, None, step)).values
+        logger.info(f"Lat range: [{lats.min()}, {lats.max()}], Lon range: [{lons.min()}, {lons.max()}]")
         # Create plotly figure
         fig = go.Figure(data=go.Heatmap(
             hovermode='closest'
         )
+        logger.info(f"Map visualization created successfully")
         return fig, f"Successfully loaded {dataset_name}"
     except Exception as e:
+        error_msg = f"Error creating visualization: {str(e)}"
+        logger.error(f"=== ERROR creating visualization ===")
+        logger.error(f"Exception type: {type(e).__name__}")
+        logger.error(f"Exception message: {str(e)}")
+        logger.error(f"Traceback:\n{traceback.format_exc()}")
+        return None, error_msg
 def get_point_forecast(dataset_name, lat, lon, variable):
     """Get forecast data for a specific point"""
+    logger.info(f"=== Getting point forecast ===")
+    logger.info(f"Dataset: {dataset_name}, Lat: {lat}, Lon: {lon}, Variable: {variable}")
     try:
+        ds, error = load_dataset(dataset_name)
         if ds is None:
+            logger.error(f"Dataset loading failed: {error}")
+            return None, f"Error loading dataset: {error}"
         if variable not in ds.variables:
+            logger.error(f"Variable '{variable}' not found in dataset")
             return None, f"Variable '{variable}' not found in dataset"
+        logger.info(f"Selecting nearest point to ({lat}, {lon})")
         # Find nearest point
         data_var = ds[variable].sel(latitude=lat, longitude=lon, method='nearest')
         # Handle ensemble dimension
         if 'ensemble' in data_var.dims:
+            logger.info(f"Handling ensemble dimension")
             data_var = data_var.isel(ensemble=0)
+        logger.info(f"Point data shape: {data_var.shape}, dims: {data_var.dims}")
         # Load data
+        logger.info(f"Computing point data values...")
         data_values = data_var.compute().values
+        logger.info(f"Point data computed, shape: {data_values.shape}")
         # Create time series plot
         if 'time' in ds[variable].dims:
             times = pd.to_datetime(ds.time.values)
+            logger.info(f"Creating time series plot with {len(times)} time steps")
             fig = go.Figure()
             fig.add_trace(go.Scatter(
                 variable: data_values
             })
+            logger.info(f"Point forecast created successfully")
             return fig, df.to_html(index=False)
         else:
+            logger.warning(f"No time dimension found for {variable}")
             return None, f"No time dimension found for {variable}"
     except Exception as e:
+        error_msg = f"Error getting point forecast: {str(e)}"
+        logger.error(f"=== ERROR getting point forecast ===")
+        logger.error(f"Exception type: {type(e).__name__}")
+        logger.error(f"Exception message: {str(e)}")
+        logger.error(f"Traceback:\n{traceback.format_exc()}")
+        return None, error_msg
 def update_available_variables(dataset_name):
     """Update the variable dropdown based on selected dataset"""
+    logger.info(f"=== Updating available variables for {dataset_name} ===")
     try:
+        ds, error = load_dataset(dataset_name, use_cache=False)
         if ds is None:
+            logger.warning(f"Could not load dataset, using default variables: {error}")
             return gr.Dropdown(choices=CATALOG[dataset_name]["variables"], value=CATALOG[dataset_name]["variables"][0])
         available_vars = list(ds.data_vars)
+        logger.info(f"Available variables: {available_vars}")
         return gr.Dropdown(choices=available_vars, value=available_vars[0] if available_vars else None)
+    except Exception as e:
+        logger.error(f"Error updating variables: {str(e)}")
+        logger.error(f"Traceback:\n{traceback.format_exc()}")
         return gr.Dropdown(choices=CATALOG[dataset_name]["variables"], value=CATALOG[dataset_name]["variables"][0])
 # Create Gradio interface