Spaces:

sammeeer
/

SchemeImpactNet

Sleeping

+[server]
+headless = true
+fileWatcherType = "auto"
+[browser]
+gatherUsageStats = false
+[theme]
+base = "light"
+backgroundColor = "#FAF9F7"
+secondaryBackgroundColor = "#F5F5F4"
+textColor = "#1C1917"
+font = "serif"
+[client]
+showSidebarNavigation = true

Dockerfile CHANGED Viewed

@@ -1,20 +1,31 @@
-FROM python:3.13.5-slim
 WORKDIR /app
-RUN apt-get update && apt-get install -y \
     build-essential \
     curl \
-    git \
     && rm -rf /var/lib/apt/lists/*
-COPY requirements.txt ./
-COPY src/ ./src/
-RUN pip3 install -r requirements.txt
-EXPOSE 8501
-HEALTHCHECK CMD curl --fail http://localhost:8501/_stcore/health
-ENTRYPOINT ["streamlit", "run", "src/streamlit_app.py", "--server.port=8501", "--server.address=0.0.0.0"]

+FROM python:3.11-slim
+# HF Spaces runs as non-root user 1000
+RUN useradd -m -u 1000 appuser
 WORKDIR /app
+# Install system deps
+RUN apt-get update && apt-get install -y --no-install-recommends \
     build-essential \
     curl \
     && rm -rf /var/lib/apt/lists/*
+# Copy requirements first for layer caching
+COPY requirements.txt .
+RUN pip install --no-cache-dir -r requirements.txt
+# Copy entire project
+COPY --chown=appuser:appuser . .
+# Create necessary directories
+RUN mkdir -p data/raw data/processed data/db models reports/figures \
+    && chown -R appuser:appuser /app
+USER appuser
+# HF Spaces exposes port 7860
+EXPOSE 7860
+# Entrypoint: generate synthetic data, seed DB, start both services
+CMD ["bash", "hf_start.sh"]

README.md DELETED Viewed

@@ -1,19 +0,0 @@
----
-title: SchemeImpactNet
-emoji: 🚀
-colorFrom: red
-colorTo: red
-sdk: docker
-app_port: 8501
-tags:
-- streamlit
-pinned: false
-short_description: Predictive analysis of government schemes...
----
-# Welcome to Streamlit!
-Edit `/src/streamlit_app.py` to customize this app to your heart's desire. :heart:
-If you have any questions, checkout our [documentation](https://docs.streamlit.io) and [community
-forums](https://discuss.streamlit.io).

backend/crud.py ADDED Viewed

	@@ -0,0 +1,130 @@

+"""
+crud.py
+-------
+Database query functions. All queries return plain dicts/lists
+so FastAPI routers stay thin.
+V3 update: expenditure_lakhs, expenditure_per_personday, demand_fulfillment_rate
+removed — these were synthetic columns dropped in the leak-free pipeline.
+"""
+import pandas as pd
+from sqlalchemy.orm import Session
+from sqlalchemy import text
+from typing import Optional, List
+# ── Districts ─────────────────────────────────────────────────────────────────
+def get_states(db: Session) -> List[str]:
+    rows = db.execute(text("SELECT DISTINCT state FROM district_data ORDER BY state")).fetchall()
+    return [r[0] for r in rows]
+def get_districts(db: Session, state: str) -> List[str]:
+    rows = db.execute(
+        text("SELECT DISTINCT district FROM district_data WHERE state=:s ORDER BY district"),
+        {"s": state}
+    ).fetchall()
+    return [r[0] for r in rows]
+def get_district_history(db: Session, state: str, district: str) -> List[dict]:
+    rows = db.execute(text("""
+        SELECT state, district, financial_year,
+               person_days_lakhs, avg_wage_rate
+        FROM district_data
+        WHERE state=:s AND district=:d
+        ORDER BY financial_year
+    """), {"s": state, "d": district}).fetchall()
+    return [dict(r._mapping) for r in rows]
+def get_top_districts(db: Session, state: Optional[str], metric: str, n: int) -> List[dict]:
+    # Only allow metrics that actually exist in V3 data
+    valid = {"person_days_lakhs"}
+    if metric not in valid:
+        metric = "person_days_lakhs"
+    where = "WHERE state=:s" if state else ""
+    params = {"s": state} if state else {}
+    rows = db.execute(text(f"""
+        SELECT state, district,
+               AVG(person_days_lakhs) as avg_persondays
+        FROM district_data
+        {where}
+        GROUP BY state, district
+        ORDER BY AVG({metric}) DESC
+        LIMIT :n
+    """), {**params, "n": n}).fetchall()
+    return [dict(r._mapping) for r in rows]
+def get_yearly_trend(db: Session, state: Optional[str]) -> List[dict]:
+    where = "WHERE state=:s" if state else ""
+    params = {"s": state} if state else {}
+    rows = db.execute(text(f"""
+        SELECT financial_year,
+               SUM(person_days_lakhs) as total_persondays,
+               AVG(avg_wage_rate)     as avg_wage
+        FROM district_data
+        {where}
+        GROUP BY financial_year
+        ORDER BY financial_year
+    """), params).fetchall()
+    return [dict(r._mapping) for r in rows]
+def get_stats(db: Session) -> dict:
+    r = db.execute(text("""
+        SELECT
+            COUNT(DISTINCT district) as total_districts,
+            COUNT(DISTINCT state)    as total_states,
+            MIN(financial_year)||' – '||MAX(financial_year) as year_range,
+            SUM(person_days_lakhs)   as total_persondays_lakhs
+        FROM district_data
+    """)).fetchone()
+    base = dict(r._mapping)
+    base["total_expenditure_lakhs"] = 0.0   # removed in V3 (synthetic column)
+    # COVID spike
+    pre  = db.execute(text("SELECT AVG(person_days_lakhs) FROM district_data WHERE financial_year=2019")).scalar()
+    post = db.execute(text("SELECT AVG(person_days_lakhs) FROM district_data WHERE financial_year=2020")).scalar()
+    base["covid_spike_pct"] = round((post - pre) / pre * 100, 2) if pre else 0.0
+    return base
+# ── Predictions ───────────────────────────────────────────────────────────────
+def get_predictions(
+    db: Session,
+    state: Optional[str],
+    district: Optional[str],
+    year: Optional[int]
+) -> List[dict]:
+    clauses, params = [], {}
+    if state:
+        clauses.append("state=:state"); params["state"] = state
+    if district:
+        clauses.append("district=:district"); params["district"] = district
+    if year:
+        clauses.append("financial_year=:year"); params["year"] = year
+    where = ("WHERE " + " AND ".join(clauses)) if clauses else ""
+    rows = db.execute(text(f"""
+        SELECT state, district, financial_year,
+               person_days_lakhs, predicted_persondays, prediction_error
+        FROM predictions {where}
+        ORDER BY state, district, financial_year
+    """), params).fetchall()
+    return [dict(r._mapping) for r in rows]
+# ── Optimizer ─────────────────────────────────────────────────────────────────
+def get_optimizer_results(db: Session, state: Optional[str]) -> List[dict]:
+    where = "WHERE state=:s" if state else ""
+    params = {"s": state} if state else {}
+    rows = db.execute(text(f"""
+        SELECT * FROM optimizer {where}
+        ORDER BY persondays_gain DESC
+    """), params).fetchall()
+    return [dict(r._mapping) for r in rows]

backend/database.py ADDED Viewed

	@@ -0,0 +1,50 @@

+"""
+database.py
+-----------
+SQLite database setup using SQLAlchemy.
+Seeds from processed CSVs on first run.
+"""
+import os
+import pandas as pd
+from sqlalchemy import create_engine, text
+from sqlalchemy.orm import declarative_base, sessionmaker
+BASE_DIR = os.path.dirname(os.path.dirname(os.path.abspath(__file__)))
+DB_PATH  = os.path.join(BASE_DIR, "data", "schemeimpactnet.db")
+DB_URL   = f"sqlite:///{DB_PATH}"
+engine       = create_engine(DB_URL, connect_args={"check_same_thread": False})
+SessionLocal = sessionmaker(bind=engine, autocommit=False, autoflush=False)
+Base         = declarative_base()
+def get_db():
+    db = SessionLocal()
+    try:
+        yield db
+    finally:
+        db.close()
+def seed_database() -> None:
+    """Load processed CSVs into SQLite tables on startup."""
+    processed = os.path.join(BASE_DIR, "data", "processed")
+    files = {
+        "district_data":   os.path.join(processed, "mnrega_cleaned.csv"),
+        "predictions":     os.path.join(processed, "mnrega_predictions.csv"),
+        "optimizer":       os.path.join(processed, "optimized_budget_allocation.csv"),
+    }
+    with engine.connect() as conn:
+        for table, path in files.items():
+            if not os.path.exists(path):
+                print(f"[db] WARNING: {path} not found, skipping")
+                continue
+            df = pd.read_csv(path)
+            df.to_sql(table, conn, if_exists="replace", index=False)
+            print(f"[db] Seeded '{table}': {len(df)} rows")
+        conn.commit()
+    print("[db] Database ready ✓")

backend/main.py ADDED Viewed

	@@ -0,0 +1,44 @@

+"""
+backend/main.py
+---------------
+FastAPI application entry point.
+Run with:
+    uvicorn backend.main:app --reload --port 8000
+"""
+from fastapi import FastAPI
+from fastapi.middleware.cors import CORSMiddleware
+from backend.database import seed_database
+from backend.routers.districts import router as districts_router
+from backend.routers.predictions import router as predictions_router
+from backend.routers.optimizer import router as optimizer_router
+app = FastAPI(
+    title="SchemeImpactNet API",
+    description="MNREGA district-level forecasting and budget optimization",
+    version="1.0.0"
+)
+app.add_middleware(
+    CORSMiddleware,
+    allow_origins=["*"],
+    allow_methods=["*"],
+    allow_headers=["*"],
+)
+@app.on_event("startup")
+def startup():
+    seed_database()
+app.include_router(districts_router)
+app.include_router(predictions_router)
+app.include_router(optimizer_router)
+@app.get("/")
+def root():
+    return {"project": "SchemeImpactNet", "version": "1.0.0", "docs": "/docs"}
+@app.get("/health")
+def health():
+    return {"status": "ok"}

backend/routers/districts.py ADDED Viewed

	@@ -0,0 +1,51 @@

+"""routers/districts.py — District data endpoints."""
+from fastapi import APIRouter, Depends, Query
+from sqlalchemy.orm import Session
+from typing import Optional, List
+from backend.database import get_db
+from backend import crud
+router = APIRouter(prefix="/districts", tags=["Districts"])
+@router.get("/states")
+def list_states(db: Session = Depends(get_db)):
+    return crud.get_states(db)
+@router.get("/list")
+def list_districts(state: str = Query(...), db: Session = Depends(get_db)):
+    return crud.get_districts(db, state)
+@router.get("/history")
+def district_history(
+    state: str = Query(...),
+    district: str = Query(...),
+    db: Session = Depends(get_db)
+):
+    return crud.get_district_history(db, state, district)
+@router.get("/top")
+def top_districts(
+    state: Optional[str] = Query(None),
+    metric: str = Query("person_days_lakhs"),
+    n: int = Query(10),
+    db: Session = Depends(get_db)
+):
+    return crud.get_top_districts(db, state, metric, n)
+@router.get("/trend")
+def yearly_trend(
+    state: Optional[str] = Query(None),
+    db: Session = Depends(get_db)
+):
+    return crud.get_yearly_trend(db, state)
+@router.get("/stats")
+def stats(db: Session = Depends(get_db)):
+    return crud.get_stats(db)

backend/routers/optimizer.py ADDED Viewed

	@@ -0,0 +1,99 @@

+"""routers/optimizer.py — Budget optimizer endpoints."""
+from fastapi import APIRouter, Depends, Query
+from sqlalchemy.orm import Session
+from typing import Optional
+from backend.database import get_db
+from backend import crud
+from backend.schemas import OptimizerRequest, OptimizerResponse
+router = APIRouter(prefix="/optimizer", tags=["Optimizer"])
+@router.get("/results")
+def get_optimizer_results(
+    state: Optional[str] = Query(None),
+    db: Session = Depends(get_db)
+):
+    return crud.get_optimizer_results(db, state)
+@router.post("/run", response_model=OptimizerResponse)
+def run_optimizer_live(req: OptimizerRequest, db: Session = Depends(get_db)):
+    """
+    Run LP optimizer live with custom parameters.
+    Reads predictions from DB, runs scipy LP, returns results.
+    """
+    import numpy as np
+    from scipy.optimize import linprog
+    from sqlalchemy import text
+    # Get latest year predictions + budget
+    state_clause = "AND p.state=:s" if req.state else ""
+    params = {"s": req.state} if req.state else {}
+    rows = db.execute(text(f"""
+        SELECT p.state, p.district,
+               p.predicted_persondays,
+               o.budget_allocated_lakhs,
+               o.persondays_per_lakh
+        FROM predictions p
+        JOIN optimizer o ON p.district = o.district AND p.state = o.state
+        WHERE p.financial_year = (SELECT MAX(financial_year) FROM predictions)
+        {state_clause}
+    """), params).fetchall()
+    if not rows:
+        return OptimizerResponse(
+            scope=req.state or "All-India",
+            total_budget_lakhs=0, sq_persondays_total=0,
+            opt_persondays_total=0, gain_lakhs=0, gain_pct=0, districts=[]
+        )
+    import pandas as pd
+    df = pd.DataFrame([dict(r._mapping) for r in rows]).dropna()
+    budgets    = df["budget_allocated_lakhs"].values * req.budget_scale
+    efficiency = df["persondays_per_lakh"].values
+    total_bud  = budgets.sum()
+    lb = budgets * req.min_fraction
+    ub = budgets * req.max_fraction
+    res = linprog(-efficiency, A_ub=[np.ones(len(df))],
+                  b_ub=[total_bud], bounds=list(zip(lb, ub)), method="highs")
+    opt_budgets   = res.x if res.success else budgets
+    sq_total      = float((efficiency * budgets).sum())
+    opt_total     = float((efficiency * opt_budgets).sum())
+    districts_out = []
+    for i, row in df.iterrows():
+        orig = budgets[df.index.get_loc(i)]
+        opt  = opt_budgets[df.index.get_loc(i)]
+        sq_pd  = float(efficiency[df.index.get_loc(i)] * orig)
+        opt_pd = float(efficiency[df.index.get_loc(i)] * opt)
+        districts_out.append({
+            "state": row["state"],
+            "district": row["district"],
+            "budget_allocated_lakhs": round(orig, 2),
+            "optimized_budget": round(opt, 2),
+            "budget_change": round(opt - orig, 2),
+            "budget_change_pct": round((opt - orig) / orig * 100, 2),
+            "sq_persondays": round(sq_pd, 3),
+            "opt_persondays": round(opt_pd, 3),
+            "persondays_gain": round(opt_pd - sq_pd, 3),
+            "persondays_gain_pct": round((opt_pd - sq_pd) / sq_pd * 100, 2) if sq_pd else 0,
+            "persondays_per_lakh": round(float(efficiency[df.index.get_loc(i)]), 4),
+        })
+    gain = opt_total - sq_total
+    return OptimizerResponse(
+        scope=req.state or "All-India",
+        total_budget_lakhs=round(total_bud, 2),
+        sq_persondays_total=round(sq_total, 2),
+        opt_persondays_total=round(opt_total, 2),
+        gain_lakhs=round(gain, 2),
+        gain_pct=round(gain / sq_total * 100, 2) if sq_total else 0,
+        districts=districts_out
+    )

backend/routers/predictions.py ADDED Viewed

	@@ -0,0 +1,19 @@

+"""routers/predictions.py — Model prediction endpoints."""
+from fastapi import APIRouter, Depends, Query
+from sqlalchemy.orm import Session
+from typing import Optional
+from backend.database import get_db
+from backend import crud
+router = APIRouter(prefix="/predictions", tags=["Predictions"])
+@router.get("/")
+def get_predictions(
+    state: Optional[str] = Query(None),
+    district: Optional[str] = Query(None),
+    year: Optional[int] = Query(None),
+    db: Session = Depends(get_db)
+):
+    return crud.get_predictions(db, state, district, year)

backend/schemas.py ADDED Viewed

	@@ -0,0 +1,77 @@

+"""
+schemas.py
+----------
+Pydantic schemas for API request/response validation.
+V3 update: expenditure_lakhs, expenditure_per_personday, demand_fulfillment_rate
+removed from DistrictSummary — synthetic columns dropped in leak-free pipeline.
+"""
+from pydantic import BaseModel
+from typing import Optional, List
+class DistrictSummary(BaseModel):
+    state: str
+    district: str
+    financial_year: int
+    person_days_lakhs: float
+    avg_wage_rate: float
+    class Config:
+        from_attributes = True
+class PredictionOut(BaseModel):
+    state: str
+    district: str
+    financial_year: int
+    person_days_lakhs: float
+    predicted_persondays: float
+    prediction_error: float
+    class Config:
+        from_attributes = True
+class OptimizerOut(BaseModel):
+    state: str
+    district: str
+    budget_allocated_lakhs: float
+    optimized_budget: float
+    budget_change: float
+    budget_change_pct: float
+    sq_persondays: float
+    opt_persondays: float
+    persondays_gain: float
+    persondays_gain_pct: float
+    persondays_per_lakh: float
+    class Config:
+        from_attributes = True
+class OptimizerRequest(BaseModel):
+    state: Optional[str] = None
+    budget_scale: float = 1.0
+    min_fraction: float = 0.40
+    max_fraction: float = 2.50
+class OptimizerResponse(BaseModel):
+    scope: str
+    total_budget_lakhs: float
+    sq_persondays_total: float
+    opt_persondays_total: float
+    gain_lakhs: float
+    gain_pct: float
+    districts: List[OptimizerOut]
+class StatsOut(BaseModel):
+    total_districts: int
+    total_states: int
+    year_range: str
+    total_persondays_lakhs: float
+    total_expenditure_lakhs: float   # kept for API compat, always 0.0 in V3
+    covid_spike_pct: float

data/processed/mnrega_cleaned.csv ADDED Viewed

The diff for this file is too large to render. See raw diff

data/processed/mnrega_predictions.csv ADDED Viewed

The diff for this file is too large to render. See raw diff

data/processed/optimized_budget_allocation.csv ADDED Viewed

	@@ -0,0 +1,707 @@

+state,district,budget_allocated_lakhs,optimized_budget,budget_change,budget_change_pct,sq_persondays,opt_persondays,persondays_gain,persondays_gain_pct,persondays_per_lakh
+Rajasthan,Jhalawar,34513.79,61420.08,26906.29,77.96,142.07,252.825,110.755,77.96,0.004116325677359687
+Rajasthan,Bhilwara,63021.65,96309.49,33287.840000000004,52.82,207.529,317.145,109.616,52.82,0.0032929794761006733
+Rajasthan,Jodhpur,43157.28,72509.08,29351.800000000003,68.01,154.84,260.149,105.309,68.01,0.00358780720193673
+Odisha,Ganjam,22347.28,40981.25,18633.97,83.38,115.335,211.505,96.17,83.38,0.005161030783164663
+Tamil Nadu,Chengalpattu,22102.08,40171.85,18069.769999999997,81.76,103.364,187.87,84.506,81.76,0.00467666391579435
+Andhra Pradesh,Prakasam,44170.36,66462.53,22292.17,50.47,143.216,215.495,72.279,50.47,0.0032423552807810487
+Gujarat,Dohad,28223.4,47928.91,19705.510000000002,69.82,103.06,175.016,71.956,69.82,0.003651579894697308
+Uttar Pradesh,Sitapur,34734.96,55845.88,21110.92,60.78,117.944,189.627,71.683,60.78,0.0033955415523725953
+Tamil Nadu,Ramanathapuram,24985.21,43423.92,18438.71,73.8,96.415,167.568,71.153,73.8,0.0038588829151325926
+Uttar Pradesh,Siddharth Nagar,33779.28,54065.01,20285.730000000003,60.05,114.38,183.069,68.689,60.05,0.003386099407684237
+Tamil Nadu,Dindigul,33099.97,53277.05,20177.08,60.96,112.531,181.128,68.597,60.96,0.003399731178004089
+Rajasthan,Ajmer,64856.7,86446.01,21589.309999999998,33.29,198.554,264.648,66.094,33.29,0.0030614261903550446
+Odisha,Koraput,24902.06,42423.72,17521.66,70.36,92.406,157.425,65.019,70.36,0.0037107773413123254
+Rajasthan,Nagaur,85238.46,106521.25,21282.789999999994,24.97,255.112,318.81,63.698,24.97,0.00299292127051568
+Tamil Nadu,Kanchipuram,20938.58,36656.01,15717.43,75.06,82.417,144.283,61.866,75.06,0.003936131294481287
+Andhra Pradesh,Kurnool,29973.18,47160.09,17186.909999999996,57.34,100.049,157.418,57.369,57.34,0.003337950794677108
+Rajasthan,Bikaner,34206.5,51717.5,17511.0,51.19,111.376,168.392,57.016,51.19,0.0032559893587476066
+Rajasthan,Banswara,60504.32,78675.2,18170.879999999997,30.03,183.15,238.154,55.004,30.03,0.003027056580422687
+Maharashtra,Palghar,21062.69,35501.96,14439.27,68.55,76.026,128.145,52.119,68.55,0.0036095104661370415
+Odisha,Kendujhar,22443.48,37179.9,14736.420000000002,65.66,78.262,129.649,51.387,65.66,0.0034870706325400517
+Andhra Pradesh,Nellore,33897.52,49717.74,15820.220000000001,46.67,108.913,159.743,50.83,46.67,0.0032130079132632714
+Tamil Nadu,Sivagangai,28850.77,44141.83,15291.060000000001,53.0,95.105,145.511,50.406,53.0,0.0032964458140978562
+Tamil Nadu,Pudukkottai,42900.64,59043.35,16142.71,37.63,132.89,182.894,50.004,37.63,0.0030976227860470143
+Tamil Nadu,Tirupathur,14446.82,25866.05,11419.23,79.04,61.585,110.264,48.679,79.04,0.0042628758439573556
+Madhya Pradesh,Balaghat,29396.28,44285.34,14889.059999999998,50.65,95.607,144.031,48.424,50.65,0.0032523502973845673
+Tamil Nadu,Karur,15300.44,27117.68,11817.24,77.23,62.237,110.306,48.069,77.24,0.004067660799297275
+Uttar Pradesh,Kheri,26011.01,40361.48,14350.470000000005,55.17,86.324,133.95,47.626,55.17,0.0033187484838151232
+Odisha,Bolangir,28454.31,43072.11,14617.8,51.37,92.675,140.285,47.61,51.37,0.0032569758324837252
+Tamil Nadu,Vellore,21076.41,34419.69,13343.280000000002,63.31,72.252,117.994,45.742,63.31,0.003428098048956155
+Tamil Nadu,Nagapattinam,11359.29,20728.36,9369.07,82.48,55.317,100.942,45.625,82.48,0.004869758585263691
+Andhra Pradesh,Palnadu,25215.12,38852.88,13637.759999999998,54.09,83.554,128.745,45.191,54.09,0.0033136467325953637
+Andhra Pradesh,Anantapur,37192.75,51524.01,14331.260000000002,38.53,115.475,159.97,44.495,38.53,0.0031047717633140865
+Tamil Nadu,Thoothukkudi,21805.35,34860.85,13055.5,59.87,73.829,118.033,44.204,59.87,0.0033858204523201873
+Chhattisgarh,Kanker,18867.61,31119.62,12252.009999999998,64.94,65.337,107.765,42.428,64.94,0.003462918726855177
+Maharashtra,Parbhani,21829.87,34110.45,12280.579999999998,56.26,72.635,113.496,40.861,56.26,0.0033273216927082027
+Uttar Pradesh,Prayagraj,20807.27,32926.51,12119.240000000002,58.25,69.884,110.588,40.704,58.25,0.0033586337852106497
+Assam,Dhubri,9215.78,16916.9,7701.120000000001,83.56,48.286,88.636,40.35,83.56,0.0052394913941088
+Andhra Pradesh,Tirupati,33787.19,46622.89,12835.699999999997,37.99,104.842,144.671,39.829,37.99,0.003103010342085269
+Rajasthan,Karauli,8015.52,14858.61,6843.09,85.37,46.365,85.948,39.583,85.37,0.005784403257680101
+Madhya Pradesh,Dindori,31667.27,44213.05,12545.780000000002,39.62,99.078,138.33,39.252,39.62,0.0031287193370315787
+Tamil Nadu,Tenkasi,13610.81,23532.3,9921.49,72.89,52.101,90.08,37.979,72.89,0.003827913254244237
+Odisha,Nabarangapur,17937.75,28807.36,10869.61,60.6,60.902,97.806,36.904,60.6,0.0033951861298100374
+Chhattisgarh,Rajnandagon,17478.81,28291.6,10812.789999999997,61.86,59.602,96.473,36.871,61.86,0.0034099575428762022
+Uttar Pradesh,Fatehpur,14174.0,24121.52,9947.52,70.18,52.156,88.76,36.604,70.18,0.003679695216593763
+Odisha,Dhenkanal,10094.64,18219.82,8125.18,80.49,45.315,81.789,36.474,80.49,0.004489015953020613
+Tamil Nadu,Tiruvarur,18963.31,29562.69,10599.379999999997,55.89,63.079,98.336,35.257,55.89,0.003326370765441265
+Uttar Pradesh,Sant Kabeer Nagar,21731.81,32581.65,10849.84,49.93,70.258,105.335,35.077,49.93,0.0032329566658276503
+Tamil Nadu,Tirunelveli,12376.02,21419.81,9043.79,73.08,47.512,82.231,34.719,73.07,0.003839037105628465
+Tamil Nadu,Erode,18763.56,29149.49,10385.93,55.35,62.324,96.821,34.497,55.35,0.003321544525665705
+Himachal Pradesh,Mandi,36291.24,47584.16,11292.920000000006,31.12,110.375,144.721,34.346,31.12,0.0030413675586725615
+Odisha,Mayurbhanj,35253.13,46478.04,11224.910000000003,31.84,107.416,141.618,34.202,31.84,0.0030469918557586234
+Karnataka,Vijayanagara,22187.48,32662.92,10475.439999999999,47.21,71.342,105.025,33.683,47.21,0.0032154169829110833
+Rajasthan,Alwar,10564.01,18780.4,8216.390000000001,77.78,43.177,76.759,33.582,77.78,0.0040871790163015745
+Uttar Pradesh,Banda,10978.28,19377.9,8399.62,76.51,43.867,77.43,33.563,76.51,0.003995798977617622
+Karnataka,Belagavi,35936.08,46923.51,10987.43,30.57,109.043,142.383,33.34,30.58,0.003034359896794531
+Maharashtra,Hingoli,11616.64,20231.56,8614.920000000002,74.16,44.881,78.165,33.284,74.16,0.0038635095862486917
+Odisha,Jajpur,4483.12,8415.9,3932.7799999999997,87.72,36.597,68.701,32.104,87.72,0.008163288067238888
+Rajasthan,Tonk,12727.92,21545.47,8817.550000000001,69.28,46.331,78.428,32.097,69.28,0.0036401077316639326
+Andhra Pradesh,Bapatla,22944.75,33030.79,10086.04,43.96,72.956,105.026,32.07,43.96,0.003179638043561163
+Jharkhand,Giridih,31209.94,41542.57,10332.630000000001,33.11,95.496,127.112,31.616,33.11,0.0030597944116521852
+Uttar Pradesh,Amethi,13338.55,22217.28,8878.73,66.56,47.308,78.798,31.49,66.56,0.003546712348793535
+Uttar Pradesh,Barabanki,27689.45,37858.09,10168.639999999996,36.72,85.624,117.068,31.444,36.72,0.003092296885636948
+Assam,Barpeta,5231.46,9754.48,4523.0199999999995,86.46,35.876,66.894,31.018,86.46,0.006857741433557744
+Tamil Nadu,Krishnagiri,34206.25,44293.61,10087.36,29.49,103.378,133.864,30.486,29.49,0.00302219623606797
+Odisha,Angul,8309.35,15027.6,6718.25,80.85,37.567,67.941,30.374,80.85,0.004521051586465849
+Uttar Pradesh,Rae Bareli,12541.8,20980.9,8439.100000000002,67.29,44.797,74.94,30.143,67.29,0.0035718158478049403
+Tamil Nadu,Tiruppur,19337.98,28677.91,9339.93,48.3,62.249,92.314,30.065,48.3,0.00321900219154224
+Uttar Pradesh,Balrampur,16982.83,26075.96,9093.129999999997,53.54,56.06,86.076,30.016,53.54,0.0033009810496837095
+Uttar Pradesh,Jhansi,13783.26,22434.53,8651.269999999999,62.77,47.131,76.713,29.582,62.77,0.0034194377817729623
+Uttar Pradesh,Ballia,13814.85,22460.97,8646.12,62.59,47.224,76.779,29.555,62.58,0.003418350543075024
+Andhra Pradesh,Y.S.R,25967.38,35456.65,9489.27,36.54,80.296,109.639,29.343,36.54,0.0030921871979383364
+Rajasthan,Jalore,22667.38,31934.59,9267.21,40.88,71.417,100.615,29.198,40.88,0.0031506508471645157
+Tamil Nadu,Mayiladuthurai,22279.07,31306.94,9027.869999999999,40.52,69.986,98.346,28.36,40.52,0.003141333996437015
+Madhya Pradesh,Bhind,1558.31,2973.23,1414.92,90.8,30.47,58.136,27.666,90.8,0.019553233952166127
+Rajasthan,Sikar,11102.46,18613.22,7510.760000000002,67.65,39.731,66.609,26.878,67.65,0.0035785762794912123
+Rajasthan,Dholpur,4089.41,7662.02,3572.6100000000006,87.36,30.37,56.902,26.532,87.36,0.007426499177142914
+Rajasthan,Jaipur,15021.74,23037.68,8015.9400000000005,53.36,49.572,76.025,26.453,53.36,0.0033000171751075445
+Odisha,Bargarh,10240.79,17353.84,7113.049999999999,69.46,37.278,63.171,25.893,69.46,0.0036401488557035147
+Jharkhand,Sahebganj,8898.15,15529.22,6631.07,74.52,34.723,60.599,25.876,74.52,0.0039022718205469677
+Madhya Pradesh,Rajgarh,19739.9,27881.66,8141.759999999998,41.25,62.223,87.887,25.664,41.25,0.0031521436278805865
+Kerala,Palakkad,26115.51,34289.23,8173.720000000005,31.3,79.43,104.29,24.86,31.3,0.003041487606407074
+Rajasthan,Sawai Madhopur,5839.71,10698.51,4858.8,83.2,29.433,53.922,24.489,83.2,0.005040147541573126
+Odisha,Rayagada,14561.44,22068.4,7506.960000000001,51.55,47.501,71.99,24.489,51.55,0.0032621086925468906
+Odisha,Bhadrak,5067.22,9356.6,4289.38,84.65,28.68,52.957,24.277,84.65,0.005659908194236681
+Andhra Pradesh,Guntur,8888.24,15270.81,6382.57,71.81,33.552,57.645,24.093,71.81,0.003774875565916312
+Telangana,Mahabubabad,15590.57,22895.0,7304.43,46.85,50.113,73.592,23.479,46.85,0.0032143148069634403
+Assam,Nalbari,6273.44,11379.66,5106.22,81.39,28.501,51.699,23.198,81.39,0.004543121477211865
+Uttar Pradesh,Chitrakoot,6662.45,11916.61,5254.160000000001,78.86,28.349,50.706,22.357,78.86,0.0042550413136308715
+Kerala,Thrissur,15471.21,22467.9,6996.690000000002,45.22,49.421,71.771,22.35,45.22,0.003194384925290265
+Chhattisgarh,Gariyaband,18272.41,25379.3,7106.889999999999,38.89,56.97,79.128,22.158,38.89,0.0031178153292313383
+Maharashtra,Chandrapur,22202.39,29432.44,7230.049999999999,32.56,67.848,89.942,22.094,32.56,0.0030558872265553393
+Kerala,Kottayam,11619.93,18240.88,6620.950000000001,56.98,38.75,60.829,22.079,56.98,0.003334787731079275
+Andhra Pradesh,West Godavari,12840.14,19552.6,6712.459999999999,52.28,42.123,64.144,22.021,52.28,0.0032805717071620714
+Uttar Pradesh,Ambedkar Nagar,14554.18,21399.36,6845.18,47.03,46.794,68.802,22.008,47.03,0.003215158806610884
+Karnataka,Bagalkote,14315.73,21152.33,6836.600000000002,47.76,46.059,68.055,21.996,47.76,0.0032173699839267715
+Odisha,Nayagarh,6035.34,10904.1,4868.76,80.67,27.266,49.262,21.996,80.67,0.004517723939330675
+Assam,Darrang,9428.32,15653.07,6224.75,66.02,33.135,55.011,21.876,66.02,0.0035144118994688343
+Telangana,Sangareddy,17704.1,24621.97,6917.870000000003,39.07,55.268,76.864,21.596,39.08,0.003121762755519908
+Madhya Pradesh,Chhatarpur,13676.71,20356.55,6679.84,48.84,44.083,65.614,21.531,48.84,0.0032232166946582915
+Uttar Pradesh,Aligarh,10684.99,17043.76,6358.769999999999,59.51,36.134,57.638,21.504,59.51,0.003381753281940367
+Tamil Nadu,Perambalur,12799.26,19328.31,6529.050000000001,51.01,41.663,62.916,21.253,51.01,0.003255110061050404
+Madhya Pradesh,Rewa,8667.3,14546.36,5879.060000000001,67.83,31.095,52.187,21.092,67.83,0.0035876224429753213
+Kerala,Ernakulam,14145.08,20695.53,6550.449999999999,46.31,45.419,66.452,21.033,46.31,0.00321093977552619
+Karnataka,Davanagere,9489.86,15532.13,6042.269999999999,63.67,32.601,53.358,20.757,63.67,0.0034353509956943514
+Uttar Pradesh,Mau,15310.59,21846.99,6536.4000000000015,42.69,48.487,69.187,20.7,42.69,0.003166892980610153
+Uttar Pradesh,Pilibhit,11020.85,17200.79,6179.9400000000005,56.07,36.668,57.23,20.562,56.08,0.0033271480874887144
+Madhya Pradesh,Shivpuri,25035.6,31739.39,6703.790000000001,26.78,75.217,95.358,20.141,26.78,0.0030044017319337266
+Uttar Pradesh,Kashganj,7366.96,12683.76,5316.8,72.17,27.865,47.975,20.11,72.17,0.003782428572979899
+Uttar Pradesh,Gonda,16865.32,23302.93,6437.610000000001,38.17,52.354,72.338,19.984,38.17,0.003104239943268198
+Madhya Pradesh,Satna,10580.94,16571.61,5990.67,56.62,35.268,55.236,19.968,56.62,0.0033331632161225752
+Chhattisgarh,Durg,13500.48,19703.59,6203.110000000001,45.95,43.314,63.216,19.902,45.95,0.0032083303704757166
+Bihar,Sitamarhi,24346.93,30954.38,6607.450000000001,27.14,73.172,93.03,19.858,27.14,0.0030053891804839457
+Uttar Pradesh,Varanasi,6283.68,11102.77,4819.09,76.69,25.208,44.541,19.333,76.69,0.004011661956051231
+Andhra Pradesh,Krishna,25808.32,32158.93,6350.610000000001,24.61,77.234,96.239,19.005,24.61,0.002992600835699495
+Uttar Pradesh,Amroha,12087.7,17882.14,5794.439999999999,47.94,38.897,57.543,18.646,47.94,0.0032178991867766404
+Jharkhand,Jamtara,16680.67,22715.96,6035.290000000001,36.18,51.466,70.087,18.621,36.18,0.003085367674080238
+Chhattisgarh,Dhamtari,12806.5,18621.26,5814.759999999998,45.4,40.929,59.513,18.584,45.41,0.0031959551790106586
+Jammu and Kashmir,Kishtwar,10612.18,16198.31,5586.129999999999,52.64,34.874,53.231,18.357,52.64,0.003286223942677188
+Nagaland,Dimapur,3211.34,5976.19,2764.8499999999995,86.1,20.958,39.002,18.044,86.1,0.006526247610031948
+Kerala,Pathanamthitta,10115.32,15567.96,5452.639999999999,53.9,33.417,51.43,18.013,53.9,0.003303602851911754
+Uttarakhand,Tehri Garhwal,8177.31,13369.08,5191.7699999999995,63.49,28.057,45.87,17.813,63.49,0.0034310794136458074
+Assam,Bongaigaon,2252.34,4236.33,1983.9899999999998,88.09,19.666,36.989,17.323,88.09,0.008731363826065337
+Uttar Pradesh,Unnao,13438.3,18908.04,5469.740000000002,40.7,42.253,59.451,17.198,40.7,0.003144222111427785
+Uttar Pradesh,Mirzapur,14179.63,19669.03,5489.4,38.71,44.175,61.277,17.102,38.71,0.0031153845340111132
+Odisha,Cuttack,2650.32,4960.91,2310.5899999999997,87.18,19.577,36.645,17.068,87.18,0.007386655196353648
+Andhra Pradesh,Ntr,25273.44,30989.65,5716.210000000003,22.62,75.382,92.431,17.049,22.62,0.0029826568919782987
+Madhya Pradesh,Sidhi,13475.68,18887.52,5411.84,40.16,42.249,59.216,16.967,40.16,0.0031352035667216796
+Jammu and Kashmir,Shopian,5659.65,9938.74,4279.09,75.61,22.312,39.181,16.869,75.61,0.003942293251349466
+Bihar,Gopalganj,12758.18,18066.46,5308.279999999999,41.61,40.227,56.964,16.737,41.61,0.003153035934592551
+Madhya Pradesh,Tikamgarh,7415.88,12204.69,4788.81,64.58,25.663,42.235,16.572,64.58,0.0034605468265398037
+Chhattisgarh,Korea,6020.12,10386.66,4366.54,72.53,22.84,39.406,16.566,72.53,0.003793944306758005
+Maharashtra,Latur,22446.52,27929.3,5482.779999999999,24.43,67.103,83.494,16.391,24.43,0.002989461172600474
+Himachal Pradesh,Kullu,11981.7,17140.26,5158.559999999998,43.05,37.981,54.333,16.352,43.05,0.0031699174574559537
+Madhya Pradesh,Jhabua,11658.77,16741.56,5082.790000000001,43.6,37.018,53.156,16.138,43.6,0.0031751205315826625
+Uttar Pradesh,Bareilly,13486.6,18658.92,5172.319999999998,38.35,41.867,57.924,16.057,38.35,0.003104340604748417
+Uttar Pradesh,Kanpur Dehat,7449.55,12098.43,4648.88,62.4,25.46,41.348,15.888,62.4,0.003417656100032888
+Maharashtra,Nandurbar,11131.85,16065.45,4933.6,44.32,35.428,51.13,15.702,44.32,0.0031825797149620232
+Madhya Pradesh,Dewas,7487.25,12091.95,4604.700000000001,61.5,25.519,41.213,15.694,61.5,0.0034083274900664462
+Uttar Pradesh,Farrukhabad,7500.79,12100.25,4599.46,61.32,25.523,41.174,15.651,61.32,0.003402708248064537
+Uttar Pradesh,Etawah,7791.32,12413.94,4622.620000000001,59.33,26.343,41.972,15.629,59.33,0.0033810702166000113
+Uttar Pradesh,Lalitpur,15202.69,20290.81,5088.120000000001,33.47,46.549,62.128,15.579,33.47,0.0030618923361589298
+Andhra Pradesh,Visakhapatanam,5614.6,9697.17,4082.5699999999997,72.71,21.379,36.924,15.545,72.71,0.0038077512200334843
+Nagaland,Kohima,1107.67,2109.41,1001.7399999999998,90.44,17.134,32.629,15.495,90.43,0.015468505962967309
+Karnataka,Gadag,10844.21,15689.55,4845.34,44.68,34.581,50.032,15.451,44.68,0.0031888906614681942
+Uttar Pradesh,Lucknow,3488.61,6416.47,2927.86,83.93,18.406,33.853,15.447,83.92,0.005276026841636067
+Karnataka,Yadgir,14626.58,19654.15,5027.5700000000015,34.37,44.896,60.328,15.432,34.37,0.0030694803569939113
+Bihar,Arwal,6966.35,11439.68,4473.33,64.21,23.964,39.352,15.388,64.21,0.003439964974484486
+Assam,Lakhimpur,8387.74,12984.98,4597.24,54.81,27.821,43.069,15.248,54.81,0.0033168648527493703
+Kerala,Idukki,18292.61,23356.24,5063.630000000001,27.68,55.061,70.303,15.242,27.68,0.0030100133332531553
+Himachal Pradesh,Shimla,15169.78,20082.28,4912.499999999998,32.38,46.348,61.357,15.009,32.38,0.003055284915140496
+Assam,Nagaon,14691.04,19501.64,4810.5999999999985,32.75,44.895,59.596,14.701,32.75,0.0030559443034666026
+Rajasthan,Dausa,5954.55,10025.85,4071.3,68.37,21.453,36.121,14.668,68.37,0.003602791142907524
+Telangana,Nizamabad,17319.99,22177.04,4857.049999999999,28.04,52.188,66.823,14.635,28.04,0.003013165711989441
+Assam,South Salmara-Mankachar,2479.84,4619.38,2139.54,86.28,16.95,31.574,14.624,86.28,0.006835118394735143
+Jharkhand,Gumla,10877.43,15481.88,4604.449999999999,42.33,34.387,48.943,14.556,42.33,0.003161316597762523
+Tripura,South Tripura,14826.45,19600.95,4774.5,32.2,45.189,59.741,14.552,32.2,0.003047863783980656
+Uttar Pradesh,Sonbhadra,15638.71,20363.67,4724.959999999999,30.21,47.388,61.705,14.317,30.21,0.00303017320482316
+Madhya Pradesh,Singrauli,12966.41,17587.48,4621.07,35.64,39.947,54.184,14.237,35.64,0.003080806483830143
+Assam,Goalpara,5604.63,9467.09,3862.46,68.92,20.334,34.347,14.013,68.91,0.0036280717906445204
+Chhattisgarh,Balod,16100.06,20702.35,4602.289999999999,28.59,48.606,62.5,13.894,28.58,0.003018994960267229
+Jharkhand,Godda,12771.04,17276.29,4505.25,35.28,39.341,53.219,13.878,35.28,0.0030804852228166224
+Jammu and Kashmir,Doda,14984.69,19539.15,4554.460000000001,30.39,45.412,59.215,13.803,30.4,0.003030559858095162
+Uttar Pradesh,Kaushambi,6734.04,10802.44,4068.4000000000005,60.42,22.824,36.613,13.789,60.41,0.0033893472566245524
+Telangana,Wanaparthy,8460.08,12699.16,4239.08,50.11,27.362,41.072,13.71,50.11,0.0032342483759018824
+Maharashtra,Nagpur,10300.81,14605.28,4304.470000000001,41.79,32.5,46.081,13.581,41.79,0.0031550916869644233
+Nagaland,Tuensang,3000.07,5523.34,2523.27,84.11,16.012,29.479,13.467,84.11,0.0053372087984613695
+Odisha,Kendrapara,3344.96,6097.81,2752.8500000000004,82.3,16.251,29.625,13.374,82.3,0.00485835406103511
+Madhya Pradesh,Ratlam,9117.03,13273.08,4156.049999999999,45.59,29.206,42.52,13.314,45.59,0.0032034555112794407
+Telangana,Medak,15931.06,20283.36,4352.300000000001,27.32,47.9,60.986,13.086,27.32,0.0030067051407753156
+Madhya Pradesh,Sagar,11895.11,16112.87,4217.76,35.46,36.643,49.636,12.993,35.46,0.003080509553925941
+Madhya Pradesh,Barwani,8970.35,12994.65,4024.2999999999993,44.86,28.641,41.49,12.849,44.86,0.003192852006889363
+Gujarat,Tapi,3899.74,6954.01,3054.2700000000004,78.32,16.375,29.2,12.825,78.32,0.0041989978819100765
+Meghalaya,West Khasi Hills,3881.82,6915.03,3033.2099999999996,78.14,16.229,28.91,12.681,78.14,0.004180770875517154
+Punjab,Ludhiana,6475.7,10224.06,3748.3599999999997,57.88,21.668,34.21,12.542,57.88,0.0033460475315409918
+Rajasthan,Jhunjhunu,6332.88,10044.39,3711.5099999999993,58.61,21.317,33.81,12.493,58.61,0.0033660830459443414
+Madhya Pradesh,Shahdol,11662.84,15713.87,4051.0300000000007,34.73,35.823,48.266,12.443,34.73,0.00307155032564967
+Uttar Pradesh,Deoria,14311.2,18376.25,4065.0499999999993,28.4,43.132,55.384,12.252,28.41,0.0030138632679300127
+Odisha,Jagatsinghapur,3460.13,6232.67,2772.54,80.13,15.256,27.48,12.224,80.13,0.004409082895729351
+Bihar,Sheohar,6402.54,10062.24,3659.7,57.16,21.352,33.557,12.205,57.16,0.003334926451064734
+Odisha,Baleshwar,8882.63,12722.99,3840.3600000000006,43.23,28.177,40.359,12.182,43.23,0.0031721460873637653
+Uttar Pradesh,Kanpur Nagar,3931.49,6953.74,3022.25,76.87,15.83,27.999,12.169,76.87,0.004026463249302428
+Tripura,Khowai,14176.43,18177.57,4001.1399999999994,28.22,42.721,54.779,12.058,28.22,0.0030135231507509293
+Nagaland,Phek,1343.53,2536.71,1193.18,88.81,13.513,25.514,12.001,88.81,0.010057832724241364
+Tripura,Sepahijala,13196.1,17135.34,3939.24,29.85,39.933,51.854,11.921,29.85,0.0030261213540364196
+Odisha,Khordha,3048.73,5552.28,2503.5499999999997,82.12,14.453,26.321,11.868,82.11,0.004740662505371088
+Uttar Pradesh,Etah,10481.7,14255.16,3773.459999999999,36.0,32.324,43.961,11.637,36.0,0.0030838509020483314
+Odisha,Puri,5557.95,8956.02,3398.0700000000006,61.14,18.896,30.449,11.553,61.14,0.003399814679872975
+Gujarat,Mahisagar,5123.16,8440.71,3317.5499999999993,64.76,17.733,29.216,11.483,64.75,0.0034613402665542364
+Assam,Sribhumi,8827.24,12452.09,3624.8500000000004,41.06,27.822,39.247,11.425,41.06,0.003151834548511199
+Puducherry,Pondicherry,2212.97,4106.25,1893.2800000000002,85.55,13.259,24.603,11.344,85.56,0.0059914955918968634
+Himachal Pradesh,Sirmaur,7647.51,11175.17,3527.66,46.13,24.536,35.854,11.318,46.13,0.0032083645526452403
+Gujarat,Narmada,10815.13,14454.36,3639.2300000000014,33.65,33.129,44.277,11.148,33.65,0.003063208671555497
+Karnataka,Haveri,14379.75,18022.17,3642.4199999999983,25.33,43.054,53.96,10.906,25.33,0.0029940715241920063
+Nagaland,Peren,3174.85,5695.84,2520.9900000000002,79.41,13.718,24.611,10.893,79.41,0.004320834055152212
+Punjab,Moga,3582.72,6310.95,2728.23,76.15,14.243,25.089,10.846,76.15,0.003975471150410861
+Karnataka,Dharwar,7112.71,10483.72,3371.0099999999993,47.39,22.879,33.722,10.843,47.39,0.003216636134469141
+Meghalaya,West Jaintia Hills,4522.22,7540.59,3018.37,66.75,16.099,26.844,10.745,66.74,0.003559977179349965
+Karnataka,Mandya,9428.79,12857.3,3428.5099999999984,36.36,29.144,39.741,10.597,36.36,0.0030909586489888943
+Nagaland,Zunheboto,2292.32,4224.47,1932.15,84.29,12.53,23.091,10.561,84.29,0.005466078034480351
+Arunachal Pradesh,Kra-Daadi,4983.38,8075.22,3091.84,62.04,17.02,27.58,10.56,62.04,0.003415352632149264
+Madhya Pradesh,Niwari,3872.87,6660.95,2788.08,71.99,14.623,25.15,10.527,71.99,0.0037757528654460385
+Odisha,Jharsuguda,3890.94,6663.88,2772.94,71.27,14.582,24.974,10.392,71.27,0.0037476805090800682
+Bihar,Sheikhpura,6078.73,9234.53,3155.800000000001,51.92,19.874,30.192,10.318,51.92,0.003269432924311493
+Chhattisgarh,Sukma,4038.09,6850.17,2812.08,69.64,14.718,24.967,10.249,69.64,0.003644792463763809
+Tripura,North Tripura,12865.36,16263.79,3398.4300000000003,26.42,38.608,48.806,10.198,26.41,0.003000926518962547
+Nagaland,Mokokchung,3842.4,6573.8,2731.4,71.09,14.309,24.481,10.172,71.09,0.0037239745992088276
+Odisha,Malkangiri,12477.78,15841.53,3363.75,26.96,37.491,47.598,10.107,26.96,0.0030046210143150464
+Madhya Pradesh,Gwalior,5057.16,8039.3,2982.1400000000003,58.97,17.024,27.063,10.039,58.97,0.003366316272374218
+Telangana,Mahabubnagar,11128.87,14430.88,3302.0099999999984,29.67,33.673,43.664,9.991,29.67,0.003025733969396713
+Jharkhand,Pakur,9536.88,12780.48,3243.6000000000004,34.01,29.252,39.201,9.949,34.01,0.0030672505054063805
+Mizoram,Lunglei,6347.94,9436.85,3088.9100000000008,48.66,20.444,30.392,9.948,48.66,0.0032205723431538423
+Assam,Jorhat,4964.01,7900.2,2936.1899999999996,59.15,16.777,26.701,9.924,59.15,0.00337972727693941
+Jharkhand,Ramgarh,6137.5,9190.61,3053.1100000000006,49.75,19.84,29.709,9.869,49.74,0.0032325865580448065
+Meghalaya,South Garo Hills,9418.37,12604.63,3186.2599999999984,33.83,28.861,38.625,9.764,33.83,0.0030643306644355657
+Madhya Pradesh,Vidisha,8923.06,12054.72,3131.66,35.1,27.434,37.062,9.628,35.1,0.0030745058309593347
+Bihar,Khagaria,6666.11,9668.73,3002.62,45.04,21.293,30.884,9.591,45.04,0.0031942167170958776
+Punjab,Hoshiarpur,4430.25,7226.99,2796.74,63.13,15.184,24.769,9.585,63.13,0.0034273460865639634
+Chhattisgarh,Dantewada,3361.18,5835.6,2474.4200000000005,73.62,12.969,22.516,9.547,73.61,0.003858466371928906
+Jharkhand,Lohardaga,4142.99,6855.79,2712.8,65.48,14.429,23.877,9.448,65.48,0.0034827503807636517
+Telangana,Rangareddy,8245.53,11288.52,3042.99,36.9,25.502,34.913,9.411,36.9,0.0030928272651970217
+Uttar Pradesh,Kannauj,9807.18,12894.4,3087.2199999999993,31.48,29.848,39.244,9.396,31.48,0.0030434844675023805
+Uttar Pradesh,Mahoba,5033.44,7837.74,2804.3,55.71,16.732,26.054,9.322,55.71,0.0033241679646524047
+Assam,Bajali,1271.6,2389.4,1117.8000000000002,87.91,10.582,19.884,9.302,87.9,0.00832179930795848
+Jammu and Kashmir,Kathua,3457.39,5927.61,2470.22,71.45,13.005,22.297,9.292,71.45,0.003761507958315377
+Himachal Pradesh,Solan,4048.04,6691.35,2643.3100000000004,65.3,14.078,23.271,9.193,65.3,0.0034777324334739775
+Assam,Sivasagar,5089.67,7860.86,2771.1899999999996,54.45,16.88,26.071,9.191,54.45,0.0033165215033587638
+Manipur,Kangpokpi,2730.61,4879.09,2148.48,78.68,11.553,20.643,9.09,78.68,0.004230922760848309
+Uttarakhand,Pauri Garhwal,4913.98,7642.83,2728.8500000000004,55.53,16.327,25.394,9.067,55.53,0.003322561345386022
+Jharkhand,Simdega,9968.62,12872.29,2903.67,29.13,30.106,38.875,8.769,29.13,0.0030200770016311183
+Maharashtra,Sangli,3172.43,5467.74,2295.31,72.35,12.031,20.736,8.705,72.35,0.0037923610607641465
+Madhya Pradesh,Burhanpur,4455.28,7042.21,2586.9300000000003,58.06,14.921,23.585,8.664,58.07,0.0033490599917401376
+Himachal Pradesh,Hamirpur,6272.55,8995.8,2723.249999999999,43.42,19.902,28.543,8.641,43.42,0.003172872276825215
+Jammu and Kashmir,Reasi,2091.67,3828.21,1736.54,83.02,10.382,19.001,8.619,83.02,0.004963498066138539
+Karnataka,Dakshina Kannada,4426.96,6981.43,2554.4700000000003,57.7,14.794,23.331,8.537,57.71,0.0033417966279342937
+Maharashtra,Ratnagiri,2905.4,5075.81,2170.4100000000003,74.7,11.366,19.857,8.491,74.71,0.003912025882838852
+Gujarat,Junagadh,1065.34,2005.68,940.3400000000001,88.27,9.602,18.077,8.475,88.26,0.009013085024499223
+Telangana,Narayanpet,7173.69,9885.99,2712.3,37.81,22.237,30.645,8.408,37.81,0.0030997994058845585
+Jharkhand,Saraikela Kharsawan,9831.93,12535.75,2703.8199999999997,27.5,29.592,37.73,8.138,27.5,0.003009785464298464
+Nagaland,Kiphire,816.18,1543.97,727.7900000000001,89.17,9.032,17.086,8.054,89.17,0.011066186380455293
+Punjab,Faridkot,3407.44,5669.42,2261.98,66.38,12.032,20.019,7.987,66.38,0.003531096659075435
+Punjab,Gurdaspur,3426.32,5682.24,2255.9199999999996,65.84,12.034,19.957,7.923,65.84,0.0035122230264540383
+Punjab,Ferozepur,5265.56,7713.51,2447.95,46.49,16.909,24.77,7.861,46.49,0.003211244388061288
+Madhya Pradesh,Shajapur,4845.8,7238.83,2393.0299999999997,49.38,15.653,23.383,7.73,49.38,0.003230219984316315
+Tamil Nadu,Theni,8174.12,10702.92,2528.8,30.94,24.85,32.538,7.688,30.94,0.003040082602163903
+Madhya Pradesh,Indore,2547.95,4478.99,1931.04,75.79,10.069,17.7,7.631,75.79,0.00395180439176593
+Punjab,Fatehgarh Sahib,6003.1,8424.81,2421.709999999999,40.34,18.839,26.439,7.6,40.34,0.0031382119238393493
+Assam,Hojai,6011.53,8414.89,2403.3599999999997,39.98,18.844,26.378,7.534,39.98,0.0031346429278403336
+Gujarat,Navsari,4433.67,6727.41,2293.74,51.73,14.493,21.991,7.498,51.74,0.0032688495084207893
+Haryana,Karnal,2122.95,3816.35,1693.4,79.77,9.291,16.702,7.411,79.77,0.004376457288207448
+Uttar Pradesh,Sant Ravidas Nagar,6400.93,8786.33,2385.3999999999996,37.27,19.802,27.182,7.38,37.27,0.003093612959366842
+Madhya Pradesh,Neemuch,4648.57,6860.13,2211.5600000000004,47.58,14.956,22.071,7.115,47.57,0.0032173335025610025
+Assam,Tamulpur,3439.66,5511.53,2071.87,60.23,11.649,18.666,7.017,60.24,0.0033866719385055497
+Manipur,Kamjong,2350.65,4119.4,1768.7499999999995,75.25,9.258,16.224,6.966,75.24,0.003938485099865994
+Punjab,Mansa,4454.01,6613.28,2159.2699999999995,48.48,14.34,21.292,6.952,48.48,0.003219570679006109
+Gujarat,Chhotaudepur,6059.22,8306.32,2247.0999999999995,37.09,18.743,25.694,6.951,37.09,0.0030933024382676314
+Karnataka,Uttara Kannada,5944.05,8169.94,2225.8899999999994,37.45,18.412,25.307,6.895,37.45,0.00309755133284545
+Maharashtra,Pune,3191.43,5200.35,2008.9200000000005,62.95,10.937,17.822,6.885,62.95,0.003426990408688268
+Himachal Pradesh,Una,4882.35,7037.36,2155.0099999999993,44.14,15.532,22.388,6.856,44.14,0.003181254928466824
+Gujarat,Patan,2741.33,4625.57,1884.2399999999998,68.73,9.94,16.772,6.832,68.73,0.003625977171664849
+Gujarat,Surat,5414.61,7549.95,2135.34,39.44,16.93,23.607,6.677,39.44,0.003126725655218012
+Arunachal Pradesh,Papum Pare,5919.32,8039.6,2120.2800000000007,35.82,18.238,24.771,6.533,35.82,0.003081097153051364
+Gujarat,Surendranagar,2257.0,3934.88,1677.88,74.34,8.783,15.312,6.529,74.34,0.003891448825875055
+Maharashtra,Sindhudurg,1861.05,3348.91,1487.86,79.95,8.155,14.675,6.52,79.95,0.0043819349292066306
+Arunachal Pradesh,Kurung Kumey,4870.3,6923.1,2052.8,42.15,15.395,21.884,6.489,42.15,0.003160996242531261
+Uttar Pradesh,Hathras,4062.16,6053.5,1991.3400000000001,49.02,13.103,19.526,6.423,49.02,0.003225623806053922
+Maharashtra,Raigad,1328.72,2455.88,1127.16,84.83,7.548,13.951,6.403,84.83,0.005680655066530194
+Jammu and Kashmir,Ramban,2849.95,4685.15,1835.1999999999998,64.39,9.829,16.158,6.329,64.39,0.0034488324356567665
+Uttar Pradesh,Meerut,2873.55,4708.36,1834.8099999999995,63.85,9.883,16.193,6.31,63.85,0.003439299820779175
+Punjab,Barnala,2131.6,3727.82,1596.2200000000003,74.88,8.384,14.662,6.278,74.88,0.003933195721523739
+Maharashtra,Satara,4626.42,6593.16,1966.7399999999998,42.51,14.635,20.856,6.221,42.51,0.0031633530894298397
+Jammu and Kashmir,Badgam,6410.72,8440.36,2029.6400000000003,31.66,19.518,25.697,6.179,31.66,0.0030445878154091895
+Haryana,Kaithal,1498.38,2736.94,1238.56,82.66,7.316,13.363,6.047,82.65,0.004882606548405611
+Assam,Golaghat,7105.04,9084.66,1979.62,27.86,21.405,27.369,5.964,27.86,0.003012650175086981
+Uttar Pradesh,Saharanpur,6696.44,8634.88,1938.4399999999996,28.95,20.223,26.077,5.854,28.95,0.003019962845930076
+Assam,Morigaon,8064.82,10020.15,1955.33,24.25,24.108,29.953,5.845,24.25,0.0029892793639535666
+Madhya Pradesh,Umaria,8236.58,10159.07,1922.4899999999998,23.34,24.59,30.33,5.74,23.34,0.0029854624127975448
+Mizoram,Khawzawl,2931.71,4596.88,1665.17,56.8,9.773,15.324,5.551,56.8,0.0033335493619764574
+Himachal Pradesh,Kinnaur,2235.16,3759.36,1524.2000000000003,68.19,8.04,13.523,5.483,68.2,0.003597057928738882
+Maharashtra,Thane,2251.89,3771.21,1519.3200000000002,67.47,8.055,13.49,5.435,67.47,0.0035769953239279005
+Jammu and Kashmir,Udhampur,2678.67,4277.62,1598.9499999999998,59.69,9.068,14.481,5.413,59.69,0.0033852620890217904
+Gujarat,Kheda,2455.68,4028.11,1572.4300000000003,64.03,8.447,13.856,5.409,64.03,0.003439780427417253
+Nagaland,Longleng,2238.52,3736.67,1498.15,66.93,7.979,13.319,5.34,66.93,0.0035644086271286388
+Uttarakhand,Nainital,2349.6,3879.6,1530.0,65.12,8.144,13.447,5.303,65.12,0.0034661218930881854
+Assam,Chirang,5967.72,7716.8,1749.08,29.31,18.028,23.312,5.284,29.31,0.0030209192120273735
+Assam,Cachar,7488.69,9250.16,1761.4700000000003,23.52,22.366,27.627,5.261,23.52,0.002986637182204097
+Chhattisgarh,Narayanpur,1998.18,3407.76,1409.5800000000002,70.54,7.422,12.658,5.236,70.55,0.003714380085878149
+Uttarakhand,Rudra Prayag,3212.41,4827.86,1615.4499999999998,50.29,10.392,15.618,5.226,50.29,0.003234954442303442
+Gujarat,Anand,1480.39,2658.57,1178.18,79.59,6.403,11.499,5.096,79.59,0.004325211599646038
+Ladakh,Leh (Ladakh),2869.19,4410.63,1541.44,53.72,9.474,14.564,5.09,53.73,0.003301977213081044
+Dadra and Nagar Haveli,Dadra And Nagar Haveli,1016.46,1882.4,865.94,85.19,5.874,10.878,5.004,85.19,0.005778879641107372
+Himachal Pradesh,Bilaspur,5114.77,6752.61,1637.8399999999992,32.02,15.589,20.581,4.992,32.02,0.0030478398833183114
+Manipur,Tamenglong,2916.99,4436.63,1519.6400000000003,52.1,9.566,14.55,4.984,52.1,0.0032794078827832803
+Mizoram,Saitual,3981.55,5566.14,1584.5900000000001,39.8,12.464,17.424,4.96,39.79,0.00313043915058206
+Uttarakhand,Almora,3196.79,4735.01,1538.2200000000003,48.12,10.287,15.237,4.95,48.12,0.003217915471457306
+Jharkhand,Khunti,5276.33,6899.11,1622.7799999999997,30.76,16.019,20.946,4.927,30.76,0.0030360117733348744
+Karnataka,Udupi,2698.69,4182.7,1484.0099999999998,54.99,8.953,13.876,4.923,54.99,0.0033175355450236962
+Uttarakhand,Chamoli,6109.62,7734.55,1624.9300000000003,26.6,18.354,23.235,4.881,26.59,0.0030041148221984343
+Punjab,Pathankot,2516.6,3936.89,1420.29,56.44,8.384,13.116,4.732,56.44,0.0033314789795756182
+Madhya Pradesh,Agar-Malwa,6097.96,7675.67,1577.71,25.87,18.282,23.012,4.73,25.87,0.0029980518074897177
+Arunachal Pradesh,Lohit,1281.83,2322.85,1041.02,81.21,5.802,10.514,4.712,81.21,0.0045263412464991454
+Gujarat,Mahesana,2617.51,4037.94,1420.4299999999998,54.27,8.676,13.384,4.708,54.26,0.0033146005172855117
+Arunachal Pradesh,Tawang,1294.84,2334.71,1039.8700000000001,80.31,5.761,10.388,4.627,80.32,0.0044491983565537055
+Odisha,Sonepur,6089.58,7621.07,1531.4899999999998,25.15,18.226,22.81,4.584,25.15,0.002992981453564942
+Madhya Pradesh,Narsinghpur,5832.08,7330.45,1498.37,25.69,17.483,21.975,4.492,25.69,0.0029977297979451585
+Assam,Charaideo,2716.13,4062.36,1346.23,49.56,8.778,13.129,4.351,49.57,0.003231804074179071
+Uttar Pradesh,Muzaffarnagar,3513.82,4893.2,1379.3799999999997,39.26,10.978,15.288,4.31,39.26,0.003124235162871177
+Arunachal Pradesh,Longding,1406.09,2479.36,1073.2700000000002,76.33,5.615,9.901,4.286,76.33,0.003993343242608937
+Karnataka,Kodagu,1619.25,2764.45,1145.1999999999998,70.72,6.02,10.278,4.258,70.73,0.003717770572796047
+Jammu and Kashmir,Jammu,4006.04,5390.27,1384.2300000000005,34.55,12.299,16.549,4.25,34.56,0.0030701141276672224
+Gujarat,Bharuch,1404.45,2463.77,1059.32,75.43,5.536,9.712,4.176,75.43,0.00394175655950728
+Arunachal Pradesh,Anjaw,1744.47,2915.13,1170.66,67.11,6.222,10.397,4.175,67.1,0.0035666993413472287
+Karnataka,Bengaluru Rural,5547.12,6922.12,1375.0,24.79,16.601,20.716,4.115,24.79,0.0029927241523529328
+Gujarat,Gir Somnath,934.42,1716.95,782.5300000000001,83.74,4.905,9.013,4.108,83.75,0.0052492455212859316
+Punjab,Bhatinda,5752.63,7116.15,1363.5199999999995,23.7,17.188,21.262,4.074,23.7,0.002987850774341475
+Uttar Pradesh,Bulandshahr,2760.56,4023.97,1263.4099999999999,45.77,8.853,12.905,4.052,45.77,0.0032069580085200104
+Manipur,Jiribam,1339.39,2356.91,1017.5199999999998,75.97,5.295,9.318,4.023,75.98,0.003953292170316338
+Gujarat,Botad,1175.7,2107.14,931.4399999999998,79.22,5.037,9.028,3.991,79.23,0.004284256187803011
+Mizoram,Hnahthial,2314.37,3528.44,1214.0700000000002,52.46,7.598,11.584,3.986,52.46,0.0032829668549108396
+Haryana,Jind,2757.91,3985.19,1227.2800000000002,44.5,8.785,12.694,3.909,44.5,0.003185383134329982
+Gujarat,Bhavnagar,2359.39,3558.68,1199.29,50.83,7.676,11.578,3.902,50.83,0.0032533832897486217
+Gujarat,Ahmadabad,1441.0,2473.16,1032.1599999999999,71.63,5.426,9.313,3.887,71.64,0.003765440666204025
+Arunachal Pradesh,Siang,1002.84,1824.54,821.6999999999999,81.94,4.728,8.602,3.874,81.94,0.004714610506162498
+Sikkim,Gyalshing District,2195.12,3362.52,1167.4,53.18,7.242,11.093,3.851,53.18,0.003299136265898903
+Gujarat,Jamnagar,1201.34,2133.54,932.2,77.6,4.905,8.711,3.806,77.59,0.004082940716200243
+Uttar Pradesh,Hapur,1001.94,1819.27,817.3299999999999,81.57,4.597,8.347,3.75,81.57,0.004588099087769727
+Gujarat,Kachchh,2315.28,3454.46,1139.1799999999998,49.2,7.469,11.144,3.675,49.2,0.0032259597111364497
+Arunachal Pradesh,Changlang,3594.93,4778.6,1183.6700000000005,32.93,10.998,14.619,3.621,32.92,0.003059308526174362
+Assam,Kamrup (Metro),869.13,1589.13,720.0000000000001,82.84,4.252,7.774,3.522,82.83,0.00489224857040949
+Uttar Pradesh,Shamli,1635.85,2644.87,1009.02,61.68,5.576,9.015,3.439,61.68,0.00340862548522175
+Madhya Pradesh,Bhopal,4848.55,5971.47,1122.92,23.16,14.465,17.815,3.35,23.16,0.002983366161017211
+Punjab,Sas Nagar Mohali,1735.13,2733.21,998.0799999999999,57.52,5.793,9.125,3.332,57.52,0.003338654740566989
+Himachal Pradesh,Lahul And Spiti,293.45,556.71,263.26000000000005,89.71,3.618,6.864,3.246,89.72,0.012329187255069006
+Arunachal Pradesh,West Siang,304.72,576.99,272.27,89.35,3.621,6.856,3.235,89.34,0.011883040168023102
+Gujarat,Rajkot,1126.2,1953.25,827.05,73.44,4.338,7.524,3.186,73.44,0.003851891315929675
+Haryana,Sirsa,3028.77,4064.37,1035.6,34.19,9.292,12.469,3.177,34.19,0.0030679120567094894
+Arunachal Pradesh,Leparada,509.71,952.24,442.53000000000003,86.82,3.621,6.765,3.144,86.83,0.007104039551902063
+Sikkim,Gangtok District,1249.02,2112.05,863.0300000000002,69.1,4.534,7.667,3.133,69.1,0.003630045956029527
+Arunachal Pradesh,Namsai,3982.09,5026.77,1044.6800000000003,26.23,11.942,15.075,3.133,26.24,0.002998927698771248
+Arunachal Pradesh,Shi Yomi,173.29,330.95,157.66,90.98,3.432,6.554,3.122,90.97,0.019804951237809454
+Arunachal Pradesh,Upper Siang,1091.95,1891.87,799.9199999999998,73.26,4.2,7.277,3.077,73.26,0.003846329960163011
+Arunachal Pradesh,Lower Subansiri,648.37,1196.04,547.67,84.47,3.637,6.709,3.072,84.47,0.0056094513934944554
+Punjab,Malerkotla,1160.05,1982.58,822.53,70.9,4.317,7.378,3.061,70.91,0.0037213913193396837
+Arunachal Pradesh,Upper Dibang Valley,567.05,1054.23,487.18000000000006,85.91,3.539,6.58,3.041,85.93,0.006241072215853982
+Punjab,Ropar,3775.12,4758.68,983.5600000000004,26.05,11.319,14.268,2.949,26.05,0.0029983152853419234
+Gujarat,Gandhinagar,1119.64,1903.39,783.75,70.0,4.116,6.997,2.881,70.0,0.003676181629809581
+Madhya Pradesh,Narmadapuram,3678.48,4616.9,938.4199999999996,25.51,11.024,13.836,2.812,25.51,0.002996890019790783
+Madhya Pradesh,Harda,2615.76,3529.06,913.2999999999997,34.92,8.042,10.85,2.808,34.92,0.0030744410802214265
+Haryana,Sonipat,1313.62,2131.01,817.3900000000003,62.22,4.489,7.282,2.793,62.22,0.003417274402034074
+Madhya Pradesh,Datia,4044.75,4974.2,929.4499999999998,22.98,12.066,14.839,2.773,22.98,0.002983126274800668
+Bihar,Begusarai,14196.08,15109.62,913.5400000000009,6.44,42.323,45.047,2.724,6.44,0.0029813159689153624
+Haryana,Jhajjar,1151.25,1913.41,762.1600000000001,66.2,4.049,6.73,2.681,66.21,0.0035170466883821935
+Haryana,Panipat,1346.3,2132.89,786.5899999999999,58.43,4.53,7.177,2.647,58.43,0.003364777538438684
+Jammu and Kashmir,Srinagar,323.32,609.87,286.55,88.63,2.953,5.57,2.617,88.62,0.009133366324384511
+Nagaland,Wokha,3828.59,4701.44,872.8499999999995,22.8,11.42,14.024,2.604,22.8,0.002982821351985979
+Uttar Pradesh,Baghpat,126.15,241.15,115.0,91.16,2.822,5.395,2.573,91.18,0.022370194213238208
+Jammu and Kashmir,Samba,820.55,1452.82,632.27,77.05,3.321,5.88,2.559,77.06,0.004047285357382244
+Haryana,Yamunanagar,641.4,1161.14,519.7400000000001,81.03,2.902,5.254,2.352,81.05,0.004524477705020269
+Karnataka,Bengaluru,219.37,415.78,196.40999999999997,89.53,2.619,4.964,2.345,89.54,0.011938733646350915
+Haryana,Mahendragarh,721.88,1280.73,558.85,77.42,2.943,5.221,2.278,77.4,0.004076854878927246
+Gujarat,Devbhumi Dwarka,680.46,1214.63,534.1700000000001,78.5,2.869,5.121,2.252,78.49,0.004216265467477883
+Manipur,Pherzawl,1108.37,1759.96,651.5900000000001,58.79,3.731,5.924,2.193,58.78,0.003366204426319731
+Haryana,Ambala,313.94,588.77,274.83,87.54,2.411,4.522,2.111,87.56,0.007679811428935465
+Gujarat,Amreli,1589.45,2256.52,667.0699999999999,41.97,5.017,7.123,2.106,41.98,0.0031564377614898237
+Haryana,Bhiwani,2422.68,3119.6,696.9200000000001,28.77,7.316,9.421,2.105,28.77,0.003019796258688725
+Haryana,Palwal,172.23,327.37,155.14000000000001,90.08,2.311,4.393,2.082,90.09,0.013418103698542646
+Haryana,Faridabad,85.33,163.27,77.94000000000001,91.34,2.273,4.349,2.076,91.33,0.026637759287472168
+Punjab,Kapurthala,2853.6,3540.3,686.7000000000003,24.06,8.53,10.583,2.053,24.07,0.002989206616204093
+Haryana,Charki Dadri,390.84,725.93,335.09,85.74,2.381,4.422,2.041,85.72,0.006092006959369563
+Haryana,Panchkula,414.45,766.78,352.33,85.01,2.381,4.405,2.024,85.01,0.0057449632042465915
+Haryana,Gurugram,212.8,402.17,189.37,88.99,2.273,4.296,2.023,89.0,0.01068139097744361
+Haryana,Rewari,321.95,602.05,280.09999999999997,87.0,2.306,4.312,2.006,86.99,0.007162602888647306
+Haryana,Kurukshetra,1416.86,2024.31,607.45,42.87,4.489,6.414,1.925,42.88,0.0031682735062038593
+Telangana,Medchal,230.3,433.99,203.69,88.45,2.089,3.937,1.848,88.46,0.00907077724706904
+Gujarat,Vadodara,1362.87,1927.45,564.5800000000002,41.43,4.297,6.077,1.78,41.42,0.0031529052660928775
+Gujarat,Morbi,585.58,1018.79,433.2099999999999,73.98,2.26,3.932,1.672,73.98,0.0038594214283274694
+Goa,South Goa,124.16,236.22,112.06,90.25,1.789,3.404,1.615,90.27,0.014408827319587628
+Gujarat,Porbandar,875.9,1354.39,478.4900000000001,54.63,2.905,4.492,1.587,54.63,0.0033165886516725654
+Goa,North Goa,133.18,252.9,119.72,89.89,1.754,3.331,1.577,89.91,0.013170145667517645
+Arunachal Pradesh,East Siang,1080.35,1553.3,472.95000000000005,43.78,3.432,4.934,1.502,43.76,0.00317674827602166
+Haryana,Rohtak,1728.22,2140.98,412.76,23.88,5.165,6.399,1.234,23.89,0.002988624133501522
+Andaman and Nicobar Islands,North And Middle Andaman,199.7,372.72,173.02000000000004,86.64,1.398,2.609,1.211,86.62,0.00700050075112669
+Andaman and Nicobar Islands,South Andaman,71.59,136.46,64.87,90.61,1.331,2.537,1.206,90.61,0.018591982120407878
+Andaman and Nicobar Islands,Nicobars,27.23,52.15,24.919999999999998,91.52,1.289,2.469,1.18,91.54,0.04733749540947484
+Sikkim,Mangan District,716.09,641.34,-74.75,-10.44,2.127,1.905,-0.222,-10.44,0.00297029702970297
+Arunachal Pradesh,Lower Siang,1167.08,1043.69,-123.38999999999987,-10.57,3.465,3.099,-0.366,-10.56,0.0029689481440860954
+Manipur,Noney,1876.03,1632.54,-243.49,-12.98,5.521,4.804,-0.717,-12.99,0.00294291669109769
+Arunachal Pradesh,Lower Dibang Valley,2574.59,2233.55,-341.03999999999996,-13.25,7.574,6.571,-1.003,-13.24,0.002941827630807235
+Uttarakhand,Udam Singh Nagar,3159.23,2795.65,-363.5799999999999,-11.51,9.341,8.266,-1.075,-11.51,0.00295673312800904
+Manipur,Tengnoupal,2469.75,2033.66,-436.0899999999999,-17.66,7.116,5.86,-1.256,-17.65,0.0028812632857576678
+Assam,Majuli,2831.61,2392.18,-439.4300000000003,-15.52,8.245,6.965,-1.28,-15.52,0.0029117710419160826
+Puducherry,Karaikal,1455.97,961.44,-494.53,-33.97,3.879,2.561,-1.318,-33.98,0.0026642032459460014
+Sikkim,Namchi District,3315.86,2850.04,-465.82000000000016,-14.05,9.717,8.352,-1.365,-14.05,0.0029304614790733024
+Gujarat,Dang,3925.72,3463.43,-462.28999999999996,-11.78,11.591,10.226,-1.365,-11.78,0.0029525793994477447
+Sikkim,Soreng,2153.73,1563.27,-590.46,-27.42,5.971,4.334,-1.637,-27.42,0.0027723995115450867
+Uttarakhand,Bageshwar,2463.99,1870.82,-593.1699999999998,-24.07,6.946,5.274,-1.672,-24.07,0.002819004947260338
+Sikkim,Pakyong,1894.76,1210.67,-684.0899999999999,-36.1,4.971,3.176,-1.795,-36.11,0.002623551267706728
+Assam,West Karbi Anglong,1659.93,860.92,-799.0100000000001,-48.14,3.839,1.991,-1.848,-48.14,0.0023127481279331054
+Punjab,Sangrur,5891.34,5260.59,-630.75,-10.71,17.477,15.606,-1.871,-10.71,0.0029665576931563954
+Manipur,Chandel,2039.1,1321.98,-717.1199999999999,-35.17,5.386,3.492,-1.894,-35.17,0.002641361384924722
+Assam,Dima Hasao,1746.74,917.62,-829.12,-47.47,4.099,2.153,-1.946,-47.47,0.0023466572014152077
+Uttarakhand,Pithoragarh,4955.61,4279.31,-676.2999999999993,-13.65,14.564,12.576,-1.988,-13.65,0.0029388914785465365
+Arunachal Pradesh,Pakke Kessang,1949.78,966.95,-982.8299999999999,-50.41,3.99,1.979,-2.011,-50.4,0.002046384720327422
+Jammu and Kashmir,Bandipora,3305.25,2571.41,-733.8400000000001,-22.2,9.377,7.295,-2.082,-22.2,0.0028370017396566072
+Arunachal Pradesh,West Kameng,2025.85,1126.53,-899.3199999999999,-44.39,4.963,2.76,-2.203,-44.39,0.002449835871362638
+Mizoram,Champhai,6114.68,5353.76,-760.9200000000001,-12.44,18.024,15.781,-2.243,-12.44,0.00294766038451726
+Gujarat,Valsad,3907.92,3066.39,-841.5300000000002,-21.53,11.113,8.72,-2.393,-21.53,0.0028437122561362563
+Maharashtra,Kolhapur,3185.13,2277.85,-907.2800000000002,-28.48,8.773,6.274,-2.499,-28.49,0.002754361674405754
+Tamil Nadu,Coimbatore,8418.98,7573.88,-845.0999999999995,-10.04,25.057,22.542,-2.515,-10.04,0.002976251279846252
+Odisha,Boudh,6544.09,5685.99,-858.1000000000004,-13.11,19.256,16.731,-2.525,-13.11,0.002942502318886201
+Madhya Pradesh,Sehore,5612.05,4711.13,-900.9200000000001,-16.05,16.261,13.651,-2.61,-16.05,0.0028975151682540247
+Jammu and Kashmir,Pulwama,5663.08,4761.54,-901.54,-15.92,16.422,13.808,-2.614,-15.92,0.0028998354252456264
+Chhattisgarh,Bijapur,4206.81,3261.55,-945.2600000000002,-22.47,11.927,9.247,-2.68,-22.47,0.0028351648874087487
+Haryana,Mewat,2465.14,1265.37,-1199.77,-48.67,5.556,2.852,-2.704,-48.67,0.002253827368830979
+Mizoram,Aizawl,6893.53,5906.68,-986.8499999999995,-14.32,20.163,17.277,-2.886,-14.31,0.002924916552187341
+Uttarakhand,Champawat,3206.03,2121.37,-1084.6600000000003,-33.83,8.545,5.654,-2.891,-33.83,0.0026652900939791576
+Arunachal Pradesh,Kamle,3008.77,1459.95,-1548.82,-51.48,5.802,2.815,-2.987,-51.48,0.0019283627528857306
+Uttar Pradesh,Shravasti,10766.0,9714.08,-1051.92,-9.77,32.073,28.939,-3.134,-9.77,0.0029791008731190785
+Punjab,Jalandhar,3084.25,1764.56,-1319.69,-42.79,7.645,4.374,-3.271,-42.79,0.0024787225419469886
+Meghalaya,East Jaintia Hills,4430.38,3180.23,-1250.15,-28.22,12.214,8.767,-3.447,-28.22,0.0027568741281786212
+Tamil Nadu,The Nilgiris,3672.72,2351.62,-1321.1,-35.97,9.652,6.18,-3.472,-35.97,0.0026280250059901107
+Jammu and Kashmir,Ganderbal,3554.17,2213.95,-1340.2200000000003,-37.71,9.267,5.773,-3.494,-37.7,0.002607359805524215
+Madhya Pradesh,Mandsaur,10840.0,9635.95,-1204.0499999999993,-11.11,32.12,28.552,-3.568,-11.11,0.0029630996309963097
+Mizoram,Serchhip,5365.91,4081.31,-1284.6,-23.94,15.145,11.519,-3.626,-23.94,0.002822447637027084
+Tamil Nadu,Kanniyakumari,6268.92,4960.87,-1308.0500000000002,-20.87,17.853,14.128,-3.725,-20.86,0.002847858961352195
+Ladakh,Kargil,4686.31,3313.83,-1372.4800000000005,-29.29,12.869,9.1,-3.769,-29.29,0.0027460838058088344
+Karnataka,Shivamogga,8906.5,7607.67,-1298.83,-14.58,26.02,22.226,-3.794,-14.58,0.002921461853702352
+Telangana,Yadadri Bhuvanagiri,10163.11,8871.22,-1291.8900000000012,-12.71,29.954,26.146,-3.808,-12.71,0.0029473261629560242
+Tripura,Unakoti,9581.79,8248.52,-1333.2700000000004,-13.91,28.11,24.199,-3.911,-13.91,0.00293368984292079
+Punjab,Fazilka,9289.54,7947.27,-1342.2700000000004,-14.45,27.145,23.223,-3.922,-14.45,0.002922103785548046
+Meghalaya,Ri Bhoi,5965.18,4521.16,-1444.0200000000004,-24.21,16.787,12.723,-4.064,-24.21,0.002814164870129652
+Uttar Pradesh,Sambhal,9062.69,7632.05,-1430.6400000000003,-15.79,26.342,22.184,-4.158,-15.78,0.0029066425090122244
+Telangana,Jayashanker Bhopalapally,6966.9,5503.9,-1463.0,-21.0,19.837,15.671,-4.166,-21.0,0.0028473209031276464
+Punjab,Nawanshahr,4721.0,3104.87,-1616.13,-34.23,12.55,8.254,-4.296,-34.23,0.0026583350984960815
+Odisha,Gajapati,10972.96,9504.79,-1468.1699999999983,-13.38,32.268,27.951,-4.317,-13.38,0.0029406832796255527
+Punjab,Patiala,8603.83,7096.12,-1507.71,-17.52,24.823,20.473,-4.35,-17.52,0.002885110468244956
+Arunachal Pradesh,Tirap,4475.82,2165.83,-2309.99,-51.61,8.448,4.088,-4.36,-51.61,0.0018874753676421305
+Bihar,Banka,14499.86,13024.97,-1474.8900000000012,-10.17,43.151,38.762,-4.389,-10.17,0.002975959767887414
+Madhya Pradesh,Raisen,6336.35,4743.19,-1593.1600000000008,-25.14,17.773,13.304,-4.469,-25.14,0.002804927126815911
+Jharkhand,Koderma,7022.2,5406.79,-1615.4099999999999,-23.0,19.879,15.306,-4.573,-23.0,0.002830879211643075
+Madhya Pradesh,Jabalpur,8190.32,6579.9,-1610.42,-19.66,23.443,18.834,-4.609,-19.66,0.00286228132722531
+Assam,Kokrajhar,13384.29,11790.29,-1594.0,-11.91,39.489,34.786,-4.703,-11.91,0.002950399311431536
+Karnataka,Chikkamagaluru,10039.32,8306.89,-1732.4300000000003,-17.26,28.99,23.987,-5.003,-17.26,0.0028876457768056
+Jammu and Kashmir,Anantnag,13839.33,12135.64,-1703.6900000000005,-12.31,40.803,35.78,-5.023,-12.31,0.002948336371775223
+Meghalaya,South West Khasi Hills,5519.03,3614.95,-1904.08,-34.5,14.626,9.58,-5.046,-34.5,0.0026501033696138634
+Uttarakhand,Haridwar,5148.42,3213.92,-1934.5,-37.57,13.443,8.392,-5.051,-37.57,0.002611092335124174
+Odisha,Sambalpur,7997.72,6179.28,-1818.4400000000005,-22.74,22.647,17.498,-5.149,-22.74,0.0028316820293783724
+Mizoram,Kolasib,6923.91,5053.45,-1870.46,-27.01,19.277,14.069,-5.208,-27.02,0.0027841205330514118
+Gujarat,Sabar Kantha,6503.95,4581.75,-1922.1999999999998,-29.55,17.818,12.552,-5.266,-29.55,0.0027395659560728483
+Uttar Pradesh,Agra,15464.1,13663.75,-1800.3500000000004,-11.64,45.714,40.392,-5.322,-11.64,0.0029561371175820124
+Punjab,Amritsar,4924.64,2751.66,-2172.9800000000005,-44.12,12.08,6.75,-5.33,-44.12,0.0024529711816498262
+Haryana,Fatehabad,7344.91,5429.44,-1915.4700000000003,-26.08,20.531,15.177,-5.354,-26.08,0.0027952691047269467
+Meghalaya,East Garo Hills,9457.67,7572.77,-1884.8999999999996,-19.93,27.066,21.672,-5.394,-19.93,0.002861804228737099
+Assam,Dibrugarh,6840.57,4873.75,-1966.8199999999997,-28.75,18.815,13.405,-5.41,-28.75,0.002750501785669908
+Manipur,Senapati,5451.86,3330.46,-2121.3999999999996,-38.91,14.018,8.563,-5.455,-38.91,0.002571232570168713
+Manipur,Ukhrul,5886.34,3729.64,-2156.7000000000003,-36.64,15.418,9.769,-5.649,-36.64,0.002619284648864999
+Mizoram,Siaha,6120.58,3959.88,-2160.7,-35.3,16.165,10.458,-5.707,-35.3,0.0026410895699427177
+Maharashtra,Dharashiv,10958.88,8877.33,-2081.5499999999993,-18.99,31.468,25.491,-5.977,-18.99,0.002871461317214898
+Madhya Pradesh,Katni,14855.97,12808.68,-2047.289999999999,-13.78,43.63,37.617,-6.013,-13.78,0.002936866458400226
+Odisha,Deogarh,5432.19,2831.93,-2600.2599999999998,-47.87,12.612,6.575,-6.037,-47.87,0.002321715551186538
+Karnataka,Mysuru,8591.76,6420.04,-2171.7200000000003,-25.28,24.093,18.003,-6.09,-25.28,0.002804198441297243
+Madhya Pradesh,Panna,12021.34,9882.61,-2138.7299999999996,-17.79,34.635,28.473,-6.162,-17.79,0.002881126396890862
+Manipur,Thoubal,7686.2,3647.4,-4038.7999999999997,-52.55,11.733,5.568,-6.165,-52.54,0.001526502042621842
+Assam,Kamrup,10554.51,8309.92,-2244.59,-21.27,30.036,23.648,-6.388,-21.27,0.0028457976732221583
+Manipur,Kakching,5831.62,3001.19,-2830.43,-48.54,13.237,6.812,-6.425,-48.54,0.0022698666922741882
+Punjab,Mukatsar,6878.49,4431.84,-2446.6499999999996,-35.57,18.146,11.692,-6.454,-35.57,0.002638078996989165
+Assam,Sonitpur,9771.88,7458.61,-2313.2699999999995,-23.67,27.606,21.071,-6.535,-23.67,0.0028250449248251107
+Jharkhand,East Singhbum,9150.81,6813.31,-2337.499999999999,-25.54,25.614,19.071,-6.543,-25.54,0.0027990964734269427
+Maharashtra,Buldhana,9081.12,6737.15,-2343.970000000001,-25.81,25.4,18.844,-6.556,-25.81,0.002797011822330285
+Telangana,Mulugu,6234.2,3583.38,-2650.8199999999997,-42.52,15.486,8.901,-6.585,-42.52,0.002484039652240865
+Bihar,Supaul,16613.3,14368.25,-2245.0499999999993,-13.51,48.832,42.233,-6.599,-13.51,0.002939331740232224
+Mizoram,Mamit,7510.96,5020.06,-2490.8999999999996,-33.16,20.061,13.408,-6.653,-33.16,0.002670896929287335
+Manipur,Bishnupur,7562.18,3608.77,-3953.4100000000003,-52.28,13.0,6.204,-6.796,-52.28,0.0017190810057417306
+Telangana,Jogulamba Gadwal,8221.69,5703.9,-2517.790000000001,-30.62,22.354,15.508,-6.846,-30.63,0.002718905723762389
+Uttarakhand,Dehradun,6697.08,3974.77,-2722.31,-40.65,16.963,10.068,-6.895,-40.65,0.0025328949333142206
+Telangana,Karimnagar,10068.7,7590.95,-2477.750000000001,-24.61,28.284,21.324,-6.96,-24.61,0.002809101472881305
+Jammu and Kashmir,Kulgam,9059.91,6515.53,-2544.38,-28.08,24.982,17.966,-7.016,-28.08,0.0027574225351024457
+Assam,Tinsukia,6803.94,3938.15,-2865.7899999999995,-42.12,16.945,9.808,-7.137,-42.12,0.002490468757807976
+Punjab,Tarn Taran,6541.89,3349.24,-3192.6500000000005,-48.8,14.739,7.546,-7.193,-48.8,0.002253018623058474
+Maharashtra,Wardha,7141.7,4286.39,-2855.3099999999995,-39.98,18.223,10.937,-7.286,-39.98,0.002551633364605066
+Tripura,West Tripura,12517.25,9938.92,-2578.33,-20.6,35.676,28.327,-7.349,-20.6,0.002850146797419561
+Assam,Baksa,8019.76,5177.88,-2841.88,-35.44,21.163,13.664,-7.499,-35.43,0.0026388570231528127
+Telangana,Nalgonda,24806.56,22250.14,-2556.420000000002,-10.31,73.812,66.205,-7.607,-10.31,0.0029755032539779797
+Jharkhand,Bokaro,12385.93,9702.19,-2683.74,-21.67,35.221,27.589,-7.632,-21.67,0.0028436298283616972
+Assam,Karbi Anglong,8701.63,4140.9,-4560.73,-52.41,14.745,7.017,-7.728,-52.41,0.0016945101090255505
+Maharashtra,Jalgaon,13448.76,10732.48,-2716.2800000000007,-20.2,38.42,30.66,-7.76,-20.2,0.002856768951189552
+Nagaland,Mon,7082.96,3844.01,-3238.95,-45.73,17.037,9.246,-7.791,-45.73,0.002405350305521985
+Telangana,Rajanna Sirsilla,7731.93,4681.98,-3049.9500000000007,-39.45,19.837,12.012,-7.825,-39.45,0.002565594877346277
+Manipur,Imphal West,10697.6,5062.13,-5635.47,-52.68,14.885,7.044,-7.841,-52.68,0.0013914335925815135
+Jammu and Kashmir,Poonch,9185.29,6261.91,-2923.380000000001,-31.83,24.693,16.834,-7.859,-31.83,0.002688320129250138
+Uttar Pradesh,Shahjahanpur,14829.62,12092.15,-2737.470000000001,-18.46,42.603,34.739,-7.864,-18.46,0.0028728315358046933
+Andhra Pradesh,East Godavari,17665.2,14947.41,-2717.790000000001,-15.38,51.442,43.528,-7.914,-15.38,0.0029120530761044313
+Manipur,Churachandpur,7912.79,3860.7,-4052.09,-51.21,15.623,7.623,-8.0,-51.21,0.001974398410674364
+Telangana,Hanumakonda,7405.49,4127.94,-3277.55,-44.26,18.155,10.12,-8.035,-44.26,0.002451559586198888
+Kerala,Kasargod,15054.29,12255.22,-2799.0700000000015,-18.59,43.24,35.2,-8.04,-18.59,0.00287227096063647
+Gujarat,Banas Kantha,8980.72,5966.38,-3014.3399999999992,-33.56,23.967,15.923,-8.044,-33.56,0.002668716984829724
+Bihar,Madhepura,16379.21,13574.64,-2804.5699999999997,-17.12,47.303,39.203,-8.1,-17.12,0.002887990324319671
+Jharkhand,West Singhbhum,12949.84,10091.99,-2857.8500000000004,-22.07,36.781,28.664,-8.117,-22.07,0.0028402667523305305
+Uttar Pradesh,Pratapgarh,24565.83,21804.35,-2761.480000000003,-11.24,72.727,64.552,-8.175,-11.24,0.0029604943126285577
+Telangana,Jangaon,10576.78,7578.13,-2998.6500000000005,-28.35,29.153,20.888,-8.265,-28.35,0.00275632092186847
+Uttar Pradesh,Ayodhya,15086.22,12180.39,-2905.83,-19.26,43.271,34.936,-8.335,-19.26,0.0028682466515800513
+Madhya Pradesh,Ujjain,8555.13,5363.44,-3191.6899999999996,-37.31,22.354,14.014,-8.34,-37.31,0.002612935162878881
+Andhra Pradesh,Konaseema,19338.21,16440.58,-2897.6299999999974,-14.98,56.443,47.986,-8.457,-14.98,0.002918729292938695
+Arunachal Pradesh,East Kameng,10259.58,7145.14,-3114.4399999999996,-30.36,27.996,19.497,-8.499,-30.36,0.0027287666746591967
+Meghalaya,West Garo Hills,26803.49,23897.96,-2905.5300000000025,-10.84,79.489,70.872,-8.617,-10.84,0.0029656212679766703
+Telangana,Nagarkurnool,12421.53,9348.18,-3073.3500000000004,-24.74,34.892,26.259,-8.633,-24.74,0.0028089937390965527
+Jharkhand,Dhanbad,10710.57,7473.55,-3237.0199999999995,-30.22,29.237,20.401,-8.836,-30.22,0.0027297333381883504
+Haryana,Hisar,8273.87,4700.47,-3573.4000000000005,-43.19,20.462,11.625,-8.837,-43.19,0.0024730869593068295
+Maharashtra,Solapur,8194.99,4129.84,-4065.1499999999996,-49.61,17.87,9.006,-8.864,-49.6,0.0021806005864558713
+Jammu and Kashmir,Baramulla,8195.06,4535.2,-3659.8599999999997,-44.66,19.942,11.036,-8.906,-44.66,0.0024334172049991095
+Karnataka,Koppal,30419.8,27406.9,-3012.899999999998,-9.9,90.552,81.583,-8.969,-9.9,0.002976745409240035
+Madhya Pradesh,Khandwa,10715.03,7276.14,-3438.8900000000003,-32.09,28.753,19.525,-9.228,-32.09,0.002683426924609637
+Chhattisgarh,Mahasamund,17755.77,14549.35,-3206.42,-18.06,51.144,41.908,-9.236,-18.06,0.0028804157747030963
+Assam,Biswanath,8946.37,4472.62,-4473.750000000001,-50.01,18.811,9.404,-9.407,-50.01,0.0021026405122971663
+Telangana,Warangal,8559.76,4668.37,-3891.3900000000003,-45.46,20.734,11.308,-9.426,-45.46,0.0024222641756310925
+Chhattisgarh,Surajpur,16607.97,13275.82,-3332.1500000000015,-20.06,47.493,37.964,-9.529,-20.06,0.002859651119311993
+Gujarat,Arvalli,10041.73,6389.39,-3652.3399999999992,-36.37,26.311,16.741,-9.57,-36.37,0.0026201660470855123
+Karnataka,Chamaraja Nagara,8668.41,4681.28,-3987.13,-46.0,20.81,11.238,-9.572,-46.0,0.002400670941960521
+Chhattisgarh,Kondagaon,10500.12,6863.52,-3636.6000000000004,-34.63,27.823,18.187,-9.636,-34.63,0.002649779240618202
+Bihar,Auranagabad,23220.77,19927.62,-3293.1500000000015,-14.18,68.042,58.392,-9.65,-14.18,0.002930221521508546
+Karnataka,Vijaypura,14636.94,11211.11,-3425.83,-23.41,41.388,31.701,-9.687,-23.41,0.0028276402034851543
+Chhattisgarh,Bastar,10032.55,4841.3,-5191.249999999999,-51.74,18.833,9.088,-9.745,-51.74,0.0018771897473723032
+Jharkhand,Ranchi,13203.11,9706.95,-3496.16,-26.48,36.847,27.09,-9.757,-26.48,0.002790781868817271
+Madhya Pradesh,Mandla,30027.05,26731.95,-3295.0999999999985,-10.97,89.045,79.273,-9.772,-10.97,0.0029654927806760903
+Maharashtra,Gadchiroli,20807.51,17411.58,-3395.9299999999967,-16.32,60.192,50.368,-9.824,-16.32,0.0028928016855452672
+Maharashtra,Bhandara,20316.86,16919.53,-3397.3300000000017,-16.72,58.748,48.924,-9.824,-16.72,0.0028915885624058047
+Bihar,Kaimur (Bhabua),15788.74,12325.48,-3463.26,-21.93,44.85,35.012,-9.838,-21.94,0.0028406319947000204
+Telangana,Peddapalli,9217.53,5211.93,-4005.6000000000004,-43.46,22.745,12.861,-9.884,-43.46,0.002467580794421065
+Uttar Pradesh,Bijnor,15624.95,12134.96,-3489.9900000000016,-22.34,44.327,34.426,-9.901,-22.34,0.00283693707819865
+Bihar,Jehanabad,11857.02,8162.56,-3694.46,-31.16,32.07,22.077,-9.993,-31.16,0.002704726820061027
+Maharashtra,Akola,9790.55,4829.22,-4961.329999999999,-50.67,19.785,9.759,-10.026,-50.67,0.0020208262048608096
+Himachal Pradesh,Kangra,16610.78,13056.03,-3554.749999999998,-21.4,47.269,37.153,-10.116,-21.4,0.002845682141356396
+Meghalaya,East Khasi Hills,12863.56,9182.19,-3681.369999999999,-28.62,35.419,25.283,-10.136,-28.62,0.002753436840190429
+Tamil Nadu,Dharmapuri,28769.36,25304.62,-3464.7400000000016,-12.04,84.86,74.64,-10.22,-12.04,0.002949665894548923
+Chhattisgarh,Balrampur,14144.84,10474.94,-3669.8999999999996,-25.95,39.551,29.289,-10.262,-25.95,0.0027961433285919107
+Arunachal Pradesh,Upper Subansiri,9496.64,5242.81,-4253.829999999999,-44.79,23.102,12.754,-10.348,-44.79,0.0024326498635306804
+Bihar,Madhubani,22131.05,18548.69,-3582.3600000000006,-16.19,64.036,53.67,-10.366,-16.19,0.0028934912713133813
+Madhya Pradesh,Betul,14066.56,10247.74,-3818.8199999999997,-27.15,39.041,28.442,-10.599,-27.15,0.002775447586332408
+Karnataka,Chikkaballapura,11493.44,7466.72,-4026.7200000000003,-35.03,30.365,19.727,-10.638,-35.03,0.002641941838126792
+Assam,Hailakandi,10464.21,5119.54,-5344.669999999999,-51.08,20.85,10.201,-10.649,-51.07,0.001992505884342918
+Kerala,Wayanad,14899.67,11073.76,-3825.91,-25.68,41.696,30.989,-10.707,-25.68,0.0027984512408664084
+Chhattisgarh,Gaurela Pendra Marwahi,10303.55,5977.51,-4326.039999999999,-41.99,25.688,14.903,-10.785,-41.98,0.00249312130285193
+Mizoram,Lawngtlai,12818.41,8790.13,-4028.2800000000007,-31.43,34.548,23.691,-10.857,-31.43,0.0026951860644182863
+Jharkhand,Chatra,20374.62,16559.1,-3815.5200000000004,-18.73,58.519,47.56,-10.959,-18.73,0.002872151726019921
+Andhra Pradesh,Nandyal,25448.99,21669.74,-3779.25,-14.85,74.302,63.268,-11.034,-14.85,0.0029196443552376734
+Andhra Pradesh,Chittoor,29200.4,25449.55,-3750.850000000002,-12.85,86.016,74.967,-11.049,-12.85,0.0029457130724236656
+Madhya Pradesh,Anuppur,16883.64,12954.53,-3929.1099999999988,-23.27,47.759,36.645,-11.114,-23.27,0.002828714661056502
+Uttar Pradesh,Bahraich,38940.81,35188.06,-3752.75,-9.64,116.049,104.865,-11.184,-9.64,0.0029801383176158895
+Chhattisgarh,Surguja,10510.73,5915.05,-4595.679999999999,-43.72,25.819,14.53,-11.289,-43.72,0.0024564421310413263
+Uttar Pradesh,Mathura,11311.04,6924.87,-4386.170000000001,-38.78,29.154,17.849,-11.305,-38.78,0.0025774818230684354
+Uttarakhand,Uttar Kashi,11087.68,6521.34,-4566.34,-41.18,27.913,16.417,-11.496,-41.19,0.0025174788594187424
+Bihar,Bhojpur,15100.03,10940.09,-4159.9400000000005,-27.55,41.854,30.324,-11.53,-27.55,0.0027717825726174053
+Telangana,Suryapet,19914.79,15865.94,-4048.8500000000004,-20.33,56.85,45.292,-11.558,-20.33,0.002854662288680925
+Madhya Pradesh,Ashok Nagar,11232.36,6636.47,-4595.89,-40.92,28.329,16.738,-11.591,-40.92,0.0025220879672660066
+Telangana,Mancherial,10785.32,5709.16,-5076.16,-47.07,25.376,13.433,-11.943,-47.06,0.0023528277325104868
+Madhya Pradesh,Guna,11406.57,5717.81,-5688.759999999999,-49.87,24.136,12.099,-12.037,-49.87,0.0021159735135101963
+Rajasthan,Bharatpur,11245.4,6343.53,-4901.87,-43.59,27.734,15.645,-12.089,-43.59,0.0024662528678392947
+Maharashtra,Nashik,14313.02,9776.78,-4536.24,-31.69,38.496,26.295,-12.201,-31.69,0.002689579138434796
+Kerala,Kannur,18684.79,14361.5,-4323.290000000001,-23.14,52.872,40.638,-12.234,-23.14,0.0028296812541109637
+Uttar Pradesh,Budaun,14600.0,10070.39,-4529.610000000001,-31.02,39.583,27.302,-12.281,-31.03,0.0027111643835616437
+Madhya Pradesh,Chhindwara,28645.85,24430.15,-4215.699999999997,-14.72,83.681,71.366,-12.315,-14.72,0.002921225936741273
+Uttar Pradesh,Kushi Nagar,19963.69,15611.35,-4352.339999999998,-21.8,56.74,44.37,-12.37,-21.8,0.002842159941373564
+Assam,Udalguri,11340.85,6215.46,-5125.39,-45.19,27.504,15.074,-12.43,-45.19,0.0024252150412006155
+Chhattisgarh,Jashpur,19228.02,14830.44,-4397.58,-22.87,54.441,41.99,-12.451,-22.87,0.0028313367679043398
+Uttar Pradesh,Auraiya,12628.94,6144.86,-6484.080000000001,-51.34,24.819,12.076,-12.743,-51.34,0.0019652480730766
+Meghalaya,South West Garo Hills,11746.32,6421.98,-5324.34,-45.33,28.456,15.558,-12.898,-45.33,0.0024225459548181897
+Uttar Pradesh,Moradabad,14381.46,9535.17,-4846.289999999999,-33.7,38.376,25.444,-12.932,-33.7,0.002668435610848968
+Maharashtra,Dhule,11760.61,6193.98,-5566.630000000001,-47.33,27.642,14.558,-13.084,-47.33,0.0023503882876823564
+Jharkhand,Dumka,19096.47,14422.66,-4673.810000000001,-24.47,53.707,40.562,-13.145,-24.48,0.0028124045962421326
+Kerala,Malappuram,18858.68,14167.44,-4691.24,-24.88,52.92,39.756,-13.164,-24.88,0.0028061348938525923
+Uttar Pradesh,Sultanpur,27055.56,22495.24,-4560.32,-16.86,78.195,65.015,-13.18,-16.86,0.0028901637962769943
+Madhya Pradesh,Khargone,17612.71,12878.26,-4734.449999999999,-26.88,49.054,35.868,-13.186,-26.88,0.002785147771126647
+Meghalaya,North Garo Hills,12018.96,6506.77,-5512.189999999999,-45.86,28.898,15.645,-13.253,-45.86,0.0024043677655970234
+Bihar,Patna,19942.98,15195.28,-4747.699999999999,-23.81,56.338,42.926,-13.412,-23.81,0.00282495394369347
+Tripura,Dhalai,24957.5,20250.39,-4707.110000000001,-18.86,71.669,58.152,-13.517,-18.86,0.002871641791044776
+Chhattisgarh,Mungeli,14674.75,9553.08,-5121.67,-34.9,38.776,25.243,-13.533,-34.9,0.002642361880100172
+Maharashtra,Washim,14826.09,7134.65,-7691.4400000000005,-51.88,26.187,12.602,-13.585,-51.88,0.0017662782297962578
+Madhya Pradesh,Damoh,20460.75,15644.48,-4816.27,-23.54,57.838,44.223,-13.615,-23.54,0.002826778099532031
+Madhya Pradesh,Alirajpur,13119.89,7646.46,-5473.429999999999,-41.72,32.83,19.134,-13.696,-41.72,0.0025023075650786705
+Bihar,Lakhisarai,13302.99,7806.52,-5496.469999999999,-41.32,33.486,19.65,-13.836,-41.32,0.0025171784689006003
+Madhya Pradesh,Sheopur,12448.9,6440.0,-6008.9,-48.27,28.709,14.852,-13.857,-48.27,0.002306147531107166
+Manipur,Imphal East,15420.98,7400.31,-8020.669999999999,-52.01,26.955,12.935,-14.02,-52.01,0.0017479433862179965
+Jammu and Kashmir,Kupwara,14803.26,9438.86,-5364.4,-36.24,38.793,24.735,-14.058,-36.24,0.0026205714146748755
+Uttar Pradesh,Jaunpur,39425.13,34624.39,-4800.739999999998,-12.18,116.275,102.116,-14.159,-12.18,0.00294926104238591
+Telangana,Siddipet,17696.39,12537.31,-5159.08,-29.15,48.615,34.442,-14.173,-29.15,0.0027471704681011214
+Chhattisgarh,Janjgir-Champa,15997.51,7655.6,-8341.91,-52.15,27.66,13.237,-14.423,-52.14,0.001729019078594106
+Kerala,Kollam,32211.56,27169.7,-5041.860000000001,-15.65,93.768,79.091,-14.677,-15.65,0.002911004620701388
+Chhattisgarh,Bemetara,13721.91,7703.85,-6018.0599999999995,-43.86,33.681,18.909,-14.772,-43.86,0.0024545416782357555
+Karnataka,Kolar,14916.09,9171.84,-5744.25,-38.51,38.543,23.7,-14.843,-38.51,0.002583988163117814
+Jharkhand,Palamu,19396.15,14026.73,-5369.420000000002,-27.68,53.749,38.87,-14.879,-27.68,0.002771116948466577
+Odisha,Kalahandi,31155.63,25987.52,-5168.110000000001,-16.59,90.118,75.169,-14.949,-16.59,0.0028925109201771875
+Bihar,Nawada,31475.44,26296.35,-5179.09,-16.45,91.051,76.069,-14.982,-16.45,0.002892763373601767
+Bihar,Darbhanga,26783.76,21553.2,-5230.559999999998,-19.53,76.72,61.737,-14.983,-19.53,0.0028644223215859165
+Telangana,Kamareddy,14712.49,8712.32,-6000.17,-40.78,37.214,22.037,-15.177,-40.78,0.002529415483035163
+Uttar Pradesh,Hamirpur,17268.67,11587.94,-5680.729999999998,-32.9,46.167,30.98,-15.187,-32.9,0.0026734542961328236
+Bihar,Purbi Champaran,41023.03,35863.21,-5159.82,-12.58,120.91,105.702,-15.208,-12.58,0.0029473688316050766
+Kerala,Kozhikode,34512.66,29295.16,-5217.500000000004,-15.12,100.609,85.399,-15.21,-15.12,0.002915133171421733
+Karnataka,Hassan,15584.31,9749.38,-5834.93,-37.44,40.7,25.461,-15.239,-37.44,0.002611601026930291
+Tripura,Gomati,18183.65,12566.53,-5617.120000000001,-30.89,49.338,34.097,-15.241,-30.89,0.00271331663334919
+Uttar Pradesh,Ghazipur,29772.78,24436.07,-5336.709999999999,-17.92,85.766,70.393,-15.373,-17.92,0.002880684974664778
+Jharkhand,Latehar,18732.23,13095.88,-5636.35,-30.09,51.176,35.778,-15.398,-30.09,0.002731975851246755
+Rajasthan,Chittorgarh,19541.01,13896.4,-5644.609999999999,-28.89,53.741,38.217,-15.524,-28.89,0.002750164909592698
+Jharkhand,Hazaribagh,17620.63,11800.57,-5820.060000000001,-33.03,47.104,31.546,-15.558,-33.03,0.0026732301852998444
+Rajasthan,Bundi,15856.22,9834.7,-6021.519999999999,-37.98,41.12,25.504,-15.616,-37.98,0.002593304078777918
+Karnataka,Kalaburagi,19737.7,13930.74,-5806.960000000001,-29.42,54.121,38.198,-15.923,-29.42,0.0027420114805676446
+Telangana,Jagtial,14450.63,7688.0,-6762.629999999999,-46.8,34.114,18.149,-15.965,-46.8,0.002360727525374326
+Bihar,Buxar,18601.21,12531.86,-6069.3499999999985,-32.63,49.755,33.521,-16.234,-32.63,0.0026748259925026387
+Maharashtra,Jalna,25461.84,19706.61,-5755.23,-22.6,72.187,55.87,-16.317,-22.6,0.002835105396939106
+Assam,Dhemaji,15658.21,7786.26,-7871.949999999999,-50.27,32.625,16.223,-16.402,-50.27,0.002083571493804209
+Andhra Pradesh,Annamayya,30000.51,24262.06,-5738.449999999997,-19.13,86.083,69.617,-16.466,-19.13,0.002869384553795919
+Telangana,Kumram Bheem(Asifabad),14917.96,7816.98,-7100.98,-47.6,34.655,18.159,-16.496,-47.6,0.0023230388069146184
+Rajasthan,Kota,16670.04,10138.92,-6531.120000000001,-39.18,42.786,26.023,-16.763,-39.18,0.0025666405119603793
+Himachal Pradesh,Chamba,24035.13,18024.08,-6011.049999999999,-25.01,67.436,50.571,-16.865,-25.01,0.0028057264512403304
+Uttar Pradesh,Rampur,16375.64,9653.41,-6722.23,-41.05,41.278,24.333,-16.945,-41.05,0.0025206953743487277
+Chhattisgarh,Raigarh,16507.48,8164.44,-8343.04,-50.54,33.751,16.693,-17.058,-50.54,0.002044588271498739
+Chhattisgarh,Baloda Bazar,20198.92,13878.26,-6320.659999999998,-31.29,54.523,37.462,-17.061,-31.29,0.002699302734997713
+Bihar,Bhagalpur,19540.99,13008.27,-6532.720000000001,-33.43,52.181,34.736,-17.445,-33.43,0.002670335535712366
+Kerala,Alappuzha,35646.37,29590.38,-6055.990000000002,-16.99,102.95,85.46,-17.49,-16.99,0.0028880921114828803
+Rajasthan,Rajsamand,35070.63,28971.82,-6098.809999999998,-17.39,101.202,83.603,-17.599,-17.39,0.0028856624474667266
+Tamil Nadu,Virudhunagar,34004.69,27818.51,-6186.180000000004,-18.19,97.725,79.947,-17.778,-18.19,0.0028738682811106347
+Telangana,Bhadradri Kothagudem,17547.88,10579.01,-6968.870000000001,-39.71,44.936,27.09,-17.846,-39.71,0.0025607651750524847
+Bihar,Muzaffarpur,31609.49,25352.01,-6257.480000000003,-19.8,90.473,72.563,-17.91,-19.8,0.0028622100514750473
+Bihar,Munger,18270.39,11209.96,-7060.43,-38.64,47.163,28.937,-18.226,-38.64,0.002581389888228987
+Telangana,Nirmal,20101.47,13247.03,-6854.4400000000005,-34.1,53.53,35.277,-18.253,-34.1,0.0026629893236663786
+Bihar,Siwan,19167.54,12093.5,-7074.040000000001,-36.91,50.155,31.645,-18.51,-36.91,0.002616663379859909
+Chhattisgarh,Raipur,21199.5,14140.67,-7058.83,-33.3,56.614,37.763,-18.851,-33.3,0.002670534682421755
+Maharashtra,Nanded,24266.9,17224.73,-7042.170000000002,-29.02,66.715,47.355,-19.36,-29.02,0.002749218070705364
+Chhattisgarh,Korba,18214.47,10372.17,-7842.300000000001,-43.06,45.103,25.684,-19.419,-43.05,0.0024762180837542896
+Jammu and Kashmir,Rajauri,17857.6,9070.9,-8786.699999999999,-49.2,39.503,20.066,-19.437,-49.2,0.0022121113699489297
+Telangana,Adilabad,18669.8,10781.2,-7888.5999999999985,-42.25,46.42,26.806,-19.614,-42.25,0.002486368359596782
+Bihar,Rohtas,19826.86,12217.96,-7608.9000000000015,-38.38,51.245,31.579,-19.666,-38.38,0.0025846250994862523
+Uttar Pradesh,Firozabad,18002.93,9409.44,-8593.49,-47.73,41.815,21.855,-19.96,-47.73,0.0023226774752776354
+Madhya Pradesh,Seoni,24724.12,17317.92,-7406.200000000001,-29.96,67.58,47.336,-20.244,-29.96,0.0027333632096915887
+Odisha,Nuapada,19930.29,9804.04,-10126.25,-50.81,40.188,19.769,-20.419,-50.81,0.0020164282607026793
+Gujarat,Panch Mahals,18705.8,9526.75,-9179.05,-49.07,41.638,21.206,-20.432,-49.07,0.0022259406173486297
+Andhra Pradesh,Vizianagaram,61304.86,54331.55,-6973.309999999998,-11.37,181.374,160.743,-20.631,-11.37,0.00295855826112318
+Rajasthan,Churu,35031.76,27769.01,-7262.750000000004,-20.73,99.77,79.086,-20.684,-20.73,0.0028479870837206005
+Bihar,Pashchim Champaran,24053.8,16301.79,-7752.009999999998,-32.23,64.524,43.729,-20.795,-32.23,0.002682486758848914
+Telangana,Khammam,20508.11,12281.38,-8226.730000000001,-40.11,52.08,31.188,-20.892,-40.12,0.002539483160564284
+Bihar,Samastipur,37753.31,30430.99,-7322.319999999996,-19.4,108.285,87.283,-21.002,-19.4,0.002868225329116838
+Karnataka,Ballari,20827.49,12639.69,-8187.800000000001,-39.31,53.437,32.43,-21.007,-39.31,0.002565695626309267
+Uttar Pradesh,Mainpuri,19129.36,10305.03,-8824.33,-46.13,45.906,24.73,-21.176,-46.13,0.0023997666414349457
+Uttar Pradesh,Jalaun,29330.76,21524.81,-7805.949999999997,-26.61,81.77,60.008,-21.762,-26.61,0.002787858207560936
+Jharkhand,Deoghar,22226.47,13726.38,-8500.090000000002,-38.24,57.596,35.57,-22.026,-38.24,0.002591324668289656
+Rajasthan,Baran,21702.55,12967.67,-8734.88,-40.25,55.091,32.918,-22.173,-40.25,0.0025384574623719333
+Karnataka,Chitradurga,22807.82,14329.31,-8478.51,-37.17,59.668,37.487,-22.181,-37.17,0.002616120260507142
+Rajasthan,Sirohi,23668.94,15186.71,-8482.23,-35.84,62.321,39.987,-22.334,-35.84,0.0026330287710391764
+Tamil Nadu,Salem,42525.61,34732.45,-7793.1600000000035,-18.33,122.174,99.785,-22.389,-18.33,0.002872951146379793
+Rajasthan,Pali,31508.66,23502.16,-8006.5,-25.41,88.242,65.819,-22.423,-25.41,0.0028005634006650873
+Bihar,Saran,29369.01,21160.3,-8208.71,-27.95,81.016,58.372,-22.644,-27.95,0.002758553999607069
+Bihar,Purnia,27039.1,18397.28,-8641.82,-31.96,72.584,49.386,-23.198,-31.96,0.002684408874555736
+Tamil Nadu,Ranipet,25289.2,16496.76,-8792.440000000002,-34.77,66.911,43.648,-23.263,-34.77,0.0026458330038119037
+Karnataka,Bidar,22142.02,11040.02,-11102.0,-50.14,46.417,23.144,-23.273,-50.14,0.0020963308677347417
+Telangana,Vikarabad,22860.64,13598.53,-9262.109999999999,-40.52,57.958,34.476,-23.482,-40.52,0.002535274602985743
+Uttar Pradesh,Maharajganj,28312.51,19604.32,-8708.189999999999,-30.76,76.975,53.299,-23.676,-30.76,0.0027187628366400576
+Chhattisgarh,Bilaspur,21653.66,11896.43,-9757.23,-45.06,52.635,28.917,-23.718,-45.06,0.002430766900376195
+Odisha,Kandhamal,31893.37,23362.79,-8530.579999999998,-26.75,88.861,65.093,-23.768,-26.75,0.0027861903586858337
+Uttar Pradesh,Chandauli,22471.24,11354.36,-11116.880000000001,-49.47,49.156,24.838,-24.318,-49.47,0.0021875072314656422
+Andhra Pradesh,Kakinada,25518.15,16202.67,-9315.480000000001,-36.51,66.84,42.44,-24.4,-36.51,0.0026193121366556746
+Madhya Pradesh,Dhar,22382.24,11429.06,-10953.180000000002,-48.94,50.067,25.566,-24.501,-48.94,0.0022369074766421947
+Odisha,Sundargarh,32692.36,23598.46,-9093.900000000001,-27.82,90.337,65.208,-25.129,-27.82,0.002763244990572721
+Bihar,Araria,24187.38,13547.11,-10640.27,-43.99,59.331,33.231,-26.1,-43.99,0.0024529734101006394
+Karnataka,Tumakuru,24323.11,12322.59,-12000.52,-49.34,53.271,26.988,-26.283,-49.34,0.0021901393366226605
+Tamil Nadu,Ariyalur,24033.5,12850.52,-11182.98,-46.53,56.909,30.429,-26.48,-46.53,0.0023679031352071066
+Bihar,Gaya,45679.72,36331.56,-9348.160000000003,-20.46,130.367,103.688,-26.679,-20.46,0.0028539360574014023
+Chhattisgarh,Kawardha,26421.9,15363.74,-11058.160000000002,-41.85,65.999,38.377,-27.622,-41.85,0.0024978900079101044
+Maharashtra,Gondia,34159.49,23972.56,-10186.929999999997,-29.82,93.475,65.599,-27.876,-29.82,0.0027364284419937185
+Uttar Pradesh,Hardoi,32387.17,21862.91,-10524.259999999998,-32.5,86.694,58.523,-28.171,-32.49,0.002676800720779247
+Bihar,Kishanganj,25780.32,13853.45,-11926.869999999999,-46.26,61.547,33.073,-28.474,-46.26,0.0023873636944770275
+Maharashtra,Yavatmal,26865.05,15226.4,-11638.65,-43.32,66.292,37.573,-28.719,-43.32,0.0024675926529077745
+Rajasthan,Jaisalmer,30664.11,19306.12,-11357.990000000002,-37.04,80.234,50.515,-29.719,-37.04,0.002616544227111108
+Uttar Pradesh,Gorakhpur,26825.72,14164.2,-12661.52,-47.2,63.051,33.291,-29.76,-47.2,0.00235039357750696
+Bihar,Vaishali,28966.34,16959.44,-12006.900000000001,-41.45,72.584,42.497,-30.087,-41.45,0.002505805013681397
+Bihar,Saharsa,36442.24,25330.99,-11111.249999999996,-30.49,99.406,69.097,-30.309,-30.49,0.0027277686552747583
+Bihar,Nalanda,35181.56,23090.87,-12090.689999999999,-34.37,93.258,61.208,-32.05,-34.37,0.002650763638678899
+Bihar,Katihar,31709.05,18904.35,-12804.7,-40.38,80.469,47.974,-32.495,-40.38,0.0025377297648463133
+Maharashtra,Amravati,44981.74,33190.9,-11790.839999999997,-26.21,125.621,92.693,-32.928,-26.21,0.002792710997840457
+Tamil Nadu,Namakkal,31198.1,17807.37,-13390.73,-42.92,77.273,44.106,-33.167,-42.92,0.0024768495517355224
+Tamil Nadu,Tiruvallur,43896.18,31920.47,-11975.71,-27.28,121.737,88.525,-33.212,-27.28,0.0027732937125736225
+Rajasthan,Sri Ganganagar,39608.45,27108.25,-12500.199999999997,-31.56,106.567,72.935,-33.632,-31.56,0.0026905117468620965
+Jharkhand,Garhwa,35448.39,22413.07,-13035.32,-36.77,92.846,58.704,-34.142,-36.77,0.0026191880646765624
+Andhra Pradesh,Eluru,42110.87,29608.99,-12501.880000000001,-29.69,115.324,81.087,-34.237,-29.69,0.002738580323797632
+Tamil Nadu,Tiruvannamalai,78187.39,66262.78,-11924.61,-15.25,227.733,193.001,-34.732,-15.25,0.002912656375919442
+Andhra Pradesh,Sri Sathya Sai,31516.06,16725.0,-14791.060000000001,-46.93,74.247,39.402,-34.845,-46.93,0.0023558465112707614
+Bihar,Jamui,31828.37,16550.37,-15278.0,-48.0,73.878,38.416,-35.462,-48.0,0.002321136772005604
+Rajasthan,Hanumangarh,39268.34,24303.41,-14964.929999999997,-38.11,101.759,62.979,-38.78,-38.11,0.002591375138343001
+Karnataka,Raichur,41250.24,26522.55,-14727.689999999999,-35.7,108.725,69.907,-38.818,-35.7,0.0026357422405299943
+Tamil Nadu,Madurai,40407.61,24414.36,-15993.25,-39.58,103.623,62.609,-41.014,-39.58,0.002564442687899631
+Uttar Pradesh,Azamgarh,38338.5,21268.01,-17070.49,-44.53,93.567,51.906,-41.661,-44.53,0.0024405493172659333
+Maharashtra,Chatrapati Sambhaji Nagar,48511.79,32812.66,-15699.129999999997,-32.36,130.042,87.958,-42.084,-32.36,0.0026806267095071117
+Andhra Pradesh,Anakapalli,42445.38,25872.53,-16572.85,-39.05,109.084,66.492,-42.592,-39.05,0.0025699852374981686
+Tamil Nadu,Tiruchirappalli,49657.91,33388.75,-16269.160000000003,-32.76,132.794,89.287,-43.507,-32.76,0.0026741761785785993
+Uttar Pradesh,Basti,44631.62,27742.1,-16889.520000000004,-37.84,116.275,72.274,-44.001,-37.84,0.0026052157640704056
+Kerala,Thiruvananthapuram,43343.3,26072.23,-17271.070000000003,-39.85,110.654,66.562,-44.092,-39.85,0.002552966663821167
+Madhya Pradesh,Morena,40950.05,22278.84,-18671.210000000003,-45.6,98.501,53.589,-44.912,-45.6,0.0024053938884079505
+Rajasthan,Dungarpur,75259.77,59355.17,-15904.600000000006,-21.13,214.214,168.944,-45.27,-21.13,0.0028463281245743907
+Rajasthan,Pratapgarh,41853.16,23049.91,-18803.250000000004,-44.93,101.776,56.051,-45.725,-44.93,0.0024317399211911356
+Andhra Pradesh,Parvathipuram Manyam,43888.63,25285.58,-18603.049999999996,-42.39,109.104,62.858,-46.246,-42.39,0.0024859285878825565
+Tamil Nadu,Kallakurichi,46627.78,22874.65,-23753.129999999997,-50.94,93.189,45.717,-47.472,-50.94,0.001998572524791015
+Andhra Pradesh,Srikakulam,70040.57,52991.94,-17048.630000000005,-24.34,197.023,149.065,-47.958,-24.34,0.0028129839605817025
+Maharashtra,Beed,47848.46,27950.73,-19897.73,-41.58,119.751,69.953,-49.798,-41.58,0.0025027137759501563
+Tamil Nadu,Thanjavur,47953.32,24742.85,-23210.47,-48.4,109.921,56.717,-53.204,-48.4,0.0022922500465035584
+Tamil Nadu,Cuddalore,53050.01,28436.33,-24613.68,-46.4,126.522,67.819,-58.703,-46.4,0.0023849571376141116
+Andhra Pradesh,Alluri Sitharama Raju,54797.3,27541.7,-27255.600000000002,-49.74,119.446,60.035,-59.411,-49.74,0.0021797789307137394
+Tamil Nadu,Villupuram,60813.4,34873.88,-25939.520000000004,-42.65,150.844,86.503,-64.341,-42.65,0.002480440166147592
+Rajasthan,Udaipur,60574.8,32307.89,-28266.910000000003,-46.66,143.347,76.455,-66.892,-46.66,0.0023664461129050364
+Rajasthan,Barmer,92571.15,68182.19,-24388.959999999992,-26.35,258.506,190.4,-68.106,-26.35,0.00279251148981081

data/scraper/mnrega_scraper.py ADDED Viewed

	@@ -0,0 +1,312 @@

+"""
+mnrega_scraper.py
+-----------------
+Real MNREGA data scraper for nreganarep.nic.in
+STRATEGY:
+  The portal has captchas on the main MIS page, but the R14 district-level
+  consolidated summary reports are accessible via direct GET URLs.
+  R14 report gives per-district per-year:
+    - Households demanded / offered / availed
+    - Person days (total, SC, ST, Women)
+    - Expenditure (Rs. lakhs)
+    - Average wage rate
+    - Works completed / in progress
+  Two-step approach:
+    Step 1: Fetch state-level page → extract district links (which have
+            embedded Digest tokens needed to access sub-pages)
+    Step 2: Follow each district link → parse the HTML table
+HOW TO RUN:
+  pip install requests beautifulsoup4 lxml
+  # Maharashtra only (fast, ~2-5 min):
+  python data/scraper/mnrega_scraper.py --state Maharashtra
+  # All India (slow, ~30-60 min):
+  python data/scraper/mnrega_scraper.py --all-india
+  # Resume after interruption:
+  python data/scraper/mnrega_scraper.py --all-india --resume
+  # Custom year range:
+  python data/scraper/mnrega_scraper.py --state Maharashtra --years 2018-2019 2023-2024
+OUTPUT:
+  data/raw/mnrega_real_data.csv
+  → drop this in as replacement for mnrega_india_unified.csv
+  → run: python main.py --stage 3
+"""
+import os, json, time, argparse
+import requests
+from bs4 import BeautifulSoup
+import pandas as pd
+from datetime import datetime
+# ── State codes ────────────────────────────────────────────────────────────────
+STATE_CODES = {
+    "Andhra Pradesh":    "02",
+    "Arunachal Pradesh": "03",
+    "Assam":             "04",
+    "Bihar":             "05",
+    "Chhattisgarh":      "33",
+    "Goa":               "10",
+    "Gujarat":           "11",
+    "Haryana":           "12",
+    "Himachal Pradesh":  "13",
+    "Jharkhand":         "34",
+    "Karnataka":         "15",
+    "Kerala":            "16",
+    "Madhya Pradesh":    "17",
+    "Maharashtra":       "18",
+    "Manipur":           "19",
+    "Meghalaya":         "20",
+    "Mizoram":           "21",
+    "Nagaland":          "22",
+    "Odisha":            "24",
+    "Punjab":            "25",
+    "Rajasthan":         "27",
+    "Sikkim":            "28",
+    "Tamil Nadu":        "29",
+    "Telangana":         "36",
+    "Tripura":           "30",
+    "Uttar Pradesh":     "31",
+    "Uttarakhand":       "35",
+    "West Bengal":       "32",
+    "Delhi":             "07",
+}
+ALL_YEARS = [
+    "2014-2015", "2015-2016", "2016-2017", "2017-2018",
+    "2018-2019", "2019-2020", "2020-2021", "2021-2022",
+    "2022-2023", "2023-2024"
+]
+BASE_URL        = "https://nreganarep.nic.in/netnrega"
+OUTPUT_PATH     = os.path.join("data", "raw", "mnrega_real_data.csv")
+CHECKPOINT_PATH = os.path.join("data", "raw", ".scraper_checkpoint.json")
+DELAY           = 1.5
+HEADERS = {
+    "User-Agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36",
+    "Accept":     "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",
+    "Referer":    "https://nreganarep.nic.in/netnrega/MISreport4.aspx",
+}
+HIGH_ACTIVITY = {"Rajasthan","Uttar Pradesh","Madhya Pradesh","West Bengal",
+                 "Andhra Pradesh","Telangana","Jharkhand","Odisha","Chhattisgarh","Bihar"}
+MID_ACTIVITY  = {"Maharashtra","Tamil Nadu","Karnataka","Gujarat",
+                 "Himachal Pradesh","Uttarakhand","Assam"}
+SOUTH         = {"Tamil Nadu","Kerala","Karnataka","Andhra Pradesh","Telangana"}
+EAST          = {"West Bengal","Odisha","Jharkhand","Bihar","Assam"}
+class MNREGAScraper:
+    def __init__(self, delay=DELAY):
+        self.session = requests.Session()
+        self.session.headers.update(HEADERS)
+        self.delay   = delay
+        self.records = []
+        self.checkpoint = self._load_checkpoint()
+    # ── Public ────────────────────────────────────────────────────────────────
+    def scrape_state(self, state_name: str, years: list) -> pd.DataFrame:
+        code = STATE_CODES.get(state_name)
+        if not code:
+            raise ValueError(f"Unknown state '{state_name}'. Options: {list(STATE_CODES)}")
+        print(f"\n{'='*60}")
+        print(f"[scraper] State: {state_name} | Code: {code} | Years: {years[0]}→{years[-1]}")
+        print(f"{'='*60}")
+        for year in years:
+            self._scrape_year(state_name, code, year)
+        return self._finalize()
+    def scrape_all_india(self, years: list, resume: bool = False) -> pd.DataFrame:
+        done = set(self.checkpoint.get("done", [])) if resume else set()
+        total = len(STATE_CODES) * len(years)
+        count = 0
+        for state_name, code in STATE_CODES.items():
+            for year in years:
+                count += 1
+                key = f"{state_name}|{year}"
+                if key in done:
+                    print(f"[scraper] [{count}/{total}] SKIP {key}")
+                    continue
+                print(f"[scraper] [{count}/{total}] {key}")
+                self._scrape_year(state_name, code, year)
+                done.add(key)
+                self._save_checkpoint(list(done))
+        return self._finalize()
+    # ── Core ──────────────────────────────────────────────────────────────────
+    def _scrape_year(self, state_name: str, state_code: str, year: str):
+        """Fetch state-year page, find district links, scrape each."""
+        url = f"{BASE_URL}/nrega_R14.aspx?state_code={state_code}&fin_year={year}&rpt=RP"
+        soup = self._get(url)
+        if soup is None:
+            return
+        district_links = self._find_district_links(soup)
+        if district_links:
+            print(f"  → {len(district_links)} districts")
+            for name, durl in district_links:
+                dsoup = self._get(durl)
+                if dsoup:
+                    rows = self._parse_table(dsoup, state_name, year, name)
+                    self.records.extend(rows)
+                time.sleep(self.delay)
+        else:
+            # State-level page may already contain the district table
+            rows = self._parse_table(soup, state_name, year)
+            self.records.extend(rows)
+            print(f"  → {len(rows)} rows (direct table)")
+    def _get(self, url: str):
+        try:
+            r = self.session.get(url, timeout=20)
+            r.raise_for_status()
+            return BeautifulSoup(r.text, "lxml")
+        except Exception as e:
+            print(f"  [ERROR] {url[:80]}... → {e}")
+            return None
+    def _find_district_links(self, soup: BeautifulSoup) -> list:
+        links = []
+        for a in soup.find_all("a", href=True):
+            href = a["href"]
+            text = a.get_text(strip=True)
+            if ("district_code" in href.lower() or "nrega_r14" in href.lower()) and text:
+                full = href if href.startswith("http") else f"{BASE_URL}/{href.lstrip('/')}"
+                links.append((text.title(), full))
+        return links
+    def _parse_table(self, soup, state_name, year, district_hint=None):
+        records = []
+        for table in soup.find_all("table"):
+            headers = [th.get_text(" ", strip=True).lower() for th in table.find_all("th")]
+            joined  = " ".join(headers)
+            if not any(k in joined for k in ["person", "household", "expenditure"]):
+                continue
+            for row in table.find_all("tr")[1:]:
+                cells = [td.get_text(strip=True) for td in row.find_all("td")]
+                r = self._map(cells, state_name, year, district_hint)
+                if r:
+                    records.append(r)
+        return records
+    def _map(self, cells, state_name, year, district_hint=None):
+        def num(v):
+            try: return float(str(v).replace(",","").replace("-","0") or 0)
+            except: return 0.0
+        if len(cells) < 6:
+            return None
+        district = district_hint or cells[0]
+        if not district or str(district).isdigit() or len(str(district)) < 3:
+            return None
+        # Skip subtotal/total rows
+        dl = district.lower()
+        if any(t in dl for t in ["total", "grand", "state"]):
+            return None
+        # Person days in R14 are in actual days, convert to lakhs
+        pd_raw = num(cells[4]) if len(cells) > 4 else 0
+        pd_lakhs = round(pd_raw / 1e5, 3) if pd_raw > 1000 else pd_raw  # already lakhs?
+        exp_raw = num(cells[8]) if len(cells) > 8 else 0
+        exp_lakhs = round(exp_raw / 1e5, 2) if exp_raw > 1e5 else exp_raw
+        # Clean year format: 2023-2024 → 2023-24
+        yr_parts = year.split("-")
+        fin_year = f"{yr_parts[0]}-{yr_parts[1][2:]}" if len(yr_parts) == 2 else year
+        return {
+            "state":                  state_name,
+            "district":               str(district).title().strip(),
+            "financial_year":         fin_year,
+            "region":                 "South" if state_name in SOUTH else ("East" if state_name in EAST else "Other"),
+            "state_category":         "high" if state_name in HIGH_ACTIVITY else ("mid" if state_name in MID_ACTIVITY else "low"),
+            "person_days_lakhs":      pd_lakhs,
+            "expenditure_lakhs":      exp_lakhs,
+            "avg_wage_rate":          num(cells[9])  if len(cells) > 9  else None,
+            "households_demanded":    num(cells[1])  if len(cells) > 1  else None,
+            "households_offered":     num(cells[2])  if len(cells) > 2  else None,
+            "households_availed":     num(cells[3])  if len(cells) > 3  else None,
+            "works_completed":        num(cells[10]) if len(cells) > 10 else None,
+            # Stage 2/3 — fill via enrich.py with IMD/census/PMKISAN data
+            "rainfall_mm":            None,
+            "crop_season_index":      None,
+            "rural_population_lakhs": None,
+            "poverty_rate_pct":       None,
+            "pmkisan_beneficiaries":  None,
+            "pmkisan_amount_lakhs":   None,
+            "pmay_houses_sanctioned": None,
+            "pmay_houses_completed":  None,
+            "pmay_expenditure_lakhs": None,
+            "budget_allocated_lakhs": round(exp_lakhs * 1.12, 2) if exp_lakhs else None,
+        }
+    # ── Persistence ───────────────────────────────────────────────────────────
+    def _finalize(self) -> pd.DataFrame:
+        df = pd.DataFrame(self.records)
+        os.makedirs(os.path.dirname(OUTPUT_PATH), exist_ok=True)
+        df.to_csv(OUTPUT_PATH, index=False)
+        print(f"\n{'='*60}")
+        print(f"[scraper] DONE: {len(df)} rows | {df['district'].nunique() if len(df) else 0} districts")
+        print(f"[scraper] Saved → {OUTPUT_PATH}")
+        print(f"[scraper] Next step: copy this to data/raw/mnrega_india_unified.csv")
+        print(f"          then run:  python main.py --stage 3")
+        print(f"{'='*60}")
+        return df
+    def _save_checkpoint(self, done):
+        os.makedirs(os.path.dirname(CHECKPOINT_PATH), exist_ok=True)
+        with open(CHECKPOINT_PATH, "w") as f:
+            json.dump({"done": done, "ts": str(datetime.now())}, f)
+    def _load_checkpoint(self):
+        if os.path.exists(CHECKPOINT_PATH):
+            with open(CHECKPOINT_PATH) as f:
+                return json.load(f)
+        return {}
+# ── CLI ───────────────────────────────────────────────────────────────────────
+if __name__ == "__main__":
+    ap = argparse.ArgumentParser()
+    ap.add_argument("--state",     type=str,  help="Single state e.g. 'Maharashtra'")
+    ap.add_argument("--all-india", action="store_true")
+    ap.add_argument("--resume",    action="store_true", help="Resume from checkpoint")
+    ap.add_argument("--years",     nargs=2, default=["2014-2015", "2023-2024"],
+                    metavar=("START", "END"),
+                    help="e.g. --years 2018-2019 2023-2024")
+    ap.add_argument("--delay",     type=float, default=1.5)
+    args = ap.parse_args()
+    start = int(args.years[0].split("-")[0])
+    end   = int(args.years[1].split("-")[0])
+    years = [f"{y}-{y+1}" for y in range(start, end + 1)]
+    scraper = MNREGAScraper(delay=args.delay)
+    if args.state:
+        df = scraper.scrape_state(args.state, years)
+    elif args.all_india:
+        df = scraper.scrape_all_india(years, resume=args.resume)
+    else:
+        print("Usage:")
+        print("  python data/scraper/mnrega_scraper.py --state Maharashtra")
+        print("  python data/scraper/mnrega_scraper.py --all-india")
+        print("  python data/scraper/mnrega_scraper.py --all-india --resume")
+        exit(0)

fix_optimizer.py ADDED Viewed

	@@ -0,0 +1,41 @@

+"""
+fix_optimizer.py
+----------------
+Standalone script to re-run the two-stage proportional-LP optimizer.
+Run this AFTER replacing src/optimize.py to regenerate
+data/processed/optimized_budget_allocation.csv with realistic
+continuous budget_change_pct values (instead of bang-bang -60%/+150%).
+Usage:
+    cd SchemeImpactNet/
+    python fix_optimizer.py
+Then reseed the database:
+    rm data/schemeimpactnet.db
+    ./start.sh
+"""
+import sys, os
+sys.path.insert(0, os.path.dirname(__file__))
+from src.optimize import run_optimizer
+if __name__ == "__main__":
+    print("=" * 60)
+    print("SchemeImpactNet — Optimizer Fix (v2 Proportional-LP)")
+    print("=" * 60)
+    result = run_optimizer(
+        predictions_path="data/processed/mnrega_predictions.csv",
+        raw_path="data/raw/mnrega_real_data_final_clean.csv",
+        scope_state=None,     # All-India
+        target_year=2024,
+    )
+    print(f"\n✅ Done. {len(result)} districts processed.")
+    print(f"   budget_change_pct range: {result['budget_change_pct'].min():.1f}% to {result['budget_change_pct'].max():.1f}%")
+    print(f"   Unique values: {result['budget_change_pct'].nunique()}")
+    print("\nNext steps:")
+    print("  rm data/schemeimpactnet.db")
+    print("  ./start.sh")

frontend/app.py ADDED Viewed

	@@ -0,0 +1,185 @@

+# frontend/app.py — SchemeImpactNet entry point
+# Run from project root: streamlit run frontend/app.py
+import sys, os
+sys.path.insert(0, os.path.dirname(__file__))
+import streamlit as st
+st.set_page_config(
+    page_title="SchemeImpactNet",
+    page_icon="🏛️",
+    layout="wide",
+    initial_sidebar_state="expanded",
+)
+# ── Inject CSS first — before anything else ───────────────────────────────────
+# Must happen before st.navigation() so sidebar styles are present when nav renders.
+st.markdown("""
+<style>
+@import url('https://fonts.googleapis.com/css2?family=Fraunces:ital,opsz,wght@0,9..144,300;0,9..144,600;0,9..144,700;1,9..144,300&family=Source+Serif+4:ital,opsz,wght@0,8..60,300;0,8..60,400;0,8..60,600&family=DM+Mono:wght@400;500&display=swap');
+/* ── Global ── */
+html, body, [class*="css"] { font-family: 'Source Serif 4', Georgia, serif !important; }
+.stApp { background-color: #FAF9F7 !important; }
+#MainMenu, footer, header { visibility: hidden; }
+.block-container { padding: 2rem 2.5rem 3rem !important; max-width: 1320px !important; }
+/* ── Sidebar shell ── */
+[data-testid="stSidebar"] {
+    background: #1C1917 !important;
+    border-right: none !important;
+    min-width: 220px !important;
+}
+[data-testid="stSidebarContent"] {
+    background: #1C1917 !important;
+}
+section[data-testid="stSidebar"] > div {
+    background: #1C1917 !important;
+}
+/* ── Sidebar text ── */
+[data-testid="stSidebar"] p,
+[data-testid="stSidebar"] span,
+[data-testid="stSidebar"] label,
+[data-testid="stSidebar"] div {
+    color: #A8A29E !important;
+}
+/* ── Nav links from st.navigation() ── */
+[data-testid="stSidebarNavLink"] {
+    border-radius: 5px !important;
+    padding: 0.48rem 1rem !important;
+    font-family: 'DM Mono', monospace !important;
+    font-size: 0.7rem !important;
+    letter-spacing: 0.5px !important;
+    color: #A8A29E !important;
+    border-left: 2px solid transparent !important;
+    transition: all 0.15s ease !important;
+}
+[data-testid="stSidebarNavLink"]:hover {
+    background: rgba(251,146,60,0.1) !important;
+    color: #FB923C !important;
+    border-left-color: rgba(251,146,60,0.5) !important;
+}
+[data-testid="stSidebarNavLink"][aria-current="page"] {
+    background: rgba(251,146,60,0.15) !important;
+    color: #FB923C !important;
+    border-left-color: #FB923C !important;
+}
+[data-testid="stSidebarNavLink"] svg { display: none !important; }
+/* ── Sidebar nav section label ── */
+[data-testid="stSidebarNavSeparator"] {
+    border-color: rgba(255,255,255,0.07) !important;
+}
+/* ── Collapse button ── */
+[data-testid="collapsedControl"] {
+    background: #1C1917 !important;
+    color: #A8A29E !important;
+    border-right: 1px solid #292524 !important;
+}
+button[kind="header"] { background: transparent !important; }
+/* ── Main area typography ── */
+h1, h2, h3 { font-family: 'Fraunces', serif !important; color: #1C1917 !important; }
+h1 { font-size: 2.2rem !important; font-weight: 600 !important; line-height: 1.15 !important; }
+h2 { font-size: 1.5rem !important; font-weight: 600 !important; }
+h3 { font-size: 1.1rem !important; font-weight: 600 !important; }
+p  { font-family: 'Source Serif 4', serif !important; color: #292524 !important; }
+/* ── Metric cards ── */
+[data-testid="stMetric"] {
+    background: #FFFFFF !important; border: 1px solid #E7E5E4 !important;
+    border-radius: 8px !important; padding: 1rem 1.2rem !important;
+}
+[data-testid="stMetricLabel"] p {
+    font-family: 'DM Mono', monospace !important; font-size: 0.62rem !important;
+    letter-spacing: 2px !important; text-transform: uppercase !important; color: #78716C !important;
+}
+[data-testid="stMetricValue"] {
+    font-family: 'Fraunces', serif !important; font-size: 1.85rem !important;
+    font-weight: 600 !important; color: #1C1917 !important; line-height: 1.2 !important;
+}
+[data-testid="stMetricDelta"] { font-family: 'DM Mono', monospace !important; font-size: 0.7rem !important; }
+/* ── Inputs ── */
+[data-testid="stSelectbox"] label p,
+[data-testid="stSlider"] label p,
+[data-testid="stTextInput"] label p {
+    font-family: 'DM Mono', monospace !important; font-size: 0.65rem !important;
+    letter-spacing: 1.5px !important; text-transform: uppercase !important; color: #78716C !important;
+}
+/* ── Buttons ── */
+.stButton > button {
+    font-family: 'DM Mono', monospace !important; font-size: 0.7rem !important;
+    letter-spacing: 1px !important; text-transform: uppercase !important;
+    background: #1C1917 !important; color: #FAF9F7 !important;
+    border: none !important; border-radius: 6px !important; padding: 0.5rem 1.2rem !important;
+}
+.stButton > button:hover { background: #FB923C !important; }
+/* ── Dataframes ── */
+[data-testid="stDataFrame"] {
+    border: 1px solid #E7E5E4 !important; border-radius: 8px !important; overflow: hidden !important;
+}
+/* ── Expander ── */
+[data-testid="stExpander"] {
+    border: 1px solid #E7E5E4 !important; border-radius: 8px !important; background: #FFFFFF !important;
+}
+/* ── Caption ── */
+[data-testid="stCaptionContainer"] p {
+    font-family: 'DM Mono', monospace !important; font-size: 0.63rem !important;
+    color: #A8A29E !important; letter-spacing: 0.3px !important;
+}
+/* ── Divider ── */
+hr { border: none !important; border-top: 1px solid #E7E5E4 !important; margin: 1.5rem 0 !important; }
+/* ── Tabs ── */
+[data-testid="stTabs"] [role="tab"] {
+    font-family: 'DM Mono', monospace !important; font-size: 0.68rem !important;
+    letter-spacing: 1px !important; text-transform: uppercase !important;
+}
+</style>
+""", unsafe_allow_html=True)
+# ── Sidebar brand — inject before navigation ──────────────────────────────────
+with st.sidebar:
+    st.markdown("""
+<div style="padding:1.4rem 0.75rem 1.2rem 0.75rem;
+            border-bottom:1px solid rgba(255,255,255,0.07);
+            margin-bottom:0.75rem;">
+  <p style="font-family:'DM Mono',monospace; font-size:0.52rem; letter-spacing:4px;
+            text-transform:uppercase; color:#FB923C; margin:0 0 8px 0; line-height:1;">
+    Policy Analytics
+  </p>
+  <p style="font-family:'Fraunces',serif; font-size:1.35rem; font-weight:600;
+            color:#FAF9F7; line-height:1.1; margin:0;">
+    Scheme<br>Impact<em style="color:#FB923C;">Net</em>
+  </p>
+  <p style="font-family:'DM Mono',monospace; font-size:0.55rem; color:#57534E;
+            margin:10px 0 0 0; letter-spacing:0.4px; line-height:1.65;">
+    MNREGA · XGBoost · SciPy LP<br>
+    7,758 district-years · 2014–2024
+  </p>
+</div>
+""", unsafe_allow_html=True)
+# ── Page registry ─────────────────────────────────────────────────────────────
+pages = [
+    st.Page("pages/home.py",        title="Home",               icon="🏛️", default=True),
+    st.Page("pages/overview.py",    title="Overview",           icon="📊"),
+    st.Page("pages/districts.py",   title="District Explorer",  icon="🔍"),
+    st.Page("pages/predictions.py", title="Predictions",        icon="🤖"),
+    st.Page("pages/optimizer.py",   title="Budget Optimizer",   icon="⚖️"),
+    st.Page("pages/spatial.py",     title="Spatial Map",        icon="🗺️"),
+    st.Page("pages/insights.py",    title="Strategic Insights", icon="🧠"),
+]
+pg = st.navigation(pages, position="sidebar")
+pg.run()

frontend/pages/districts.py ADDED Viewed

	@@ -0,0 +1,164 @@

+# pages/districts.py — District deep-dive explorer.
+import sys, os
+sys.path.insert(0, os.path.dirname(os.path.dirname(__file__)))
+import streamlit as st
+import plotly.graph_objects as go
+from theme import inject_theme, page_header, section_label, PLOTLY_LAYOUT, SAFFRON, GREEN, RED
+from utils.api_client import fetch_states, fetch_districts, fetch_district_history
+inject_theme()
+page_header(
+    "◈ Module 02",
+    "District Explorer",
+    "Full historical MNREGA performance deep-dive for any district",
+)
+# ── Selectors ─────────────────────────────────────────────────────────────────
+states = fetch_states()
+if not states:
+    st.error("⚠️ API offline — run `uvicorn backend.main:app --port 8000`")
+    st.stop()
+col1, col2 = st.columns(2)
+with col1:
+    state = st.selectbox("State", states)
+with col2:
+    districts = fetch_districts(state)
+    if not districts:
+        st.warning("No districts found for this state.")
+        st.stop()
+    district = st.selectbox("District", districts)
+# ── Fetch district history ────────────────────────────────────────────────────
+df = fetch_district_history(state, district)
+if df.empty:
+    st.warning("No historical data for this district.")
+    st.stop()
+df = df.sort_values("financial_year").reset_index(drop=True)
+# ── District headline ─────────────────────────────────────────────────────────
+latest = df.iloc[-1]
+prev   = df.iloc[-2] if len(df) > 1 else latest
+st.markdown(f"""
+<div style="margin:0.5rem 0 1.5rem;">
+  <p style="font-family:'Fraunces',serif; font-size:1.65rem; font-weight:600;
+            color:#1C1917; margin:0;">
+    {district}
+    <span style="font-size:1rem; font-weight:300; color:#78716C;">· {state}</span>
+  </p>
+</div>
+""", unsafe_allow_html=True)
+pd_delta = latest['person_days_lakhs'] - prev['person_days_lakhs']
+wage_delta = latest['avg_wage_rate'] - prev['avg_wage_rate']
+c1, c2, c3 = st.columns(3)
+c1.metric(
+    "Person-Days (latest yr)",
+    f"{latest['person_days_lakhs']:.2f}L",
+    delta=f"{pd_delta:+.2f}L",
+)
+c2.metric(
+    "Avg Wage Rate",
+    f"₹{latest['avg_wage_rate']:.0f}/day",
+    delta=f"₹{wage_delta:+.0f}",
+)
+c3.metric(
+    "Years on Record",
+    f"{len(df)}",
+)
+st.markdown("---")
+# ── Person-Days Trend ─────────────────────────────────────────────────────────
+section_label("Person-Days Trend")
+fig1 = go.Figure()
+fig1.add_scatter(
+    x=df["financial_year"], y=df["person_days_lakhs"],
+    mode="lines+markers",
+    fill="tozeroy",
+    fillcolor="rgba(251,146,60,0.07)",
+    line=dict(color=SAFFRON, width=2.5),
+    marker=dict(size=6, color=SAFFRON, line=dict(width=1.5, color="#FFFFFF")),
+    name="Person-Days",
+    hovertemplate="FY%{x}<br>PD: <b>%{y:.2f}L</b><extra></extra>",
+)
+if 2020 in df["financial_year"].values:
+    fig1.add_vline(
+        x=2020, line_dash="dot", line_color=RED, line_width=1.5,
+        annotation_text="COVID",
+        annotation_font=dict(color=RED, size=9, family="DM Mono, monospace"),
+    )
+if 2022 in df["financial_year"].values:
+    fig1.add_vline(
+        x=2022, line_dash="dot", line_color="#A8A29E", line_width=1,
+        annotation_text="2022 anomaly",
+        annotation_font=dict(color="#A8A29E", size=9, family="DM Mono, monospace"),
+    )
+l1 = {**PLOTLY_LAYOUT}
+l1.update(dict(
+    height=320,
+    yaxis=dict(**PLOTLY_LAYOUT["yaxis"], title="Lakh Person-Days"),
+    xaxis=dict(**PLOTLY_LAYOUT["xaxis"], title="Financial Year", dtick=1),
+))
+fig1.update_layout(**l1)
+st.plotly_chart(fig1, use_container_width=True, config={"displayModeBar": False})
+# ── YoY Change ────────────────────────────────────────────────────────────────
+section_label("Year-on-Year Change")
+df["yoy"] = df["person_days_lakhs"].pct_change() * 100
+fig2 = go.Figure()
+fig2.add_bar(
+    x=df["financial_year"],
+    y=df["yoy"],
+    marker=dict(
+        color=[GREEN if v >= 0 else RED for v in df["yoy"].fillna(0)],
+        opacity=0.8,
+    ),
+    hovertemplate="FY%{x}<br>YoY: <b>%{y:+.1f}%</b><extra></extra>",
+)
+fig2.add_hline(y=0, line_dash="solid", line_color="#1C1917", line_width=1)
+l2 = {**PLOTLY_LAYOUT}
+l2.update(dict(
+    height=220,
+    bargap=0.3,
+    yaxis=dict(**PLOTLY_LAYOUT["yaxis"], title="% Change"),
+    xaxis=dict(**PLOTLY_LAYOUT["xaxis"], title="Financial Year", dtick=1),
+))
+fig2.update_layout(**l2)
+st.plotly_chart(fig2, use_container_width=True, config={"displayModeBar": False})
+# ── Wage Rate Trend ───────────────────────────────────────────────────────────
+section_label("Wage Rate History")
+fig3 = go.Figure()
+fig3.add_scatter(
+    x=df["financial_year"], y=df["avg_wage_rate"],
+    mode="lines+markers",
+    fill="tozeroy",
+    fillcolor="rgba(22,163,74,0.06)",
+    line=dict(color=GREEN, width=2),
+    marker=dict(size=6, color=GREEN),
+    hovertemplate="FY%{x}<br>₹%{y:.0f}/day<extra></extra>",
+)
+l3 = {**PLOTLY_LAYOUT}
+l3.update(dict(
+    height=220,
+    yaxis=dict(**PLOTLY_LAYOUT["yaxis"], title="₹/day"),
+    xaxis=dict(**PLOTLY_LAYOUT["xaxis"], title="Financial Year", dtick=1),
+))
+fig3.update_layout(**l3)
+st.plotly_chart(fig3, use_container_width=True, config={"displayModeBar": False})
+# ── Raw data ──────────────────────────────────────────────────────────────────
+with st.expander("📋 Raw Data Table"):
+    display_cols = [c for c in [
+        "financial_year", "person_days_lakhs", "avg_wage_rate",
+    ] if c in df.columns]
+    st.dataframe(df[display_cols].round(3), use_container_width=True, hide_index=True)

frontend/pages/home.py ADDED Viewed

	@@ -0,0 +1,226 @@

+# pages/home.py — Landing dashboard.
+import sys, os
+sys.path.insert(0, os.path.dirname(os.path.dirname(__file__)))
+import streamlit as st
+import numpy as np
+import plotly.graph_objects as go
+from theme import (
+    inject_theme, page_header, section_label, kpi_html,
+    signal_card_html, PLOTLY_LAYOUT, SAFFRON, SAFFRON_SCALE, GREEN, RED, AMBER,
+)
+from utils.api_client import (
+    is_online, fetch_stats, fetch_predictions, fetch_optimizer_results,
+)
+inject_theme()
+# ── Status pill ───────────────────────────────────────────────────────────────
+online = is_online()
+pill_color = "#16A34A" if online else "#DC2626"
+pill_text  = "API LIVE" if online else "API OFFLINE — run `uvicorn backend.main:app --port 8000`"
+st.markdown(
+    f'<div style="display:flex;align-items:center;gap:8px;margin-bottom:1.4rem;">'
+    f'<span style="width:7px;height:7px;border-radius:50%;background:{pill_color};display:inline-block;"></span>'
+    f'<span style="font-family:DM Mono,monospace;font-size:0.62rem;letter-spacing:2px;'
+    f'text-transform:uppercase;color:{pill_color};">{pill_text}</span></div>',
+    unsafe_allow_html=True,
+)
+page_header(
+    "◈ MNREGA · India · 2014–2024",
+    "SchemeImpactNet",
+    "Predictive impact analysis and budget optimisation for India's rural employment scheme",
+)
+# ── Data fetch ────────────────────────────────────────────────────────────────
+stats   = fetch_stats()
+pred_df = fetch_predictions()
+opt_df  = fetch_optimizer_results()
+# Derived KPIs
+n_dist    = stats.get("total_districts", "—")
+n_states  = stats.get("total_states", "—")
+yr_range  = stats.get("year_range", "—")
+total_pd  = stats.get("total_persondays_lakhs", 0)
+covid_pct = stats.get("covid_spike_pct", 0)
+nat_gain = gain_pct = 0.0
+if not opt_df.empty and "persondays_gain" in opt_df.columns:
+    nat_gain = opt_df["persondays_gain"].sum()
+    sq_sum   = opt_df["sq_persondays"].sum() if "sq_persondays" in opt_df.columns else 1
+    gain_pct = nat_gain / sq_sum * 100 if sq_sum else 0
+# ── KPI strip ─────────────────────────────────────────────────────────────────
+c1, c2, c3, c4, c5 = st.columns(5, gap="small")
+cards = [
+    (str(n_dist),          "Districts",       SAFFRON,  ""),
+    (str(n_states),        "States / UTs",    "#1C1917", ""),
+    (f"{total_pd:,.0f}L",  "Person-Days",     "#1C1917", "historical total"),
+    (f"{covid_pct:+.1f}%", "COVID-20 Spike",  RED,      "2020 peak"),
+    (f"{gain_pct:+.2f}%",  "LP Opt. Gain",    GREEN,    "budget-neutral"),
+]
+for col, (val, label, color, note) in zip([c1, c2, c3, c4, c5], cards):
+    with col:
+        st.markdown(kpi_html(val, label, color, note), unsafe_allow_html=True)
+st.markdown("<div style='margin-top:2rem'></div>", unsafe_allow_html=True)
+# ── Two-column layout ─────────────────────────────────────────────────────────
+left, right = st.columns([3, 2], gap="large")
+# ── LEFT: state bubble map ────────────────────────────────────────────────────
+STATE_COORDS = {
+    "Andhra Pradesh":      (15.9, 79.7), "Arunachal Pradesh": (28.2, 94.7),
+    "Assam":               (26.2, 92.9), "Bihar":             (25.1, 85.3),
+    "Chhattisgarh":        (21.3, 81.7), "Goa":               (15.3, 74.0),
+    "Gujarat":             (22.3, 71.2), "Haryana":           (29.1, 76.1),
+    "Himachal Pradesh":    (31.1, 77.2), "Jharkhand":         (23.6, 85.3),
+    "Karnataka":           (15.3, 75.7), "Kerala":            (10.9, 76.3),
+    "Madhya Pradesh":      (22.9, 78.7), "Maharashtra":       (19.7, 75.7),
+    "Manipur":             (24.7, 93.9), "Meghalaya":         (25.5, 91.4),
+    "Mizoram":             (23.2, 92.7), "Nagaland":          (26.2, 94.6),
+    "Odisha":              (20.9, 85.1), "Punjab":            (31.1, 75.3),
+    "Rajasthan":           (27.0, 74.2), "Sikkim":            (27.5, 88.5),
+    "Tamil Nadu":          (11.1, 78.7), "Telangana":         (17.4, 79.1),
+    "Tripura":             (23.9, 91.5), "Uttar Pradesh":     (26.8, 80.9),
+    "Uttarakhand":         (30.1, 79.3), "West Bengal":       (22.9, 87.9),
+    "Jammu and Kashmir":   (33.7, 76.9), "Ladakh":            (34.2, 77.6),
+    "Delhi":               (28.7, 77.1), "Puducherry":        (11.9, 79.8),
+}
+with left:
+    section_label("State-Level Employment · Latest Year")
+    if not pred_df.empty and "financial_year" in pred_df.columns:
+        ly = pred_df["financial_year"].max()
+        agg = (
+            pred_df[pred_df["financial_year"] == ly]
+            .groupby("state", as_index=False)
+            .agg(
+                pd_sum   =("person_days_lakhs",   "sum"),
+                pred_sum =("predicted_persondays", "sum"),
+                n_dist   =("district",             "count"),
+                avg_err  =("prediction_error",     "mean"),
+            )
+        )
+        rng = np.random.default_rng(42)
+        lats, lons, szs = [], [], []
+        for _, r in agg.iterrows():
+            lat, lon = STATE_COORDS.get(r["state"], (22.0, 78.0))
+            lats.append(lat + rng.uniform(-0.12, 0.12))
+            lons.append(lon + rng.uniform(-0.12, 0.12))
+            szs.append(float(r["pd_sum"]))
+        mn, mx = min(szs), max(szs)
+        bsz = [float(np.clip((v - mn) / (mx - mn + 1e-9) * 14 + 5, 5, 19)) for v in szs]
+        fig = go.Figure()
+        fig.add_scattergeo(
+            lat=lats, lon=lons, mode="markers",
+            marker=dict(
+                size=bsz, color=szs,
+                colorscale=SAFFRON_SCALE,
+                colorbar=dict(
+                    title=dict(text="Lakh PD", font=dict(color="#78716C", size=9)),
+                    tickfont=dict(color="#78716C", size=8),
+                    thickness=8, len=0.45,
+                    bgcolor="rgba(255,255,255,0.85)",
+                ),
+                opacity=0.88,
+                line=dict(width=1, color="#FFFFFF"),
+            ),
+            text=agg["state"],
+            customdata=list(zip(
+                agg["pd_sum"].round(1),
+                agg["pred_sum"].round(1),
+                agg["n_dist"],
+                agg["avg_err"].round(2),
+            )),
+            hovertemplate=(
+                "<b>%{text}</b><br>"
+                "Actual PD: <b>%{customdata[0]}L</b><br>"
+                "Predicted: <b>%{customdata[1]}L</b><br>"
+                "Districts: %{customdata[2]}<br>"
+                "Avg Model Error: %{customdata[3]}L"
+                "<extra></extra>"
+            ),
+        )
+        fig.update_geos(
+            scope="asia", showland=True, landcolor="#F5F5F4",
+            showocean=True, oceancolor="#EFF6FF",
+            showcountries=True, countrycolor="#D6D3D1",
+            showsubunits=True, subunitcolor="#E7E5E4",
+            center=dict(lat=22, lon=80), projection_scale=5.2,
+            bgcolor="rgba(0,0,0,0)",
+        )
+        fig.update_layout(
+            height=420, paper_bgcolor="rgba(0,0,0,0)",
+            margin=dict(l=0, r=0, t=0, b=0),
+            font=dict(family="DM Mono, monospace", color="#1C1917"),
+            showlegend=False,
+        )
+        st.plotly_chart(fig, use_container_width=True, config={"displayModeBar": False})
+        st.caption(f"FY {ly} · bubble size ∝ employment volume · hover for model predictions")
+    else:
+        st.info("Start the backend to load state-level data.")
+# ── RIGHT: brief + signals ────────────────────────────────────────────────────
+with right:
+    section_label("Intelligence Brief")
+    n_declining = n_underfunded = 0
+    top_state   = "—"
+    if not pred_df.empty:
+        ly = pred_df["financial_year"].max()
+        lat = pred_df[pred_df["financial_year"] == ly]
+        prv = pred_df[pred_df["financial_year"] == ly - 1]
+        if not prv.empty:
+            mg = lat.merge(
+                prv[["state", "district", "person_days_lakhs"]].rename(
+                    columns={"person_days_lakhs": "prev"}
+                ),
+                on=["state", "district"], how="left",
+            )
+            n_declining = int((mg["predicted_persondays"] < mg["prev"]).sum())
+    if not opt_df.empty and "budget_allocated_lakhs" in opt_df.columns:
+        th = opt_df["budget_allocated_lakhs"].quantile(0.33)
+        n_underfunded = int((opt_df["budget_allocated_lakhs"] < th).sum())
+    if not opt_df.empty and "persondays_gain" in opt_df.columns:
+        top_state = opt_df.groupby("state")["persondays_gain"].sum().idxmax()
+    gain_str = f"{nat_gain:+,.1f}L" if nat_gain else "—"
+    ly_label = pred_df["financial_year"].max() if not pred_df.empty else "—"
+    st.markdown(f"""
+<div style="background:#FFF7ED; border:1px solid #FED7AA; border-left:3px solid #FB923C;
+            border-radius:8px; padding:1.2rem 1.4rem; margin-bottom:1rem;">
+  <p style="font-family:'DM Mono',monospace; font-size:0.56rem; letter-spacing:2.5px;
+            text-transform:uppercase; color:#FB923C; margin:0 0 9px 0;">
+    ◈ Auto-generated · Pipeline FY {ly_label}</p>
+  <p style="font-family:'Source Serif 4',serif; font-size:0.88rem; color:#431407;
+            line-height:1.75; margin:0;">
+    Budget-neutral LP reallocation yields a projected
+    <strong>{gain_str}</strong> of additional employment —
+    a <strong>{gain_pct:+.2f}%</strong> uplift at zero additional outlay.
+    <strong>{n_declining} districts</strong> face declining employment trajectories.
+    Highest reallocation opportunity: <strong>{top_state}</strong>.
+    <strong>{n_underfunded} districts</strong> in the bottom budget tercile show
+    above-average delivery efficiency.
+  </p>
+</div>
+""", unsafe_allow_html=True)
+    section_label("Live Signals")
+    signals = [
+        (str(n_declining),   "High-Risk Districts",     "Predicted employment decline",          RED),
+        (str(n_underfunded), "Underfunded · High Eff.", "Bottom-tercile budget",                 AMBER),
+        (gain_str,           "LP Reallocation Gain",    f"Budget-neutral · {gain_pct:+.2f}%",    GREEN),
+        (str(n_dist),        "Districts in Model",      "GBR · Walk-fwd CV R²≈0.91",             SAFFRON),
+    ]
+    for val, title, body, accent in signals:
+        st.markdown(signal_card_html(val, title, body, accent), unsafe_allow_html=True)

frontend/pages/insights.py ADDED Viewed

	@@ -0,0 +1,278 @@

+# pages/insights.py — Strategic Insights & Policy Brief.
+import sys, os
+sys.path.insert(0, os.path.dirname(os.path.dirname(__file__)))
+import streamlit as st
+import plotly.graph_objects as go
+import plotly.express as px
+import pandas as pd
+import numpy as np
+from theme import inject_theme, page_header, section_label, kpi_html, signal_card_html, PLOTLY_LAYOUT, SAFFRON, GREEN, RED, AMBER, BLUE
+from utils.api_client import fetch_states, fetch_predictions, fetch_optimizer_results, fetch_yearly_trend
+inject_theme()
+page_header(
+    "◈ Module 06",
+    "Strategic Insights",
+    "Auto-generated policy intelligence — high-risk districts, efficiency leaders, and reallocation priorities",
+)
+states = fetch_states()
+if not states:
+    st.error("⚠️ API offline — run `uvicorn backend.main:app --port 8000`")
+    st.stop()
+cs, _ = st.columns([1, 2])
+with cs:
+    scope = st.selectbox("State Scope", ["All India"] + states)
+state_param = None if scope == "All India" else scope
+pred_df = fetch_predictions(state=state_param)
+opt_df  = fetch_optimizer_results(state=state_param)
+trend   = fetch_yearly_trend(state_param)
+if pred_df.empty:
+    st.info("No data — run the pipeline first.")
+    st.stop()
+st.markdown("---")
+# ── Section A: Declining districts ───────────────────────────────────────────
+section_label("A. High-Risk Districts — Declining Employment Trajectory")
+ly  = pred_df["financial_year"].max()
+prv = ly - 1
+lat = pred_df[pred_df["financial_year"] == ly].copy()
+prv_df = pred_df[pred_df["financial_year"] == prv].copy()
+if not prv_df.empty:
+    mg = lat.merge(
+        prv_df[["state", "district", "person_days_lakhs"]].rename(
+            columns={"person_days_lakhs": "prev_actual"}
+        ),
+        on=["state", "district"], how="inner",
+    )
+    mg["predicted_chg"]    = mg["predicted_persondays"] - mg["prev_actual"]
+    mg["predicted_chg_pct"]= (mg["predicted_chg"] / mg["prev_actual"] * 100).round(2)
+    declining = mg[mg["predicted_chg"] < 0].copy().nsmallest(20, "predicted_chg")
+    declining["label"] = declining["district"] + " · " + declining["state"]
+    if not declining.empty:
+        col_risk, col_info = st.columns([2, 1])
+        with col_risk:
+            fig1 = go.Figure()
+            fig1.add_bar(
+                x=declining["predicted_chg"],
+                y=declining["label"],
+                orientation="h",
+                marker=dict(
+                    color=declining["predicted_chg_pct"],
+                    colorscale=[[0, "#7F1D1D"], [1, "#FCA5A5"]],
+                    showscale=False,
+                    opacity=0.85,
+                ),
+                customdata=list(zip(
+                    declining["state"], declining["district"],
+                    declining["prev_actual"].round(2),
+                    declining["predicted_persondays"].round(2),
+                    declining["predicted_chg"].round(2),
+                    declining["predicted_chg_pct"],
+                )),
+                hovertemplate=(
+                    "<b>%{customdata[1]}</b> · %{customdata[0]}<br>"
+                    "Actual: %{customdata[2]}L<br>"
+                    "Predicted: %{customdata[3]}L<br>"
+                    "Change: <b>%{customdata[4]:+.2f}L</b> (%{customdata[5]:+.1f}%)"
+                    "<extra></extra>"
+                ),
+            )
+            l1 = {**PLOTLY_LAYOUT}
+            l1.update(dict(
+                height=max(380, len(declining) * 26),
+                title=dict(text=f"Districts with Declining Predicted Employment · FY{prv}→{ly}",
+                           font=dict(family="Fraunces, serif", size=13, color="#1C1917")),
+                xaxis=dict(**PLOTLY_LAYOUT["xaxis"], title="Predicted Change (Lakh PD)"),
+                yaxis=dict(**PLOTLY_LAYOUT["yaxis"]),
+                bargap=0.28, showlegend=False,
+            ))
+            fig1.update_layout(**l1)
+            st.plotly_chart(fig1, width="stretch", config={"displayModeBar": False})
+        with col_info:
+            st.markdown(f"""
+<div style="background:#FEF2F2; border:1px solid #FECACA; border-left:3px solid #DC2626;
+            border-radius:8px; padding:1.1rem 1.2rem; margin-bottom:0.8rem;">
+  <p style="font-family:'DM Mono',monospace; font-size:0.56rem; letter-spacing:2px;
+            text-transform:uppercase; color:#DC2626; margin:0 0 8px 0;">Risk Alert</p>
+  <p style="font-family:'Fraunces',serif; font-size:1.6rem; font-weight:600;
+            color:#7F1D1D; margin:0 0 4px 0;">{len(declining)}</p>
+  <p style="font-family:'Source Serif 4',serif; font-size:0.82rem; color:#991B1B;
+            margin:0; line-height:1.5;">
+    Districts predicted to see employment decline next cycle.
+    Avg change: <strong>{declining['predicted_chg'].mean():+.2f}L</strong> person-days.
+  </p>
+</div>
+<div style="background:#FFFFFF; border:1px solid #E7E5E4;
+            border-radius:8px; padding:1rem 1.1rem;">
+  <p style="font-family:'DM Mono',monospace; font-size:0.56rem; letter-spacing:2px;
+            text-transform:uppercase; color:#A8A29E; margin:0 0 8px 0;">Worst Decline</p>
+  <p style="font-family:'Fraunces',serif; font-size:1.1rem; font-weight:600;
+            color:#1C1917; margin:0 0 2px 0;">{declining.iloc[0]['district']}</p>
+  <p style="font-family:'DM Mono',monospace; font-size:0.62rem; color:#78716C; margin:0;">
+    {declining.iloc[0]['state']} · {declining.iloc[0]['predicted_chg']:+.2f}L
+  </p>
+</div>
+""", unsafe_allow_html=True)
+    else:
+        st.success("✅ No districts show predicted employment decline.")
+else:
+    st.info("Previous year data unavailable for trend comparison.")
+st.markdown("---")
+# ── Section B: Efficiency leaders & laggards ──────────────────────────────────
+section_label("B. Cost Efficiency — Leaders & Laggards")
+eff_df = (
+    pred_df.groupby(["state", "district"], as_index=False)
+    .agg(
+        avg_actual      =("person_days_lakhs",   "mean"),
+        avg_predicted   =("predicted_persondays", "mean"),
+        avg_error       =("prediction_error",     "mean"),
+    )
+)
+if not opt_df.empty and "persondays_per_lakh" in opt_df.columns:
+    eff_sub = opt_df[["state", "district", "persondays_per_lakh"]].drop_duplicates(["state", "district"])
+    eff_df  = eff_df.merge(eff_sub, on=["state", "district"], how="left")
+    top_eff = eff_df.nlargest(12, "persondays_per_lakh")
+    bot_eff = eff_df.nsmallest(12, "persondays_per_lakh")
+    col_e1, col_e2 = st.columns(2)
+    for col_e, sub, title_str, c in [
+        (col_e1, top_eff, "Top 12 Most Efficient", GREEN),
+        (col_e2, bot_eff, "Bottom 12 Least Efficient", RED),
+    ]:
+        with col_e:
+            sub = sub.copy()
+            sub["label"] = sub["district"] + " · " + sub["state"]
+            fig_e = go.Figure()
+            fig_e.add_bar(
+                x=sub["persondays_per_lakh"],
+                y=sub["label"],
+                orientation="h",
+                marker=dict(color=c, opacity=0.78),
+                hovertemplate="<b>%{y}</b><br>%{x:.4f} PD/₹L<extra></extra>",
+            )
+            l_e = {**PLOTLY_LAYOUT}
+            l_e.update(dict(
+                height=340,
+                title=dict(text=title_str, font=dict(family="Fraunces, serif", size=13, color="#1C1917")),
+                xaxis=dict(**PLOTLY_LAYOUT["xaxis"], title="PD per ₹ Lakh"),
+                yaxis=dict(**PLOTLY_LAYOUT["yaxis"], autorange="reversed"),
+                bargap=0.25, showlegend=False,
+            ))
+            fig_e.update_layout(**l_e)
+            st.plotly_chart(fig_e, width="stretch", config={"displayModeBar": False})
+else:
+    st.info("Run optimizer pipeline to see efficiency rankings.")
+st.markdown("---")
+# ── Section C: State-level LP opportunities ───────────────────────────────────
+section_label("C. LP Reallocation Opportunities by State")
+if not opt_df.empty and "persondays_gain" in opt_df.columns:
+    state_gain = (
+        opt_df.groupby("state", as_index=False)
+        .agg(
+            total_gain =("persondays_gain",        "sum"),
+            n_districts=("district",               "count"),
+            avg_eff    =("persondays_per_lakh",    "mean"),
+            total_bud  =("budget_allocated_lakhs", "sum"),
+        )
+        .sort_values("total_gain", ascending=False)
+    )
+    state_gain["gain_per_dist"] = (state_gain["total_gain"] / state_gain["n_districts"]).round(3)
+    fig_s = go.Figure()
+    fig_s.add_bar(
+        x=state_gain["state"],
+        y=state_gain["total_gain"],
+        marker=dict(
+            color=state_gain["total_gain"],
+            colorscale=[[0, "#FEF3C7"], [0.5, "#FB923C"], [1, "#7C2D12"]],
+            showscale=False,
+            opacity=0.85,
+        ),
+        customdata=list(zip(
+            state_gain["state"],
+            state_gain["total_gain"].round(2),
+            state_gain["n_districts"],
+            state_gain["avg_eff"].round(4),
+            state_gain["total_bud"].round(0),
+        )),
+        hovertemplate=(
+            "<b>%{customdata[0]}</b><br>"
+            "Total PD Gain: <b>%{customdata[1]:+.2f}L</b><br>"
+            "Districts: %{customdata[2]}<br>"
+            "Avg Efficiency: %{customdata[3]} PD/₹L<br>"
+            "Total Budget: ₹%{customdata[4]:,.0f}L"
+            "<extra></extra>"
+        ),
+    )
+    l_s = {**PLOTLY_LAYOUT}
+    l_s.update(dict(
+        height=360,
+        title=dict(text="Total LP Person-Day Gain by State",
+                   font=dict(family="Fraunces, serif", size=14, color="#1C1917")),
+        xaxis=dict(**PLOTLY_LAYOUT["xaxis"], title="State", tickangle=-35),
+        yaxis=dict(**PLOTLY_LAYOUT["yaxis"], title="Total PD Gain (Lakh)"),
+        bargap=0.3,
+    ))
+    fig_s.update_layout(**l_s)
+    st.plotly_chart(fig_s, width="stretch", config={"displayModeBar": False})
+    with st.expander("📋 State-Level Summary Table"):
+        st.dataframe(state_gain.round(3), width="stretch", hide_index=True)
+else:
+    st.info("No optimizer data — run `python main.py --stage 3`.")
+st.markdown("---")
+# ── Section D: National trend analysis ───────────────────────────────────────
+section_label("D. National Employment Trend & COVID Impact")
+if not trend.empty:
+    fig_t = go.Figure()
+    fig_t.add_scatter(
+        x=trend["financial_year"], y=trend["total_persondays"],
+        name="Total PD (Lakh)", mode="lines+markers",
+        fill="tozeroy", fillcolor="rgba(251,146,60,0.07)",
+        line=dict(color=SAFFRON, width=2.5),
+        marker=dict(size=7, color=SAFFRON),
+    )
+    if 2020 in trend["financial_year"].values:
+        fig_t.add_vline(
+            x=2020, line_dash="dot", line_color=RED, line_width=1.5,
+            annotation_text="COVID surge",
+            annotation_font=dict(color=RED, size=9, family="DM Mono, monospace"),
+        )
+    l_t = {**PLOTLY_LAYOUT}
+    l_t.update(dict(
+        height=260,
+        title=dict(text="National Person-Days Trend",
+                   font=dict(family="Fraunces, serif", size=13, color="#1C1917")),
+        xaxis=dict(**PLOTLY_LAYOUT["xaxis"], title="Financial Year", dtick=1),
+        yaxis=dict(**PLOTLY_LAYOUT["yaxis"], title="Lakh PD"),
+        showlegend=False,
+    ))
+    fig_t.update_layout(**l_t)
+    st.plotly_chart(fig_t, width="stretch", config={"displayModeBar": False})

frontend/pages/optimizer.py ADDED Viewed

	@@ -0,0 +1,240 @@

+# pages/optimizer.py — Budget reallocation optimizer results and live LP runner.
+import sys, os
+sys.path.insert(0, os.path.dirname(os.path.dirname(__file__)))
+import streamlit as st
+import plotly.graph_objects as go
+import plotly.express as px
+import pandas as pd
+from theme import inject_theme, page_header, section_label, kpi_html, PLOTLY_LAYOUT, SAFFRON, GREEN, RED, AMBER
+from utils.api_client import fetch_states, fetch_optimizer_results, run_optimizer_live
+inject_theme()
+page_header(
+    "◈ Module 04",
+    "Budget Optimizer",
+    "SciPy LP two-stage proportional reallocation — maximize employment at zero additional cost",
+)
+# ── Tabs: pre-computed vs live ────────────────────────────────────────────────
+tab1, tab2 = st.tabs(["Pre-Computed Results", "Run Live Optimizer"])
+# ══════════════════════════════════════════════════════════════════════════════
+# TAB 1 — Pre-computed results
+# ══════════════════════════════════════════════════════════════════════════════
+with tab1:
+    states = fetch_states()
+    if not states:
+        st.error("⚠️ API offline — run `uvicorn backend.main:app --port 8000`")
+        st.stop()
+    cs, _ = st.columns([1, 2])
+    with cs:
+        scope = st.selectbox("State Filter", ["All-India"] + states, key="pre_scope")
+    state_param = None if scope == "All-India" else scope
+    df = fetch_optimizer_results(state_param)
+    if df.empty:
+        st.info("No optimizer results — run the pipeline first: `python main.py --stage 3`")
+    else:
+        # ── Summary KPIs ──────────────────────────────────────────────────────
+        sq_total  = df["sq_persondays"].sum()
+        opt_total = df["opt_persondays"].sum() if "opt_persondays" in df.columns else sq_total + df["persondays_gain"].sum()
+        gain      = df["persondays_gain"].sum()
+        gain_pct  = gain / sq_total * 100 if sq_total else 0
+        tot_bud   = df["budget_allocated_lakhs"].sum() if "budget_allocated_lakhs" in df.columns else 0
+        n_gain    = int((df["persondays_gain"] > 0).sum())
+        n_cut     = int((df["persondays_gain"] <= 0).sum())
+        kc1, kc2, kc3, kc4, kc5 = st.columns(5)
+        with kc1: st.markdown(kpi_html(f"{sq_total:,.0f}L",  "Status Quo PD",   "#1C1917"), unsafe_allow_html=True)
+        with kc2: st.markdown(kpi_html(f"{opt_total:,.0f}L", "Optimized PD",    GREEN),     unsafe_allow_html=True)
+        with kc3: st.markdown(kpi_html(f"{gain:+,.1f}L",     "Net Gain",        GREEN,      "lakh person-days"), unsafe_allow_html=True)
+        with kc4: st.markdown(kpi_html(f"{gain_pct:+.2f}%",  "% Uplift",        GREEN,      "budget-neutral"), unsafe_allow_html=True)
+        with kc5: st.markdown(kpi_html(f"₹{tot_bud:,.0f}L",  "Total Budget",    "#1C1917",  "unchanged"), unsafe_allow_html=True)
+        st.markdown("<div style='margin-top:1.5rem'></div>", unsafe_allow_html=True)
+        # ── Budget change waterfall — top movers ──────────────────────────────
+        section_label("Top Budget Movers")
+        top_gain = df.nlargest(10, "persondays_gain").copy()
+        top_cut  = df.nsmallest(10, "persondays_gain").copy()
+        show     = pd.concat([top_gain, top_cut]).drop_duplicates().sort_values("persondays_gain")
+        show["label"] = show["district"] + " · " + show["state"]
+        fig1 = go.Figure()
+        fig1.add_bar(
+            x=show["persondays_gain"],
+            y=show["label"],
+            orientation="h",
+            marker=dict(
+                color=[GREEN if v > 0 else RED for v in show["persondays_gain"]],
+                opacity=0.8,
+            ),
+            customdata=list(zip(
+                show["state"], show["district"],
+                show["budget_allocated_lakhs"].round(0) if "budget_allocated_lakhs" in show else [0]*len(show),
+                show.get("budget_change_pct", pd.Series([0]*len(show))).round(1),
+                show["persondays_gain"].round(2),
+                show.get("persondays_per_lakh", pd.Series([0]*len(show))).round(4),
+            )),
+            hovertemplate=(
+                "<b>%{customdata[1]}</b> · %{customdata[0]}<br>"
+                "Budget: ₹%{customdata[2]:,.0f}L → %{customdata[3]:+.1f}%<br>"
+                "PD Gain: <b>%{customdata[4]:+.2f}L</b><br>"
+                "Efficiency: %{customdata[5]} PD/₹L"
+                "<extra></extra>"
+            ),
+        )
+        fig1.add_vline(x=0, line_dash="solid", line_color="#1C1917", line_width=1)
+        l1 = {**PLOTLY_LAYOUT}
+        l1.update(dict(
+            height=520,
+            title=dict(text="Person-Day Gain by District (Top 10 + Bottom 10)",
+                       font=dict(family="Fraunces, serif", size=14, color="#1C1917")),
+            xaxis=dict(**PLOTLY_LAYOUT["xaxis"], title="Person-Day Gain (Lakh)"),
+            yaxis=dict(**PLOTLY_LAYOUT["yaxis"]),
+            showlegend=False,
+            bargap=0.3,
+        ))
+        fig1.update_layout(**l1)
+        st.plotly_chart(fig1, use_container_width=True, config={"displayModeBar": False})
+        # ── Efficiency vs budget change scatter ───────────────────────────────
+        section_label("Efficiency vs Budget Reallocation")
+        if "persondays_per_lakh" in df.columns and "budget_change_pct" in df.columns:
+            fig2 = go.Figure()
+            fig2.add_scatter(
+                x=df["persondays_per_lakh"],
+                y=df["budget_change_pct"],
+                mode="markers",
+                marker=dict(
+                    color=df["persondays_gain"],
+                    colorscale=[[0, RED], [0.5, "#FED7AA"], [1, GREEN]],
+                    size=5, opacity=0.65,
+                    colorbar=dict(
+                        title=dict(text="PD Gain", font=dict(color="#78716C", size=9)),
+                        tickfont=dict(color="#78716C", size=8),
+                        thickness=8, len=0.5,
+                    ),
+                ),
+                customdata=list(zip(
+                    df["state"], df["district"],
+                    df["budget_change_pct"].round(1),
+                    df["persondays_gain"].round(2),
+                )),
+                hovertemplate=(
+                    "<b>%{customdata[1]}</b> · %{customdata[0]}<br>"
+                    "Budget Δ: %{customdata[2]:+.1f}%<br>"
+                    "PD Gain: %{customdata[3]:+.2f}L"
+                    "<extra></extra>"
+                ),
+            )
+            fig2.add_hline(y=0, line_dash="dot", line_color="#1C1917", line_width=1)
+            l2 = {**PLOTLY_LAYOUT}
+            l2.update(dict(
+                height=340,
+                title=dict(text="Efficiency (PD/₹ Lakh) vs Budget Change %",
+                           font=dict(family="Fraunces, serif", size=13, color="#1C1917")),
+                xaxis=dict(**PLOTLY_LAYOUT["xaxis"], title="PD per ₹ Lakh"),
+                yaxis=dict(**PLOTLY_LAYOUT["yaxis"], title="Budget Change (%)"),
+                showlegend=False,
+            ))
+            fig2.update_layout(**l2)
+            st.plotly_chart(fig2, use_container_width=True, config={"displayModeBar": False})
+        # ── Full table ────────────────────────────────────────────────────────
+        with st.expander("📋 Full Reallocation Table"):
+            show_cols = [c for c in [
+                "state", "district", "budget_allocated_lakhs", "optimized_budget",
+                "budget_change_pct", "sq_persondays", "opt_persondays",
+                "persondays_gain", "persondays_gain_pct", "persondays_per_lakh",
+            ] if c in df.columns]
+            styled = df[show_cols].round(3).sort_values("persondays_gain", ascending=False)
+            st.dataframe(styled, use_container_width=True, hide_index=True)
+# ══════════════════════════════════════════════════════════════════════════════
+# TAB 2 — Live optimizer
+# ══════════════════════════════════════════════════════════════════════════════
+with tab2:
+    st.markdown("""
+<p style="font-family:'Source Serif 4',serif; font-size:0.9rem; color:#57534E;
+          line-height:1.7; margin-bottom:1.5rem;">
+  Run the SciPy linear-programming optimizer live with custom parameters.
+  Results are computed in real-time using the latest district predictions from the database.
+</p>
+""", unsafe_allow_html=True)
+    ca, cb = st.columns(2)
+    states2 = fetch_states() or []
+    with ca:
+        scope2      = st.selectbox("State (or All-India)", ["All-India"] + states2, key="live_scope")
+        budget_scale = st.slider("Budget Scale", 0.8, 1.5, 1.0, 0.05,
+                                  help="1.0 = same total budget; 1.1 = +10% more funds")
+    with cb:
+        min_frac = st.slider("Min Allocation (floor)", 0.10, 0.60, 0.40, 0.05,
+                              help="No district drops below this fraction of its current budget")
+        max_frac = st.slider("Max Allocation (cap)", 1.5, 3.0, 2.5, 0.1,
+                              help="No district exceeds this multiple of its current budget")
+    if st.button("�� Run Optimizer", type="primary"):
+        with st.spinner("Running LP optimization…"):
+            result = run_optimizer_live(
+                state=None if scope2 == "All-India" else scope2,
+                budget_scale=budget_scale,
+                min_fraction=min_frac,
+                max_fraction=max_frac,
+            )
+        if result:
+            st.success(
+                f"✅ Optimization complete — "
+                f"Gain: **{result['gain_lakhs']:+,.2f}L** person-days "
+                f"({result['gain_pct']:+.2f}%) · "
+                f"Total budget: ₹{result['total_budget_lakhs']:,.0f}L"
+            )
+            # Summary metrics
+            m1, m2, m3, m4 = st.columns(4)
+            m1.metric("SQ Person-Days",  f"{result['sq_persondays_total']:,.1f}L")
+            m2.metric("Opt Person-Days", f"{result['opt_persondays_total']:,.1f}L")
+            m3.metric("Net Gain",        f"{result['gain_lakhs']:+,.2f}L")
+            m4.metric("% Uplift",        f"{result['gain_pct']:+.2f}%")
+            # District breakdown
+            if result.get("districts"):
+                dist_df = pd.DataFrame(result["districts"])
+                section_label("District Reallocation Details")
+                top10 = dist_df.nlargest(10, "persondays_gain")
+                top10["label"] = top10["district"] + " · " + top10["state"]
+                fig_live = go.Figure()
+                fig_live.add_bar(
+                    x=top10["persondays_gain"], y=top10["label"],
+                    orientation="h",
+                    marker=dict(color=GREEN, opacity=0.8),
+                    hovertemplate=(
+                        "<b>%{y}</b><br>PD Gain: <b>%{x:+.2f}L</b><extra></extra>"
+                    ),
+                )
+                l_live = {**PLOTLY_LAYOUT}
+                l_live.update(dict(
+                    height=380, showlegend=False, bargap=0.3,
+                    title=dict(text="Top 10 Districts to Increase",
+                               font=dict(family="Fraunces, serif", size=13, color="#1C1917")),
+                    xaxis=dict(**PLOTLY_LAYOUT["xaxis"], title="PD Gain (Lakh)"),
+                    yaxis=dict(**PLOTLY_LAYOUT["yaxis"]),
+                ))
+                fig_live.update_layout(**l_live)
+                st.plotly_chart(fig_live, use_container_width=True,
+                                config={"displayModeBar": False})
+                with st.expander("📋 Full Live Results Table"):
+                    st.dataframe(dist_df.round(3), use_container_width=True, hide_index=True)

frontend/pages/overview.py ADDED Viewed

	@@ -0,0 +1,159 @@

+# pages/overview.py — National MNREGA trend overview.
+import sys, os
+sys.path.insert(0, os.path.dirname(os.path.dirname(__file__)))
+import streamlit as st
+import plotly.graph_objects as go
+from theme import inject_theme, page_header, section_label, PLOTLY_LAYOUT, SAFFRON, GREEN, RED
+from utils.api_client import fetch_stats, fetch_states, fetch_yearly_trend, fetch_top_districts
+inject_theme()
+page_header(
+    "◈ Module 01",
+    "Overview",
+    "Longitudinal MNREGA performance across India — employment and wage trends",
+)
+# ── Stats KPIs ────────────────────────────────────────────────────────────────
+stats = fetch_stats()
+if stats:
+    c1, c2, c3, c4, c5 = st.columns(5)
+    c1.metric("States",      stats.get("total_states", "—"))
+    c2.metric("Districts",   stats.get("total_districts", "—"))
+    c3.metric("Period",      stats.get("year_range", "—"))
+    c4.metric("Total PD",    f"{stats.get('total_persondays_lakhs', 0):,.0f}L")
+    c5.metric("COVID Spike", f"{stats.get('covid_spike_pct', 0):.1f}%", delta="2020 peak")
+else:
+    st.warning("⚠️ Backend offline — run `uvicorn backend.main:app --port 8000`")
+    st.stop()
+st.markdown("---")
+# ── Scope selector ────────────────────────────────────────────────────────────
+states_list = fetch_states()
+col_sel, _ = st.columns([1, 2])
+with col_sel:
+    scope = st.selectbox("Geographic Scope", ["All-India"] + states_list)
+state_param = None if scope == "All-India" else scope
+# ── Trend chart ───────────────────────────────────────────────────────────────
+section_label("Employment Trend")
+df_trend = fetch_yearly_trend(state_param)
+if not df_trend.empty:
+    fig = go.Figure()
+    fig.add_bar(
+        x=df_trend["financial_year"],
+        y=df_trend["total_persondays"],
+        name="Person-Days (lakh)",
+        marker=dict(color=SAFFRON, opacity=0.78),
+    )
+    # Wage on secondary axis if available
+    if "avg_wage" in df_trend.columns:
+        fig.add_scatter(
+            x=df_trend["financial_year"],
+            y=df_trend["avg_wage"],
+            name="Avg Wage Rate (₹/day)",
+            yaxis="y2",
+            mode="lines+markers",
+            line=dict(color=GREEN, width=2.5),
+            marker=dict(size=6, color=GREEN),
+        )
+    if 2020 in df_trend["financial_year"].values:
+        fig.add_vline(
+            x=2020, line_dash="dot", line_color=RED, line_width=1.5,
+            annotation_text="COVID-19",
+            annotation_font=dict(color=RED, size=9, family="DM Mono, monospace"),
+            annotation_position="top right",
+        )
+    if 2022 in df_trend["financial_year"].values:
+        fig.add_vline(
+            x=2022, line_dash="dot", line_color="#A8A29E", line_width=1,
+            annotation_text="WB anomaly",
+            annotation_font=dict(color="#A8A29E", size=9, family="DM Mono, monospace"),
+            annotation_position="top left",
+        )
+    layout = {**PLOTLY_LAYOUT}
+    layout.update(dict(
+        title=dict(
+            text=f"MNREGA Employment Trend — {scope}",
+            font=dict(family="Fraunces, serif", size=15, color="#1C1917"),
+        ),
+        hovermode="x unified",
+        height=420,
+        bargap=0.35,
+        yaxis=dict(**PLOTLY_LAYOUT["yaxis"], title="Person-Days (lakh)"),
+        yaxis2=dict(
+            title="Avg Wage Rate (₹/day)", overlaying="y", side="right",
+            gridcolor="rgba(0,0,0,0)",
+            tickfont=dict(color="#78716C", size=10),
+            title_font=dict(color="#57534E", size=11),
+        ),
+        legend=dict(**PLOTLY_LAYOUT["legend"], orientation="h", y=1.08, x=0),
+    ))
+    fig.update_layout(**layout)
+    st.plotly_chart(fig, use_container_width=True, config={"displayModeBar": False})
+    st.caption("Source: MNREGA MIS · Ministry of Rural Development · Annual district-level aggregates")
+else:
+    st.info("No trend data — API offline or pipeline not yet run.")
+st.markdown("---")
+# ── District ranking ──────────────────────────────────────────────────────────
+section_label("District Performance Benchmarking")
+cm, cn = st.columns([2, 1])
+with cm:
+    # V3: only person_days_lakhs is a real non-synthetic column
+    metric = "person_days_lakhs"
+    st.markdown(
+        '<p style="font-family:\'DM Mono\',monospace; font-size:0.65rem; '
+        'letter-spacing:1.5px; text-transform:uppercase; color:#78716C; margin-bottom:4px;">'
+        'Ranking Metric</p>'
+        '<p style="font-size:0.9rem; color:#1C1917; margin:0;">Employment Volume (Lakh Person-Days)</p>',
+        unsafe_allow_html=True
+    )
+with cn:
+    n_top = st.slider("Top N Districts", 5, 30, 15)
+df_top = fetch_top_districts(state_param, metric, n_top)
+if not df_top.empty:
+    df_top["label"] = df_top["district"] + " · " + df_top["state"]
+    fig2 = go.Figure()
+    fig2.add_bar(
+        x=df_top["avg_persondays"],
+        y=df_top["label"],
+        orientation="h",
+        marker=dict(
+            color=df_top["avg_persondays"],
+            colorscale=[[0, "#FED7AA"], [1, "#9A3412"]],
+            showscale=False,
+        ),
+        customdata=list(zip(df_top["state"], df_top["district"], df_top["avg_persondays"].round(2))),
+        hovertemplate=(
+            "<b>%{customdata[1]}</b> · %{customdata[0]}<br>"
+            "Avg Person-Days: <b>%{customdata[2]}L</b><extra></extra>"
+        ),
+    )
+    layout2 = {**PLOTLY_LAYOUT}
+    layout2.update(dict(
+        title=dict(
+            text=f"Top {n_top} Districts — Employment Volume",
+            font=dict(family="Fraunces, serif", size=14, color="#1C1917"),
+        ),
+        height=max(380, n_top * 30),
+        xaxis=dict(**PLOTLY_LAYOUT["xaxis"], title="Avg Lakh Person-Days"),
+        yaxis=dict(**PLOTLY_LAYOUT["yaxis"], autorange="reversed"),
+    ))
+    fig2.update_layout(**layout2)
+    st.plotly_chart(fig2, use_container_width=True, config={"displayModeBar": False})
+else:
+    st.info("No ranking data available.")

frontend/pages/predictions.py ADDED Viewed

	@@ -0,0 +1,255 @@

+# pages/predictions.py — GBR V3 model predictions and error analysis.
+import sys, os
+sys.path.insert(0, os.path.dirname(os.path.dirname(__file__)))
+import streamlit as st
+import plotly.graph_objects as go
+import numpy as np
+from theme import inject_theme, page_header, section_label, kpi_html, PLOTLY_LAYOUT, SAFFRON, GREEN, RED
+from utils.api_client import fetch_states, fetch_districts, fetch_predictions
+inject_theme()
+page_header(
+    "◈ Module 03",
+    "Predictions",
+    "GBR V3 district-level employment forecasts — walk-forward CV R²≈0.91 (excl. 2022 anomaly)",
+)
+# ── Filters ───────────────────────────────────────────────────────────────────
+states = fetch_states()
+if not states:
+    st.error("⚠️ API offline — run `uvicorn backend.main:app --port 8000`")
+    st.stop()
+c1, c2, c3 = st.columns(3)
+with c1:
+    scope = st.selectbox("State", ["All States"] + states)
+with c2:
+    state_param = None if scope == "All States" else scope
+    districts = ["All Districts"] + fetch_districts(state_param) if state_param else ["All Districts"]
+    dist_sel = st.selectbox("District", districts)
+with c3:
+    df_all = fetch_predictions(state=state_param)
+    years  = sorted(df_all["financial_year"].unique().tolist()) if not df_all.empty else []
+    yr_sel = st.selectbox("Year", ["All Years"] + years)
+# Apply filters
+df = fetch_predictions(
+    state=state_param,
+    district=None if dist_sel == "All Districts" else dist_sel,
+    year=None if yr_sel == "All Years" else int(yr_sel),
+)
+if df.empty:
+    st.info("No prediction data for selected filters.")
+    st.stop()
+# ── Model KPIs ────────────────────────────────────────────────────────────────
+from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
+import warnings
+warnings.filterwarnings("ignore")
+try:
+    rmse = np.sqrt(mean_squared_error(df["person_days_lakhs"], df["predicted_persondays"]))
+    mae  = mean_absolute_error(df["person_days_lakhs"], df["predicted_persondays"])
+    r2   = r2_score(df["person_days_lakhs"], df["predicted_persondays"])
+    bias = (df["predicted_persondays"] - df["person_days_lakhs"]).mean()
+    c1, c2, c3, c4 = st.columns(4)
+    c1.metric("R² Score",  f"{r2:.4f}")
+    c2.metric("RMSE",      f"{rmse:.3f}L")
+    c3.metric("MAE",       f"{mae:.3f}L")
+    c4.metric("Mean Bias", f"{bias:+.3f}L")
+except Exception:
+    pass
+# ── Model info callout ────────────────────────────────────────────────────────
+st.markdown("""
+<div style="background:#F0FDF4; border:1px solid #BBF7D0; border-left:3px solid #16A34A;
+            border-radius:8px; padding:0.9rem 1.1rem; margin:1rem 0;">
+  <p style="font-family:'DM Mono',monospace; font-size:0.56rem; letter-spacing:2px;
+            text-transform:uppercase; color:#16A34A; margin:0 0 6px 0;">V3 Leak-Free Model</p>
+  <p style="font-family:'Source Serif 4',serif; font-size:0.85rem; color:#14532D;
+            line-height:1.65; margin:0;">
+    GradientBoostingRegressor · 17 lag-based features · Walk-forward CV
+    · R²=0.91 excl. 2022 · Previous R²=0.9963 was data leakage
+    (<code>works_completed</code> r=1.0 with target).
+    2022 West Bengal reporting anomaly (−93 to −98% drop) is structurally unpredictable.
+  </p>
+</div>
+""", unsafe_allow_html=True)
+st.markdown("---")
+col_left, col_right = st.columns(2)
+# ── Actual vs Predicted scatter ───────────────────────────────────────────────
+with col_left:
+    section_label("Actual vs Predicted")
+    fig1 = go.Figure()
+    lim_mn = min(df["person_days_lakhs"].min(), df["predicted_persondays"].min()) * 0.92
+    lim_mx = max(df["person_days_lakhs"].max(), df["predicted_persondays"].max()) * 1.06
+    fig1.add_scatter(
+        x=[lim_mn, lim_mx], y=[lim_mn, lim_mx],
+        mode="lines",
+        line=dict(color="#E7E5E4", width=1.5, dash="dot"),
+        name="Perfect prediction",
+        hoverinfo="skip",
+    )
+    fig1.add_scatter(
+        x=df["person_days_lakhs"],
+        y=df["predicted_persondays"],
+        mode="markers",
+        marker=dict(
+            color=df["prediction_error"].abs(),
+            colorscale=[[0, SAFFRON], [1, RED]],
+            size=5, opacity=0.65,
+            colorbar=dict(
+                title=dict(text="|Error|L", font=dict(color="#78716C", size=9)),
+                tickfont=dict(color="#78716C", size=8),
+                thickness=8, len=0.5,
+            ),
+        ),
+        customdata=list(zip(
+            df["state"], df["district"],
+            df["financial_year"],
+            df["person_days_lakhs"].round(2),
+            df["predicted_persondays"].round(2),
+            df["prediction_error"].round(2),
+        )),
+        hovertemplate=(
+            "<b>%{customdata[1]}</b> · %{customdata[0]}<br>"
+            "FY: %{customdata[2]}<br>"
+            "Actual: <b>%{customdata[3]}L</b><br>"
+            "Predicted: <b>%{customdata[4]}L</b><br>"
+            "Error: %{customdata[5]}L"
+            "<extra></extra>"
+        ),
+        name="Districts",
+    )
+    l1 = {**PLOTLY_LAYOUT}
+    l1.update(dict(
+        height=370,
+        title=dict(text="Actual vs Predicted Person-Days",
+                   font=dict(family="Fraunces, serif", size=13, color="#1C1917")),
+        xaxis=dict(**PLOTLY_LAYOUT["xaxis"], title="Actual (Lakh PD)", range=[lim_mn, lim_mx]),
+        yaxis=dict(**PLOTLY_LAYOUT["yaxis"], title="Predicted (Lakh PD)", range=[lim_mn, lim_mx]),
+        showlegend=False,
+    ))
+    fig1.update_layout(**l1)
+    st.plotly_chart(fig1, use_container_width=True, config={"displayModeBar": False})
+# ── Error distribution ────────────────────────────────────────────────────────
+with col_right:
+    section_label("Prediction Error Distribution")
+    errors = df["prediction_error"]
+    fig2 = go.Figure()
+    fig2.add_histogram(
+        x=errors, nbinsx=40,
+        marker=dict(color=SAFFRON, opacity=0.75, line=dict(color="#FFFFFF", width=0.5)),
+        hovertemplate="Error: %{x:.2f}L<br>Count: %{y}<extra></extra>",
+    )
+    fig2.add_vline(x=0, line_dash="dot", line_color="#1C1917", line_width=1.5)
+    fig2.add_vline(x=errors.mean(), line_dash="dash", line_color=RED, line_width=1,
+                   annotation_text=f"Mean={errors.mean():+.2f}",
+                   annotation_font=dict(color=RED, size=9, family="DM Mono, monospace"))
+    l2 = {**PLOTLY_LAYOUT}
+    l2.update(dict(
+        height=370,
+        title=dict(text="Error Distribution (Actual − Predicted)",
+                   font=dict(family="Fraunces, serif", size=13, color="#1C1917")),
+        xaxis=dict(**PLOTLY_LAYOUT["xaxis"], title="Error (Lakh PD)"),
+        yaxis=dict(**PLOTLY_LAYOUT["yaxis"], title="Count"),
+        showlegend=False, bargap=0.05,
+    ))
+    fig2.update_layout(**l2)
+    st.plotly_chart(fig2, use_container_width=True, config={"displayModeBar": False})
+st.markdown("---")
+# ── Year-on-year prediction vs actual trend ───────────────────────────────────
+section_label("Year-on-Year Prediction Accuracy")
+trend = df.groupby("financial_year", as_index=False).agg(
+    actual   =("person_days_lakhs",   "sum"),
+    predicted=("predicted_persondays", "sum"),
+)
+fig3 = go.Figure()
+fig3.add_bar(
+    x=trend["financial_year"], y=trend["actual"],
+    name="Actual",
+    marker=dict(color="#E7E5E4", opacity=0.9),
+)
+fig3.add_scatter(
+    x=trend["financial_year"], y=trend["predicted"],
+    name="Predicted",
+    mode="lines+markers",
+    line=dict(color=SAFFRON, width=2.5),
+    marker=dict(size=7, color=SAFFRON, line=dict(width=1.5, color="#FFFFFF")),
+)
+l3 = {**PLOTLY_LAYOUT}
+l3.update(dict(
+    height=300,
+    barmode="overlay", bargap=0.35,
+    title=dict(text="Aggregated Actual vs Predicted by Year",
+               font=dict(family="Fraunces, serif", size=13, color="#1C1917")),
+    xaxis=dict(**PLOTLY_LAYOUT["xaxis"], title="Financial Year", dtick=1),
+    yaxis=dict(**PLOTLY_LAYOUT["yaxis"], title="Total Lakh PD"),
+    legend=dict(**PLOTLY_LAYOUT["legend"], orientation="h", y=1.08, x=0),
+))
+# Annotate known anomalies
+if 2020 in trend["financial_year"].values:
+    fig3.add_vline(x=2020, line_dash="dot", line_color=RED, line_width=1.5,
+                   annotation_text="COVID", annotation_font=dict(color=RED, size=9, family="DM Mono, monospace"))
+if 2022 in trend["financial_year"].values:
+    fig3.add_vline(x=2022, line_dash="dot", line_color="#A8A29E", line_width=1,
+                   annotation_text="WB anomaly", annotation_font=dict(color="#A8A29E", size=9, family="DM Mono, monospace"))
+fig3.update_layout(**l3)
+st.plotly_chart(fig3, use_container_width=True, config={"displayModeBar": False})
+st.markdown("---")
+# ── Walk-forward CV summary ───────────────────────────────────────────────────
+section_label("Walk-Forward CV Performance (Honest Evaluation)")
+cv_data = {
+    "Year": [2018, 2019, 2020, 2021, 2022, 2023, 2024],
+    "R²":   [0.916, 0.926, 0.835, 0.926, 0.510, 0.909, 0.935],
+    "MAE":  [6.639, 6.380, 12.681, 7.150, 13.954, 7.403, 5.673],
+    "vs Naive R²": ["+0.004", "+0.061", "+0.083", "−0.012", "+0.330", "−0.014", "+0.065"],
+    "Note": ["", "", "COVID spike", "", "WB reporting anomaly", "", ""],
+}
+import pandas as pd
+cv_df = pd.DataFrame(cv_data)
+st.dataframe(cv_df, use_container_width=True, hide_index=True)
+st.caption("Walk-forward CV: model trained on years before test year only. Mean R²=0.851, excl. 2022: R²=0.908.")
+st.markdown("---")
+# ── Worst predictions table ───────────────────────────────────────────────────
+section_label("Largest Prediction Errors")
+worst = (
+    df.assign(abs_error=df["prediction_error"].abs())
+    .nlargest(20, "abs_error")[
+        ["state", "district", "financial_year",
+         "person_days_lakhs", "predicted_persondays", "prediction_error"]
+    ]
+    .rename(columns={
+        "person_days_lakhs":   "actual_L",
+        "predicted_persondays":"predicted_L",
+        "prediction_error":    "error_L",
+    })
+    .round(3)
+)
+st.dataframe(worst, use_container_width=True, hide_index=True)

frontend/pages/spatial.py ADDED Viewed

	@@ -0,0 +1,491 @@

+# pages/spatial.py — Spatial Overview Map
+import sys, os
+sys.path.insert(0, os.path.dirname(os.path.dirname(__file__)))
+import streamlit as st
+import plotly.graph_objects as go
+import pandas as pd
+import numpy as np
+from theme import inject_theme, page_header, section_label, kpi_html, PLOTLY_LAYOUT, SAFFRON, SAFFRON_SCALE, GREEN, RED, AMBER
+from utils.api_client import fetch_states, fetch_predictions, fetch_optimizer_results, fetch_district_history
+inject_theme()
+page_header(
+    "◈ Module 05",
+    "Spatial Overview",
+    "District-level employment prediction map — hover any bubble for full model details",
+)
+# ── District coordinates (approximate centroids for all major districts) ──────
+# Covers all 36 states/UTs across India's 700+ districts.
+# Format: "District|State": (lat, lon)
+DISTRICT_COORDS: dict[str, tuple[float, float]] = {
+    # ── Andhra Pradesh ─────────────────────────────────────────────────────────
+    "Srikakulam|Andhra Pradesh":          (18.30, 83.90), "Vizianagaram|Andhra Pradesh": (18.12, 83.41),
+    "Visakhapatnam|Andhra Pradesh":       (17.69, 83.22), "East Godavari|Andhra Pradesh":(17.00, 82.00),
+    "West Godavari|Andhra Pradesh":       (16.92, 81.34), "Krishna|Andhra Pradesh":       (16.61, 80.83),
+    "Guntur|Andhra Pradesh":              (16.31, 80.44), "Prakasam|Andhra Pradesh":      (15.35, 79.57),
+    "Nellore|Andhra Pradesh":             (14.44, 79.99), "Kurnool|Andhra Pradesh":       (15.83, 78.05),
+    "Kadapa|Andhra Pradesh":              (14.47, 78.82), "Anantapur|Andhra Pradesh":     (14.68, 77.60),
+    "Chittoor|Andhra Pradesh":            (13.22, 79.10),
+    # ── Assam ─────────────────────────────────────────────────────────────────
+    "Kamrup|Assam":                       (26.14, 91.77), "Barpeta|Assam":                (26.32, 91.00),
+    "Dhubri|Assam":                       (26.02, 89.98), "Goalpara|Assam":               (26.17, 90.62),
+    "Nagaon|Assam":                       (26.35, 92.68), "Cachar|Assam":                 (24.81, 92.86),
+    "Lakhimpur|Assam":                    (27.24, 94.10), "Dibrugarh|Assam":              (27.49, 95.00),
+    "Sonitpur|Assam":                     (26.63, 92.80), "Jorhat|Assam":                 (26.75, 94.22),
+    # ── Bihar ─────────────────────────────────────────────────────────────────
+    "Patna|Bihar":                        (25.59, 85.13), "Gaya|Bihar":                   (24.80, 84.99),
+    "Muzaffarpur|Bihar":                  (26.12, 85.38), "Bhagalpur|Bihar":              (25.24, 86.98),
+    "Darbhanga|Bihar":                    (26.16, 85.90), "Purnea|Bihar":                 (25.78, 87.47),
+    "Rohtas|Bihar":                       (24.98, 83.98), "Siwan|Bihar":                  (26.22, 84.36),
+    "Saran|Bihar":                        (25.92, 84.74), "Nalanda|Bihar":                (25.10, 85.44),
+    "Madhubani|Bihar":                    (26.37, 86.07), "Champaran East|Bihar":         (26.65, 84.92),
+    "Champaran West|Bihar":               (27.02, 84.46),
+    # ── Chhattisgarh ──────────────────────────────────────────────────────────
+    "Raipur|Chhattisgarh":               (21.25, 81.63), "Bilaspur|Chhattisgarh":        (22.09, 82.15),
+    "Durg|Chhattisgarh":                 (21.19, 81.28), "Rajnandgaon|Chhattisgarh":    (21.10, 81.03),
+    "Bastar|Chhattisgarh":               (19.10, 81.95), "Sarguja|Chhattisgarh":         (23.12, 83.19),
+    "Korba|Chhattisgarh":                (22.35, 82.72), "Raigarh|Chhattisgarh":        (21.90, 83.40),
+    # ── Gujarat ───────────────────────────────────────────────────────────────
+    "Ahmedabad|Gujarat":                  (23.03, 72.58), "Surat|Gujarat":                (21.17, 72.83),
+    "Vadodara|Gujarat":                   (22.31, 73.18), "Rajkot|Gujarat":               (22.30, 70.80),
+    "Bhavnagar|Gujarat":                  (21.77, 72.15), "Jamnagar|Gujarat":             (22.47, 70.06),
+    "Junagadh|Gujarat":                   (21.52, 70.46), "Anand|Gujarat":                (22.56, 72.93),
+    "Mehsana|Gujarat":                    (23.59, 72.37), "Banaskantha|Gujarat":          (24.17, 72.42),
+    "Kutch|Gujarat":                      (23.73, 69.86), "Dahod|Gujarat":                (22.83, 74.25),
+    "Narmada|Gujarat":                    (21.87, 73.49), "Valsad|Gujarat":               (20.59, 72.93),
+    "Dang|Gujarat":                       (20.75, 73.69),
+    # ── Haryana ───────────────────────────────────────────────────────────────
+    "Hisar|Haryana":                      (29.15, 75.72), "Sirsa|Haryana":               (29.53, 75.03),
+    "Bhiwani|Haryana":                    (28.79, 76.13), "Rohtak|Haryana":              (28.89, 76.61),
+    "Sonipat|Haryana":                    (28.99, 77.01), "Karnal|Haryana":              (29.68, 76.99),
+    "Ambala|Haryana":                     (30.37, 76.78), "Kurukshetra|Haryana":         (29.97, 76.85),
+    "Mahendragarh|Haryana":               (28.27, 76.15),
+    # ── Jharkhand ─────────────────────────────────────────────────────────────
+    "Ranchi|Jharkhand":                   (23.35, 85.33), "Dhanbad|Jharkhand":           (23.80, 86.45),
+    "Bokaro|Jharkhand":                   (23.67, 86.15), "Giridih|Jharkhand":           (24.19, 86.30),
+    "Hazaribagh|Jharkhand":               (23.99, 85.36), "Dumka|Jharkhand":             (24.27, 87.25),
+    "Palamu|Jharkhand":                   (24.03, 84.08), "Gumla|Jharkhand":             (23.05, 84.54),
+    "Pakur|Jharkhand":                    (24.63, 87.84), "Lohardaga|Jharkhand":         (23.44, 84.68),
+    # ── Karnataka ─────────────────────────────────────────────────────────────
+    "Bangalore Rural|Karnataka":          (13.01, 77.57), "Tumkur|Karnataka":            (13.34, 77.10),
+    "Kolar|Karnataka":                    (13.14, 78.13), "Mysore|Karnataka":            (12.30, 76.65),
+    "Mandya|Karnataka":                   (12.52, 76.90), "Hassan|Karnataka":            (13.00, 76.10),
+    "Chikmagalur|Karnataka":              (13.32, 75.78), "Shimoga|Karnataka":           (13.93, 75.57),
+    "Dakshina Kannada|Karnataka":         (12.85, 75.24), "Uttara Kannada|Karnataka":    (14.79, 74.68),
+    "Raichur|Karnataka":                  (16.21, 77.36), "Koppal|Karnataka":            (15.35, 76.15),
+    "Gadag|Karnataka":                    (15.42, 75.62), "Dharwad|Karnataka":           (15.46, 75.01),
+    "Bagalkot|Karnataka":                 (16.18, 75.70), "Bijapur|Karnataka":           (16.83, 75.72),
+    "Gulbarga|Karnataka":                 (17.34, 76.82), "Bidar|Karnataka":             (17.91, 77.52),
+    "Bellary|Karnataka":                  (15.14, 76.92), "Chitradurga|Karnataka":       (14.23, 76.40),
+    "Davangere|Karnataka":                (14.46, 75.92), "Udupi|Karnataka":             (13.34, 74.75),
+    # ── Kerala ────────────────────────────────────────────────────────────────
+    "Thiruvananthapuram|Kerala":          (8.52,  76.94), "Kollam|Kerala":               (8.88,  76.61),
+    "Pathanamthitta|Kerala":              (9.27,  76.77), "Alappuzha|Kerala":            (9.49,  76.32),
+    "Kottayam|Kerala":                    (9.59,  76.52), "Idukki|Kerala":               (9.85,  77.10),
+    "Ernakulam|Kerala":                   (10.01, 76.31), "Thrissur|Kerala":             (10.52, 76.22),
+    "Palakkad|Kerala":                    (10.77, 76.65), "Malappuram|Kerala":           (11.07, 76.07),
+    "Kozhikode|Kerala":                   (11.25, 75.78), "Wayanad|Kerala":              (11.61, 76.08),
+    "Kannur|Kerala":                      (11.87, 75.37), "Kasaragod|Kerala":            (12.50, 74.99),
+    # ── Madhya Pradesh ────────────────────────────────────────────────────────
+    "Bhopal|Madhya Pradesh":             (23.26, 77.41), "Indore|Madhya Pradesh":       (22.72, 75.86),
+    "Jabalpur|Madhya Pradesh":           (23.18, 79.99), "Gwalior|Madhya Pradesh":      (26.22, 78.18),
+    "Sagar|Madhya Pradesh":              (23.84, 78.74), "Rewa|Madhya Pradesh":         (24.53, 81.30),
+    "Satna|Madhya Pradesh":              (24.60, 80.83), "Ujjain|Madhya Pradesh":       (23.18, 75.78),
+    "Chhindwara|Madhya Pradesh":         (22.06, 78.94), "Shivpuri|Madhya Pradesh":     (25.42, 77.66),
+    "Morena|Madhya Pradesh":             (26.50, 78.00), "Bhind|Madhya Pradesh":        (26.56, 78.78),
+    "Datia|Madhya Pradesh":              (25.67, 78.46), "Chhatarpur|Madhya Pradesh":   (24.92, 79.58),
+    "Tikamgarh|Madhya Pradesh":          (24.74, 78.83), "Raisen|Madhya Pradesh":       (22.99, 77.79),
+    "Vidisha|Madhya Pradesh":            (23.52, 77.81), "Hoshangabad|Madhya Pradesh":  (22.75, 77.73),
+    "Harda|Madhya Pradesh":              (22.34, 77.09), "Betul|Madhya Pradesh":        (21.91, 77.90),
+    "Balaghat|Madhya Pradesh":           (21.81, 80.19), "Seoni|Madhya Pradesh":        (22.09, 79.55),
+    "Mandla|Madhya Pradesh":             (22.60, 80.38), "Dindori|Madhya Pradesh":      (22.95, 81.08),
+    "Shahdol|Madhya Pradesh":            (23.30, 81.36), "Anuppur|Madhya Pradesh":      (23.10, 81.69),
+    "Umaria|Madhya Pradesh":             (23.53, 80.84), "Katni|Madhya Pradesh":        (23.83, 80.39),
+    "Panna|Madhya Pradesh":              (24.72, 80.19), "Damoh|Madhya Pradesh":        (23.83, 79.45),
+    "Narsinghpur|Madhya Pradesh":        (22.95, 79.19), "Niwari|Madhya Pradesh":       (25.01, 78.76),
+    # ── Maharashtra ───────────────────────────────────────────────────────────
+    "Ahmednagar|Maharashtra":            (19.10, 74.74), "Akola|Maharashtra":           (20.71, 77.00),
+    "Amravati|Maharashtra":              (20.93, 77.75), "Aurangabad|Maharashtra":      (19.88, 75.34),
+    "Beed|Maharashtra":                  (18.99, 75.75), "Bhandara|Maharashtra":        (21.17, 79.65),
+    "Buldhana|Maharashtra":              (20.53, 76.18), "Chandrapur|Maharashtra":      (19.96, 79.30),
+    "Dhule|Maharashtra":                 (20.90, 74.78), "Gadchiroli|Maharashtra":      (20.18, 80.00),
+    "Gondia|Maharashtra":                (21.46, 80.20), "Hingoli|Maharashtra":         (19.72, 77.15),
+    "Jalgaon|Maharashtra":               (21.00, 75.57), "Jalna|Maharashtra":           (19.84, 75.89),
+    "Kolhapur|Maharashtra":              (16.70, 74.24), "Latur|Maharashtra":           (18.40, 76.57),
+    "Mumbai City|Maharashtra":           (18.96, 72.82), "Mumbai Suburban|Maharashtra": (19.17, 72.96),
+    "Nagpur|Maharashtra":                (21.15, 79.09), "Nanded|Maharashtra":          (19.15, 77.32),
+    "Nandurbar|Maharashtra":             (21.37, 74.24), "Nashik|Maharashtra":          (19.99, 73.79),
+    "Osmanabad|Maharashtra":             (18.18, 76.04), "Palghar|Maharashtra":         (19.70, 72.77),
+    "Parbhani|Maharashtra":              (19.27, 76.77), "Pune|Maharashtra":            (18.52, 73.86),
+    "Raigad|Maharashtra":                (18.52, 73.18), "Ratnagiri|Maharashtra":       (16.99, 73.30),
+    "Sangli|Maharashtra":                (16.86, 74.56), "Satara|Maharashtra":          (17.69, 74.00),
+    "Sindhudurg|Maharashtra":            (16.35, 73.74), "Solapur|Maharashtra":         (17.69, 75.91),
+    "Thane|Maharashtra":                 (19.22, 72.98), "Wardha|Maharashtra":          (20.75, 78.60),
+    "Washim|Maharashtra":                (20.11, 77.15), "Yavatmal|Maharashtra":        (20.39, 78.13),
+    # ── Odisha ────────────────────────────────────────────────────────────────
+    "Bhubaneswar|Odisha":                (20.30, 85.84), "Cuttack|Odisha":              (20.46, 85.88),
+    "Balasore|Odisha":                   (21.49, 86.93), "Mayurbhanj|Odisha":           (21.92, 86.73),
+    "Keonjhar|Odisha":                   (21.63, 85.58), "Sundargarh|Odisha":           (22.12, 84.03),
+    "Sambalpur|Odisha":                  (21.47, 83.97), "Bargarh|Odisha":              (21.33, 83.62),
+    "Bolangir|Odisha":                   (20.71, 83.49), "Kalahandi|Odisha":            (19.91, 83.17),
+    "Koraput|Odisha":                    (18.81, 82.71), "Rayagada|Odisha":             (19.17, 83.41),
+    "Ganjam|Odisha":                     (19.39, 84.70), "Puri|Odisha":                 (19.81, 85.83),
+    "Khordha|Odisha":                    (20.18, 85.62), "Jagatsinghpur|Odisha":        (20.25, 86.18),
+    "Kendrapara|Odisha":                 (20.50, 86.42), "Jajpur|Odisha":               (20.85, 86.33),
+    # ── Rajasthan ─────────────────────────────────────────────────────────────
+    "Jaipur|Rajasthan":                  (26.92, 75.79), "Jodhpur|Rajasthan":           (26.29, 73.03),
+    "Udaipur|Rajasthan":                 (24.58, 73.69), "Kota|Rajasthan":              (25.18, 75.84),
+    "Ajmer|Rajasthan":                   (26.45, 74.64), "Bikaner|Rajasthan":           (28.02, 73.31),
+    "Alwar|Rajasthan":                   (27.57, 76.61), "Bharatpur|Rajasthan":         (27.22, 77.49),
+    "Sikar|Rajasthan":                   (27.61, 75.14), "Nagaur|Rajasthan":            (27.21, 73.74),
+    "Pali|Rajasthan":                    (25.77, 73.33), "Barmer|Rajasthan":            (25.75, 71.39),
+    "Jaisalmer|Rajasthan":               (26.92, 70.91), "Churu|Rajasthan":             (28.30, 74.96),
+    "Jhunjhunu|Rajasthan":               (28.13, 75.40), "Sirohi|Rajasthan":            (24.89, 72.86),
+    "Banswara|Rajasthan":                (23.54, 74.44), "Dungarpur|Rajasthan":         (23.84, 73.71),
+    "Baran|Rajasthan":                   (25.10, 76.52), "Jhalawar|Rajasthan":          (24.60, 76.16),
+    "Tonk|Rajasthan":                    (26.17, 75.79), "Sawai Madhopur|Rajasthan":    (26.01, 76.35),
+    "Dausa|Rajasthan":                   (26.89, 76.34), "Karauli|Rajasthan":           (26.50, 77.02),
+    # ── Tamil Nadu ────────────────────────────────────────────────────────────
+    "Chennai|Tamil Nadu":                (13.08, 80.27), "Coimbatore|Tamil Nadu":       (11.02, 76.97),
+    "Madurai|Tamil Nadu":                (9.93,  78.12), "Tiruchirappalli|Tamil Nadu":  (10.80, 78.69),
+    "Salem|Tamil Nadu":                  (11.65, 78.16), "Tirunelveli|Tamil Nadu":      (8.73,  77.70),
+    "Vellore|Tamil Nadu":                (12.92, 79.13), "Erode|Tamil Nadu":            (11.34, 77.73),
+    "Thanjavur|Tamil Nadu":              (10.79, 79.14), "Virudhunagar|Tamil Nadu":     (9.58,  77.96),
+    "Ramanathapuram|Tamil Nadu":         (9.37,  78.83), "Pudukkottai|Tamil Nadu":      (10.38, 78.82),
+    "Dindigul|Tamil Nadu":               (10.36, 77.98), "Dharmapuri|Tamil Nadu":       (12.13, 78.16),
+    "Krishnagiri|Tamil Nadu":            (12.52, 78.21), "Namakkal|Tamil Nadu":         (11.22, 78.17),
+    "Nilgiris|Tamil Nadu":               (11.47, 76.73), "Tiruppur|Tamil Nadu":         (11.11, 77.34),
+    "Cuddalore|Tamil Nadu":              (11.75, 79.77), "Villupuram|Tamil Nadu":       (11.94, 79.49),
+    "Kancheepuram|Tamil Nadu":           (12.83, 79.70), "Thiruvallur|Tamil Nadu":      (13.15, 79.91),
+    "Tiruvannamalai|Tamil Nadu":         (12.23, 79.07),
+    # ── Telangana ─────────────────────────────────────────────────────────────
+    "Hyderabad|Telangana":               (17.38, 78.47), "Medchal|Telangana":           (17.62, 78.48),
+    "Rangareddy|Telangana":              (17.25, 78.38), "Nalgonda|Telangana":          (17.05, 79.27),
+    "Warangal|Telangana":                (17.97, 79.59), "Karimnagar|Telangana":        (18.44, 79.13),
+    "Khammam|Telangana":                 (17.25, 80.15), "Nizamabad|Telangana":         (18.67, 78.10),
+    "Adilabad|Telangana":                (19.67, 78.53), "Mahabubnagar|Telangana":      (16.74, 77.99),
+    # ── Uttar Pradesh ─────────────────────────────────────────────────────────
+    "Lucknow|Uttar Pradesh":             (26.85, 80.95), "Kanpur Nagar|Uttar Pradesh":  (26.45, 80.35),
+    "Agra|Uttar Pradesh":                (27.18, 78.02), "Varanasi|Uttar Pradesh":      (25.32, 83.01),
+    "Allahabad|Uttar Pradesh":           (25.44, 81.85), "Meerut|Uttar Pradesh":        (28.98, 77.71),
+    "Bareilly|Uttar Pradesh":            (28.35, 79.43), "Gorakhpur|Uttar Pradesh":     (26.76, 83.37),
+    "Mathura|Uttar Pradesh":             (27.49, 77.67), "Muzaffarnagar|Uttar Pradesh": (29.47, 77.70),
+    "Shahjahanpur|Uttar Pradesh":        (27.88, 79.91), "Sitapur|Uttar Pradesh":       (27.57, 80.68),
+    "Lakhimpur Kheri|Uttar Pradesh":     (27.94, 80.78), "Hardoi|Uttar Pradesh":        (27.40, 80.13),
+    "Unnao|Uttar Pradesh":               (26.54, 80.49), "Rae Bareli|Uttar Pradesh":    (26.22, 81.24),
+    "Pratapgarh|Uttar Pradesh":          (25.89, 81.99), "Jaunpur|Uttar Pradesh":       (25.73, 82.69),
+    "Ghazipur|Uttar Pradesh":            (25.58, 83.57), "Ballia|Uttar Pradesh":        (25.75, 84.15),
+    "Azamgarh|Uttar Pradesh":            (26.07, 83.18), "Mau|Uttar Pradesh":           (25.94, 83.56),
+    "Deoria|Uttar Pradesh":              (26.50, 83.78), "Basti|Uttar Pradesh":         (26.79, 82.73),
+    "Siddharthnagar|Uttar Pradesh":      (27.29, 83.07), "Maharajganj|Uttar Pradesh":   (27.15, 83.56),
+    "Gonda|Uttar Pradesh":               (27.13, 81.97), "Bahraich|Uttar Pradesh":      (27.57, 81.60),
+    "Shravasti|Uttar Pradesh":           (27.72, 81.87), "Balrampur|Uttar Pradesh":     (27.43, 82.19),
+    "Barabanki|Uttar Pradesh":           (26.94, 81.19), "Faizabad|Uttar Pradesh":      (26.77, 82.14),
+    "Ambedkar Nagar|Uttar Pradesh":      (26.43, 82.62), "Sultanpur|Uttar Pradesh":     (26.26, 82.06),
+    "Banda|Uttar Pradesh":               (25.48, 80.34), "Chitrakoot|Uttar Pradesh":    (25.20, 80.90),
+    "Hamirpur|Uttar Pradesh":            (25.95, 80.15), "Mahoba|Uttar Pradesh":        (25.29, 79.87),
+    "Lalitpur|Uttar Pradesh":            (24.69, 78.41), "Jhansi|Uttar Pradesh":        (25.45, 78.57),
+    "Jalaun|Uttar Pradesh":              (26.14, 79.34), "Etawah|Uttar Pradesh":        (26.78, 79.02),
+    "Auraiya|Uttar Pradesh":             (26.47, 79.51), "Kannauj|Uttar Pradesh":       (27.05, 79.92),
+    "Farrukhabad|Uttar Pradesh":         (27.38, 79.57), "Mainpuri|Uttar Pradesh":      (27.23, 79.02),
+    "Firozabad|Uttar Pradesh":           (27.15, 78.39), "Etah|Uttar Pradesh":          (27.65, 78.67),
+    "Kasganj|Uttar Pradesh":             (27.81, 78.65), "Hathras|Uttar Pradesh":       (27.60, 78.06),
+    "Aligarh|Uttar Pradesh":             (27.88, 78.07), "Bulandshahr|Uttar Pradesh":   (28.41, 77.85),
+    "Hapur|Uttar Pradesh":               (28.72, 77.78), "Gautam Buddha Nagar|Uttar Pradesh": (28.54, 77.39),
+    "Ghaziabad|Uttar Pradesh":           (28.67, 77.44), "Bagpat|Uttar Pradesh":        (28.94, 77.22),
+    "Bijnor|Uttar Pradesh":              (29.37, 78.13), "Amroha|Uttar Pradesh":        (28.91, 78.47),
+    "Sambhal|Uttar Pradesh":             (28.59, 78.56), "Moradabad|Uttar Pradesh":     (28.84, 78.77),
+    "Rampur|Uttar Pradesh":              (28.81, 79.03), "Pilibhit|Uttar Pradesh":      (28.64, 79.81),
+    "Budaun|Uttar Pradesh":              (28.04, 79.13),
+    # ── West Bengal ───────────────────────────────────────────────────────────
+    "Kolkata|West Bengal":               (22.57, 88.37), "Howrah|West Bengal":          (22.59, 88.31),
+    "North 24 Parganas|West Bengal":     (22.86, 88.54), "South 24 Parganas|West Bengal":(22.15, 88.27),
+    "Bardhaman|West Bengal":             (23.23, 87.86), "Birbhum|West Bengal":         (23.90, 87.53),
+    "Murshidabad|West Bengal":           (24.18, 88.27), "Nadia|West Bengal":           (23.47, 88.55),
+    "Hooghly|West Bengal":               (22.96, 88.38), "Midnapore West|West Bengal":  (22.43, 86.92),
+    "Midnapore East|West Bengal":        (22.11, 87.67), "Bankura|West Bengal":         (23.23, 87.07),
+    "Purulia|West Bengal":               (23.33, 86.36), "Malda|West Bengal":           (25.00, 88.14),
+    "Dinajpur North|West Bengal":        (25.62, 88.43), "Dinajpur South|West Bengal":  (25.29, 88.68),
+    "Jalpaiguri|West Bengal":            (26.54, 88.73), "Darjeeling|West Bengal":      (27.04, 88.26),
+    "Cooch Behar|West Bengal":           (26.32, 89.45),
+    # ── Himachal Pradesh ──────────────────────────────────────────────────────
+    "Shimla|Himachal Pradesh":           (31.10, 77.17), "Kangra|Himachal Pradesh":     (32.10, 76.27),
+    "Mandi|Himachal Pradesh":            (31.71, 76.93), "Hamirpur|Himachal Pradesh":   (31.69, 76.52),
+    "Una|Himachal Pradesh":              (31.46, 76.27), "Chamba|Himachal Pradesh":     (32.55, 76.13),
+    "Solan|Himachal Pradesh":            (30.91, 77.10), "Sirmaur|Himachal Pradesh":    (30.56, 77.46),
+    "Bilaspur|Himachal Pradesh":         (31.34, 76.76), "Kinnaur|Himachal Pradesh":    (31.59, 78.45),
+    "Kullu|Himachal Pradesh":            (31.96, 77.11), "Lahul Spiti|Himachal Pradesh":(32.77, 77.67),
+    # ── Uttarakhand ───────────────────────────────────────────────────────────
+    "Dehradun|Uttarakhand":              (30.32, 78.03), "Haridwar|Uttarakhand":        (29.96, 78.16),
+    "Nainital|Uttarakhand":              (29.38, 79.46), "Udham Singh Nagar|Uttarakhand":(29.00, 79.52),
+    "Almora|Uttarakhand":                (29.60, 79.66), "Pauri Garhwal|Uttarakhand":   (29.78, 79.01),
+    "Tehri Garhwal|Uttarakhand":         (30.39, 78.48), "Chamoli|Uttarakhand":         (30.41, 79.32),
+    "Rudraprayag|Uttarakhand":           (30.28, 78.98), "Uttarkashi|Uttarakhand":      (30.73, 78.44),
+    "Bageshwar|Uttarakhand":             (29.84, 79.77), "Pithoragarh|Uttarakhand":     (29.58, 80.22),
+    "Champawat|Uttarakhand":             (29.33, 80.09),
+    # ── Punjab ────────────────────────────────────────────────────────────────
+    "Amritsar|Punjab":                   (31.63, 74.87), "Ludhiana|Punjab":             (30.90, 75.85),
+    "Jalandhar|Punjab":                  (31.33, 75.58), "Patiala|Punjab":              (30.34, 76.39),
+    "Bathinda|Punjab":                   (30.21, 74.95), "Gurdaspur|Punjab":            (32.04, 75.41),
+    "Firozpur|Punjab":                   (30.93, 74.61), "Hoshiarpur|Punjab":           (31.53, 75.91),
+    "Rupnagar|Punjab":                   (30.96, 76.53), "Sangrur|Punjab":              (30.25, 75.84),
+    "Moga|Punjab":                       (30.82, 75.17), "Faridkot|Punjab":             (30.67, 74.76),
+    "Muktsar|Punjab":                    (30.48, 74.52), "Fazilka|Punjab":              (30.40, 74.02),
+    "Nawanshahr|Punjab":                 (31.12, 76.12), "Kapurthala|Punjab":           (31.38, 75.38),
+    # ── Jharkhand extra ───────────────────────────────────────────────────────
+    "Chatra|Jharkhand":                  (24.21, 84.88), "Koderma|Jharkhand":           (24.47, 85.60),
+    "Simdega|Jharkhand":                 (22.61, 84.51), "Khunti|Jharkhand":            (23.07, 85.28),
+    "Ramgarh|Jharkhand":                 (23.63, 85.51), "Jamtara|Jharkhand":           (23.96, 86.80),
+    "Sahibganj|Jharkhand":               (24.96, 87.63), "Godda|Jharkhand":             (24.83, 87.21),
+    "Deoghar|Jharkhand":                 (24.48, 86.70),
+    # ── Generic fallback centroids for states ─────────────────────────────────
+    "Unknown|Andhra Pradesh":            (15.9,  79.7),
+    "Unknown|Assam":                     (26.2,  92.9),
+    "Unknown|Bihar":                     (25.1,  85.3),
+    "Unknown|Chhattisgarh":              (21.3,  81.7),
+    "Unknown|Gujarat":                   (22.3,  71.2),
+    "Unknown|Haryana":                   (29.1,  76.1),
+    "Unknown|Jharkhand":                 (23.6,  85.3),
+    "Unknown|Karnataka":                 (15.3,  75.7),
+    "Unknown|Kerala":                    (10.9,  76.3),
+    "Unknown|Madhya Pradesh":            (22.9,  78.7),
+    "Unknown|Maharashtra":               (19.7,  75.7),
+    "Unknown|Odisha":                    (20.9,  85.1),
+    "Unknown|Rajasthan":                 (27.0,  74.2),
+    "Unknown|Tamil Nadu":                (11.1,  78.7),
+    "Unknown|Telangana":                 (17.4,  79.1),
+    "Unknown|Uttar Pradesh":             (26.8,  80.9),
+    "Unknown|West Bengal":               (22.9,  87.9),
+}
+def get_coords(district: str, state: str) -> tuple[float, float]:
+    """Return (lat, lon) for a district, with fallback to state centroid."""
+    rng = np.random.default_rng(abs(hash(f"{district}{state}")) % (2**31))
+    key = f"{district}|{state}"
+    if key in DISTRICT_COORDS:
+        lat, lon = DISTRICT_COORDS[key]
+        lat += rng.uniform(-0.08, 0.08)
+        lon += rng.uniform(-0.08, 0.08)
+        return lat, lon
+    # Fallback: state centroid + jitter
+    fb_key = f"Unknown|{state}"
+    lat, lon = DISTRICT_COORDS.get(fb_key, (22.0, 78.0))
+    lat += rng.uniform(-1.2, 1.2)
+    lon += rng.uniform(-1.2, 1.2)
+    return lat, lon
+# ── Controls ──────────────────────────────────────────────────────────────────
+states = fetch_states()
+if not states:
+    st.error("⚠️ API offline — run `uvicorn backend.main:app --port 8000`")
+    st.stop()
+cc1, cc2, cc3 = st.columns(3)
+with cc1:
+    state_filter = st.selectbox("State Filter", ["All India"] + states)
+with cc2:
+    map_metric = st.selectbox("Bubble Color / Size", [
+        "Predicted Person-Days",
+        "Prediction Error",
+        "Budget Gain (LP Optimizer)",
+        "Actual Person-Days",
+    ])
+with cc3:
+    year_opts = []
+    _df_raw = fetch_predictions()
+    if not _df_raw.empty:
+        year_opts = sorted(_df_raw["financial_year"].unique().tolist())
+    selected_year = st.selectbox("Financial Year", year_opts if year_opts else ["—"])
+# ── Fetch & merge data ────────────────────────────────────────────────────────
+pred_df = fetch_predictions(
+    state=None if state_filter == "All India" else state_filter,
+    year=int(selected_year) if selected_year != "—" else None,
+)
+opt_df = fetch_optimizer_results(
+    state=None if state_filter == "All India" else state_filter,
+)
+if pred_df.empty:
+    st.info("No prediction data for selected filters. Ensure the pipeline has run.")
+    st.stop()
+# Merge optimizer results in if available
+if not opt_df.empty:
+    merge_cols = ["state", "district"]
+    opt_sub = opt_df[merge_cols + [
+        c for c in ["persondays_gain", "budget_change_pct", "persondays_per_lakh",
+                    "budget_allocated_lakhs", "optimized_budget"]
+        if c in opt_df.columns
+    ]].drop_duplicates(subset=merge_cols)
+    pred_df = pred_df.merge(opt_sub, on=merge_cols, how="left")
+# Pick what to color by
+COLOR_MAP = {
+    "Predicted Person-Days":    "predicted_persondays",
+    "Prediction Error":         "prediction_error",
+    "Budget Gain (LP Optimizer)": "persondays_gain",
+    "Actual Person-Days":       "person_days_lakhs",
+}
+color_col = COLOR_MAP[map_metric]
+if color_col not in pred_df.columns:
+    color_col = "predicted_persondays"
+# ── Build map data ────────────────────────────────────────────────────────────
+lats, lons, colors, sizes = [], [], [], []
+hover_data = []
+for _, row in pred_df.iterrows():
+    lat, lon = get_coords(str(row["district"]), str(row["state"]))
+    lats.append(lat)
+    lons.append(lon)
+    colors.append(float(row.get(color_col, 0) or 0))
+    sizes.append(max(float(row.get("predicted_persondays", 1) or 1), 0.1))
+    hover_data.append(row)
+# Normalize sizes for bubble radius
+sz_arr = np.array(sizes)
+sz_min, sz_max = sz_arr.min(), sz_arr.max()
+norm_sz = np.clip((sz_arr - sz_min) / (sz_max - sz_min + 1e-9) * 13 + 4, 4, 17).tolist()
+# ── Choose colorscale based on metric ────────────────────────────────────────
+if color_col == "prediction_error":
+    cscale = [[0, RED], [0.5, "#FED7AA"], [1, "#FED7AA"]]
+    cscale = [[0, RED], [0.5, "#FAFAF9"], [1, GREEN]]
+elif color_col == "persondays_gain":
+    cscale = [[0, RED], [0.5, "#FFF7ED"], [1, GREEN]]
+else:
+    cscale = SAFFRON_SCALE
+# ── Build hover template ──────────────────────────────────────────────────────
+# customdata columns: 0=district, 1=state, 2=fy, 3=actual, 4=predicted,
+#                     5=error, 6=persondays_gain, 7=budget_chg_pct,
+#                     8=persondays_per_lakh, 9=budget_allocated
+custom = []
+for row in hover_data:
+    custom.append([
+        str(row.get("district", "")),
+        str(row.get("state", "")),
+        int(row.get("financial_year", 0)),
+        float(row.get("person_days_lakhs", 0) or 0),
+        float(row.get("predicted_persondays", 0) or 0),
+        float(row.get("prediction_error", 0) or 0),
+        float(row.get("persondays_gain", 0) or 0),
+        float(row.get("budget_change_pct", 0) or 0),
+        float(row.get("persondays_per_lakh", 0) or 0),
+        float(row.get("budget_allocated_lakhs", 0) or 0),
+    ])
+hover_tmpl = (
+    "<b>%{customdata[0]}</b><br>"
+    "<span style='color:#A8A29E'>%{customdata[1]}</span><br>"
+    "<br>"
+    "<b>FY:</b> %{customdata[2]}<br>"
+    "<b>Actual PD:</b> %{customdata[3]:.2f}L<br>"
+    "<b>Predicted PD:</b> %{customdata[4]:.2f}L<br>"
+    "<b>Model Error:</b> %{customdata[5]:+.2f}L<br>"
+    "<br>"
+    "<b>LP Optimizer</b><br>"
+    "<b>PD Gain:</b> %{customdata[6]:+.2f}L<br>"
+    "<b>Budget Δ:</b> %{customdata[7]:+.1f}%<br>"
+    "<b>Efficiency:</b> %{customdata[8]:.4f} PD/₹L<br>"
+    "<b>Budget:</b> ₹%{customdata[9]:,.0f}L"
+    "<extra></extra>"
+)
+fig = go.Figure()
+fig.add_scattergeo(
+    lat=lats, lon=lons,
+    mode="markers",
+    marker=dict(
+        size=norm_sz,
+        color=colors,
+        colorscale=cscale,
+        colorbar=dict(
+            title=dict(text=map_metric[:12], font=dict(color="#78716C", size=9)),
+            tickfont=dict(color="#78716C", size=8),
+            thickness=10, len=0.55,
+            bgcolor="rgba(255,255,255,0.88)",
+        ),
+        opacity=0.80,
+        line=dict(width=0.8, color="rgba(255,255,255,0.7)"),
+    ),
+    customdata=custom,
+    hovertemplate=hover_tmpl,
+)
+fig.update_geos(
+    scope="asia",
+    showland=True,    landcolor="#F5F5F4",
+    showocean=True,   oceancolor="#EFF6FF",
+    showcountries=True, countrycolor="#D6D3D1",
+    showsubunits=True,  subunitcolor="#E7E5E4",
+    showrivers=True,  rivercolor="#DBEAFE",
+    center=dict(lat=22, lon=80),
+    projection_scale=5.0,
+    bgcolor="rgba(0,0,0,0)",
+)
+fig.update_layout(
+    height=620,
+    paper_bgcolor="rgba(0,0,0,0)",
+    margin=dict(l=0, r=0, t=10, b=0),
+    font=dict(family="DM Mono, monospace", color="#1C1917"),
+    showlegend=False,
+    hoverlabel=dict(
+        bgcolor="#1C1917",
+        bordercolor="#1C1917",
+        font=dict(family="DM Mono, monospace", size=11, color="#FAF9F7"),
+    ),
+)
+st.plotly_chart(fig, use_container_width=True, config={"displayModeBar": False})
+# ── Caption ───────────────────────────────────────────────────────────────────
+n_mapped = len([c for c in custom if c[0]])
+year_label = selected_year if selected_year != "—" else "all years"
+st.caption(
+    f"{n_mapped} districts · FY {year_label} · "
+    f"Bubble size ∝ predicted person-days · Hover for full model details"
+)
+# ── Summary cards below map ───────────────────────────────────────────────────
+st.markdown("<div style='margin-top:1.5rem'></div>", unsafe_allow_html=True)
+section_label("Prediction Summary for Filtered View")
+c1, c2, c3, c4 = st.columns(4)
+total_pred = pred_df["predicted_persondays"].sum()
+total_act  = pred_df["person_days_lakhs"].sum()
+mean_err   = pred_df["prediction_error"].mean()
+gain_total = pred_df["persondays_gain"].sum() if "persondays_gain" in pred_df.columns else 0
+c1.metric("Total Predicted PD", f"{total_pred:,.1f}L")
+c2.metric("Total Actual PD",    f"{total_act:,.1f}L")
+c3.metric("Mean Model Error",   f"{mean_err:+.3f}L")
+c4.metric("Total LP Gain",      f"{gain_total:+,.1f}L")

frontend/theme.py ADDED Viewed

	@@ -0,0 +1,297 @@

+"""
+theme.py — SchemeImpactNet shared design system
+Editorial / policy-brief aesthetic.
+Fonts: Fraunces (display) + Source Serif 4 (body) + DM Mono (data/labels)
+Palette: warm off-white #FAF9F7, deep stone #1C1917, saffron accent #FB923C
+"""
+THEME_CSS = """
+<style>
+@import url('https://fonts.googleapis.com/css2?family=Fraunces:ital,opsz,wght@0,9..144,300;0,9..144,600;0,9..144,700;1,9..144,300&family=Source+Serif+4:ital,opsz,wght@0,8..60,300;0,8..60,400;0,8..60,600&family=DM+Mono:wght@400;500&display=swap');
+html, body, [class*="css"] {
+    font-family: 'Source Serif 4', Georgia, serif !important;
+}
+.stApp {
+    background-color: #FAF9F7 !important;
+}
+#MainMenu, footer, header { visibility: hidden; }
+.block-container {
+    padding: 2rem 2.5rem 3rem !important;
+    max-width: 1320px !important;
+}
+/* ── Sidebar ── */
+[data-testid="stSidebar"] {
+    background: #1C1917 !important;
+    border-right: none !important;
+}
+[data-testid="stSidebarContent"] {
+    background: #1C1917 !important;
+}
+/* Nav links generated by st.navigation */
+[data-testid="stSidebarNavLink"] {
+    border-radius: 5px !important;
+    padding: 0.5rem 1rem !important;
+    font-family: 'DM Mono', monospace !important;
+    font-size: 0.7rem !important;
+    letter-spacing: 0.5px !important;
+    color: #A8A29E !important;
+    text-decoration: none !important;
+    transition: all 0.15s ease !important;
+    border-left: 2px solid transparent !important;
+}
+[data-testid="stSidebarNavLink"]:hover {
+    background: rgba(251,146,60,0.1) !important;
+    color: #FB923C !important;
+    border-left-color: rgba(251,146,60,0.4) !important;
+}
+[data-testid="stSidebarNavLink"][aria-current="page"] {
+    background: rgba(251,146,60,0.15) !important;
+    color: #FB923C !important;
+    border-left-color: #FB923C !important;
+}
+/* ── Typography ── */
+h1, h2, h3 {
+    font-family: 'Fraunces', serif !important;
+    color: #1C1917 !important;
+}
+h1 { font-size: 2.2rem !important; font-weight: 600 !important; line-height: 1.15 !important; }
+h2 { font-size: 1.5rem !important; font-weight: 600 !important; }
+h3 { font-size: 1.1rem !important; font-weight: 600 !important; }
+p  { font-family: 'Source Serif 4', serif !important; color: #292524 !important; }
+/* ── Metric cards ── */
+[data-testid="stMetric"] {
+    background: #FFFFFF !important;
+    border: 1px solid #E7E5E4 !important;
+    border-radius: 8px !important;
+    padding: 1rem 1.2rem !important;
+}
+[data-testid="stMetricLabel"] p {
+    font-family: 'DM Mono', monospace !important;
+    font-size: 0.62rem !important;
+    letter-spacing: 2px !important;
+    text-transform: uppercase !important;
+    color: #78716C !important;
+}
+[data-testid="stMetricValue"] {
+    font-family: 'Fraunces', serif !important;
+    font-size: 1.85rem !important;
+    font-weight: 600 !important;
+    color: #1C1917 !important;
+    line-height: 1.2 !important;
+}
+[data-testid="stMetricDelta"] {
+    font-family: 'DM Mono', monospace !important;
+    font-size: 0.7rem !important;
+}
+/* ── Inputs ── */
+[data-testid="stSelectbox"] label p,
+[data-testid="stSlider"] label p,
+[data-testid="stTextInput"] label p,
+[data-testid="stMultiSelect"] label p {
+    font-family: 'DM Mono', monospace !important;
+    font-size: 0.65rem !important;
+    letter-spacing: 1.5px !important;
+    text-transform: uppercase !important;
+    color: #78716C !important;
+}
+/* ── Buttons ── */
+.stButton > button {
+    font-family: 'DM Mono', monospace !important;
+    font-size: 0.7rem !important;
+    letter-spacing: 1px !important;
+    text-transform: uppercase !important;
+    background: #1C1917 !important;
+    color: #FAF9F7 !important;
+    border: none !important;
+    border-radius: 6px !important;
+    padding: 0.5rem 1.2rem !important;
+}
+.stButton > button:hover {
+    background: #FB923C !important;
+}
+/* ── Dataframes ── */
+[data-testid="stDataFrame"] {
+    border: 1px solid #E7E5E4 !important;
+    border-radius: 8px !important;
+    overflow: hidden !important;
+}
+[data-testid="stDataFrame"] th {
+    font-family: 'DM Mono', monospace !important;
+    font-size: 0.65rem !important;
+    letter-spacing: 1px !important;
+    text-transform: uppercase !important;
+    background: #F5F5F4 !important;
+    color: #57534E !important;
+}
+/* ── Expander ── */
+[data-testid="stExpander"] {
+    border: 1px solid #E7E5E4 !important;
+    border-radius: 8px !important;
+    background: #FFFFFF !important;
+}
+details summary p {
+    font-family: 'DM Mono', monospace !important;
+    font-size: 0.72rem !important;
+    letter-spacing: 0.5px !important;
+    color: #57534E !important;
+}
+/* ── Alerts ── */
+[data-testid="stAlert"] {
+    border-radius: 8px !important;
+}
+/* ── Caption ── */
+[data-testid="stCaptionContainer"] p {
+    font-family: 'DM Mono', monospace !important;
+    font-size: 0.63rem !important;
+    color: #A8A29E !important;
+    letter-spacing: 0.3px !important;
+}
+/* ── Divider ── */
+hr {
+    border: none !important;
+    border-top: 1px solid #E7E5E4 !important;
+    margin: 1.5rem 0 !important;
+}
+/* ── Tab strip ── */
+[data-testid="stTabs"] [role="tab"] {
+    font-family: 'DM Mono', monospace !important;
+    font-size: 0.68rem !important;
+    letter-spacing: 1px !important;
+    text-transform: uppercase !important;
+}
+</style>
+"""
+# ── Plotly shared layout (light, editorial) ───────────────────────────────────
+PLOTLY_LAYOUT = dict(
+    paper_bgcolor="#FFFFFF",
+    plot_bgcolor="#FAFAF9",
+    font=dict(family="DM Mono, monospace", color="#292524", size=10.5),
+    margin=dict(l=0, r=0, t=44, b=0),
+    legend=dict(
+        bgcolor="rgba(255,255,255,0.92)",
+        bordercolor="#E7E5E4", borderwidth=1,
+        font=dict(size=10),
+    ),
+    xaxis=dict(
+        gridcolor="#F5F5F4", linecolor="#E7E5E4",
+        tickfont=dict(color="#78716C", size=10),
+        title_font=dict(color="#57534E", size=11),
+        zerolinecolor="#E7E5E4",
+    ),
+    yaxis=dict(
+        gridcolor="#F5F5F4", linecolor="#E7E5E4",
+        tickfont=dict(color="#78716C", size=10),
+        title_font=dict(color="#57534E", size=11),
+        zerolinecolor="#E7E5E4",
+    ),
+)
+# ── Colour tokens ─────────────────────────────────────────────────────────────
+SAFFRON   = "#FB923C"   # primary accent
+SAFFRON_D = "#EA580C"   # darker saffron
+SLATE     = "#1C1917"   # near-black
+STONE     = "#78716C"   # muted label
+BORDER    = "#E7E5E4"
+BG        = "#FAF9F7"
+WHITE     = "#FFFFFF"
+GREEN     = "#16A34A"
+RED       = "#DC2626"
+AMBER     = "#D97706"
+BLUE      = "#2563EB"
+# ── Saffron scale for choropleth / sequential maps ───────────────────────────
+SAFFRON_SCALE = [
+    [0.0,  "#FFF7ED"],
+    [0.25, "#FED7AA"],
+    [0.5,  "#FB923C"],
+    [0.75, "#EA580C"],
+    [1.0,  "#7C2D12"],
+]
+# ── Helpers ───────────────────────────────────────────────────────────────────
+def inject_theme():
+    import streamlit as st
+    st.markdown(THEME_CSS, unsafe_allow_html=True)
+def page_header(eyebrow: str, title: str, subtitle: str = ""):
+    import streamlit as st
+    sub_html = (
+        f'<p style="font-family:\'Source Serif 4\',serif; font-size:0.92rem; '
+        f'color:#78716C; margin:6px 0 0 0; line-height:1.5;">{subtitle}</p>'
+        if subtitle else ""
+    )
+    st.markdown(f"""
+<div style="margin-bottom:1.75rem; padding-bottom:1.25rem; border-bottom:2px solid #E7E5E4;">
+  <p style="font-family:'DM Mono',monospace; font-size:0.58rem; letter-spacing:3.5px;
+            text-transform:uppercase; color:#FB923C; margin:0 0 7px 0;">{eyebrow}</p>
+  <h1 style="font-family:'Fraunces',serif; font-size:2.1rem; font-weight:600;
+             color:#1C1917; margin:0; line-height:1.15;">{title}</h1>
+  {sub_html}
+</div>""", unsafe_allow_html=True)
+def section_label(text: str):
+    import streamlit as st
+    st.markdown(
+        f'<p style="font-family:\'DM Mono\',monospace; font-size:0.58rem; '
+        f'letter-spacing:3px; text-transform:uppercase; color:#A8A29E; '
+        f'margin:0 0 10px 0; padding-bottom:8px; border-bottom:1px solid #F5F5F4;">'
+        f'{text}</p>',
+        unsafe_allow_html=True,
+    )
+def kpi_html(value: str, label: str, color: str = "#1C1917", note: str = "") -> str:
+    note_html = (
+        f'<p style="font-family:\'DM Mono\',monospace; font-size:0.62rem; '
+        f'color:#A8A29E; margin:3px 0 0 0;">{note}</p>'
+        if note else ""
+    )
+    return f"""
+<div style="background:#FFFFFF; border:1px solid #E7E5E4; border-radius:8px; padding:1rem 1.25rem;">
+  <p style="font-family:'DM Mono',monospace; font-size:0.58rem; letter-spacing:2.5px;
+            text-transform:uppercase; color:#A8A29E; margin:0 0 5px 0;">{label}</p>
+  <p style="font-family:'Fraunces',serif; font-size:1.9rem; font-weight:600;
+            color:{color}; line-height:1; margin:0;">{value}</p>
+  {note_html}
+</div>"""
+def signal_card_html(value: str, title: str, body: str, accent: str = "#FB923C") -> str:
+    return f"""
+<div style="background:#FFFFFF; border:1px solid #E7E5E4; border-left:3px solid {accent};
+            border-radius:8px; padding:0.85rem 1rem; margin-bottom:7px;
+            display:flex; align-items:center; gap:0.9rem;">
+  <span style="font-family:'Fraunces',serif; font-size:1.55rem; font-weight:600;
+               color:{accent}; min-width:56px; text-align:right; flex-shrink:0;">{value}</span>
+  <div>
+    <p style="font-family:'DM Mono',monospace; font-size:0.6rem; letter-spacing:1.2px;
+              text-transform:uppercase; color:#57534E; margin:0 0 2px 0;">{title}</p>
+    <p style="font-family:'Source Serif 4',serif; font-size:0.78rem;
+              color:#A8A29E; margin:0; line-height:1.4;">{body}</p>
+  </div>
+</div>"""
+# NOTE: inject_theme() is now a no-op for page files.
+# All CSS is injected once in app.py before st.navigation() runs,
+# which means it persists across every page automatically.
+def inject_theme():
+    pass  # CSS already injected globally by app.py

frontend/utils/api_client.py ADDED Viewed

	@@ -0,0 +1,128 @@

+"""
+utils/api_client.py
+--------------------
+Centralized, cached API wrappers.
+HF Spaces compatible: reads API_URL from environment variable so the
+same code works locally (localhost:8000) and on HuggingFace (localhost:8000
+since both services run in the same container).
+"""
+import os
+import requests
+import pandas as pd
+import streamlit as st
+# HF Spaces: backend always on localhost:8000 inside the container
+API = os.environ.get("API_URL", "http://localhost:8000")
+TIMEOUT = 15
+@st.cache_data(ttl=300)
+def _get(endpoint: str, params: dict | None = None):
+    """Raw cached GET — returns JSON or None on any error."""
+    try:
+        r = requests.get(f"{API}{endpoint}", params=params or {}, timeout=TIMEOUT)
+        r.raise_for_status()
+        return r.json()
+    except requests.exceptions.ConnectionError:
+        return None
+    except requests.exceptions.Timeout:
+        return None
+    except Exception:
+        return None
+def _df(data) -> pd.DataFrame:
+    if not data:
+        return pd.DataFrame()
+    if isinstance(data, list):
+        return pd.DataFrame(data)
+    if isinstance(data, dict):
+        return pd.DataFrame([data])
+    return pd.DataFrame()
+# ── Health ─────────────────────────────────────────────────────────────────────
+def is_online() -> bool:
+    try:
+        requests.get(f"{API}/health", timeout=5)
+        return True
+    except Exception:
+        return False
+# ── /districts/* ───────────────────────────────────────────────────────────────
+def fetch_stats() -> dict:
+    return _get("/districts/stats") or {}
+def fetch_states() -> list[str]:
+    return _get("/districts/states") or []
+def fetch_districts(state: str) -> list[str]:
+    return _get("/districts/list", {"state": state}) or []
+def fetch_district_history(state: str, district: str) -> pd.DataFrame:
+    return _df(_get("/districts/history", {"state": state, "district": district}))
+def fetch_top_districts(
+    state: str | None = None,
+    metric: str = "person_days_lakhs",
+    n: int = 12,
+) -> pd.DataFrame:
+    params = {"metric": metric, "n": n}
+    if state:
+        params["state"] = state
+    return _df(_get("/districts/top", params))
+def fetch_yearly_trend(state: str | None = None) -> pd.DataFrame:
+    params = {"state": state} if state else {}
+    return _df(_get("/districts/trend", params))
+# ── /predictions/* ─────────────────────────────────────────────────────────────
+def fetch_predictions(
+    state: str | None = None,
+    district: str | None = None,
+    year: int | None = None,
+) -> pd.DataFrame:
+    params = {}
+    if state:    params["state"]    = state
+    if district: params["district"] = district
+    if year:     params["year"]     = year
+    return _df(_get("/predictions/", params))
+# ── /optimizer/* ───────────────────────────────────────────────────────────────
+def fetch_optimizer_results(state: str | None = None) -> pd.DataFrame:
+    params = {"state": state} if state else {}
+    return _df(_get("/optimizer/results", params))
+def run_optimizer_live(
+    state: str | None = None,
+    budget_scale: float = 1.0,
+    min_fraction: float = 0.40,
+    max_fraction: float = 2.50,
+) -> dict | None:
+    payload = {
+        "state":        state,
+        "budget_scale": budget_scale,
+        "min_fraction": min_fraction,
+        "max_fraction": max_fraction,
+    }
+    try:
+        r = requests.post(f"{API}/optimizer/run", json=payload, timeout=60)
+        r.raise_for_status()
+        return r.json()
+    except requests.exceptions.ConnectionError:
+        st.error("Cannot reach API — backend may still be starting up, refresh in a moment.")
+        return None
+    except Exception as e:
+        st.error(f"Optimizer error: {e}")
+        return None

hf_start.sh ADDED Viewed

	@@ -0,0 +1,69 @@

+#!/bin/bash
+# hf_start.sh — SchemeImpactNet HuggingFace Spaces entrypoint
+# Runs pipeline (if needed), starts FastAPI on 8000, Streamlit on 7860
+set -euo pipefail
+echo "============================================================"
+echo "  SchemeImpactNet — HuggingFace Spaces Startup"
+echo "============================================================"
+cd /app
+# ── Step 1: Generate / verify processed data ─────────────────────────────────
+echo ""
+echo "→ Checking processed data..."
+NEEDS_PIPELINE=false
+for f in data/processed/mnrega_cleaned.csv \
+  data/processed/mnrega_predictions.csv \
+  data/processed/optimized_budget_allocation.csv; do
+  if [[ ! -f "$f" ]]; then
+    echo "  Missing: $f"
+    NEEDS_PIPELINE=true
+  fi
+done
+if [[ "$NEEDS_PIPELINE" == true ]]; then
+  echo "→ Running data pipeline (Stage 3)..."
+  python main.py --stage 3
+  echo "✓ Pipeline complete"
+else
+  echo "✓ Processed data found — skipping pipeline"
+fi
+# ── Step 2: Start FastAPI backend on port 8000 (background) ──────────────────
+echo ""
+echo "→ Starting FastAPI backend on port 8000..."
+python -m uvicorn backend.main:app \
+  --host 0.0.0.0 \
+  --port 8000 \
+  --log-level warning &
+BACKEND_PID=$!
+# Wait for backend health
+MAX_WAIT=20
+WAITED=0
+until curl -sf "http://localhost:8000/health" >/dev/null 2>&1; do
+  sleep 1
+  WAITED=$((WAITED + 1))
+  if [[ $WAITED -ge $MAX_WAIT ]]; then
+    echo "  ⚠ Backend health timeout — continuing"
+    break
+  fi
+done
+echo "✓ Backend live"
+# ── Step 3: Start Streamlit on HF port 7860 (foreground) ────────────────────
+echo ""
+echo "→ Starting Streamlit frontend on port 7860..."
+echo "✓ Dashboard: https://huggingface.co/spaces/{YOUR_SPACE}"
+echo ""
+exec python -m streamlit run frontend/app.py \
+  --server.port 7860 \
+  --server.address 0.0.0.0 \
+  --server.headless true \
+  --server.enableCORS false \
+  --server.enableXsrfProtection false \
+  --browser.gatherUsageStats false

main.py ADDED Viewed

	@@ -0,0 +1,50 @@

+"""
+main.py
+-------
+Entry point for SchemeImpactNet.
+Usage:
+    python main.py                        # Stage 1 — Maharashtra
+    python main.py --stage 2              # Stage 2 — All-India
+    python main.py --stage 3              # Stage 3 — All-India + optimize
+    python main.py --stage 3 --state Maharashtra  # Stage 3, one state
+    python main.py --optimize-only        # Run optimizer on existing predictions
+"""
+import sys
+from src.pipeline import run_pipeline, run_optimizer_step
+if __name__ == "__main__":
+    args = sys.argv[1:]
+    stage = 1
+    if "--stage" in args:
+        stage = int(args[args.index("--stage") + 1])
+    scope_state = None
+    if "--state" in args:
+        scope_state = args[args.index("--state") + 1]
+    optimize_only = "--optimize-only" in args
+    if optimize_only:
+        print("\nRunning optimizer on existing predictions...")
+        run_optimizer_step(scope_state=scope_state)
+    else:
+        predictions = run_pipeline(stage=stage)
+        print(f"\nTop 10 predicted districts (2023):")
+        latest = predictions[predictions["financial_year"] == 2023]
+        print(
+            latest[["state", "district", "person_days_lakhs", "predicted_persondays"]]
+            .sort_values("predicted_persondays", ascending=False)
+            .head(10)
+            .to_string(index=False)
+        )
+        # Stage 3: automatically run optimizer after model
+        if stage == 3:
+            print("\n" + "─" * 60)
+            print("  Running Stage 3 Budget Optimizer...")
+            print("─" * 60)
+            run_optimizer_step(scope_state=scope_state)

overview.txt ADDED Viewed

	@@ -0,0 +1,92 @@

+### Project Overview: SchemeImpactNet - A Machine Learning Framework for Predictive Impact Analysis and Optimization of Indian Government Schemes
+SchemeImpactNet is an innovative, machine learning-powered platform designed to revolutionize how Indian government schemes are analyzed, predicted, and optimized. Building at the intersection of AI and public policy, this system addresses the limitations of traditional scheme management tools by shifting from reactive administration to proactive, data-driven decision-making. It leverages publicly available datasets from Indian government portals (such as data.gov.in, mospi.gov.in, and scheme-specific sites like pmkisan.gov.in) to forecast the socio-economic impacts of schemes, identify inefficiencies, and recommend optimized resource allocations. This makes it particularly suitable for a final-year engineering project, as it combines real-world data integration, advanced ML algorithms, and practical visualizations, demonstrating technical depth while solving a pressing national issue: enhancing the effectiveness of welfare programs that affect millions.
+The core inspiration stems from the vast, underutilized data on schemes like Pradhan Mantri Kisan Samman Nidhi (PM-KISAN), Mahatma Gandhi National Rural Employment Guarantee Act (MNREGA), Pradhan Mantri Awas Yojana (PMAY), and others. These datasets include beneficiary demographics, budget expenditures, regional implementations, and outcome metrics (e.g., employment generated, houses built, income uplifts). By applying ML, SchemeImpactNet not only manages this data but transforms it into actionable insights—predicting future outcomes and simulating policy tweaks to maximize benefits like poverty alleviation or rural development. Unlike basic management systems (which might have led to your initial rejection), this framework emphasizes predictive analytics and optimization, making it unique, scalable, and aligned with India's National AI Strategy for governance.
+#### Key Features and Benefits
+- **Predictive Impact Analysis**: Uses historical data to forecast scheme performance. For instance, it could predict how MNREGA's job creation in a Maharashtra district might reduce migration rates over the next 5 years, factoring in variables like rainfall, population density, and overlapping schemes.
+- **Optimization Engine**: Recommends budget reallocations or scheme integrations to minimize waste. E.g., if PMAY is underperforming in urban slums due to labor shortages, the system might suggest diverting funds from less critical areas, using optimization algorithms to ensure equitable distribution.
+- **Interconnected Scheme Network**: Models schemes as a graph, revealing dependencies (e.g., how agricultural schemes like PM-KISAN influence health outcomes via better nutrition), enabling holistic policy simulations.
+- **User-Friendly Dashboard**: An interactive interface for stakeholders (policymakers, researchers, or even citizens) to query predictions, visualize data, and explore "what-if" scenarios.
+- **Ethical and Bias-Aware Design**: Incorporates fairness checks to avoid regional biases in predictions, ensuring the system promotes inclusive growth.
+- **Benefits for India-Specific Context**: With over 400 central schemes and trillions in annual budgets, inefficiencies like duplication (e.g., multiple housing aids) cost billions. SchemeImpactNet could help save resources, improve targeting (e.g., to underserved tribal areas), and support evidence-based policymaking, aligning with Sustainable Development Goals (SDGs) like No Poverty and Decent Work.
+This project stands out for examiners because it tackles a real problem with measurable impact: You can quantify improvements (e.g., 15-20% better resource utilization in simulations) using metrics from ML models. It's feasible with open data, requires no proprietary tools, and has extension potential (e.g., integrating real-time APIs from government sites).
+#### System Architecture
+To visualize the high-level structure, here's a text-based diagram representing the end-to-end architecture. (If a graphical diagram is preferred, imagine this as a flowchart: Data sources feed into preprocessing, which branches to ML modules, converging at the optimization and UI layers.)
+```
++-------------------+     +-------------------+     +-------------------+
+|   Data Sources    |     | Data Preprocessing|     |   ML Core Engine  |
+| - data.gov.in     | --> | - Cleaning        | --> | - Predictive Models|
+| - mospi.gov.in    |     | - Integration     |     |   (XGBoost, LSTM) |
+| - Scheme APIs     |     | - Feature Eng.    |     | - Clustering (K-Means)|
++-------------------+     +-------------------+     | - Graph Analysis (GNN)|
+                                                   | - Optimization (RL/PuLP)|
+                                                   +-------------------+
+                                                                |
+                                                                v
++-------------------+     +-------------------+     +-------------------+
+|  Impact Simulation| <-- |   Visualization  | <-- |  User Interface   |
+| - What-If Scenarios|     | - Dashboards     |     | - Web App (Streamlit)|
+| - Network Propagation|   | - Geospatial Maps|     | - Interactive Queries|
++-------------------+     +-------------------+     +-------------------+
+```
+- **Data Layer**: Ingests raw datasets (e.g., CSV files on beneficiary counts, budgets by state/year). Handles challenges like missing values or inconsistent formats using Pandas.
+- **Preprocessing Layer**: Normalizes data, engineers features (e.g., deriving "impact score" from outcomes), and merges datasets (e.g., linking MNREGA jobs to PMAY completions via district codes).
+- **ML Core**:
+  - Predictive: Time-series models (LSTM for forecasting beneficiary growth) and regression (XGBoost for impact scores).
+  - Unsupervised: Clustering districts into performance groups.
+  - Graph-Based: Represents schemes as nodes/edges in a network (using NetworkX/PyTorch Geometric) to model ripple effects.
+  - Optimization: Solves allocation problems (e.g., maximize total impact under budget constraints) with linear programming or reinforcement learning.
+- **Simulation Layer**: Runs scenarios, e.g., "Increase PM-KISAN funding by 10% in drought areas—predict GDP lift."
+- **Visualization & UI Layer**: Outputs charts, maps, and reports. E.g., a heatmap showing predicted poverty reduction across India.
+#### Data Flow and Workflow
+1. **Ingestion**: Automatically pull or upload data from gov sites (focus on 5-10 schemes initially, like agriculture and rural development ones relevant to Maharashtra, given your location).
+2. **Analysis Pipeline**: Feed cleaned data into models. Train on 80% historical data (e.g., 2015-2023), test on recent years.
+3. **Output Generation**: Generate predictions (e.g., "MNREGA in Pimpri-Chinchwad could generate 50,000 jobs by 2027, reducing unemployment by 8%"), optimizations, and visuals.
+4. **Iteration**: Users refine inputs via the dashboard, re-running simulations for refined insights.
+#### Implementation Considerations
+- **Scalability**: Start with subsets (e.g., Maharashtra-focused data for local relevance), expand nationwide.
+- **Challenges and Solutions**: Data privacy (use anonymized aggregates); model accuracy (cross-validate with real outcomes); computational needs (run on local machines with GPU for GNNs if available).
+- **Evaluation**: Measure success via metrics like prediction accuracy (RMSE < 0.1 for forecasts) and optimization gains (e.g., 10-25% efficiency boost in simulations). Compare against baselines like non-ML rule-based allocators.
+- **Future Enhancements**: Integrate NLP for scheme document analysis (e.g., extracting eligibility rules) or blockchain for transparent tracking.
+This elaborate overview positions SchemeImpactNet as a cutting-edge project that not only impresses with its technical sophistication but also its potential societal impact. If diagrams are crucial, I can suggest generating one via tools like Draw.io or Python's Matplotlib in your code—e.g., a simple flowchart script you can run locally. Let me know if you'd like code snippets for that!
+The core problem
+India spends ₹70,000–90,000 crore per year on MNREGA alone. But nobody can reliably answer questions like:
+Will this district generate enough employment next year, or will it fall short?
+Is this district spending efficiently, or is money being wasted?
+Where should we prioritize resources to get the most impact?
+Right now, decisions are made reactively — officials look at last year's numbers and make gut calls. There's no forecasting, no early warning system, no optimization.
+What SchemeImpactNet actually tries to solve
+At its core, three concrete questions:
+1. Prediction — "What will this district's MNREGA performance look like next year?"
+Given historical persondays, expenditure, and other factors → predict future performance. Early warning if a district is going to underperform.
+2. Efficiency Analysis — "Is this district getting good value for money?"
+Some districts generate 50 persondays per ₹1000 spent. Others generate 20. Why? What separates high-performers from low-performers?
+3. Resource Optimization — "Where should budget go to maximize employment generated?"
+Given a fixed budget, which districts should get more funding to maximize total persondays across Maharashtra?
+-----------------------------------------------------------------------------------------------------
+3. Data Sources and Processing
+The dataset used in this study combines real government data with domain-informed estimates to produce a comprehensive district-level MNREGA dataset spanning 2014-15 to 2024-25 across 759 districts and 34 states.
+Primary Source — MNREGA Employment Data: Person days generated and households engaged in work were sourced from the Ministry of Rural Development's official MIS portal via Dataful.in (Dataset ID: 20063), which aggregates monthly district-level records from nreganarep.nic.in. Monthly figures were summed to produce annual totals. Person days were converted from absolute numbers to lakh units by dividing by 100,000.
+Wage and Expenditure Derivation: District-level expenditure was derived using MoRD's officially notified state wage rates, which are revised annually. Expenditure in Rs. lakhs was computed as the product of person days (lakhs) and the prevailing wage rate (Rs./day). Budget allocated was estimated as expenditure divided by 0.89, reflecting the national average budget utilization rate of approximately 89%.
+Rainfall Data: Annual subdivision-level rainfall data was sourced from the India Meteorological Department (IMD) historical dataset covering 1901-2017. IMD meteorological subdivisions were mapped to states. For years 2018-2024 where IMD data was unavailable, rainfall was estimated using each subdivision's 2000-2017 average with ±5% stochastic variation using a fixed random seed for reproducibility.
+Demographic and Poverty Data: Rural population figures were derived from Census of India 2011 state-level rural headcounts, distributed across districts proportional to each district's share of state-level person days. A 1.2% annual growth rate was applied to project values from 2011 to 2024. Poverty rates were sourced from NITI Aayog's National Multidimensional Poverty Index (MPI) 2021 report, with district-level variation introduced based on relative MNREGA activity.
+Scheme Interdependency Features: PM-KISAN beneficiary estimates were computed from rural population assuming 35% farmer household penetration from 2019-20 onwards (scheme launch year), scaled by district activity. PMAY-G housing figures were estimated from 2016-17 onwards using poverty-weighted rural population ratios, with completion rates linearly interpolated from 30% (2016-17) to 85% (2023-24) based on reported national progress.
+Final Dataset: 7,758 district-year observations, 22 features, zero missing values.

reports/model_comparison.csv ADDED Viewed

	@@ -0,0 +1,4 @@

+model,rmse,mae,r2,selected
+XGBoost,2.3301,1.3795,0.9963,★
+GradientBoostingRegressor,1.9383,1.1863,0.9975,
+RandomForestRegressor,2.2926,1.0879,0.9965,

reports/model_report.txt ADDED Viewed

	@@ -0,0 +1,57 @@

+SchemeImpactNet — V4 Model Selection Report
+============================================================
+Best Model    : GradientBoosting
+Selection     : max mean R² excl. 2022 (walk-forward CV)
+Features      : 17
+Evaluation    : Walk-forward CV (2018–2024)
+Algorithm Comparison:
+  Model                       R²     ex22 R²       MAE      RMSE
+  ------------------------------------------------------------
+  GradientBoosting        0.8510      0.9078     8.554    16.334 ← BEST
+  RandomForest            0.8417      0.9063     8.739    16.679
+  Ridge                   0.8018      0.8824     9.975    18.545
+  ElasticNet              0.7982      0.8811     9.890    18.678
+  XGBoost                 0.8533      0.9034     8.457    16.409
+Best Model (GradientBoosting) Walk-Forward CV:
+  Mean R²     : 0.8510
+  excl.2022 R²: 0.9078
+  Mean MAE    : 8.554 lakh
+  Mean RMSE   : 16.334 lakh
+  R² gain     : +0.0737 vs naive lag-1
+Previous (leaked) R²: 0.9963
+Leakage source: works_completed (r=1.0 with target)
+2022 anomaly: West Bengal -93 to -98% reporting drop. Excl. R²=0.9078
+Feature Importances:
+  lag1_pd                             0.5270
+  lag1_adj                            0.2512
+  state_lag1_zscore                   0.0837
+  roll2_mean                          0.0612
+  blended_capacity                    0.0199
+  roll3_mean                          0.0188
+  is_covid                            0.0067
+  lag3_pd                             0.0065
+  state_lag1_norm                     0.0056
+  lag2_pd                             0.0054
+  relative_to_state                   0.0034
+  state_enc                           0.0033
+  roll3_std                           0.0030
+  avg_wage_rate                       0.0015
+  lag1_vs_capacity                    0.0014
+  wage_yoy                            0.0013
+  lag1_is_covid                       0.0000
+Year-by-year CV (GradientBoosting):
+ year   n     r2    mae   rmse         mape  naive_r2  naive_mae  r2_gain  mae_gain
+ 2018 689 0.9160  6.639 13.168 1.996413e+09    0.9124      7.556   0.0036     0.916
+ 2019 701 0.9262  6.380 11.111 1.571437e+10    0.8651      7.484   0.0611     1.104
+ 2020 695 0.8354 12.681 23.825 1.346619e+09    0.7526     18.279   0.0828     5.598
+ 2021 698 0.9261  7.150 14.966 6.480334e+08    0.9384      7.988  -0.0122     0.839
+ 2022 713 0.5101 13.954 28.022 2.442193e+08    0.1804     14.288   0.3297     0.334
+ 2023 709 0.9089  7.403 13.336 3.815669e+10    0.9227      6.984  -0.0139    -0.419
+ 2024 727 0.9345  5.673  9.911 2.038457e+10    0.8697      7.278   0.0648     1.605

requirements.txt CHANGED Viewed

@@ -1,3 +1,30 @@
-altair
-pandas
-streamlit

+contourpy==1.3.3
+cycler==0.12.1
+fonttools==4.61.1
+joblib==1.5.3
+kiwisolver==1.4.9
+matplotlib==3.10.8
+numpy==2.4.2
+nvidia-nccl-cu12==2.29.3
+packaging==26.0
+pandas==3.0.1
+pillow==12.1.1
+pyparsing==3.3.2
+python-dateutil==2.9.0.post0
+scikit-learn==1.8.0
+scipy==1.17.0
+seaborn==0.13.2
+six==1.17.0
+threadpoolctl==3.6.0
+xgboost==3.2.0
+# Backend
+fastapi>=0.104.0
+uvicorn[standard]>=0.24.0
+sqlalchemy>=2.0.0
+pydantic>=2.0.0
+# Frontend
+streamlit
+plotly>=5.17.0
+requests>=2.31.0

src/__init__.py ADDED Viewed

File without changes

src/clean.py ADDED Viewed

	@@ -0,0 +1,98 @@

+"""
+clean.py
+--------
+Cleans and standardizes the unified MNREGA dataset.
+Works for Stage 1 (Maharashtra) through Stage 3 (All-India + scheme data).
+"""
+import pandas as pd
+import numpy as np
+CRITICAL_COLS = ["person_days_lakhs", "expenditure_lakhs", "avg_wage_rate"]
+NON_CRITICAL_COLS = [
+    "households_demanded", "households_offered", "households_availed",
+    "works_completed", "rainfall_mm", "crop_season_index",
+    "rural_population_lakhs", "poverty_rate_pct",
+    "pmkisan_beneficiaries", "pmkisan_amount_lakhs",
+    "pmay_houses_sanctioned", "pmay_houses_completed",
+    "pmay_expenditure_lakhs", "budget_allocated_lakhs"
+]
+def clean(df: pd.DataFrame) -> pd.DataFrame:
+    print("[clean] Starting cleaning pipeline...")
+    df = _strip_strings(df)
+    df = _parse_financial_year(df)
+    df = _cast_numerics(df)
+    df = _handle_missing(df)
+    df = _enforce_logical_constraints(df)
+    print(f"[clean] Done. Shape: {df.shape}")
+    return df
+def _strip_strings(df: pd.DataFrame) -> pd.DataFrame:
+    for col in df.select_dtypes(include="object").columns:
+        df[col] = df[col].str.strip()
+    return df
+def _parse_financial_year(df: pd.DataFrame) -> pd.DataFrame:
+    """Convert '2018-19' → integer 2018."""
+    def _parse(val):
+        val = str(val).strip()
+        return int(val.split("-")[0]) if "-" in val else int(val)
+    df["financial_year"] = df["financial_year"].apply(_parse)
+    print(f"[clean] financial_year range: {df['financial_year'].min()} – {df['financial_year'].max()}")
+    return df
+def _cast_numerics(df: pd.DataFrame) -> pd.DataFrame:
+    all_numeric = CRITICAL_COLS + NON_CRITICAL_COLS
+    for col in all_numeric:
+        if col in df.columns:
+            df[col] = pd.to_numeric(df[col], errors="coerce")
+    return df
+def _handle_missing(df: pd.DataFrame) -> pd.DataFrame:
+    """
+    Critical cols   → forward-fill within district, drop if still null.
+    Non-critical    → forward-fill within district, leave remaining NaN.
+    """
+    df = df.sort_values(["state", "district", "financial_year"])
+    for col in CRITICAL_COLS + NON_CRITICAL_COLS:
+        if col not in df.columns:
+            continue
+        before = df[col].isna().sum()
+        if before > 0:
+            df[col] = df.groupby(["state", "district"])[col].transform(lambda s: s.ffill())
+            filled = before - df[col].isna().sum()
+            if filled > 0:
+                print(f"[clean] '{col}': forward-filled {filled} value(s)")
+    before = len(df)
+    df = df.dropna(subset=CRITICAL_COLS).reset_index(drop=True)
+    if len(df) < before:
+        print(f"[clean] Dropped {before - len(df)} rows with unresolvable critical nulls")
+    return df
+def _enforce_logical_constraints(df: pd.DataFrame) -> pd.DataFrame:
+    """Clip any constraint violations that slipped through generation."""
+    if all(c in df.columns for c in ["households_offered", "households_demanded"]):
+        violations = (df["households_offered"] > df["households_demanded"]).sum()
+        if violations:
+            df["households_offered"] = df[["households_offered", "households_demanded"]].min(axis=1)
+            print(f"[clean] Fixed {violations} households_offered > households_demanded")
+    if all(c in df.columns for c in ["households_availed", "households_offered"]):
+        violations = (df["households_availed"] > df["households_offered"]).sum()
+        if violations:
+            df["households_availed"] = df[["households_availed", "households_offered"]].min(axis=1)
+            print(f"[clean] Fixed {violations} households_availed > households_offered")
+    return df

src/eda.py ADDED Viewed

	@@ -0,0 +1,201 @@

+"""
+eda.py
+------
+Exploratory Data Analysis for MNREGA unified dataset.
+Automatically adapts to Maharashtra-only or All-India data.
+Figures produced:
+    01_statewide_trend.png
+    02_district_performance_ranking.png
+    03_efficiency_ranking.png
+    04_covid_impact.png
+    05_correlation_heatmap.png
+"""
+import os
+import pandas as pd
+import numpy as np
+import matplotlib.pyplot as plt
+import matplotlib.font_manager as fm
+import seaborn as sns
+FIGURES_DIR = os.path.join("reports", "figures")
+os.makedirs(FIGURES_DIR, exist_ok=True)
+sns.set_theme(style="whitegrid", palette="muted")
+plt.rcParams.update({"figure.dpi": 120, "font.size": 10})
+# Use a font that supports the rupee symbol if available, else fallback
+def _get_font():
+    available = [f.name for f in fm.fontManager.ttflist]
+    for font in ["DejaVu Sans", "FreeSans", "Liberation Sans", "Arial"]:
+        if font in available:
+            return font
+    return None
+FONT = _get_font()
+if FONT:
+    plt.rcParams["font.family"] = FONT
+def run_eda(df: pd.DataFrame, scope: str = "Maharashtra") -> None:
+    print(f"\n[eda] Starting EDA — scope: {scope}")
+    _summary_stats(df)
+    _plot_trend(df, scope)
+    _plot_top_bottom_districts(df, scope)
+    _plot_efficiency_ranking(df, scope)
+    _plot_covid_impact(df)
+    _plot_correlation_heatmap(df)
+    print(f"[eda] All figures saved to: {FIGURES_DIR}/")
+# ── 1. Summary ────────────────────────────────────────────────────────────────
+def _summary_stats(df: pd.DataFrame) -> None:
+    print(f"\n[eda] {'─'*50}")
+    print(f"[eda] Rows            : {len(df)}")
+    print(f"[eda] States          : {df['state'].nunique()}")
+    print(f"[eda] Districts       : {df['district'].nunique()}")
+    print(f"[eda] Years           : {df['financial_year'].min()} – {df['financial_year'].max()}")
+    print(f"[eda] Total persondays: {df['person_days_lakhs'].sum():,.1f} lakh")
+    if "expenditure_lakhs" in df.columns:
+        print(f"[eda] Total expenditure: Rs. {df['expenditure_lakhs'].sum():,.1f} lakh")
+    print(f"\n[eda] Person days by year (state-aggregated mean):")
+    by_year = df.groupby("financial_year")["person_days_lakhs"].mean()
+    max_val = by_year.max()
+    for yr, val in by_year.items():
+        bar = "█" * int(val / max_val * 28)
+        print(f"      {yr}: {bar} {val:.2f}")
+    print(f"[eda] {'─'*50}")
+# ── 2. Trend ──────────────────────────────────────────────────────────────────
+def _plot_trend(df: pd.DataFrame, scope: str) -> None:
+    yearly = df.groupby("financial_year").agg(
+        total_persondays=("person_days_lakhs", "sum"),
+    ).reset_index()
+    fig, ax1 = plt.subplots(figsize=(11, 5))
+    ax1.bar(yearly["financial_year"], yearly["total_persondays"],
+            color="#2196F3", alpha=0.75, label="Person Days (lakh)")
+    ax1.set_ylabel("Total Person Days (lakh)", color="#2196F3")
+    ax1.tick_params(axis="y", labelcolor="#2196F3")
+    ax1.set_xlabel("Financial Year")
+    plt.title(f"MNREGA Trend — {scope} (Person Days)")
+    fig.tight_layout()
+    _save("01_statewide_trend.png")
+# ── 3. District rankings ──────────────────────────────────────────────────────
+def _plot_top_bottom_districts(df: pd.DataFrame, scope: str) -> None:
+    avg = df.groupby("district")["person_days_lakhs"].mean().sort_values(ascending=False)
+    n = min(10, len(avg) // 2)
+    top = avg.head(n)
+    bot = avg.tail(n).sort_values()
+    fig, axes = plt.subplots(1, 2, figsize=(14, max(5, n * 0.55)))
+    axes[0].barh(top.index, top.values, color="#4CAF50")
+    axes[0].set_title(f"Top {n} Districts")
+    axes[0].set_xlabel("Avg Person Days (lakh)")
+    axes[0].invert_yaxis()
+    axes[1].barh(bot.index, bot.values, color="#FF7043")
+    axes[1].set_title(f"Bottom {n} Districts")
+    axes[1].set_xlabel("Avg Person Days (lakh)")
+    axes[1].invert_yaxis()
+    plt.suptitle(f"MNREGA District Performance — {scope}", fontsize=13)
+    plt.tight_layout()
+    _save("02_district_performance_ranking.png")
+    print(f"\n[eda] Top 5 districts:")
+    for d, v in avg.head(5).items():
+        print(f"      {d:35s}: {v:.2f} lakh")
+    print(f"[eda] Bottom 5 districts:")
+    for d, v in avg.tail(5).items():
+        print(f"      {d:35s}: {v:.2f} lakh")
+# ── 4. Efficiency ranking ─────────────────────────────────────────────────────
+def _plot_efficiency_ranking(df: pd.DataFrame, scope: str) -> None:
+    if "expenditure_per_personday" not in df.columns:
+        print("[eda] Skipping efficiency ranking — expenditure_per_personday not in V3 features")
+        return
+    eff = (
+        df.groupby("district")["expenditure_per_personday"]
+        .mean().sort_values().dropna()
+    )
+    if len(eff) > 30:
+        eff = pd.concat([eff.head(15), eff.tail(15)])
+    fig, ax = plt.subplots(figsize=(10, max(6, len(eff) * 0.3)))
+    colors = ["#43A047" if v <= eff.median() else "#EF5350" for v in eff.values]
+    ax.barh(eff.index, eff.values, color=colors)
+    ax.axvline(eff.median(), color="navy", linestyle="--",
+               linewidth=1.5, label=f"Median: {eff.median():.1f}")
+    ax.set_title(f"Cost Efficiency — {scope}\n(Rs. expenditure per lakh persondays — lower is better)")
+    ax.set_xlabel("Rs. lakh per lakh persondays")
+    ax.legend()
+    plt.tight_layout()
+    _save("03_efficiency_ranking.png")
+    print(f"\n[eda] Most efficient : {eff.idxmin()} ({eff.min():.1f})")
+    print(f"[eda] Least efficient: {eff.idxmax()} ({eff.max():.1f})")
+# ── 5. COVID impact ───────────────────────────────────────────────────────────
+def _plot_covid_impact(df: pd.DataFrame) -> None:
+    pre  = df[df["financial_year"] == 2019].groupby("district")["person_days_lakhs"].mean()
+    post = df[df["financial_year"] == 2020].groupby("district")["person_days_lakhs"].mean()
+    common = pre.index.intersection(post.index)
+    change = ((post[common] - pre[common]) / pre[common] * 100).sort_values(ascending=False)
+    # Cap at 20 districts for readability
+    show = pd.concat([change.head(10), change.tail(10)]) if len(change) > 20 else change
+    fig, ax = plt.subplots(figsize=(10, max(6, len(show) * 0.35)))
+    colors = ["#388E3C" if v >= 0 else "#D32F2F" for v in show.values]
+    ax.barh(show.index, show.values, color=colors)
+    ax.axvline(0, color="black", linewidth=0.8)
+    ax.set_title("COVID Impact: % Change in Person Days\n(2019-20 to 2020-21)")
+    ax.set_xlabel("% Change")
+    plt.tight_layout()
+    _save("04_covid_impact.png")
+    print(f"\n[eda] COVID — biggest spike   : {change.idxmax()} (+{change.max():.1f}%)")
+    print(f"[eda] COVID — least impacted  : {change.idxmin()} ({change.min():.1f}%)")
+# ── 6. Correlation heatmap ────────────────────────────────────────────────────
+def _plot_correlation_heatmap(df: pd.DataFrame) -> None:
+    candidates = [
+        "person_days_lakhs", "expenditure_lakhs", "avg_wage_rate",
+        "expenditure_per_personday", "lag_person_days", "yoy_growth",
+        "demand_fulfillment_rate", "district_avg_persondays",
+        "rainfall_mm", "poverty_rate_pct", "scheme_overlap_score",
+        "budget_utilization_rate"
+    ]
+    cols = [c for c in candidates if c in df.columns]
+    corr = df[cols].corr()
+    fig, ax = plt.subplots(figsize=(11, 9))
+    mask = np.triu(np.ones_like(corr, dtype=bool))
+    sns.heatmap(corr, mask=mask, annot=True, fmt=".2f",
+                cmap="coolwarm", center=0, ax=ax,
+                linewidths=0.5, annot_kws={"size": 8})
+    ax.set_title("Feature Correlation Heatmap")
+    plt.tight_layout()
+    _save("05_correlation_heatmap.png")
+# ── Helper ────────────────────────────────────────────────────────────────────
+def _save(filename: str) -> None:
+    path = os.path.join(FIGURES_DIR, filename)
+    plt.savefig(path, bbox_inches="tight")
+    plt.close()
+    print(f"[eda] Saved: {path}")

src/extract.py ADDED Viewed

	@@ -0,0 +1,58 @@

+"""
+extract.py
+----------
+Loads and validates the unified MNREGA CSV.
+Supports both the synthetic unified dataset and any real CSV
+that matches the schema.
+"""
+import pandas as pd
+REQUIRED_COLUMNS = {
+    "state", "district", "financial_year",
+    "person_days_lakhs", "expenditure_lakhs", "avg_wage_rate"
+}
+STAGE1_COLUMNS = REQUIRED_COLUMNS
+STAGE2_COLUMNS = STAGE1_COLUMNS | {"rainfall_mm", "crop_season_index", "rural_population_lakhs", "poverty_rate_pct"}
+STAGE3_COLUMNS = STAGE2_COLUMNS | {"pmkisan_beneficiaries", "pmay_houses_sanctioned", "budget_allocated_lakhs"}
+def load_csv(filepath: str, state_filter: str = None) -> pd.DataFrame:
+    """
+    Load unified MNREGA CSV.
+    Args:
+        filepath     : Path to CSV file.
+        state_filter : If provided, filter to a single state e.g. "Maharashtra".
+                       Pass None for all-India (Stage 2+).
+    Returns:
+        Raw DataFrame.
+    """
+    print(f"[extract] Loading: {filepath}")
+    try:
+        df = pd.read_csv(filepath)
+    except FileNotFoundError:
+        raise FileNotFoundError(f"[extract] File not found: {filepath}")
+    # Normalize column names
+    df.columns = [c.strip().lower().replace(" ", "_") for c in df.columns]
+    _validate_columns(df)
+    if state_filter:
+        before = len(df)
+        df = df[df["state"] == state_filter].reset_index(drop=True)
+        print(f"[extract] Filtered to '{state_filter}': {before} → {len(df)} rows")
+    print(f"[extract] Loaded {len(df)} rows | {df['state'].nunique()} state(s) | {df['district'].nunique()} districts | {df['financial_year'].nunique()} years")
+    print(f"[extract] Validation passed ✓")
+    return df
+def _validate_columns(df: pd.DataFrame) -> None:
+    actual = set(df.columns)
+    missing = REQUIRED_COLUMNS - actual
+    if missing:
+        raise ValueError(f"[extract] Missing required columns: {missing}")

src/features.py ADDED Viewed

	@@ -0,0 +1,320 @@

+"""
+features.py
+-----------
+V3 leak-free feature engineering for MNREGA district-level forecasting.
+LEAKAGE AUDIT (what was removed vs original):
+    REMOVED — works_completed         : r=1.00 with target (formula of person_days)
+    REMOVED — expenditure_lakhs       : r=0.976 (person_days × wage_rate)
+    REMOVED — budget_allocated_lakhs  : r=0.976 (derived from expenditure)
+    REMOVED — households_demanded/offered/availed : r=0.94 (copies of target structure)
+    REMOVED — lag_expenditure         : r=0.866 (derived from target)
+    REMOVED — district_avg_persondays : replaced with blended_capacity (safer)
+    REMOVED — yoy_growth              : computed from current-year target → leaky
+    REMOVED — demand_fulfillment_rate : uses current-year availed (target-correlated)
+    REMOVED — all synthetic columns   : rainfall, poverty, pmkisan, pmay (fabricated)
+V3 FEATURES (all computed from lagged/historical values only):
+    lag1_pd            : person_days_lakhs shifted 1 year per district
+    lag2_pd            : shifted 2 years
+    lag3_pd            : shifted 3 years
+    roll2_mean         : 2-year rolling mean of lag1
+    roll3_mean         : 3-year rolling mean of lag1
+    roll3_std          : 3-year rolling std of lag1 (volatility)
+    lag1_adj           : lag1 deflated by COVID multiplier when lag year = 2020
+    lag_yoy            : YoY growth of lag1 vs lag2 (historical, not current)
+    lag2_yoy           : YoY growth of lag2 vs lag3
+    momentum           : lag_yoy - lag2_yoy (acceleration)
+    district_capacity  : expanding mean of lag1 (long-run structural level)
+    blended_capacity   : district_capacity blended with state mean when history < 3yr
+    relative_to_state  : lag1 / state-year lag1 mean (district's share)
+    state_lag1_norm    : state total lag1 / state historical mean
+    lag1_vs_capacity   : lag1 / district_capacity (how anomalous last year was)
+    lag1_zscore        : z-score of lag1 vs district expanding history
+    state_lag1_zscore  : z-score of state-level lag1
+    lag1_extreme       : flag when |lag1_zscore| > 2.5
+    lag1_is_covid      : flag when lag year = 2020
+    history_length     : cumulative count of observations per district
+    avg_wage_rate      : official wage schedule (genuinely exogenous)
+    wage_yoy           : year-on-year % change in wage rate
+    is_covid           : flag for FY 2020 (COVID demand shock year)
+    is_post_covid      : flag for FY >= 2021
+    is_2022_anomaly    : flag for FY 2022 (West Bengal + others reporting anomaly)
+    year_trend         : years since dataset start (linear time trend)
+    state_enc          : label-encoded state
+    district_enc       : label-encoded district (state|district composite)
+Walk-forward CV results (GBR, max_depth=4, lr=0.03, n_est=200, subsample=0.7):
+    Mean R²     : 0.7722  (excl. 2022: 0.8618)
+    Mean MAE    : 10.68L
+    Old R²      : 0.9963  ← was leakage from works_completed (r=1.0)
+"""
+import pandas as pd
+import numpy as np
+from sklearn.preprocessing import LabelEncoder
+# COVID multiplier: how much 2020 inflated vs 2019 nationally
+# Computed from real data: 55.01L / 38.04L = 1.447
+COVID_MULTIPLIER = 1.447
+TARGET = "person_days_lakhs"
+def build_features(df: pd.DataFrame) -> pd.DataFrame:
+    """
+    Main entry point. Takes a cleaned DataFrame and returns it with
+    all V3 features added. Drops rows with no lag1/lag2 (first 1-2 years
+    per district cannot be used for training).
+    Args:
+        df : Cleaned DataFrame with at minimum:
+             state, district, financial_year, person_days_lakhs,
+             households_availed, avg_wage_rate
+    Returns:
+        Feature-engineered DataFrame ready for model training/inference.
+    """
+    print("[features] Building V3 leak-free features...")
+    df = df.sort_values(["state", "district", "financial_year"]).reset_index(drop=True)
+    df = _lag_features(df)
+    df = _rolling_features(df)
+    df = _covid_features(df)
+    df = _trend_features(df)
+    df = _capacity_features(df)
+    df = _anomaly_features(df)
+    df = _state_features(df)
+    df = _temporal_flags(df)
+    df = _wage_features(df)
+    df = _encode_categoricals(df)
+    # Drop rows with no lag1/lag2 — cannot train or predict without history
+    before = len(df)
+    df = df.dropna(subset=["lag1_pd", "lag2_pd"]).reset_index(drop=True)
+    print(f"[features] Dropped {before - len(df)} rows (insufficient history)")
+    print(f"[features] Done. Final shape: {df.shape}")
+    return df
+# ── Lag features ──────────────────────────────────────────────────────────────
+def _lag_features(df: pd.DataFrame) -> pd.DataFrame:
+    grp = df.groupby(["state", "district"])
+    df["lag1_pd"] = grp[TARGET].shift(1)
+    df["lag2_pd"] = grp[TARGET].shift(2)
+    df["lag3_pd"] = grp[TARGET].shift(3)
+    df["lag1_hh"] = grp["households_availed"].shift(1)
+    return df
+# ── Rolling statistics (computed on lag1, so no leakage) ─────────────────────
+def _rolling_features(df: pd.DataFrame) -> pd.DataFrame:
+    lag1 = df.groupby(["state", "district"])["lag1_pd"]
+    df["roll2_mean"] = lag1.transform(lambda s: s.rolling(2, min_periods=1).mean())
+    df["roll3_mean"] = lag1.transform(lambda s: s.rolling(3, min_periods=1).mean())
+    df["roll3_std"]  = lag1.transform(
+        lambda s: s.rolling(3, min_periods=1).std().fillna(0)
+    )
+    return df
+# ── COVID-aware lag adjustment ────────────────────────────────────────────────
+def _covid_features(df: pd.DataFrame) -> pd.DataFrame:
+    """
+    When predicting year T and lag1 comes from 2020 (COVID spike),
+    the model would otherwise extrapolate the spike forward. We:
+      1. Flag that lag1 is a COVID year value.
+      2. Provide a deflated version (lag1_adj) so the model has a
+         COVID-corrected signal alongside the raw lag1.
+    """
+    df["lag1_is_covid"] = (df["financial_year"] - 1 == 2020).astype(int)
+    df["lag1_adj"] = np.where(
+        df["lag1_is_covid"] == 1,
+        df["lag1_pd"] / COVID_MULTIPLIER,
+        df["lag1_pd"]
+    )
+    return df
+# ── YoY trend / momentum (all historical — no current-year leakage) ───────────
+def _trend_features(df: pd.DataFrame) -> pd.DataFrame:
+    df["lag_yoy"] = (
+        (df["lag1_pd"] - df["lag2_pd"]) / df["lag2_pd"].replace(0, np.nan)
+    ).clip(-1, 3)
+    df["lag2_yoy"] = (
+        (df["lag2_pd"] - df["lag3_pd"]) / df["lag3_pd"].replace(0, np.nan)
+    ).clip(-1, 3)
+    df["momentum"] = df["lag_yoy"] - df["lag2_yoy"]
+    return df
+# ── District structural capacity ──────────────────────────────────────────────
+def _capacity_features(df: pd.DataFrame) -> pd.DataFrame:
+    """
+    district_capacity: expanding mean of lag1 — the district's long-run level.
+    blended_capacity : when history is short (<3 years), blend district mean
+                       with state mean to reduce cold-start noise.
+    """
+    df["district_capacity"] = df.groupby(["state", "district"])["lag1_pd"].transform(
+        lambda s: s.expanding().mean()
+    )
+    df["history_length"] = df.groupby(["state", "district"]).cumcount()
+    state_mean = df.groupby(["state", "financial_year"])["lag1_pd"].transform("mean")
+    df["blended_capacity"] = np.where(
+        df["history_length"] < 3,
+        0.5 * df["district_capacity"].fillna(state_mean) + 0.5 * state_mean,
+        df["district_capacity"]
+    )
+    # How anomalous was last year vs the district's own history?
+    df["lag1_vs_capacity"] = (
+        df["lag1_pd"] / df["blended_capacity"].replace(0, np.nan)
+    ).clip(0, 5).fillna(1.0)
+    # Lagged household ratio (demand signal — uses only lagged values)
+    df["lag1_hh_ratio"] = (
+        df["lag1_hh"] / df["blended_capacity"].replace(0, np.nan)
+    ).clip(0, 5).fillna(1.0)
+    return df
+# ── Anomaly detection ─────────────────────────────────────────────────────────
+def _rolling_zscore(s: pd.Series) -> pd.Series:
+    """Z-score of each value vs its own expanding historical mean/std."""
+    exp_mean = s.shift(1).expanding().mean()
+    exp_std  = s.shift(1).expanding().std().fillna(1).replace(0, 1)
+    return ((s - exp_mean) / exp_std).clip(-4, 4)
+def _anomaly_features(df: pd.DataFrame) -> pd.DataFrame:
+    """
+    Detect when lag1_pd is anomalous for this district or state.
+    The model uses these to discount or adjust its reliance on lag1
+    when it was an outlier year (e.g. West Bengal in 2022).
+    """
+    # District-level z-score of lag1
+    df["lag1_zscore"] = df.groupby(["state", "district"])[TARGET].transform(
+        lambda s: _rolling_zscore(s).shift(1)
+    ).fillna(0)
+    df["lag1_extreme"] = (df["lag1_zscore"].abs() > 2.5).astype(int)
+    return df
+# ── State-level features ──────────────────────────────────────────────────────
+def _state_features(df: pd.DataFrame) -> pd.DataFrame:
+    """
+    State-level lag and z-score. Captures state budget decisions and
+    policy changes that affect all districts simultaneously.
+    """
+    # State total person_days per year
+    state_yr = (
+        df.groupby(["state", "financial_year"])[TARGET]
+        .sum().reset_index()
+        .rename(columns={TARGET: "state_total"})
+    )
+    state_yr["state_total_lag1"] = state_yr.groupby("state")["state_total"].shift(1)
+    # State z-score of lag1
+    state_yr["state_lag1_zscore"] = state_yr.groupby("state")["state_total"].transform(
+        lambda s: _rolling_zscore(s)
+    )
+    # Normalised state lag (state lag relative to its own history)
+    state_hist_mean = state_yr.groupby("state")["state_total_lag1"].transform("mean")
+    state_yr["state_lag1_norm"] = (
+        state_yr["state_total_lag1"] / state_hist_mean.replace(0, np.nan)
+    ).clip(0, 5).fillna(1.0)
+    df = df.merge(
+        state_yr[["state", "financial_year",
+                  "state_lag1_zscore", "state_lag1_norm"]],
+        on=["state", "financial_year"],
+        how="left"
+    )
+    # District's position relative to state mean (its structural share)
+    state_yr_lag = df.groupby(["state", "financial_year"])["lag1_pd"].transform("mean")
+    df["relative_to_state"] = (
+        df["lag1_pd"] / state_yr_lag.replace(0, np.nan)
+    ).clip(0, 10).fillna(1.0)
+    return df
+# ── Temporal flags ────────────────────────────────────────────────────────────
+def _temporal_flags(df: pd.DataFrame) -> pd.DataFrame:
+    fy_min = df["financial_year"].min()
+    df["year_trend"]      = df["financial_year"] - fy_min
+    df["is_covid"]        = (df["financial_year"] == 2020).astype(int)
+    df["is_post_covid"]   = (df["financial_year"] >= 2021).astype(int)
+    df["is_2022_anomaly"] = (df["financial_year"] == 2022).astype(int)
+    return df
+# ── Wage features ─────────────────────────────────────────────────────────────
+def _wage_features(df: pd.DataFrame) -> pd.DataFrame:
+    """
+    avg_wage_rate is the official state-notified wage schedule — genuinely
+    exogenous (set by government, not derived from person_days).
+    wage_yoy captures the policy signal of wage revision speed.
+    """
+    if "avg_wage_rate" not in df.columns:
+        return df
+    df["wage_yoy"] = (
+        df.groupby(["state", "district"])["avg_wage_rate"]
+        .pct_change(fill_method=None)
+        .fillna(0)
+        .clip(-0.2, 0.5)
+    )
+    return df
+# ── Categorical encoding ──────────────────────────────────────────────────────
+def _encode_categoricals(df: pd.DataFrame) -> pd.DataFrame:
+    le_state = LabelEncoder()
+    le_dist  = LabelEncoder()
+    df["state_enc"]    = le_state.fit_transform(df["state"].astype(str))
+    df["district_enc"] = le_dist.fit_transform(
+        (df["district"] + "|" + df["state"]).astype(str)
+    )
+    return df
+# ── Feature list for model ────────────────────────────────────────────────────
+# Canonical lean feature set — chosen by permutation importance analysis.
+# All features are computed from lagged/historical values only.
+FEATURE_COLS = [
+    "lag1_pd",
+    "roll2_mean",
+    "roll3_mean",
+    "lag1_adj",
+    "lag2_pd",
+    "lag3_pd",
+    "roll3_std",
+    "state_lag1_norm",
+    "relative_to_state",
+    "blended_capacity",
+    "lag1_vs_capacity",
+    "state_lag1_zscore",
+    "state_enc",
+    "is_covid",
+    "lag1_is_covid",
+    "wage_yoy",
+    "avg_wage_rate",
+]

src/generate_synthetic.py ADDED Viewed

	@@ -0,0 +1,184 @@

+"""
+generate_synthetic.py
+----------------------
+Generates realistic synthetic MNREGA district-level data for Maharashtra.
+Mimics the structure of real data available from:
+- nregarep1.nic.in (MoRD official portal)
+- dataful.in (district-wise persondays + expenditure)
+Columns produced match what you'd get from real sources:
+    state, district, financial_year,
+    households_demanded, households_offered, households_availed,
+    person_days, expenditure_lakhs, avg_wage_rate, works_completed
+Design principles for realism:
+    - Each district has a stable "base capacity" (some districts are
+      structurally larger / more active than others)
+    - Year-on-year growth follows real MNREGA trends (spike in 2020-21
+      due to COVID reverse migration, slowdown in urban-adjacent districts)
+    - Expenditure correlates with person_days but has noise (efficiency varies)
+    - Wage rate increases over years (matches real wage revision schedule)
+    - ~8% missing values injected randomly to simulate real data quality
+"""
+import numpy as np
+import pandas as pd
+import os
+# ── Maharashtra districts (all 36) ───────────────────────────────────────────
+MAHARASHTRA_DISTRICTS = [
+    "Ahmednagar", "Akola", "Amravati", "Aurangabad", "Beed",
+    "Bhandara", "Buldhana", "Chandrapur", "Dhule", "Gadchiroli",
+    "Gondia", "Hingoli", "Jalgaon", "Jalna", "Kolhapur",
+    "Latur", "Mumbai City", "Mumbai Suburban", "Nagpur", "Nanded",
+    "Nandurbar", "Nashik", "Osmanabad", "Palghar", "Parbhani",
+    "Pune", "Raigad", "Ratnagiri", "Sangli", "Satara",
+    "Sindhudurg", "Solapur", "Thane", "Wardha", "Washim", "Yavatmal"
+]
+YEARS = [
+    "2014-15", "2015-16", "2016-17", "2017-18", "2018-19",
+    "2019-20", "2020-21", "2021-22", "2022-23", "2023-24"
+]
+# Real MNREGA wage rates in Maharashtra (approx ₹/day by year)
+WAGE_RATES = {
+    "2014-15": 162, "2015-16": 174, "2016-17": 183, "2017-18": 194,
+    "2018-19": 203, "2019-20": 213, "2020-21": 238, "2021-22": 256,
+    "2022-23": 273, "2023-24": 289
+}
+# Year-level demand multipliers based on real MNREGA trends
+# COVID year (2020-21) saw massive spike due to reverse migration
+YEAR_MULTIPLIERS = {
+    "2014-15": 0.85, "2015-16": 0.90, "2016-17": 0.92, "2017-18": 0.95,
+    "2018-19": 1.00, "2019-20": 1.05, "2020-21": 1.45, "2021-22": 1.20,
+    "2022-23": 1.10, "2023-24": 1.08
+}
+# District profile: (base_persondays_lakhs, efficiency_score, rural_weight)
+# Urban/peri-urban districts have lower base; tribal/rural have higher
+DISTRICT_PROFILES = {
+    "Gadchiroli":      (18.5, 0.72, 0.95),
+    "Nandurbar":       (16.2, 0.68, 0.93),
+    "Yavatmal":        (15.8, 0.74, 0.91),
+    "Amravati":        (14.3, 0.76, 0.88),
+    "Chandrapur":      (13.9, 0.71, 0.87),
+    "Washim":          (12.1, 0.73, 0.89),
+    "Buldhana":        (11.8, 0.75, 0.86),
+    "Beed":            (11.5, 0.70, 0.90),
+    "Hingoli":         (10.9, 0.72, 0.88),
+    "Osmanabad":       (10.7, 0.69, 0.87),
+    "Latur":           (10.4, 0.71, 0.85),
+    "Nanded":          (10.2, 0.73, 0.84),
+    "Jalna":           (9.8,  0.74, 0.85),
+    "Parbhani":        (9.5,  0.72, 0.84),
+    "Akola":           (9.3,  0.75, 0.83),
+    "Dhule":           (9.1,  0.70, 0.85),
+    "Gondia":          (8.9,  0.76, 0.82),
+    "Bhandara":        (8.6,  0.74, 0.81),
+    "Wardha":          (8.3,  0.77, 0.80),
+    "Ahmednagar":      (8.1,  0.78, 0.79),
+    "Solapur":         (7.9,  0.76, 0.80),
+    "Aurangabad":      (7.6,  0.79, 0.75),
+    "Jalgaon":         (7.4,  0.77, 0.77),
+    "Nashik":          (7.1,  0.80, 0.73),
+    "Satara":          (6.8,  0.81, 0.74),
+    "Sangli":          (6.5,  0.80, 0.73),
+    "Kolhapur":        (6.2,  0.82, 0.71),
+    "Palghar":         (6.0,  0.75, 0.78),
+    "Nandurbar":       (5.8,  0.71, 0.82),
+    "Ratnagiri":       (5.5,  0.79, 0.74),
+    "Sindhudurg":      (5.1,  0.80, 0.72),
+    "Raigad":          (4.8,  0.78, 0.68),
+    "Pune":            (4.2,  0.83, 0.55),
+    "Thane":           (3.5,  0.81, 0.45),
+    "Mumbai Suburban": (1.2,  0.85, 0.15),
+    "Mumbai City":     (0.4,  0.88, 0.05),
+}
+def generate(seed: int = 42, missing_rate: float = 0.08) -> pd.DataFrame:
+    """
+    Generate a synthetic MNREGA dataset for Maharashtra.
+    Args:
+        seed        : Random seed for reproducibility.
+        missing_rate: Fraction of cells to nullify (simulates real data gaps).
+    Returns:
+        DataFrame with realistic MNREGA data.
+    """
+    rng = np.random.default_rng(seed)
+    records = []
+    for district in MAHARASHTRA_DISTRICTS:
+        profile = DISTRICT_PROFILES.get(district, (7.0, 0.75, 0.70))
+        base_pd, efficiency, rural_w = profile
+        for year in YEARS:
+            year_mult = YEAR_MULTIPLIERS[year]
+            wage = WAGE_RATES[year]
+            # ── Person days (in lakhs) ────────────────────────────────────
+            noise = rng.normal(1.0, 0.07)
+            person_days_lakhs = base_pd * year_mult * noise
+            person_days_lakhs = max(person_days_lakhs, 0.1)
+            # ── Households ───────────────────────────────────────────────
+            # Avg ~45 days per household → households = person_days / 45
+            hh_demanded = int(person_days_lakhs * 1e5 / 38 * rng.uniform(1.05, 1.15))
+            hh_offered   = int(hh_demanded * rng.uniform(0.92, 0.99))
+            hh_availed   = int(hh_offered  * rng.uniform(0.88, 0.97))
+            # ── Expenditure (₹ lakhs) ────────────────────────────────────
+            # Base = person_days * wage_rate, efficiency introduces noise
+            base_expenditure = person_days_lakhs * 1e5 * wage / 1e5
+            expenditure_lakhs = base_expenditure / efficiency * rng.uniform(0.93, 1.07)
+            # ── Works completed ──────────────────────────────────────────
+            works = int(person_days_lakhs * rng.uniform(18, 35))
+            records.append({
+                "state":                "Maharashtra",
+                "district":             district,
+                "financial_year":       year,
+                "households_demanded":  hh_demanded,
+                "households_offered":   hh_offered,
+                "households_availed":   hh_availed,
+                "person_days_lakhs":    round(person_days_lakhs, 3),
+                "expenditure_lakhs":    round(expenditure_lakhs, 2),
+                "avg_wage_rate":        wage,
+                "works_completed":      works,
+            })
+    df = pd.DataFrame(records)
+    # ── Inject realistic missing values ──────────────────────────────────────
+    nullable_cols = [
+        "households_demanded", "households_offered",
+        "households_availed", "works_completed"
+    ]
+    for col in nullable_cols:
+        mask = rng.random(len(df)) < missing_rate
+        df.loc[mask, col] = np.nan
+    print(f"[generate] Created {len(df)} rows × {len(df.columns)} columns")
+    print(f"[generate] Districts: {df['district'].nunique()} | Years: {df['financial_year'].nunique()}")
+    print(f"[generate] Missing values injected: ~{missing_rate*100:.0f}% per nullable column")
+    return df
+def save(df: pd.DataFrame, path: str = "data/raw/mnrega_maharashtra_synthetic.csv") -> None:
+    os.makedirs(os.path.dirname(path), exist_ok=True)
+    df.to_csv(path, index=False)
+    print(f"[generate] Saved → {path}")
+if __name__ == "__main__":
+    df = generate()
+    save(df)
+    print("\nSample:")
+    print(df.head(6).to_string(index=False))

src/model.py ADDED Viewed

	@@ -0,0 +1,656 @@

+"""
+model.py
+--------
+V4 Multi-Algorithm Model Selection for MNREGA district-level forecasting.
+Algorithms compared via walk-forward CV:
+    - GradientBoostingRegressor  (current champion)
+    - RandomForestRegressor
+    - XGBoost
+    - LightGBM
+    - Ridge (linear baseline)
+    - ElasticNet (regularised linear baseline)
+Selection criterion: mean R² across walk-forward CV years (excl. 2022 anomaly).
+Best model is saved to models/mnrega_best_model.pkl.
+W&B logging:
+    - Each algorithm gets its own W&B run (group="mnrega_model_selection")
+    - Per-year CV metrics logged as time-series
+    - Feature importance logged as bar chart
+    - Model comparison summary table logged
+    - Best model flagged with tag "champion"
+Usage:
+    export WANDB_API_KEY=your_key   # or wandb login
+    python main.py --stage 3
+"""
+import os
+import pickle
+import warnings
+import numpy as np
+import pandas as pd
+import matplotlib
+matplotlib.use("Agg")
+import matplotlib.pyplot as plt
+from sklearn.ensemble import GradientBoostingRegressor, RandomForestRegressor
+from sklearn.linear_model import Ridge, ElasticNet
+from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
+from sklearn.preprocessing import StandardScaler
+from sklearn.pipeline import Pipeline
+warnings.filterwarnings("ignore")
+# Optional imports — graceful fallback if not installed
+try:
+    from xgboost import XGBRegressor
+    HAS_XGB = True
+except ImportError:
+    HAS_XGB = False
+    print("[model] xgboost not installed — skipping")
+try:
+    from lightgbm import LGBMRegressor
+    HAS_LGB = True
+except ImportError:
+    HAS_LGB = False
+    print("[model] lightgbm not installed — skipping")
+try:
+    import wandb
+    HAS_WANDB = True
+except ImportError:
+    HAS_WANDB = False
+    print("[model] wandb not installed — metrics will be logged locally only")
+from src.features import FEATURE_COLS
+TARGET      = "person_days_lakhs"
+FIGURES_DIR = os.path.join("reports", "figures")
+OUTPUT_DIR  = os.path.join("data", "processed")
+MODELS_DIR  = "models"
+MODEL_PATH  = os.path.join(MODELS_DIR, "mnrega_best_model.pkl")
+WANDB_PROJECT = "SchemeImpactNet"
+WANDB_GROUP   = "mnrega_model_selection"
+os.makedirs(FIGURES_DIR, exist_ok=True)
+os.makedirs(OUTPUT_DIR,  exist_ok=True)
+os.makedirs(MODELS_DIR,  exist_ok=True)
+# Walk-forward CV test years
+WF_TEST_YEARS = [2018, 2019, 2020, 2021, 2022, 2023, 2024]
+# ── Algorithm registry ────────────────────────────────────────────────────────
+def _build_candidates() -> dict:
+    """
+    Returns dict of {name: estimator}.
+    Each estimator is either a plain sklearn estimator or a Pipeline
+    (for linear models that need scaling).
+    """
+    candidates = {
+        "GradientBoosting": GradientBoostingRegressor(
+            n_estimators=200, max_depth=4, learning_rate=0.03,
+            subsample=0.7, min_samples_leaf=10, random_state=42,
+        ),
+        "RandomForest": RandomForestRegressor(
+            n_estimators=300, max_depth=8, min_samples_leaf=10,
+            n_jobs=-1, random_state=42,
+        ),
+        "Ridge": Pipeline([
+            ("scaler", StandardScaler()),
+            ("model",  Ridge(alpha=10.0)),
+        ]),
+        "ElasticNet": Pipeline([
+            ("scaler", StandardScaler()),
+            ("model",  ElasticNet(alpha=0.1, l1_ratio=0.5, max_iter=2000)),
+        ]),
+    }
+    if HAS_XGB:
+        candidates["XGBoost"] = XGBRegressor(
+            n_estimators=200, max_depth=4, learning_rate=0.03,
+            subsample=0.7, colsample_bytree=0.8,
+            reg_alpha=0.1, reg_lambda=1.0,
+            random_state=42, verbosity=0,
+        )
+    if HAS_LGB:
+        candidates["LightGBM"] = LGBMRegressor(
+            n_estimators=200, max_depth=4, learning_rate=0.03,
+            subsample=0.7, colsample_bytree=0.8,
+            reg_alpha=0.1, reg_lambda=1.0,
+            random_state=42, verbosity=-1,
+        )
+    return candidates
+# ── Main entry point ──────────────────────────────────────────────────────────
+def run_model(df: pd.DataFrame) -> pd.DataFrame:
+    """
+    Full model selection pipeline:
+      1. Walk-forward CV for each algorithm candidate
+      2. Select best by mean R² (excl. 2022)
+      3. Train winner on all data
+      4. Save model + metadata pkl
+      5. Generate figures + W&B logs
+      6. Return predictions DataFrame
+    """
+    print("\n[model] ── V4 Multi-Algorithm Model Selection ───────────────")
+    features = _get_features(df)
+    print(f"[model] Features ({len(features)}): {features}")
+    print(f"[model] Algorithms: {list(_build_candidates().keys())}")
+    candidates = _build_candidates()
+    # ── Walk-forward CV for all candidates ───────���────────────────────────
+    all_cv_results = {}
+    for name, estimator in candidates.items():
+        print(f"\n[model] ── {name} ──")
+        cv = _walk_forward_cv(df, features, estimator, name)
+        all_cv_results[name] = cv
+    # ── Select best model ─────────────────────────────────────────────────
+    best_name, best_cv = _select_best(all_cv_results)
+    print(f"\n[model] ✓ Best model: {best_name}")
+    # ── Print full comparison table ───────────────────────────────────────
+    _print_comparison_table(all_cv_results)
+    # ── Train winner on all data ──────────────────────────────────────────
+    print(f"\n[model] Training {best_name} on all {len(df):,} district-years...")
+    best_estimator = candidates[best_name]
+    X_all = df[features].fillna(0)
+    y_all = df[TARGET]
+    best_estimator.fit(X_all, y_all)
+    # ── Log to W&B ────────────────────────────────────────────────────────
+    if HAS_WANDB:
+        _wandb_log_all(all_cv_results, best_name, best_estimator, features, df)
+    # ── Save best model ───────────────────────────────────────────────────
+    _save_model(best_name, best_estimator, features, best_cv, all_cv_results, df)
+    # ── Figures ───────────────────────────────────────────────────────────
+    _plot_model_comparison(all_cv_results, best_name)
+    _plot_cv_per_year(all_cv_results, best_name)
+    _plot_feature_importance(best_name, best_estimator, features)
+    # ── Predictions + report ──────────────────────────────────────────────
+    predictions_df = _predict_all(best_estimator, df, features)
+    _save_predictions(predictions_df)
+    _save_model_report(best_name, best_cv, all_cv_results, features, best_estimator)
+    print("\n[model] ── V4 Pipeline Complete ─────────────────────────────\n")
+    return predictions_df
+# ── Walk-forward CV ───────────────────────────────────────────────────────────
+def _walk_forward_cv(
+    df: pd.DataFrame,
+    features: list,
+    estimator,
+    name: str,
+) -> pd.DataFrame:
+    """Walk-forward CV: train on years < T, evaluate on T."""
+    print(f"  {'Year':<6} {'n':>5}  {'R²':>8}  {'MAE':>8}  {'RMSE':>8}  {'Naive R²':>10}  {'R² gain':>8}")
+    print(f"  {'-'*68}")
+    rows = []
+    for test_yr in WF_TEST_YEARS:
+        tr = df[df["financial_year"] < test_yr]
+        te = df[df["financial_year"] == test_yr]
+        if len(tr) < 200 or len(te) < 50:
+            continue
+        import copy
+        m = copy.deepcopy(estimator)
+        m.fit(tr[features].fillna(0), tr[TARGET])
+        pred  = m.predict(te[features].fillna(0))
+        naive = te["lag1_pd"].fillna(te[TARGET].mean()).values
+        r2      = r2_score(te[TARGET], pred)
+        mae     = mean_absolute_error(te[TARGET], pred)
+        rmse    = np.sqrt(mean_squared_error(te[TARGET], pred))
+        naive_r2  = r2_score(te[TARGET], naive)
+        naive_mae = mean_absolute_error(te[TARGET], naive)
+        mape    = np.mean(np.abs((te[TARGET].values - pred) / (te[TARGET].values + 1e-9))) * 100
+        print(f"  {test_yr:<6} {len(te):>5}  {r2:>8.4f}  {mae:>8.3f}  {rmse:>8.3f}  "
+              f"{naive_r2:>10.4f}  {r2-naive_r2:>+8.4f}")
+        rows.append({
+            "year": test_yr, "n": len(te),
+            "r2": round(r2, 4),
+            "mae": round(mae, 3),
+            "rmse": round(rmse, 3),
+            "mape": round(mape, 3),
+            "naive_r2": round(naive_r2, 4),
+            "naive_mae": round(naive_mae, 3),
+            "r2_gain": round(r2 - naive_r2, 4),
+            "mae_gain": round(naive_mae - mae, 3),
+        })
+    cv = pd.DataFrame(rows)
+    ex22 = cv[cv["year"] != 2022]
+    print(f"  → Mean R²={cv['r2'].mean():.4f}  excl.2022 R²={ex22['r2'].mean():.4f}  "
+          f"MAE={cv['mae'].mean():.3f}L")
+    return cv
+# ── Model selection ───────────────────────────────────────────────────────────
+def _select_best(all_cv: dict) -> tuple:
+    """Select best model by mean R² excluding 2022 anomaly year."""
+    scores = {}
+    for name, cv in all_cv.items():
+        ex22 = cv[cv["year"] != 2022]
+        scores[name] = ex22["r2"].mean()
+    best_name = max(scores, key=scores.get)
+    print(f"\n[model] Model selection (mean R² excl. 2022):")
+    for name, score in sorted(scores.items(), key=lambda x: -x[1]):
+        marker = " ← BEST" if name == best_name else ""
+        print(f"  {name:<20}: {score:.4f}{marker}")
+    return best_name, all_cv[best_name]
+def _print_comparison_table(all_cv: dict) -> None:
+    print(f"\n[model] Full comparison (all years):")
+    print(f"  {'Model':<20}  {'R²':>8}  {'excl22 R²':>10}  {'MAE':>8}  {'RMSE':>8}  {'R²gain':>8}")
+    print(f"  {'-'*72}")
+    for name, cv in all_cv.items():
+        ex22 = cv[cv["year"] != 2022]
+        print(f"  {name:<20}  {cv['r2'].mean():>8.4f}  {ex22['r2'].mean():>10.4f}  "
+              f"{cv['mae'].mean():>8.3f}  {cv['rmse'].mean():>8.3f}  "
+              f"{cv['r2_gain'].mean():>+8.4f}")
+# ── W&B logging ───────────────────────────────────────────────────────────────
+def _wandb_log_all(
+    all_cv: dict,
+    best_name: str,
+    best_estimator,
+    features: list,
+    df: pd.DataFrame,
+) -> None:
+    """Log all model results to W&B — one run per algorithm + one summary run."""
+    # ── Per-algorithm runs ────────────────────────────────────────────────
+    for name, cv in all_cv.items():
+        ex22 = cv[cv["year"] != 2022]
+        tags = ["champion"] if name == best_name else []
+        run = wandb.init(
+            project=WANDB_PROJECT,
+            group=WANDB_GROUP,
+            name=name,
+            tags=tags,
+            config={
+                "algorithm": name,
+                "n_features": len(features),
+                "features": features,
+                "wf_test_years": WF_TEST_YEARS,
+                "target": TARGET,
+                "is_best": name == best_name,
+            },
+            reinit=True,
+        )
+        # Per-year CV metrics as time series
+        for _, row in cv.iterrows():
+            run.log({
+                "year": int(row["year"]),
+                "r2": row["r2"],
+                "mae": row["mae"],
+                "rmse": row["rmse"],
+                "mape": row["mape"],
+                "naive_r2": row["naive_r2"],
+                "r2_gain": row["r2_gain"],
+                "mae_gain": row["mae_gain"],
+                "is_anomaly_year": int(row["year"]) == 2022,
+            })
+        # Summary metrics
+        run.summary.update({
+            "cv_mean_r2":     round(cv["r2"].mean(), 4),
+            "cv_ex22_r2":     round(ex22["r2"].mean(), 4),
+            "cv_mean_mae":    round(cv["mae"].mean(), 3),
+            "cv_mean_rmse":   round(cv["rmse"].mean(), 3),
+            "cv_mean_mape":   round(cv["mape"].mean(), 3),
+            "cv_r2_gain":     round(cv["r2_gain"].mean(), 4),
+            "n_districts":    df["district"].nunique(),
+            "n_states":       df["state"].nunique(),
+            "train_years":    len(df["financial_year"].unique()),
+        })
+        # Feature importance (tree-based only)
+        fi = _get_feature_importance(name, best_estimator if name == best_name else None, features)
+        if fi is not None and name == best_name:
+            fi_table = wandb.Table(
+                columns=["feature", "importance"],
+                data=[[f, v] for f, v in sorted(fi.items(), key=lambda x: -x[1])]
+            )
+            run.log({"feature_importance": wandb.plot.bar(
+                fi_table, "feature", "importance",
+                title=f"Feature Importance — {name}"
+            )})
+        # CV R² chart per year
+        cv_table = wandb.Table(dataframe=cv[["year","r2","naive_r2","mae","rmse","r2_gain"]])
+        run.log({
+            "cv_results_table": cv_table,
+            "cv_r2_chart": wandb.plot.line_series(
+                xs=cv["year"].tolist(),
+                ys=[cv["r2"].tolist(), cv["naive_r2"].tolist()],
+                keys=["Model R²", "Naive R²"],
+                title=f"Walk-Forward CV R² — {name}",
+                xname="Financial Year",
+            ),
+        })
+        run.finish()
+    # ── Summary comparison run ────────────────────────────────────────────
+    run = wandb.init(
+        project=WANDB_PROJECT,
+        group=WANDB_GROUP,
+        name="model_selection_summary",
+        tags=["summary"],
+        reinit=True,
+    )
+    summary_rows = []
+    for name, cv in all_cv.items():
+        ex22 = cv[cv["year"] != 2022]
+        summary_rows.append([
+            name,
+            round(cv["r2"].mean(), 4),
+            round(ex22["r2"].mean(), 4),
+            round(cv["mae"].mean(), 3),
+            round(cv["rmse"].mean(), 3),
+            round(cv["mape"].mean(), 3),
+            round(cv["r2_gain"].mean(), 4),
+            name == best_name,
+        ])
+    summary_table = wandb.Table(
+        columns=["model", "mean_r2", "ex22_r2", "mean_mae",
+                 "mean_rmse", "mean_mape", "r2_gain", "is_best"],
+        data=summary_rows,
+    )
+    run.log({
+        "model_comparison": summary_table,
+        "best_model": best_name,
+        "best_ex22_r2": round(all_cv[best_name][all_cv[best_name]["year"] != 2022]["r2"].mean(), 4),
+    })
+    # Comparison bar chart
+    run.log({
+        "r2_comparison": wandb.plot.bar(
+            wandb.Table(
+                columns=["model", "ex22_r2"],
+                data=[[r[0], r[2]] for r in summary_rows]
+            ),
+            "model", "ex22_r2",
+            title="Model Comparison — R² excl. 2022",
+        )
+    })
+    run.finish()
+    print(f"[model] W&B logs complete → project: {WANDB_PROJECT} / group: {WANDB_GROUP}")
+# ── Figures ───────────────────────────────────────────────────────────────────
+def _plot_model_comparison(all_cv: dict, best_name: str) -> None:
+    """Bar chart comparing all models on mean R² (all years and excl. 2022)."""
+    names = list(all_cv.keys())
+    mean_r2  = [all_cv[n]["r2"].mean() for n in names]
+    ex22_r2  = [all_cv[n][all_cv[n]["year"] != 2022]["r2"].mean() for n in names]
+    mean_mae = [all_cv[n]["mae"].mean() for n in names]
+    x = np.arange(len(names))
+    w = 0.35
+    fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(14, 5))
+    bars1 = ax1.bar(x - w/2, mean_r2,  w, label="All years",    alpha=0.8, color="#42A5F5")
+    bars2 = ax1.bar(x + w/2, ex22_r2, w, label="excl. 2022",   alpha=0.8, color="#26A69A")
+    ax1.set_xticks(x); ax1.set_xticklabels(names, rotation=20, ha="right")
+    ax1.set_ylabel("Mean R² (Walk-Forward CV)")
+    ax1.set_title("Model Comparison — R² Score")
+    ax1.set_ylim(0, 1)
+    ax1.legend()
+    # Annotate best
+    best_idx = names.index(best_name)
+    ax1.annotate("★ BEST", xy=(best_idx + w/2, ex22_r2[best_idx] + 0.01),
+                 ha="center", color="#E53935", fontsize=9, fontweight="bold")
+    bars3 = ax2.bar(x, mean_mae, alpha=0.8,
+                    color=["#E53935" if n == best_name else "#78909C" for n in names])
+    ax2.set_xticks(x); ax2.set_xticklabels(names, rotation=20, ha="right")
+    ax2.set_ylabel("Mean MAE (lakh person-days)")
+    ax2.set_title("Model Comparison — MAE")
+    for bar in bars3:
+        ax2.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 0.1,
+                 f"{bar.get_height():.2f}", ha="center", va="bottom", fontsize=8)
+    plt.suptitle("SchemeImpactNet V4 — Algorithm Selection Results", fontsize=12, fontweight="bold")
+    plt.tight_layout()
+    path = os.path.join(FIGURES_DIR, "06_model_comparison.png")
+    plt.savefig(path, dpi=150, bbox_inches="tight")
+    plt.close()
+    print(f"[model] Saved: {path}")
+def _plot_cv_per_year(all_cv: dict, best_name: str) -> None:
+    """Line chart: R² per year for every algorithm."""
+    fig, axes = plt.subplots(1, 2, figsize=(14, 5))
+    colors = plt.cm.tab10(np.linspace(0, 1, len(all_cv)))
+    for (name, cv), color in zip(all_cv.items(), colors):
+        lw  = 2.5 if name == best_name else 1.2
+        ls  = "-"  if name == best_name else "--"
+        alpha = 1.0 if name == best_name else 0.65
+        axes[0].plot(cv["year"], cv["r2"], marker="o", label=name,
+                     linewidth=lw, linestyle=ls, alpha=alpha, color=color)
+        axes[1].plot(cv["year"], cv["mae"], marker="o", label=name,
+                     linewidth=lw, linestyle=ls, alpha=alpha, color=color)
+    for ax in axes:
+        ax.axvspan(2021.5, 2022.5, alpha=0.08, color="red", label="2022 anomaly")
+        ax.axvspan(2019.5, 2020.5, alpha=0.05, color="orange", label="COVID-2020")
+        ax.set_xticks(WF_TEST_YEARS)
+        ax.set_xlabel("Financial Year")
+        ax.legend(fontsize=8)
+    axes[0].set_ylabel("R²"); axes[0].set_title("Walk-Forward CV R² by Year")
+    axes[1].set_ylabel("MAE (lakh PD)"); axes[1].set_title("Walk-Forward CV MAE by Year")
+    plt.suptitle("All Models — Walk-Forward CV Results", fontsize=12, fontweight="bold")
+    plt.tight_layout()
+    path = os.path.join(FIGURES_DIR, "07_cv_per_year.png")
+    plt.savefig(path, dpi=150, bbox_inches="tight")
+    plt.close()
+    print(f"[model] Saved: {path}")
+def _plot_feature_importance(name: str, estimator, features: list) -> None:
+    fi = _get_feature_importance(name, estimator, features)
+    if fi is None:
+        return
+    imp = pd.Series(fi).sort_values()
+    fig, ax = plt.subplots(figsize=(8, max(5, len(imp) * 0.35)))
+    colors = ["#E53935" if imp[f] > imp.quantile(0.75) else "#42A5F5" for f in imp.index]
+    imp.plot(kind="barh", ax=ax, color=colors)
+    ax.set_title(f"Feature Importances — {name} (Best Model)")
+    ax.set_xlabel("Importance Score")
+    plt.tight_layout()
+    path = os.path.join(FIGURES_DIR, "08_feature_importance.png")
+    plt.savefig(path, dpi=150, bbox_inches="tight")
+    plt.close()
+    print(f"[model] Saved: {path}")
+    print(f"\n[model] Top 5 features ({name}):")
+    for feat, val in imp.sort_values(ascending=False).head(5).items():
+        print(f"  {feat:<35}: {val:.4f}")
+def _get_feature_importance(name: str, estimator, features: list):
+    """Extract feature importance — works for tree models and linear models."""
+    if estimator is None:
+        return None
+    try:
+        # Tree-based: direct feature_importances_
+        if hasattr(estimator, "feature_importances_"):
+            return dict(zip(features, estimator.feature_importances_))
+        # Pipeline with tree inside
+        if hasattr(estimator, "named_steps"):
+            inner = list(estimator.named_steps.values())[-1]
+            if hasattr(inner, "feature_importances_"):
+                return dict(zip(features, inner.feature_importances_))
+            if hasattr(inner, "coef_"):
+                return dict(zip(features, np.abs(inner.coef_)))
+        # XGBoost / LightGBM
+        if hasattr(estimator, "feature_importances_"):
+            return dict(zip(features, estimator.feature_importances_))
+    except Exception:
+        pass
+    return None
+# ── Model persistence ─────────────────────────────────────────────────────────
+def _save_model(
+    best_name: str,
+    best_estimator,
+    features: list,
+    best_cv: pd.DataFrame,
+    all_cv: dict,
+    df: pd.DataFrame,
+) -> None:
+    ex22 = best_cv[best_cv["year"] != 2022]
+    # Build comparison summary for the bundle
+    comparison = {}
+    for name, cv in all_cv.items():
+        e22 = cv[cv["year"] != 2022]
+        comparison[name] = {
+            "mean_r2": round(cv["r2"].mean(), 4),
+            "ex22_r2": round(e22["r2"].mean(), 4),
+            "mean_mae": round(cv["mae"].mean(), 3),
+            "mean_rmse": round(cv["rmse"].mean(), 3),
+        }
+    bundle = {
+        "model":              best_estimator,
+        "model_name":         best_name,
+        "features":           features,
+        "target":             TARGET,
+        "covid_multiplier":   1.447,
+        "train_years":        sorted(df["financial_year"].unique().tolist()),
+        "n_districts":        df["district"].nunique(),
+        "n_states":           df["state"].nunique(),
+        "feature_importance": _get_feature_importance(best_name, best_estimator, features),
+        "cv_results":         best_cv.to_dict(),
+        "cv_mean_r2":         round(best_cv["r2"].mean(), 4),
+        "cv_ex22_r2":         round(ex22["r2"].mean(), 4),
+        "cv_mean_mae":        round(best_cv["mae"].mean(), 3),
+        "all_model_comparison": comparison,
+    }
+    with open(MODEL_PATH, "wb") as f:
+        pickle.dump(bundle, f)
+    print(f"\n[model] Model saved → {MODEL_PATH}")
+    print(f"[model] Best: {best_name}  |  ex22 R²={ex22['r2'].mean():.4f}  |  MAE={best_cv['mae'].mean():.3f}L")
+def load_model(path: str = MODEL_PATH) -> dict:
+    """Load the saved best model bundle."""
+    with open(path, "rb") as f:
+        bundle = pickle.load(f)
+    print(f"[model] Loaded: {bundle['model_name']} from {path}")
+    print(f"[model] ex22 R²={bundle['cv_ex22_r2']}  |  MAE={bundle['cv_mean_mae']}L")
+    return bundle
+# ── Prediction helpers ────────────────────────────────────────────────────────
+def _predict_all(estimator, df: pd.DataFrame, features: list) -> pd.DataFrame:
+    preds = estimator.predict(df[features].fillna(0))
+    out = df[["state", "district", "financial_year", TARGET]].copy()
+    out["predicted_persondays"] = preds.round(3)
+    out["prediction_error"]     = (out[TARGET] - out["predicted_persondays"]).round(3)
+    out["abs_error"]            = out["prediction_error"].abs()
+    return out
+def _save_predictions(df: pd.DataFrame) -> None:
+    path = os.path.join(OUTPUT_DIR, "mnrega_predictions.csv")
+    df.to_csv(path, index=False)
+    print(f"[model] Predictions saved → {path}")
+# ── Report ────────────────────────────────────────────────────────────────────
+def _save_model_report(
+    best_name: str,
+    best_cv: pd.DataFrame,
+    all_cv: dict,
+    features: list,
+    best_estimator,
+) -> None:
+    ex22 = best_cv[best_cv["year"] != 2022]
+    path = os.path.join("reports", "model_report.txt")
+    os.makedirs("reports", exist_ok=True)
+    with open(path, "w") as f:
+        f.write("SchemeImpactNet — V4 Model Selection Report\n")
+        f.write("=" * 60 + "\n\n")
+        f.write(f"Best Model    : {best_name}\n")
+        f.write(f"Selection     : max mean R² excl. 2022 (walk-forward CV)\n")
+        f.write(f"Features      : {len(features)}\n")
+        f.write(f"Evaluation    : Walk-forward CV (2018–2024)\n\n")
+        f.write("Algorithm Comparison:\n")
+        f.write(f"  {'Model':<20}  {'R²':>8}  {'ex22 R²':>10}  {'MAE':>8}  {'RMSE':>8}\n")
+        f.write(f"  {'-'*60}\n")
+        for name, cv in all_cv.items():
+            e22 = cv[cv["year"] != 2022]
+            marker = " ← BEST" if name == best_name else ""
+            f.write(f"  {name:<20}  {cv['r2'].mean():>8.4f}  "
+                    f"{e22['r2'].mean():>10.4f}  {cv['mae'].mean():>8.3f}  "
+                    f"{cv['rmse'].mean():>8.3f}{marker}\n")
+        f.write(f"\nBest Model ({best_name}) Walk-Forward CV:\n")
+        f.write(f"  Mean R²     : {best_cv['r2'].mean():.4f}\n")
+        f.write(f"  excl.2022 R²: {ex22['r2'].mean():.4f}\n")
+        f.write(f"  Mean MAE    : {best_cv['mae'].mean():.3f} lakh\n")
+        f.write(f"  Mean RMSE   : {best_cv['rmse'].mean():.3f} lakh\n")
+        f.write(f"  R² gain     : {best_cv['r2_gain'].mean():+.4f} vs naive lag-1\n\n")
+        f.write(f"Previous (leaked) R²: 0.9963\n")
+        f.write(f"Leakage source: works_completed (r=1.0 with target)\n\n")
+        f.write(f"2022 anomaly: West Bengal -93 to -98% reporting drop. Excl. R²={ex22['r2'].mean():.4f}\n\n")
+        fi = _get_feature_importance(best_name, best_estimator, features)
+        if fi:
+            f.write("Feature Importances:\n")
+            for feat, val in sorted(fi.items(), key=lambda x: -x[1]):
+                f.write(f"  {feat:<35} {val:.4f}\n")
+        f.write(f"\nYear-by-year CV ({best_name}):\n")
+        f.write(best_cv.to_string(index=False))
+    print(f"[model] Report saved → {path}")
+# ── Feature list helper ───────────────────────────────────────────────────────
+def _get_features(df: pd.DataFrame) -> list:
+    available = [f for f in FEATURE_COLS if f in df.columns]
+    missing   = [f for f in FEATURE_COLS if f not in df.columns]
+    if missing:
+        print(f"[model] Warning: {len(missing)} features not in df: {missing}")
+    return available

src/optimize.py ADDED Viewed

	@@ -0,0 +1,210 @@

+"""
+optimize.py  (v2 — proportional rank-based LP)
+-----------------------------------------------
+Fixes the LP bang-bang problem caused by low efficiency variance (~7.7% CV).
+Root cause: With efficiency ranging only 0.0026–0.0039, pure LP pushes
+every district to either MIN_FRACTION floor or MAX_FRACTION ceiling.
+462 districts hit -60%, 262 hit +150%, only 1 in-between.
+Fix: Two-stage allocation
+  Stage 1 — Proportional rank allocation
+    Compute efficiency percentile rank (0→1) per district.
+    Assign multiplier: rank 0 → 0.60×, rank 1 → 1.80×
+    Rescale to preserve total budget.
+    → Produces a continuous, meaningful spread of -40% to +80%
+  Stage 2 — LP refinement within ±15% of stage1
+    Tighter LP bounds around the proportional solution.
+    LP fills in genuine optimality within the constrained band.
+    → Adds economic rigour without collapsing to bang-bang.
+Result: 725 unique budget_change_pct values, realistic distribution,
+        same total budget, higher total employment.
+"""
+import os
+import numpy as np
+import pandas as pd
+import matplotlib.pyplot as plt
+import matplotlib.patches as mpatches
+from scipy.optimize import linprog
+FIGURES_DIR = os.path.join("reports", "figures")
+OUTPUT_DIR  = os.path.join("data", "processed")
+os.makedirs(FIGURES_DIR, exist_ok=True)
+os.makedirs(OUTPUT_DIR, exist_ok=True)
+# Stage 1 bounds
+RANK_FLOOR = 0.60   # worst district keeps 60% of budget  → -40%
+RANK_CEIL  = 1.80   # best district gets 180% of budget   → +80%
+# Stage 2 LP refinement band around stage1
+LP_REFINE_BAND = 0.15   # ±15% around stage1 solution
+# Hard absolute limits
+ABS_MIN_FRACTION = 0.40
+ABS_MAX_FRACTION = 2.00
+def run_optimizer(
+    predictions_path: str = "data/processed/mnrega_predictions.csv",
+    raw_path: str = "data/raw/mnrega_real_data_final_clean.csv",
+    scope_state: str = None,
+    total_budget_override: float = None,
+    target_year: int = 2024,
+) -> pd.DataFrame:
+    print("\n[optimizer-v2] ── Budget Allocation Optimizer (Proportional-LP) ──")
+    df = _prepare_data(predictions_path, raw_path, scope_state, target_year)
+    result = _optimize(df, total_budget_override)
+    _print_summary(result)
+    _plot_allocation_comparison(result, scope_state or "All-India")
+    _plot_efficiency_gain(result, scope_state or "All-India")
+    _save_results(result)
+    print("[optimizer-v2] ── Optimization Complete ────────────────────────────\n")
+    return result
+def _prepare_data(predictions_path, raw_path, scope_state, target_year):
+    preds = pd.read_csv(predictions_path)
+    preds = preds[preds["financial_year"] == target_year].copy()
+    raw = pd.read_csv(raw_path)
+    raw["financial_year"] = raw["financial_year"].apply(
+        lambda v: int(str(v).split("-")[0])
+    )
+    budget = raw[raw["financial_year"] == target_year][
+        ["state", "district", "budget_allocated_lakhs", "expenditure_lakhs"]
+    ].copy()
+    df = preds.merge(budget, on=["state", "district"], how="inner")
+    df = df.dropna(subset=["budget_allocated_lakhs", "predicted_persondays"])
+    df = df[df["budget_allocated_lakhs"] > 0].reset_index(drop=True)
+    if scope_state:
+        df = df[df["state"] == scope_state].reset_index(drop=True)
+    print(f"[optimizer-v2] Scope: {scope_state or 'All-India'} | Districts: {len(df)} | Year: {target_year}")
+    df["persondays_per_lakh"] = df["predicted_persondays"] / df["budget_allocated_lakhs"]
+    print(f"[optimizer-v2] Efficiency CV: {df['persondays_per_lakh'].std()/df['persondays_per_lakh'].mean()*100:.1f}%")
+    print(f"[optimizer-v2] Total budget: ₹{df['budget_allocated_lakhs'].sum():,.0f} lakh")
+    return df
+def _optimize(df: pd.DataFrame, total_budget_override: float = None) -> pd.DataFrame:
+    current_budgets = df["budget_allocated_lakhs"].values
+    efficiency      = df["persondays_per_lakh"].values
+    total_budget    = total_budget_override or current_budgets.sum()
+    # ── Stage 1: Proportional rank allocation ──────────────────────────────
+    eff_rank = pd.Series(efficiency).rank(pct=True).values   # 0 → 1
+    # Linear interpolation: worst district → RANK_FLOOR×, best → RANK_CEIL×
+    multipliers = RANK_FLOOR + eff_rank * (RANK_CEIL - RANK_FLOOR)
+    stage1_raw  = current_budgets * multipliers
+    # Rescale to preserve total budget
+    scale = total_budget / stage1_raw.sum()
+    stage1 = stage1_raw * scale
+    print(f"[optimizer-v2] Stage 1 (proportional rank) range: "
+          f"{((stage1-current_budgets)/current_budgets*100).min():.1f}% to "
+          f"{((stage1-current_budgets)/current_budgets*100).max():.1f}%")
+    # ── Stage 2: LP refinement within ±LP_REFINE_BAND of stage1 ──────────
+    lb = np.maximum(stage1 * (1 - LP_REFINE_BAND),
+                    current_budgets * ABS_MIN_FRACTION)
+    ub = np.minimum(stage1 * (1 + LP_REFINE_BAND),
+                    current_budgets * ABS_MAX_FRACTION)
+    res = linprog(
+        -efficiency,
+        A_ub=[np.ones(len(df))],
+        b_ub=[total_budget],
+        bounds=list(zip(lb, ub)),
+        method="highs",
+    )
+    if res.success:
+        optimized = res.x
+        print(f"[optimizer-v2] Stage 2 LP converged ✓ | Unique values: {pd.Series(optimized.round(2)).nunique()}")
+    else:
+        print(f"[optimizer-v2] LP failed, using stage1 allocation")
+        optimized = stage1
+    df = df.copy()
+    df["optimized_budget"]    = optimized.round(2)
+    df["budget_change"]       = df["optimized_budget"] - df["budget_allocated_lakhs"]
+    df["budget_change_pct"]   = (df["budget_change"] / df["budget_allocated_lakhs"] * 100).round(2)
+    df["sq_persondays"]       = df["predicted_persondays"]
+    df["opt_persondays"]      = (df["persondays_per_lakh"] * df["optimized_budget"]).round(3)
+    df["persondays_gain"]     = (df["opt_persondays"] - df["sq_persondays"]).round(3)
+    df["persondays_gain_pct"] = (df["persondays_gain"] / df["sq_persondays"] * 100).round(2)
+    return df
+def _print_summary(df):
+    sq  = df["sq_persondays"].sum()
+    opt = df["opt_persondays"].sum()
+    gain = opt - sq
+    print(f"\n[optimizer-v2] ── Results ───────────────────────────────────────")
+    print(f"  budget_change_pct — min: {df['budget_change_pct'].min():.1f}%  "
+          f"max: {df['budget_change_pct'].max():.1f}%  "
+          f"std: {df['budget_change_pct'].std():.1f}%  "
+          f"unique: {df['budget_change_pct'].nunique()}")
+    print(f"  Status quo : {sq:>10,.2f} lakh PD")
+    print(f"  Optimized  : {opt:>10,.2f} lakh PD")
+    print(f"  Net gain   : {gain:>+10,.2f} lakh PD  ({gain/sq*100:+.2f}%)")
+    print(f"  Budget     : ₹{df['budget_allocated_lakhs'].sum():,.0f} lakh (unchanged)")
+    print(f"[optimizer-v2] ────────────────────────────────────────────────────")
+    print("\n[optimizer-v2] Top 5 districts to INCREASE:")
+    print(df.nlargest(5, "persondays_gain")[
+        ["state","district","budget_allocated_lakhs","optimized_budget","budget_change_pct","persondays_gain"]
+    ].to_string(index=False))
+    print("\n[optimizer-v2] Top 5 districts to REDUCE:")
+    print(df.nsmallest(5, "budget_change")[
+        ["state","district","budget_allocated_lakhs","optimized_budget","budget_change_pct","persondays_gain"]
+    ].to_string(index=False))
+def _plot_allocation_comparison(df, scope):
+    show = pd.concat([df.nlargest(10,"budget_change"), df.nsmallest(10,"budget_change")]).drop_duplicates()
+    show = show.sort_values("budget_change")
+    fig, ax = plt.subplots(figsize=(12, max(7, len(show)*0.4)))
+    x = np.arange(len(show)); w = 0.38
+    ax.barh(x-w/2, show["budget_allocated_lakhs"].values, height=w, color="#90CAF9", label="Status Quo")
+    ax.barh(x+w/2, show["optimized_budget"].values,       height=w, color="#1565C0", label="Optimized")
+    ax.set_yticks(x); ax.set_yticklabels(show["district"], fontsize=8)
+    ax.set_xlabel("Budget (Rs. lakh)"); ax.set_title(f"Budget Reallocation — {scope}"); ax.legend()
+    plt.tight_layout(); _save_fig("08_budget_allocation_comparison.png")
+def _plot_efficiency_gain(df, scope):
+    fig, ax = plt.subplots(figsize=(10, 7))
+    colors = df["budget_change"].apply(lambda v: "#2E7D32" if v > 0 else "#C62828")
+    ax.scatter(df["persondays_per_lakh"], df["budget_change_pct"], c=colors, alpha=0.55, s=40)
+    ax.axhline(0, color="black", linewidth=0.8, linestyle="--")
+    ax.set_xlabel("Efficiency (PD per ₹ lakh)"); ax.set_ylabel("Budget Change (%)")
+    ax.set_title(f"Efficiency vs Budget Change — {scope}")
+    gain = mpatches.Patch(color="#2E7D32", label="Increase"); cut = mpatches.Patch(color="#C62828", label="Decrease")
+    ax.legend(handles=[gain, cut]); plt.tight_layout(); _save_fig("09_efficiency_gain_by_district.png")
+def _save_results(df):
+    cols = ["state","district","budget_allocated_lakhs","optimized_budget",
+            "budget_change","budget_change_pct","sq_persondays","opt_persondays",
+            "persondays_gain","persondays_gain_pct","persondays_per_lakh"]
+    path = os.path.join(OUTPUT_DIR, "optimized_budget_allocation.csv")
+    df[cols].sort_values("persondays_gain", ascending=False).to_csv(path, index=False)
+    print(f"[optimizer-v2] Saved → {path}")
+def _save_fig(filename):
+    path = os.path.join(FIGURES_DIR, filename)
+    plt.savefig(path, bbox_inches="tight"); plt.close()
+    print(f"[optimizer-v2] Saved: {path}")

src/pipeline.py ADDED Viewed

	@@ -0,0 +1,212 @@

+"""
+pipeline.py
+-----------
+V3 pipeline orchestrator for SchemeImpactNet.
+Changes from original:
+    - RAW_PATH now points to the real Dataful government CSV
+      (confirmed 99% match with mnrega_india_unified.csv, <0.005L diff)
+    - Feature engineering uses V3 leak-free features (src/features.py)
+    - Model uses GBR V3 with walk-forward CV (src/model.py)
+    - Model saved to models/mnrega_gbr_v3.pkl
+    - Removed generate_synthetic dependency from Stage 1
+    - Stage 3 model comparison retained but flags honest metrics
+Data sources:
+    Real:      data/raw/20063- Dataful/mnrega-...-persondays-...csv
+               → person_days_lakhs, households_availed (real gov data)
+               → avg_wage_rate (official wage schedule, exogenous)
+    Synthetic: all other columns (rainfall, poverty, pmkisan, pmay)
+               → EXCLUDED from V3 model features
+"""
+import os
+import pandas as pd
+import numpy as np
+from src.clean   import clean
+from src.features import build_features
+from src.eda     import run_eda
+from src.model   import run_model
+# ── Data paths ────────────────────────────────────────────────────────────────
+DATAFUL_PATH   = os.path.join(
+    "data", "raw", "20063- Dataful",
+    "mnrega-year-month-state-and-district-wise-total-persondays-"
+    "and-households-engaged-in-work.csv"
+)
+UNIFIED_PATH   = os.path.join("data", "raw", "mnrega_india_unified.csv")
+PROCESSED_PATH = os.path.join("data", "processed", "mnrega_cleaned.csv")
+MODEL_PATH     = os.path.join("models", "mnrega_best_model.pkl")
+SCOPE_LABEL = {
+    1: "Maharashtra",
+    2: "All-India",
+    3: "All-India (V3 leak-free)",
+}
+def run_pipeline(stage: int = 3) -> pd.DataFrame:
+    assert stage in [1, 2, 3], "Stage must be 1, 2, or 3"
+    print("\n" + "=" * 60)
+    print(f"  SchemeImpactNet V3 — Stage {stage} Pipeline")
+    print(f"  Scope : {SCOPE_LABEL[stage]}")
+    print("=" * 60)
+    # ── Extract ───────────────────────────────────────────────────
+    print(f"\n[pipeline] Step 1: Extract (real government data)")
+    df = _load_real_data(state_filter="Maharashtra" if stage == 1 else None)
+    # ── Clean ─────────────────────────────────────────────────────
+    print(f"\n[pipeline] Step 2: Clean")
+    df = _clean_real(df)
+    # ── Features ──────────────────────────────────────────────────
+    print(f"\n[pipeline] Step 3: V3 Feature Engineering (leak-free)")
+    df = build_features(df)
+    # ── Save processed ────────────────────────────────────────────
+    os.makedirs(os.path.dirname(PROCESSED_PATH), exist_ok=True)
+    df.to_csv(PROCESSED_PATH, index=False)
+    print(f"\n[pipeline] Processed data saved → {PROCESSED_PATH}")
+    # ── EDA ───────────────────────────────────────────────────────
+    print(f"\n[pipeline] Step 4: EDA")
+    run_eda(df, scope=SCOPE_LABEL[stage])
+    # ── Model ─────────────────────────────────────────────────────
+    print(f"\n[pipeline] Step 5: V3 Model (walk-forward CV + pkl save)")
+    predictions = run_model(df)
+    print("\n" + "=" * 60)
+    print(f"  Stage {stage} Complete!")
+    print(f"  Processed   : {PROCESSED_PATH}")
+    print(f"  Model       : {MODEL_PATH}")
+    print(f"  Figures     : reports/figures/")
+    print(f"  Predictions : data/processed/mnrega_predictions.csv")
+    print(f"  Report      : reports/model_report.txt")
+    print("=" * 60 + "\n")
+    return predictions
+# ── Real data loader ──────────────────────────────────────────────────────────
+def _load_real_data(state_filter: str = None) -> pd.DataFrame:
+    """
+    Load and pivot the Dataful government CSV from long format
+    (one row per district-month-category) to annual wide format
+    (one row per district-year with person_days_lakhs + households_availed).
+    Falls back to unified CSV if Dataful not found.
+    """
+    if os.path.exists(DATAFUL_PATH):
+        print(f"[pipeline] Loading Dataful government CSV: {DATAFUL_PATH}")
+        df_raw = pd.read_csv(DATAFUL_PATH)
+        df_raw.columns = [c.strip().lower().replace(" ", "_") for c in df_raw.columns]
+        # Parse fiscal year start integer from '2014-15' → 2014
+        df_raw["fy"] = df_raw["fiscal_year"].apply(
+            lambda v: int(str(v).split("-")[0]) if "-" in str(v) else int(v)
+        )
+        # Exclude incomplete current fiscal year
+        df_raw = df_raw[df_raw["fy"] <= 2024]
+        # Pivot: sum monthly values to annual per district
+        pivot = df_raw.pivot_table(
+            index=["fiscal_year", "fy", "state", "district"],
+            columns="category",
+            values="value",
+            aggfunc="sum"
+        ).reset_index()
+        pivot.columns.name = None
+        # Rename to match model schema
+        pivot = pivot.rename(columns={
+            "Persondays": "person_days",
+            "Household":  "households_availed",
+            "fy":         "financial_year",
+        })
+        pivot["person_days_lakhs"] = (pivot["person_days"] / 1e5).round(3)
+        # Bring in avg_wage_rate from unified CSV (official schedule, exogenous)
+        if os.path.exists(UNIFIED_PATH):
+            df_uni = pd.read_csv(UNIFIED_PATH)
+            df_uni.columns = [c.strip().lower().replace(" ", "_") for c in df_uni.columns]
+            df_uni["financial_year"] = df_uni["financial_year"].apply(
+                lambda v: int(str(v).split("-")[0]) if "-" in str(v) else int(v)
+            )
+            wage_map = df_uni[["state", "financial_year", "avg_wage_rate"]].drop_duplicates()
+            pivot = pivot.merge(wage_map, on=["state", "financial_year"], how="left")
+        # Keep only needed columns
+        keep = ["state", "district", "financial_year",
+                "person_days_lakhs", "households_availed", "avg_wage_rate"]
+        df = pivot[[c for c in keep if c in pivot.columns]].copy()
+    else:
+        print(f"[pipeline] Dataful CSV not found, falling back to unified CSV")
+        print(f"[pipeline] NOTE: unified CSV contains synthetic columns — "
+              f"V3 features ignore them")
+        df = pd.read_csv(UNIFIED_PATH)
+        df.columns = [c.strip().lower().replace(" ", "_") for c in df.columns]
+        df["financial_year"] = df["financial_year"].apply(
+            lambda v: int(str(v).split("-")[0]) if "-" in str(v) else int(v)
+        )
+    if state_filter:
+        before = len(df)
+        df = df[df["state"] == state_filter].reset_index(drop=True)
+        print(f"[pipeline] Filtered to {state_filter}: {before} → {len(df)} rows")
+    print(f"[pipeline] Loaded {len(df):,} rows | "
+          f"{df['state'].nunique()} states | "
+          f"{df['district'].nunique()} districts | "
+          f"{df['financial_year'].nunique()} years "
+          f"({df['financial_year'].min()}–{df['financial_year'].max()})")
+    return df
+def _clean_real(df: pd.DataFrame) -> pd.DataFrame:
+    """
+    Lightweight clean for the real Dataful data.
+    The full clean() from src/clean.py expects synthetic columns —
+    we do a minimal version here.
+    """
+    df = df.sort_values(["state", "district", "financial_year"]).reset_index(drop=True)
+    # Strip strings
+    for col in df.select_dtypes(include="object").columns:
+        df[col] = df[col].str.strip()
+    # Numeric cast
+    for col in ["person_days_lakhs", "households_availed", "avg_wage_rate"]:
+        if col in df.columns:
+            df[col] = pd.to_numeric(df[col], errors="coerce")
+    # Forward-fill wage within state (official schedule rarely changes mid-year)
+    if "avg_wage_rate" in df.columns:
+        df["avg_wage_rate"] = df.groupby("state")["avg_wage_rate"].transform(
+            lambda s: s.ffill().bfill()
+        )
+    # Drop rows with no person_days_lakhs
+    before = len(df)
+    df = df.dropna(subset=["person_days_lakhs"]).reset_index(drop=True)
+    if len(df) < before:
+        print(f"[pipeline] Dropped {before - len(df)} rows with null person_days_lakhs")
+    print(f"[pipeline] Cleaned. Shape: {df.shape}")
+    return df
+def run_optimizer_step(scope_state: str = None) -> None:
+    """Run the budget optimizer after predictions are generated."""
+    from src.optimize import run_optimizer
+    run_optimizer(
+        predictions_path=os.path.join("data", "processed", "mnrega_predictions.csv"),
+        raw_path=UNIFIED_PATH,
+        scope_state=scope_state,
+        target_year=2024,
+    )

src/streamlit_app.py DELETED Viewed

@@ -1,40 +0,0 @@
-import altair as alt
-import numpy as np
-import pandas as pd
-import streamlit as st
-"""
-# Welcome to Streamlit!
-Edit `/streamlit_app.py` to customize this app to your heart's desire :heart:.
-If you have any questions, checkout our [documentation](https://docs.streamlit.io) and [community
-forums](https://discuss.streamlit.io).
-In the meantime, below is an example of what you can do with just a few lines of code:
-"""
-num_points = st.slider("Number of points in spiral", 1, 10000, 1100)
-num_turns = st.slider("Number of turns in spiral", 1, 300, 31)
-indices = np.linspace(0, 1, num_points)
-theta = 2 * np.pi * num_turns * indices
-radius = indices
-x = radius * np.cos(theta)
-y = radius * np.sin(theta)
-df = pd.DataFrame({
-    "x": x,
-    "y": y,
-    "idx": indices,
-    "rand": np.random.randn(num_points),
-})
-st.altair_chart(alt.Chart(df, height=700, width=700)
-    .mark_point(filled=True)
-    .encode(
-        x=alt.X("x", axis=None),
-        y=alt.Y("y", axis=None),
-        color=alt.Color("idx", legend=None, scale=alt.Scale()),
-        size=alt.Size("rand", legend=None, scale=alt.Scale(range=[1, 150])),
-    ))

start.sh ADDED Viewed

	@@ -0,0 +1,239 @@

+#!/bin/bash
+# ============================================================
+#  SchemeImpactNet — Start Script
+#  Usage: ./start.sh [options]
+#
+#  Options:
+#    --skip-pipeline   Skip data generation even if files missing
+#    --backend-only    Start only the FastAPI backend
+#    --frontend-only   Start only the Streamlit frontend
+#    --port-backend N  Backend port (default: 8000)
+#    --port-frontend N Frontend port (default: 8501)
+#    --stage N         Pipeline stage to run if needed (1|2|3, default: 3)
+# ============================================================
+set -euo pipefail
+# ── Defaults ──────────────────────────────────────────────────────────────────
+BACKEND_PORT=8000
+FRONTEND_PORT=8501
+PIPELINE_STAGE=3
+SKIP_PIPELINE=false
+BACKEND_ONLY=false
+FRONTEND_ONLY=false
+BACKEND_PID=""
+FRONTEND_PID=""
+# ── Always resolve project root (where this script lives) ─────────────────────
+PROJECT_ROOT="$(cd "$(dirname "${BASH_SOURCE[0]}")" && pwd)"
+# ── Colours ───────────────────────────────────────────────────────────────────
+RED='\033[0;31m'
+GREEN='\033[0;32m'
+AMBER='\033[0;33m'
+BLUE='\033[0;34m'
+BOLD='\033[1m'
+RESET='\033[0m'
+ok() { echo -e "${GREEN}  ✓${RESET}  $*"; }
+info() { echo -e "${BLUE}  →${RESET}  $*"; }
+warn() { echo -e "${AMBER}  ⚠${RESET}  $*"; }
+err() { echo -e "${RED}  ✗${RESET}  $*"; }
+hr() { echo -e "${BOLD}──────────────────────────────────────────────────${RESET}"; }
+# ── Arg parsing ───────────────────────────────────────────────────────────────
+while [[ $# -gt 0 ]]; do
+  case $1 in
+  --skip-pipeline) SKIP_PIPELINE=true ;;
+  --backend-only) BACKEND_ONLY=true ;;
+  --frontend-only) FRONTEND_ONLY=true ;;
+  --port-backend)
+    BACKEND_PORT="$2"
+    shift
+    ;;
+  --port-frontend)
+    FRONTEND_PORT="$2"
+    shift
+    ;;
+  --stage)
+    PIPELINE_STAGE="$2"
+    shift
+    ;;
+  *) warn "Unknown option: $1" ;;
+  esac
+  shift
+done
+# ── Cleanup handler ───────────────────────────────────────────────────────────
+cleanup() {
+  echo ""
+  hr
+  info "Shutting down services…"
+  [[ -n "$BACKEND_PID" ]] && kill "$BACKEND_PID" 2>/dev/null && ok "Backend stopped"
+  [[ -n "$FRONTEND_PID" ]] && kill "$FRONTEND_PID" 2>/dev/null && ok "Frontend stopped"
+  hr
+}
+trap cleanup EXIT INT TERM
+# ── Banner ────────────────────────────────────────────────────────────────────
+echo ""
+echo -e "${BOLD}  ◈  SchemeImpactNet — Service Manager${RESET}"
+hr
+echo ""
+# ── Prerequisite checks ───────────────────────────────────────────────────────
+info "Checking prerequisites…"
+if ! command -v python &>/dev/null && ! command -v python3 &>/dev/null; then
+  err "Python not found. Install Python 3.9+."
+  exit 1
+fi
+PYTHON=$(command -v python3 2>/dev/null || command -v python)
+ok "Python → $($PYTHON --version 2>&1)"
+if ! $PYTHON -m uvicorn --version &>/dev/null; then
+  warn "uvicorn not found — attempting install…"
+  $PYTHON -m pip install "uvicorn[standard]" --quiet || {
+    err "uvicorn install failed."
+    exit 1
+  }
+fi
+ok "uvicorn ready"
+if ! $PYTHON -m streamlit --version &>/dev/null; then
+  warn "streamlit not found — attempting install…"
+  $PYTHON -m pip install streamlit --quiet || {
+    err "streamlit install failed."
+    exit 1
+  }
+fi
+STREAMLIT_VER=$($PYTHON -m streamlit --version 2>&1 | awk '{print $3}')
+ok "streamlit $STREAMLIT_VER ready"
+STREAMLIT_MAJOR=$(echo "$STREAMLIT_VER" | cut -d. -f1)
+STREAMLIT_MINOR=$(echo "$STREAMLIT_VER" | cut -d. -f2)
+if [[ "$STREAMLIT_MAJOR" -lt 1 ]] || { [[ "$STREAMLIT_MAJOR" -eq 1 ]] && [[ "$STREAMLIT_MINOR" -lt 36 ]]; }; then
+  warn "Streamlit $STREAMLIT_VER — upgrade to 1.36+ for st.navigation():"
+  warn "  pip install --upgrade streamlit"
+fi
+if [[ ! -f "$PROJECT_ROOT/frontend/app.py" ]]; then
+  err "frontend/app.py not found at $PROJECT_ROOT/frontend/app.py"
+  exit 1
+fi
+ok "frontend/app.py found"
+if [[ ! -f "$PROJECT_ROOT/backend/main.py" ]]; then
+  err "backend/main.py not found at $PROJECT_ROOT/backend/main.py"
+  exit 1
+fi
+ok "backend/main.py found"
+echo ""
+# ── Data pipeline ─────────��───────────────────────────────────────────────────
+if [[ "$FRONTEND_ONLY" == false && "$SKIP_PIPELINE" == false ]]; then
+  PROCESSED_FILES=(
+    "$PROJECT_ROOT/data/processed/mnrega_cleaned.csv"
+    "$PROJECT_ROOT/data/processed/mnrega_predictions.csv"
+    "$PROJECT_ROOT/data/processed/optimized_budget_allocation.csv"
+  )
+  MISSING=false
+  for f in "${PROCESSED_FILES[@]}"; do
+    if [[ ! -f "$f" ]]; then
+      warn "Missing: $f"
+      MISSING=true
+    fi
+  done
+  if [[ "$MISSING" == true ]]; then
+    hr
+    info "Processed data not found — running Stage $PIPELINE_STAGE pipeline…"
+    info "This may take several minutes on first run."
+    hr
+    echo ""
+    cd "$PROJECT_ROOT" && $PYTHON main.py --stage "$PIPELINE_STAGE" || {
+      err "Pipeline failed. Check errors above."
+      exit 1
+    }
+    echo ""
+    ok "Pipeline complete"
+    hr
+    echo ""
+  else
+    ok "Processed data found — skipping pipeline"
+    for f in "${PROCESSED_FILES[@]}"; do
+      info "  $(basename $f) ($(wc -l <"$f") rows)"
+    done
+    echo ""
+  fi
+fi
+# ── Start backend ─────────────────────────────────────────────────────────────
+if [[ "$FRONTEND_ONLY" == false ]]; then
+  if lsof -i ":$BACKEND_PORT" &>/dev/null 2>&1; then
+    warn "Port $BACKEND_PORT already in use — stopping existing process…"
+    lsof -ti ":$BACKEND_PORT" | xargs kill -9 2>/dev/null || true
+    sleep 1
+  fi
+  info "Starting FastAPI backend on port $BACKEND_PORT…"
+  # Backend must run from project root so 'backend.main' import resolves
+  (cd "$PROJECT_ROOT" && $PYTHON -m uvicorn backend.main:app \
+    --host 0.0.0.0 \
+    --port "$BACKEND_PORT" \
+    --reload \
+    --log-level warning \
+    2>&1 | sed "s/^/  [backend] /") &
+  BACKEND_PID=$!
+  info "Waiting for backend health check…"
+  MAX_WAIT=15
+  WAITED=0
+  until curl -sf "http://localhost:$BACKEND_PORT/health" &>/dev/null; do
+    sleep 1
+    WAITED=$((WAITED + 1))
+    if [[ $WAITED -ge $MAX_WAIT ]]; then
+      warn "Backend health check timed out after ${MAX_WAIT}s — continuing anyway"
+      break
+    fi
+  done
+  curl -sf "http://localhost:$BACKEND_PORT/health" &>/dev/null && ok "Backend live → http://localhost:$BACKEND_PORT"
+  echo ""
+fi
+# ── Start frontend ────────────────────────────────────────────────────────────
+if [[ "$BACKEND_ONLY" == false ]]; then
+  if lsof -i ":$FRONTEND_PORT" &>/dev/null 2>&1; then
+    warn "Port $FRONTEND_PORT already in use — stopping existing process…"
+    lsof -ti ":$FRONTEND_PORT" | xargs kill -9 2>/dev/null || true
+    sleep 1
+  fi
+  info "Starting Streamlit frontend on port $FRONTEND_PORT…"
+  cd "$PROJECT_ROOT/frontend"
+  $PYTHON -m streamlit run app.py --server.port "$FRONTEND_PORT" --server.headless true --browser.gatherUsageStats false &
+  FRONTEND_PID=$!
+  cd "$PROJECT_ROOT"
+  sleep 2
+  ok "Frontend live → http://localhost:$FRONTEND_PORT"
+  echo ""
+fi
+# ── Ready banner ──────────────────────────────────────────────────────────────
+hr
+echo ""
+echo -e "${BOLD}  ◈  SchemeImpactNet is running${RESET}"
+echo ""
+[[ "$FRONTEND_ONLY" == false ]] && echo -e "  ${GREEN}Backend${RESET}   http://localhost:$BACKEND_PORT"
+[[ "$FRONTEND_ONLY" == false ]] && echo -e "  ${GREEN}API docs${RESET}  http://localhost:$BACKEND_PORT/docs"
+[[ "$BACKEND_ONLY" == false ]] && echo -e "  ${GREEN}Dashboard${RESET} http://localhost:$FRONTEND_PORT"
+echo ""
+echo -e "  ${BOLD}Press Ctrl+C to stop all services${RESET}"
+echo ""
+hr
+echo ""
+# ── Keep alive ────────────────────────────────────────────────────────────────
+wait