Spaces:

AKKI-AFK
/

ECL-Risk-Analyzer

Sleeping

App Files Files Community

AKKI-AFK commited on Nov 12, 2025

Commit

4b71f90

verified ·

1 Parent(s): e2583c6

Update src/streamlit_app.py

Browse files

Files changed (1) hide show

src/streamlit_app.py +212 -76

src/streamlit_app.py CHANGED Viewed

@@ -1,35 +1,92 @@
 import streamlit as st
 import pandas as pd
 import matplotlib.pyplot as plt
 import google.generativeai as genai
-import json, os, re
-# ====== CONFIG ======
-st.set_page_config(page_title="ECL Risk Analyzer", layout="wide")
-genai.configure(api_key=os.getenv("GEMINI_API_KEY"))
-# ====== HELPERS ======
 @st.cache_data
-def process_loan_data(df: pd.DataFrame):
-    df = df.dropna(subset=["loan_intent", "credit_score", "loan_amnt", "loan_status"])
     df["loan_status"] = df["loan_status"].astype(int)
-    group = df.groupby("loan_intent")
     pd_seg = group["loan_status"].mean()
-    lgd_seg = (1 - group["credit_score"].mean() / 850)
     ead_seg = group["loan_amnt"].sum()
     ecl_seg = pd_seg * lgd_seg * ead_seg
     ecl_df = pd.concat([pd_seg, lgd_seg, ead_seg, ecl_seg], axis=1)
     ecl_df.columns = ["PD", "LGD", "EAD", "ECL"]
-    return ecl_df.reset_index()
-def get_gemini_decision(segment, pd_val, lgd_val, ead_val, ecl_val):
-    """Gemini-backed risk decision. Single call, valid for all SDK versions."""
-    model = genai.GenerativeModel("gemini-2.5-flash-lite")
     prompt = f"""
-You are a financial risk advisor.
-Analyze the following loan segment and return ONLY valid JSON.
-Schema:
 {{"action":"increase_interest"|"reduce_disbursement"|"maintain","rationale":"string","confidence":float}}
 Segment: {segment}
@@ -39,77 +96,156 @@ EAD: {ead_val:,.0f}
 ECL: {ecl_val:,.0f}
 Rules:
-- PD > 0.25 ⇒ increase_interest
-- 0.20 ≤ PD ≤ 0.25 ⇒ reduce_disbursement
-- PD < 0.15 ⇒ maintain
-Respond with one JSON object only.
 """
     try:
-        resp = model.generate_content(prompt, generation_config={"temperature": 0.1})
-        text = resp.text.strip()
-        # clean markdown fences if any
-        text = re.sub(r"^```json", "", text)
-        text = re.sub(r"^```", "", text)
-        text = re.sub(r"```$", "", text)
-        # extract first {...} JSON block
-        match = re.search(r"\{.*\}", text, re.DOTALL)
-        if match:
-            text = match.group(0)
-        data = json.loads(text)
         return data
     except Exception as e:
-        st.warning(f"⚠️ Gemini output parse failed: {e}")
-        st.text_area("Raw Gemini output", value=resp.text if 'resp' in locals() else "No response", height=150)
-        return {"action": "maintain", "rationale": "Fallback - parse failure", "confidence": 0.0}
-# ====== UI ======
-st.title("📊 Expected Credit Loss (ECL) Risk Dashboard")
-st.write("Upload your **loan dataset**, review segment-level ECL metrics, and analyze one segment at a time with Gemini.")
-uploaded = st.file_uploader("Upload CSV dataset", type=["csv"])
 if uploaded:
     df = pd.read_csv(uploaded)
-    ecl_df = process_loan_data(df)
-    st.success("Dataset processed successfully.")
-    st.dataframe(ecl_df, use_container_width=True, hide_index=True)
-    # --- Visual overview ---
     col1, col2 = st.columns(2)
     with col1:
         st.subheader("ECL by Segment")
-        fig, ax = plt.subplots(figsize=(6, 3))
-        ax.bar(ecl_df["loan_intent"], ecl_df["ECL"])
-        ax.set_xlabel("Segment"); ax.set_ylabel("ECL")
-        plt.xticks(rotation=45)
         st.pyplot(fig)
     with col2:
         st.subheader("PD by Segment")
-        fig2, ax2 = plt.subplots(figsize=(6, 3))
-        ax2.bar(ecl_df["loan_intent"], ecl_df["PD"], color="gray")
-        ax2.set_xlabel("Segment"); ax2.set_ylabel("PD")
-        plt.xticks(rotation=45)
         st.pyplot(fig2)
-    # --- Segment selection ---
-    st.subheader("Analyze Specific Segment")
-    segments = ecl_df["loan_intent"].unique().tolist()
-    selected_segment = st.selectbox("Choose a segment:", segments)
-    row = ecl_df[ecl_df["loan_intent"] == selected_segment].iloc[0]
-    st.write(f"**PD:** {row.PD:.3f} | **LGD:** {row.LGD:.3f} | **EAD:** {row.EAD:,.0f} | **ECL:** {row.ECL:,.0f}")
-    if st.button("Generate Gemini Decision"):
-        with st.spinner("Querying Gemini..."):
-            decision = get_gemini_decision(row["loan_intent"], row["PD"], row["LGD"], row["EAD"], row["ECL"])
-        st.success("Gemini Decision:")
-        st.json(decision)
 else:
-    st.info("Upload a CSV file to begin.")

+# app.py
 import streamlit as st
 import pandas as pd
 import matplotlib.pyplot as plt
 import google.generativeai as genai
+import json, os, re, time
+from datetime import datetime
+from sqlalchemy import create_engine, Column, Integer, String, Float, DateTime
+from sqlalchemy.orm import declarative_base, sessionmaker
+# ========== CONFIG ==========
+st.set_page_config(page_title="ECL Decision Assistant", layout="wide")
+GEN_API_KEY = os.getenv("GEMINI_API_KEY")
+if GEN_API_KEY:
+    genai.configure(api_key=GEN_API_KEY)
+else:
+    st.warning("GEMINI_API_KEY not found in env. Set it in HF Space secrets to enable AI decisions.")
+# Simple credential store (replace with secure store in production)
+USERS = {
+    "analyst": {"password": "analyst123", "role": "analyst"},
+    "cro": {"password": "cro123", "role": "cro"},
+}
+# SQLite DB for persisting reports
+DB_FILE = "reports.db"
+engine = create_engine(f"sqlite:///{DB_FILE}", connect_args={"check_same_thread": False})
+Base = declarative_base()
+SessionLocal = sessionmaker(bind=engine)
+class Report(Base):
+    __tablename__ = "reports"
+    id = Column(Integer, primary_key=True, index=True)
+    segment = Column(String)
+    pd = Column(Float)
+    lgd = Column(Float)
+    ead = Column(Float)
+    ecl = Column(Float)
+    action = Column(String)
+    rationale = Column(String)
+    confidence = Column(Float)
+    generated_by = Column(String)
+    created_at = Column(DateTime)
+Base.metadata.create_all(bind=engine)
+# ========== UTILITIES ==========
 @st.cache_data
+def process_loan_data(df: pd.DataFrame, segment_col: str = "loan_intent"):
+    """Compute PD, LGD, EAD, ECL by segment column."""
+    required = [segment_col, "credit_score", "loan_amnt", "loan_status"]
+    df = df.dropna(subset=required)
+    # ensure types
     df["loan_status"] = df["loan_status"].astype(int)
+    df["credit_score"] = df["credit_score"].astype(float)
+    df["loan_amnt"] = df["loan_amnt"].astype(float)
+    group = df.groupby(segment_col)
     pd_seg = group["loan_status"].mean()
+    lgd_seg = (1 - group["credit_score"].mean() / 850).clip(lower=0.0)
     ead_seg = group["loan_amnt"].sum()
     ecl_seg = pd_seg * lgd_seg * ead_seg
     ecl_df = pd.concat([pd_seg, lgd_seg, ead_seg, ecl_seg], axis=1)
     ecl_df.columns = ["PD", "LGD", "EAD", "ECL"]
+    ecl_df = ecl_df.reset_index().rename(columns={segment_col: "segment"})
+    return ecl_df
+def sanitize_parse_json(text: str):
+    """Extract first JSON object in text and parse it."""
+    if not text:
+        raise ValueError("Empty response")
+    # remove common markdown fences
+    text = re.sub(r"^```json\s*", "", text, flags=re.IGNORECASE)
+    text = re.sub(r"^```\s*", "", text)
+    text = re.sub(r"```$", "", text)
+    # find JSON block
+    m = re.search(r"\{.*\}", text, flags=re.DOTALL)
+    if m:
+        text = m.group(0)
+    # attempt load
+    return json.loads(text)
+def get_gemini_decision_single(segment, pd_val, lgd_val, ead_val, ecl_val):
+    """Single Gemini call per selected segment. Robust cleaning. Returns dict."""
+    # If API key missing, return deterministic fallback
+    if not GEN_API_KEY:
+        return {"action": "maintain", "rationale": "No API key configured", "confidence": 0.0}
     prompt = f"""
+You are a financial risk advisor. Return ONLY one valid JSON object with this schema:
 {{"action":"increase_interest"|"reduce_disbursement"|"maintain","rationale":"string","confidence":float}}
 Segment: {segment}
 ECL: {ecl_val:,.0f}
 Rules:
+- PD > 0.25 => increase_interest
+- 0.20 <= PD <= 0.25 => reduce_disbursement
+- PD < 0.15 => maintain
+Respond with a single JSON object and nothing else.
 """
+    # Use model.generate_content with single prompt string (compat for HF)
     try:
+        model = genai.GenerativeModel("gemini-2.5-flash-lite")
+        resp = model.generate_content(prompt, generation_config={"temperature": 0.05})
+        raw = resp.text if hasattr(resp, "text") else str(resp)
+        # parse
+        data = sanitize_parse_json(raw)
+        # validate keys
+        for k in ("action", "rationale", "confidence"):
+            if k not in data:
+                raise ValueError(f"Missing key: {k}")
         return data
     except Exception as e:
+        # handle rate limits explicitly
+        msg = str(e)
+        if "429" in msg or "Resource exhausted" in msg:
+            return {"action": "maintain", "rationale": "API quota exhausted - retry later", "confidence": 0.0}
+        # fallback deterministic rule as final fallback
+        if pd_val > 0.25:
+            return {"action": "increase_interest", "rationale": "PD > 0.25 (deterministic fallback)", "confidence": 0.8}
+        if 0.20 <= pd_val <= 0.25:
+            return {"action": "reduce_disbursement", "rationale": "PD in 0.20-0.25 (deterministic fallback)", "confidence": 0.7}
+        return {"action": "maintain", "rationale": "Fallback - parse or API error", "confidence": 0.0}
+def save_report_to_db(row, decision, username):
+    s = SessionLocal()
+    r = Report(
+        segment=row["segment"],
+        pd=float(row["PD"]),
+        lgd=float(row["LGD"]),
+        ead=float(row["EAD"]),
+        ecl=float(row["ECL"]),
+        action=decision.get("action"),
+        rationale=decision.get("rationale"),
+        confidence=float(decision.get("confidence", 0.0)),
+        generated_by=username,
+        created_at=datetime.utcnow()
+    )
+    s.add(r)
+    s.commit()
+    s.refresh(r)
+    s.close()
+    return r.id
+def load_reports_from_db(username, role):
+    s = SessionLocal()
+    if role == "cro":
+        rows = s.query(Report).order_by(Report.created_at.desc()).all()
+    else:
+        rows = s.query(Report).filter(Report.generated_by == username).order_by(Report.created_at.desc()).all()
+    df = pd.DataFrame([{
+        "id": r.id,
+        "segment": r.segment,
+        "pd": r.pd,
+        "lgd": r.lgd,
+        "ead": r.ead,
+        "ecl": r.ecl,
+        "action": r.action,
+        "rationale": r.rationale,
+        "confidence": r.confidence,
+        "generated_by": r.generated_by,
+        "created_at": r.created_at
+    } for r in rows])
+    s.close()
+    return df
+# ========== UI - AUTH ==========
+st.sidebar.title("Login")
+username = st.sidebar.text_input("Username")
+password = st.sidebar.text_input("Password", type="password")
+if "auth_ok" not in st.session_state:
+    st.session_state.auth_ok = False
+if st.sidebar.button("Sign in"):
+    user = USERS.get(username)
+    if user and user["password"] == password:
+        st.session_state.auth_ok = True
+        st.session_state.username = username
+        st.session_state.role = user["role"]
+        st.sidebar.success(f"Signed in as {username} ({user['role']})")
+    else:
+        st.sidebar.error("Invalid credentials")
+if not st.session_state.auth_ok:
+    st.stop()
+# ========== MAIN ==========
+st.header("ECL Decision Assistant")
+st.write(f"Signed in as **{st.session_state.username}** ({st.session_state.role})")
+# Upload CSV
+uploaded = st.file_uploader("Upload loan CSV (must contain loan_intent, credit_score, loan_amnt, loan_status)", type=["csv"])
 if uploaded:
     df = pd.read_csv(uploaded)
+    st.write("Sample rows:")
+    st.dataframe(df.head(), width='stretch')
+    # allow user to choose segmentation column
+    seg_col = st.selectbox("Segment by column", options=[c for c in df.columns if df[c].dtype == object] , index=0)
+    ecl_df = process_loan_data(df, segment_col=seg_col)
+    st.subheader("Segment-level ECL Summary")
+    st.dataframe(ecl_df, width='stretch')
+    # Plots
     col1, col2 = st.columns(2)
     with col1:
         st.subheader("ECL by Segment")
+        fig, ax = plt.subplots(figsize=(8, 3))
+        ax.bar(ecl_df["segment"], ecl_df["ECL"])
+        ax.set_xlabel("Segment"); ax.set_ylabel("ECL"); plt.xticks(rotation=45)
         st.pyplot(fig)
     with col2:
         st.subheader("PD by Segment")
+        fig2, ax2 = plt.subplots(figsize=(8, 3))
+        ax2.bar(ecl_df["segment"], ecl_df["PD"], color="gray")
+        ax2.set_xlabel("Segment"); ax2.set_ylabel("PD"); plt.xticks(rotation=45)
         st.pyplot(fig2)
+    # Select single segment for Gemini
+    st.subheader("Analyze one segment (single API call)")
+    selected = st.selectbox("Choose a segment to analyze", ecl_df["segment"].tolist())
+    row = ecl_df[ecl_df["segment"] == selected].iloc[0]
+    st.write(f"PD: {row.PD:.3f} | LGD: {row.LGD:.3f} | EAD: {row.EAD:,.0f} | ECL: {row.ECL:,.0f}")
+    # Optionally show top segments only to reduce API usage
+    top_n = st.number_input("Show top N segments by ECL (for reference)", min_value=1, max_value=len(ecl_df), value=5)
+    st.write(ecl_df.sort_values("ECL", ascending=False).head(top_n))
+    if st.button("Request Gemini decision for selected segment"):
+        with st.spinner("Querying Gemini (single call)..."):
+            decision = get_gemini_decision_single(row["segment"], row["PD"], row["LGD"], row["EAD"], row["ECL"])
+            # save
+            rec_id = save_report_to_db(row, decision, st.session_state.username)
+        st.success("Decision recorded")
+        st.json({"record_id": rec_id, "segment": row["segment"], "decision": decision})
+# Historical reports section
+st.subheader("Past Reports")
+reports_df = load_reports_from_db(st.session_state.username, st.session_state.role)
+if not reports_df.empty:
+    st.dataframe(reports_df, width='stretch')
+    # allow filtering by action
+    action_filter = st.selectbox("Filter by action (All / increase_interest / reduce_disbursement / maintain)", ["All", "increase_interest", "reduce_disbursement", "maintain"])
+    if action_filter != "All":
+        st.dataframe(reports_df[reports_df["action"] == action_filter], width='stretch')
+    if st.button("Download reports CSV"):
+        st.download_button("Download", reports_df.to_csv(index=False).encode("utf-8"), file_name="reports.csv", mime="text/csv")
 else:
+    st.info("No reports recorded yet (use 'Request Gemini decision' to create one).")