Spaces:

Thslc99
/

Integration

Sleeping

App Files Files Community

Thslc99 commited on Sep 23, 2025

Commit

1cecdaa

verified ·

1 Parent(s): 2d6ddd0

Update app.py

Browse files

Files changed (1) hide show

app.py +109 -77

app.py CHANGED Viewed

@@ -1,13 +1,17 @@
 """
 LegalOne – PowerBI-like Dashboard (Streamlit)
---------------------------------------------
-Visual estilo Power BI: cards, filtros na sidebar, gráficos Plotly, tabela interativa (AgGrid),
-export de CSV filtrado e tema escuro. Ingestão por upload de CSV gerado do Legal One.
-Como usar no Hugging Face:
-- Crie um Space do tipo **Streamlit**.
-- Suba este arquivo como `app.py` e um `requirements.txt` (veja no README da conversa).
-- Abra o Space → faça upload do CSV → explore.
 """
 from __future__ import annotations
@@ -15,32 +19,33 @@ import io
 import json
 import re
 import unicodedata
-from typing import Dict, Optional
-import pandas as pd
 import numpy as np
 import plotly.express as px
 import streamlit as st
-from datetime import datetime
 try:
     from st_aggrid import AgGrid, GridOptionsBuilder, GridUpdateMode
     AG_AVAILABLE = True
 except Exception:
     AG_AVAILABLE = False
 st.set_page_config(page_title="LegalOne Dashboard", layout="wide")
-# ----------------- Estilo / Tema -----------------
-# Paleta sóbria tipo Power BI
-PRIMARY_BG = "#0f172a"  # slate-900
-CARD_BG = "#111827"     # gray-900
-TEXT = "#e5e7eb"        # gray-200
-ACCENT = "#22c55e"      # green-500
-SUBTLE = "#94a3b8"      # slate-400
-CARD_CSS = f"""
 <style>
 html, body, [class^="css"], .stApp {{ background-color: {PRIMARY_BG} !important; }}
 .block-container {{ padding-top: 1rem; padding-bottom: 1rem; }}
@@ -50,30 +55,30 @@ html, body, [class^="css"], .stApp {{ background-color: {PRIMARY_BG} !important;
 .section-title {{ color: {TEXT}; font-weight: 700; font-size: 1.2rem; margin: 12px 0 8px 0; }}
 hr {{ border: none; border-top: 1px solid #1f2937; margin: 8px 0 16px 0; }}
 </style>
-"""
-st.markdown(CARD_CSS, unsafe_allow_html=True)
-px.defaults.template = "plotly_dark"
-px.defaults.width = None
-px.defaults.height = 420
-# ----------------- Utilidades -----------------
 def _norm_key(s: Optional[str]) -> str:
     if s is None:
         return ""
     s = str(s).strip().lower()
-    s = "".join(c for c in unicodedata.normalize("NFD", s) if unicodedata.category(c) != 'Mn')
     s = re.sub(r"\s+", " ", s)
     return s
 @st.cache_data(show_spinner=False)
 def load_csv(upload) -> pd.DataFrame:
     if upload is None:
         return pd.DataFrame()
     df = pd.read_csv(upload)
-    # garante colunas esperadas
     cols = [
         "processo_numero","cliente","contrario","valor_causa","acao","natureza","area","orgao",
         "comarca","tribunal","vara","situacao","data_ajuizamento","posicao_cliente",
@@ -82,23 +87,34 @@ def load_csv(upload) -> pd.DataFrame:
     for c in cols:
         if c not in df.columns:
             df[c] = None
     # tipos
     df["valor_causa"] = pd.to_numeric(df["valor_causa"], errors="coerce")
     df["data_ajuizamento"] = pd.to_datetime(df["data_ajuizamento"], errors="coerce")
-    # cat escritório (se faltou), cria como cópia do bruto
-    df["escritorio_cat"] = df["escritorio_cat"].fillna(df["escritorio_responsavel"]).astype(str)
     return df[cols]
 @st.cache_data(show_spinner=False)
 def apply_mapping(df: pd.DataFrame, mapping_json: str) -> pd.DataFrame:
-    if not mapping_json:
         return df
     try:
         raw = json.loads(mapping_json)
         mapping = {_norm_key(k): v for k, v in raw.items()}
-        df = df.copy()
-        df["escritorio_cat"] = df["escritorio_responsavel"].apply(lambda x: mapping.get(_norm_key(x), x))
-        return df
     except Exception:
         return df
@@ -127,13 +143,16 @@ def filter_df(
         out = out[out["acao"].isin(acao)]
     if periodo and not pd.isna(out["data_ajuizamento"]).all():
         start, end = periodo
-        out = out[(out["data_ajuizamento"] >= pd.to_datetime(start)) & (out["data_ajuizamento"] <= pd.to_datetime(end))]
     return out
-# ----------------- Sidebar (Filtros) -----------------
 st.sidebar.title("⚙️ Filtros")
-up = st.sidebar.file_uploader("CSV do Legal One", type=["csv"])  # upload manual
 mapping_str = st.sidebar.text_area(
     "Mapeamento (JSON opcional) — escritório bruto → categoria",
     value='{"CÍVEL PARTIDO":"Cível – Partido","CÍVEL INDIVIDUAL":"Cível – Individual","CÍVEL RECUPERAÇÃO DE CRÉDITO":"Cível – Recuperação de Crédito"}',
@@ -147,7 +166,7 @@ if base.empty:
     st.info("Faça upload do CSV para começar.")
     st.stop()
-# Valores únicos para filtros
 cats = sorted([c for c in base["escritorio_cat"].dropna().unique()])
 tribs = sorted([t for t in base["tribunal"].dropna().unique()])
 nats = sorted([n for n in base["natureza"].dropna().unique()])
@@ -165,92 +184,105 @@ max_dt = pd.to_datetime(base["data_ajuizamento"]).max()
 if pd.isna(min_dt) or pd.isna(max_dt):
     period = None
 else:
-    period = st.sidebar.date_input("Período (Data de ajuizamento)", value=(min_dt.date(), max_dt.date()))
 f = filter_df(base, cliente_q, sel_cat, sel_trib, sel_nat, sel_acao, period)
-# ----------------- KPIs (cards) -----------------
 col1, col2, col3, col4 = st.columns(4)
 with col1:
-    st.markdown('<div class="kpi-card"><div class="kpi-label">Processos</div>'
-                f'<div class="kpi-value">{int(f["processo_numero"].nunique())}</div></div>', unsafe_allow_html=True)
 with col2:
-    st.markdown('<div class="kpi-card"><div class="kpi-label">Clientes</div>'
-                f'<div class="kpi-value">{int(f["cliente"].nunique())}</div></div>', unsafe_allow_html=True)
 with col3:
-    st.markdown('<div class="kpi-card"><div class="kpi-label">Categorias de Escritório</div>'
-                f'<div class="kpi-value">{int(f["escritorio_cat"].nunique())}</div></div>', unsafe_allow_html=True)
 with col4:
     total_valor = float(f["valor_causa"].fillna(0).sum())
-    st.markdown('<div class="kpi-card"><div class="kpi-label">Soma Valor da Causa</div>'
-                f'<div class="kpi-value">R$ {total_valor:,.2f}</div></div>', unsafe_allow_html=True)
 st.markdown("<div class='section-title'>Visão Geral</div>", unsafe_allow_html=True)
-# ----------------- Gráficos principais -----------------
 gcol1, gcol2 = st.columns(2)
 with gcol1:
-    top_cat = (f.groupby("escritorio_cat")["processo_numero"].nunique()
-                 .sort_values(ascending=False).head(15).reset_index(name="qtd"))
-    fig1 = px.bar(top_cat, x="escritorio_cat", y="qtd", title="Processos por Categoria de Escritório (Top 15)")
-    fig1.update_layout(margin=dict(l=10,r=10,b=10,t=50))
     st.plotly_chart(fig1, use_container_width=True)
 with gcol2:
-    by_tri = (f.groupby("tribunal")["processo_numero"].nunique()
-                .sort_values(ascending=False).reset_index(name="qtd"))
     fig2 = px.bar(by_tri, x="tribunal", y="qtd", title="Processos por Tribunal")
-    fig2.update_layout(margin=dict(l=10,r=10,b=10,t=50))
     st.plotly_chart(fig2, use_container_width=True)
-# Linha do tempo (mês)
 if not f["data_ajuizamento"].isna().all():
     ts = f.dropna(subset=["data_ajuizamento"]).copy()
     ts["mes"] = ts["data_ajuizamento"].dt.to_period("M").dt.to_timestamp()
     serie = ts.groupby("mes")["processo_numero"].nunique().reset_index(name="qtd")
-    fig3 = px.line(serie, x="mes", y="qtd", markers=True, title="Processos por mês (Data de ajuizamento)")
-    fig3.update_layout(margin=dict(l=10,r=10,b=10,t=50))
     st.plotly_chart(fig3, use_container_width=True)
-# Histograma Valor da Causa
 vc = f["valor_causa"].dropna()
 if len(vc) > 0:
-    fig4 = px.histogram(f, x="valor_causa", nbins=30, title="Distribuição do Valor da Causa")
-    fig4.update_layout(margin=dict(l=10,r=10,b=10,t=50))
     st.plotly_chart(fig4, use_container_width=True)
 st.markdown("<div class='section-title'>Tabela</div>", unsafe_allow_html=True)
-# ----------------- Tabela interativa -----------------
 if AG_AVAILABLE:
     gob = GridOptionsBuilder.from_dataframe(f)
     gob.configure_pagination(paginationAutoPageSize=False, paginationPageSize=20)
     gob.configure_side_bar()
     gob.configure_default_column(filter=True, sortable=True, resizable=True)
     gob.configure_selection("single")
-    gob.configure_grid_options(domLayout='normal')
     grid_options = gob.build()
-    grid = AgGrid(
         f,
         gridOptions=grid_options,
         update_mode=GridUpdateMode.MODEL_CHANGED,
-        theme='alpine',
         height=420,
         fit_columns_on_grid_load=True,
     )
 else:
     st.dataframe(f, use_container_width=True)
-# ----------------- Export -----------------
 st.markdown("---")
 buff = io.StringIO()
-# exporta com ; como separador opcional? manter vírgula.
 f.to_csv(buff, index=False)
 st.download_button(
     label="⬇️ Baixar CSV filtrado",

 """
 LegalOne – PowerBI-like Dashboard (Streamlit)
+---------------------------------------------
+Visual com cards de KPI, filtros na sidebar, gráficos Plotly e tabela interativa.
+- Upload do CSV do Legal One
+- Mapeamento (opcional) de "escritorio_responsavel" -> "escritorio_cat" via JSON
+- Download do CSV filtrado
+Requisitos (requirements.txt):
+streamlit>=1.37
+pandas>=2.2
+plotly>=5.22
+numpy>=1.26
+streamlit-aggrid>=0.3.4.post3
 """
 from __future__ import annotations
 import json
 import re
 import unicodedata
+from datetime import datetime
+from typing import Optional
 import numpy as np
+import pandas as pd
 import plotly.express as px
 import streamlit as st
+# AgGrid é opcional
 try:
     from st_aggrid import AgGrid, GridOptionsBuilder, GridUpdateMode
     AG_AVAILABLE = True
 except Exception:
     AG_AVAILABLE = False
+# ---------- Configuração de página e tema ----------
 st.set_page_config(page_title="LegalOne Dashboard", layout="wide")
+px.defaults.template = "plotly_dark"
+px.defaults.width = None
+px.defaults.height = 420
+PRIMARY_BG = "#0f172a"   # slate-900
+CARD_BG    = "#111827"   # gray-900
+TEXT       = "#e5e7eb"   # gray-200
+SUBTLE     = "#94a3b8"   # slate-400
+st.markdown(f"""
 <style>
 html, body, [class^="css"], .stApp {{ background-color: {PRIMARY_BG} !important; }}
 .block-container {{ padding-top: 1rem; padding-bottom: 1rem; }}
 .section-title {{ color: {TEXT}; font-weight: 700; font-size: 1.2rem; margin: 12px 0 8px 0; }}
 hr {{ border: none; border-top: 1px solid #1f2937; margin: 8px 0 16px 0; }}
 </style>
+""", unsafe_allow_html=True)
+# ---------- Utilidades ----------
 def _norm_key(s: Optional[str]) -> str:
     if s is None:
         return ""
     s = str(s).strip().lower()
+    s = "".join(c for c in unicodedata.normalize("NFD", s) if unicodedata.category(c) != "Mn")
     s = re.sub(r"\s+", " ", s)
     return s
 @st.cache_data(show_spinner=False)
 def load_csv(upload) -> pd.DataFrame:
+    """
+    PASSO A: garante a coluna 'escritorio_cat' SEMPRE.
+    - se não existir no CSV, cria;
+    - se vier nula, preenche com 'escritorio_responsavel'.
+    """
     if upload is None:
         return pd.DataFrame()
     df = pd.read_csv(upload)
+    # colunas esperadas (inclui 'escritorio_cat')
     cols = [
         "processo_numero","cliente","contrario","valor_causa","acao","natureza","area","orgao",
         "comarca","tribunal","vara","situacao","data_ajuizamento","posicao_cliente",
     for c in cols:
         if c not in df.columns:
             df[c] = None
     # tipos
     df["valor_causa"] = pd.to_numeric(df["valor_causa"], errors="coerce")
     df["data_ajuizamento"] = pd.to_datetime(df["data_ajuizamento"], errors="coerce")
+    # garantia da categoria: se vazia, usa o responsável
+    df["escritorio_cat"] = (
+        df["escritorio_cat"]
+        .fillna(df["escritorio_responsavel"])
+        .astype(str)
+        .replace({"None": None})
+    )
     return df[cols]
 @st.cache_data(show_spinner=False)
 def apply_mapping(df: pd.DataFrame, mapping_json: str) -> pd.DataFrame:
+    """Aplica mapeamento JSON (responsável -> categoria)."""
+    if df.empty or not mapping_json:
         return df
     try:
         raw = json.loads(mapping_json)
         mapping = {_norm_key(k): v for k, v in raw.items()}
+        out = df.copy()
+        out["escritorio_cat"] = out["escritorio_responsavel"].apply(
+            lambda x: mapping.get(_norm_key(x), x)
+        )
+        return out
     except Exception:
         return df
         out = out[out["acao"].isin(acao)]
     if periodo and not pd.isna(out["data_ajuizamento"]).all():
         start, end = periodo
+        out = out[
+            (out["data_ajuizamento"] >= pd.to_datetime(start)) &
+            (out["data_ajuizamento"] <= pd.to_datetime(end))
+        ]
     return out
+# ---------- Sidebar (upload + filtros) ----------
 st.sidebar.title("⚙️ Filtros")
+up = st.sidebar.file_uploader("CSV do Legal One", type=["csv"])
 mapping_str = st.sidebar.text_area(
     "Mapeamento (JSON opcional) — escritório bruto → categoria",
     value='{"CÍVEL PARTIDO":"Cível – Partido","CÍVEL INDIVIDUAL":"Cível – Individual","CÍVEL RECUPERAÇÃO DE CRÉDITO":"Cível – Recuperação de Crédito"}',
     st.info("Faça upload do CSV para começar.")
     st.stop()
+# valores únicos para filtros
 cats = sorted([c for c in base["escritorio_cat"].dropna().unique()])
 tribs = sorted([t for t in base["tribunal"].dropna().unique()])
 nats = sorted([n for n in base["natureza"].dropna().unique()])
 if pd.isna(min_dt) or pd.isna(max_dt):
     period = None
 else:
+    period = st.sidebar.date_input(
+        "Período (Data de ajuizamento)",
+        value=(min_dt.date(), max_dt.date())
+    )
 f = filter_df(base, cliente_q, sel_cat, sel_trib, sel_nat, sel_acao, period)
+# ---------- KPIs ----------
 col1, col2, col3, col4 = st.columns(4)
 with col1:
+    st.markdown(
+        f'<div class="kpi-card"><div class="kpi-label">Processos</div>'
+        f'<div class="kpi-value">{int(f["processo_numero"].nunique())}</div></div>',
+        unsafe_allow_html=True,
+    )
 with col2:
+    st.markdown(
+        f'<div class="kpi-card"><div class="kpi-label">Clientes</div>'
+        f'<div class="kpi-value">{int(f["cliente"].nunique())}</div></div>',
+        unsafe_allow_html=True,
+    )
 with col3:
+    st.markdown(
+        f'<div class="kpi-card"><div class="kpi-label">Categorias de Escritório</div>'
+        f'<div class="kpi-value">{int(f["escritorio_cat"].nunique())}</div></div>',
+        unsafe_allow_html=True,
+    )
 with col4:
     total_valor = float(f["valor_causa"].fillna(0).sum())
+    st.markdown(
+        f'<div class="kpi-card"><div class="kpi-label">Soma Valor da Causa</div>'
+        f'<div class="kpi-value">R$ {total_valor:,.2f}</div></div>',
+        unsafe_allow_html=True,
+    )
 st.markdown("<div class='section-title'>Visão Geral</div>", unsafe_allow_html=True)
+# ---------- Gráficos ----------
 gcol1, gcol2 = st.columns(2)
 with gcol1:
+    top_cat = (
+        f.groupby("escritorio_cat")["processo_numero"].nunique()
+        .sort_values(ascending=False).head(15).reset_index(name="qtd")
+    )
+    fig1 = px.bar(top_cat, x="escritorio_cat", y="qtd",
+                  title="Processos por Categoria de Escritório (Top 15)")
+    fig1.update_layout(margin=dict(l=10, r=10, b=10, t=50))
     st.plotly_chart(fig1, use_container_width=True)
 with gcol2:
+    by_tri = (
+        f.groupby("tribunal")["processo_numero"].nunique()
+        .sort_values(ascending=False).reset_index(name="qtd")
+    )
     fig2 = px.bar(by_tri, x="tribunal", y="qtd", title="Processos por Tribunal")
+    fig2.update_layout(margin=dict(l=10, r=10, b=10, t=50))
     st.plotly_chart(fig2, use_container_width=True)
 if not f["data_ajuizamento"].isna().all():
     ts = f.dropna(subset=["data_ajuizamento"]).copy()
     ts["mes"] = ts["data_ajuizamento"].dt.to_period("M").dt.to_timestamp()
     serie = ts.groupby("mes")["processo_numero"].nunique().reset_index(name="qtd")
+    fig3 = px.line(serie, x="mes", y="qtd", markers=True,
+                   title="Processos por mês (Data de ajuizamento)")
+    fig3.update_layout(margin=dict(l=10, r=10, b=10, t=50))
     st.plotly_chart(fig3, use_container_width=True)
 vc = f["valor_causa"].dropna()
 if len(vc) > 0:
+    fig4 = px.histogram(f, x="valor_causa", nbins=30,
+                        title="Distribuição do Valor da Causa")
+    fig4.update_layout(margin=dict(l=10, r=10, b=10, t=50))
     st.plotly_chart(fig4, use_container_width=True)
 st.markdown("<div class='section-title'>Tabela</div>", unsafe_allow_html=True)
+# ---------- Tabela ----------
 if AG_AVAILABLE:
     gob = GridOptionsBuilder.from_dataframe(f)
     gob.configure_pagination(paginationAutoPageSize=False, paginationPageSize=20)
     gob.configure_side_bar()
     gob.configure_default_column(filter=True, sortable=True, resizable=True)
     gob.configure_selection("single")
     grid_options = gob.build()
+    AgGrid(
         f,
         gridOptions=grid_options,
         update_mode=GridUpdateMode.MODEL_CHANGED,
+        theme="alpine",
         height=420,
         fit_columns_on_grid_load=True,
     )
 else:
     st.dataframe(f, use_container_width=True)
+# ---------- Export ----------
 st.markdown("---")
 buff = io.StringIO()
 f.to_csv(buff, index=False)
 st.download_button(
     label="⬇️ Baixar CSV filtrado",