Spaces:

AEDIUnBLudimila
/

Tarefa1

Configuration error

App Files Files Community

ludimilalopes08 commited on Sep 3, 2025

Commit

fb04cc7

verified ·

1 Parent(s): 3b1eb2f

Upload 3 files

Browse files

Incidentes Diários na Classificação de Documentos Gerados no SEI-GDF

Files changed (3) hide show

README.md +12 -13
app.py +128 -0
requirements.txt +4 -0

README.md CHANGED Viewed

@@ -1,13 +1,12 @@
----
-title: Tarefa1
-emoji: 📉
-colorFrom: indigo
-colorTo: indigo
-sdk: gradio
-sdk_version: 5.44.1
-app_file: app.py
-pinned: false
-short_description: 'Incidentes Diários na Classificação de  Documentos Gerados '
----
-Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

+# Beta-Binomial Monte Carlo Dashboard
+Monte um **dashboard** para simular incidentes diários utilizando **Distribuição Beta-Binomial** com Monte Carlo.
+## Parâmetros padrão
+- N = 60000
+- limiteX = 5000
+- alpha = 500
+- beta = 5000
+- sims = 100000

app.py ADDED Viewed

	@@ -0,0 +1,128 @@

+# Beta-Binomial Monte Carlo Dashboard
+import gradio as modelo					# cria o dashboard interativo
+import numpy as np					# gera números aleatórios
+import matplotlib.pyplot as gfc_histograma		# gera o gráfico
+import pandas as pd					# gera tbls e export resultados p/ csv
+from io import BytesIO
+import os
+from datetime import datetime
+# Função para rodar Simulação Monte Carlo
+def simulate_beta_binomial(N:int, limiteX:int, alpha:float, beta:float, sims:int, bins:int, seed:str|None):
+    # Seed handling
+    if seed is None or str(seed).strip() == "":
+        rng = np.random.default_rng()
+        seed_used = None
+    else:
+        try:
+            seed_int = int(seed)
+        rng = np.random.default_rng(seed_int)
+        seed_used = seed_int
+    # simulação: sorteia, simula e repete
+    p = rng.beta(alpha, beta, size=sims)
+    X = rng.binomial(N, p)
+    # Estatísticas: média, desvio padrão, probabilidade de ultrapassar o limite X e quantis
+    mean = float(X.mean())
+    std = float(X.std(ddof=0))
+    prob_exceed = float((X > limiteX).mean())
+    q = np.quantile(X, [0.01, 0.05, 0.50, 0.95, 0.99])
+    quantiles = {
+        "q1%": int(q[0]),
+        "q5%": int(q[1]),
+        "q50% (mediana)": int(q[2]),
+        "q95%": int(q[3]),
+        "q99%": int(q[4]),
+    }
+    # Construção do Gráfico
+    fig = gfc_histograma.figure(figsize=(8, 5))
+    ax = fig.gca()
+    ax.hist(X, bins=bins)
+    ax.axvline(limiteX, linestyle="--", linewidth=2, label=f"Limite = {limiteX}")
+    ax.set_title("Distribuição simulada de incidentes diários (Monte Carlo)")
+    ax.set_xlabel("Número de incidentes")
+    ax.set_ylabel("Frequência")
+    ax.legend()
+    md = f"""
+### Resultados
+- **Média de incidentes**: {mean:,.2f}
+- **Desvio padrão**: {std:,.2f}
+- **Probabilidade de exceder {limiteX}**: {prob_exceed:.4%}
+### Quantis (distribuição de X)
+- q1%: {quantiles['q1%']}
+- q5%: {quantiles['q5%']}
+- q50% (mediana): {quantiles['q50% (mediana)']}
+- q95%: {quantiles['q95%']}
+- q99%: {quantiles['q99%']}
+**Semente usada**: {seed_used if seed_used is not None else "aleatória"}
+"""
+    # Tbl dados
+    df_stats = pd.DataFrame({
+        "Métrica": ["Média", "Desvio padrão", f"P(X > {limiteX})", "q1%", "q5%", "q50% (mediana)", "q95%", "q99%"],
+        "Valor": [mean, std, prob_exceed, quantiles["q1%"], quantiles["q5%"], quantiles["q50% (mediana)"], quantiles["q95%"], quantiles["q99%"]]
+    })
+    # Exporta para csv
+    out_dir = "/mnt/data"
+    os.makedirs(out_dir, exist_ok=True)
+    timestamp = datetime.now().strftime("%Y%m%d-%H%M%S")
+    csv_path = os.path.join(out_dir, f"simulacoes_beta_binomial_{timestamp}.csv")
+    pd.DataFrame({"incidentes": X}).to_csv(csv_path, index=False)
+    return fig, md, df_stats, csv_path
+with modelo.Blocks(title="Beta-Binomial Monte Carlo | Incidentes Diários na Classificação de Documentos Gerados no SEI-GDF") as demo:
+    modelo.Markdown(
+        """
+# Dashboard Beta-Binomial (Monte Carlo)
+Simula incidentes diários de exposição de dados com **prior Beta** e **likelihood Binomial**.
+Use os parâmetros para avaliar a probabilidade de exceder um limite de incidentes por dia.
+> Parâmetros: `N=60000`, `limiteX=5000`, `alpha=500`, `beta=5000`, `sims=100000`.
+"""
+    )
+    with modelo.Row():
+        with modelo.Column():
+            N = modelo.Number(value=60000, label="N (documentos/dia)", precision=0)
+            limiteX = modelo.Number(value=5000, label="Limite de incidentes X", precision=0)
+            sims = modelo.Number(value=100000, label="Número de simulações (Monte Carlo)", precision=0)
+            bins = modelo.Slider(20, 120, value=50, step=1, label="Bins do histograma")
+        with modelo.Column():
+            alpha = modelo.Number(value=500, label="α (parâmetro Beta)", precision=0)
+            beta = modelo.Number(value=5000, label="β (parâmetro Beta)", precision=0)
+            seed = modelo.Textbox(value="", label="Semente (opcional, int ou texto)", placeholder="Ex.: 42")
+            run = modelo.Button("Rodar simulação", variant="primary")
+    with modelo.Row():
+        plot = modelo.Plot(label="Distribuição simulada de incidentes")							# mostra o gráfico
+    	md = modelo.Markdown()												# mostra o resumo
+    	df = modelo.Dataframe(headers=["Métrica", "Valor"], label="Estatísticas resumidas", interactive=False)		# mostra a tbl
+    	file = modelo.File(label="Baixar simulações (.csv)")								# botão para download do csv
+# chamada da função
+run.click(
+        simulate_beta_binomial,
+        inputs=[N, limiteX, alpha, beta, sims, bins, seed],
+        outputs=[plot, md, df, file],
+        api_name="SimulaMC"
+    )
+    modelo.Markdown(
+        """
+### Resultados
+A distribuição Beta-Binomial (não fixa) captura a variabilidade adicional em relação à Binomial simples (fixa). Alterações nos parâmetros α e β influenciam tanto na média de incidentes quanto a probabilidade de ultrapassar o limite estabelecido.
+"""
+    )

requirements.txt ADDED Viewed

	@@ -0,0 +1,4 @@

+gradio>=4.44.0
+numpy>=1.24.0
+matplotlib>=3.7.0
+pandas>=2.0.0