Spaces:

yezdata
/

emcoder-api-ui

Running

App Files Files Community

yezdata commited on May 22

Commit

2592d48

0 Parent(s):

initial commit

Browse files

Files changed (5) hide show

.gitignore +10 -0
.python-version +1 -0
main.py +221 -0
pyproject.toml +14 -0
uv.lock +0 -0

.gitignore ADDED Viewed

	@@ -0,0 +1,10 @@

+# Python-generated files
+__pycache__/
+*.py[oc]
+build/
+dist/
+wheels/
+*.egg-info
+# Virtual environments
+.venv

.python-version ADDED Viewed

	@@ -0,0 +1 @@


1	+ 3.13

main.py ADDED Viewed

	@@ -0,0 +1,221 @@

+import torch
+import gradio as gr
+from fastapi import FastAPI
+import uvicorn
+from pydantic import BaseModel
+from transformers import AutoTokenizer, AutoModel
+app = FastAPI(title="EmCoder API & UI")
+repo_id = "yezdata/EmCoder"
+tokenizer = AutoTokenizer.from_pretrained(repo_id, trust_remote_code=True)
+model = AutoModel.from_pretrained(repo_id, trust_remote_code=True)
+max_labels = getattr(model.config, "num_labels", 28)
+model.eval()
+def compute_binary_entropy(p: torch.Tensor, eps: float = 1e-9) -> torch.Tensor:
+    p = torch.clamp(p, min=eps, max=1.0 - eps)
+    return -(p * torch.log(p) + (1.0 - p) * torch.log(1.0 - p))
+def compute_uncertainty(probs_samples: torch.Tensor, mean_probs: torch.Tensor) -> dict:
+    total_unc = compute_binary_entropy(mean_probs)  # (num_labels,)
+    # Aleatoric (Expected Entropy)
+    sample_entropies = compute_binary_entropy(probs_samples)  # (n_samples, num_labels)
+    aleatoric_unc = sample_entropies.mean(dim=0)  # (num_labels,)
+    # Epistemic (Mutual Information)
+    epistemic_unc = total_unc - aleatoric_unc
+    epistemic_unc = torch.clamp(epistemic_unc, min=0.0)
+    return {"total": total_unc, "aleatoric": aleatoric_unc, "epistemic": epistemic_unc}
+class PredictRequest(BaseModel):
+    text: str
+    monte_carlo: bool = False
+    n_samples: int = 10
+@app.post("/predict")
+def predict_api(request: PredictRequest):
+    encoded = tokenizer(request.text, return_tensors="pt")
+    input_ids = encoded["input_ids"]
+    attention_mask = encoded["attention_mask"]
+    id2label = model.config.id2label
+    if request.monte_carlo:
+        with torch.no_grad():
+            outputs = model.mc_forward(
+                input_ids=input_ids,
+                attention_mask=attention_mask,
+                n_samples=request.n_samples
+            )
+        mc_logits = outputs.logits
+        logits_samples = mc_logits.squeeze(1)
+        probs_samples = torch.sigmoid(logits_samples)  # (n_samples, num_labels)
+        mean_probs = probs_samples.mean(dim=0)  # (num_labels,)
+        unc_dict = compute_uncertainty(probs_samples=probs_samples, mean_probs=mean_probs)
+        predictions = {}
+        for i in range(model.config.num_labels):
+            label_name = id2label[i]
+            predictions[label_name] = {
+                "mean_probability": float(mean_probs[i]),
+                "uncertainty": {
+                    "total_entropy": float(unc_dict["total"][i]),
+                    "epistemic": float(unc_dict["epistemic"][i]),
+                    "aleatoric": float(unc_dict["aleatoric"][i]),
+                }
+            }
+        return {
+            "mode": "monte_carlo",
+            "n_samples": request.n_samples,
+            "predictions": predictions
+        }
+    else:
+        with torch.no_grad():
+            outputs = model(input_ids=input_ids, attention_mask=attention_mask)
+        logits = outputs.logits.squeeze(0)
+        probs = torch.sigmoid(logits)
+        predictions = {}
+        for i in range(model.config.num_labels):
+            label_name = id2label[i]
+            predictions[label_name] = {
+                "probability": float(probs[i])
+            }
+        return {
+            "mode": "standard",
+            "predictions": predictions
+        }
+@app.get("/health")
+def health_check():
+    return {"status": "healthy"}
+def gradio_predict(text, top_n, monte_carlo, n_samples):
+    request_data = PredictRequest(text=text, monte_carlo=bool(monte_carlo), n_samples=int(n_samples))
+    response = predict_api(request_data)
+    sorted_preds = sorted(
+        response["predictions"].items(),
+        key=lambda item: item[1]["mean_probability"] if monte_carlo else item[1]["probability"],
+        reverse=True
+    )
+    top_preds = sorted_preds[:int(top_n)]
+    standard_rows = []
+    mc_rows = []
+    for label_name, metrics in top_preds:
+        if monte_carlo:
+            prob = metrics["mean_probability"]
+            mc_rows.append([
+                label_name,
+                f"{prob * 100:.2f}%",
+                f"{metrics['uncertainty']['total_entropy']:.4f}",
+                f"{metrics['uncertainty']['epistemic']:.4f}",
+                f"{metrics['uncertainty']['aleatoric']:.4f}"
+            ])
+        else:
+            prob = metrics["probability"]
+            standard_rows.append([
+                label_name,
+                f"{prob * 100:.2f}%"
+            ])
+    if monte_carlo:
+        return (
+            gr.update(value=[], visible=False),
+            gr.update(value=mc_rows, visible=True)
+        )
+    else:
+        return (
+            gr.update(value=standard_rows, visible=True),
+            gr.update(value=[], visible=False)
+        )
+with gr.Blocks(title="EmCoder - Probabilistic Emotion Recognition") as ui:
+    gr.Markdown("# EmCoder - Probabilistic Emotion Recognition")
+    gr.Markdown("Live API service and graphical interface demonstrating EmCoder's epistemic and aleatoric uncertainty decomposition via Monte Carlo Dropout.")
+    with gr.Row():
+        with gr.Column(scale=1):
+            input_text = gr.Textbox(
+                label="Input text",
+                placeholder="Input text for classification...",
+                lines=3
+            )
+            top_n_slider = gr.Slider(
+                minimum=1,
+                maximum=max_labels,
+                value=min(5, max_labels),
+                step=1,
+                label="Top Emotions to display"
+            )
+            use_mc = gr.Checkbox(label="Use Monte Carlo Dropout (Uncertainty Estimation)", value=False)
+            mc_samples_slider = gr.Slider(
+                minimum=5,
+                maximum=50,
+                value=10,
+                step=1,
+                label="MC samples"
+            )
+            submit_btn = gr.Button("Analyze Emotion", variant="primary")
+        with gr.Column(scale=2):
+            output_table_standard = gr.DataFrame(
+                headers=["Emotion", "Probability"],
+                datatype=["str", "str"],
+                label="Prediction Report",
+                visible=True
+            )
+            output_table_mc = gr.DataFrame(
+                headers=[
+                    "Emotion",
+                    "Probability (Mean)",
+                    "Total Uncertainty (Entropy)",
+                    "Epistemic (Model Knowledge)",
+                    "Aleatoric (Data Noise)"
+                ],
+                datatype=["str", "str", "str", "str", "str"],
+                label="Prediction & Bayesian Uncertainty Report",
+                visible=False
+            )
+    submit_btn.click(
+        fn=gradio_predict,
+        inputs=[input_text, top_n_slider, use_mc, mc_samples_slider],
+        outputs=[output_table_standard, output_table_mc]
+    )
+app = gr.mount_gradio_app(app, ui, path="/")
+if __name__ == "__main__":
+    uvicorn.run("main:app", host="0.0.0.0", port=8000, reload=True)

pyproject.toml ADDED Viewed

	@@ -0,0 +1,14 @@

+[project]
+name = "api"
+version = "0.1.0"
+description = "Add your description here"
+readme = "README.md"
+requires-python = ">=3.13"
+dependencies = [
+    "fastapi>=0.136.1",
+    "gradio>=6.14.0",
+    "pydantic>=2.13.4",
+    "torch>=2.12.0",
+    "transformers>=5.9.0",
+    "uvicorn>=0.47.0",
+]

uv.lock ADDED Viewed

The diff for this file is too large to render. See raw diff