Spaces:

MohamedTry
/

CancerType

Sleeping

MohamedTry commited on Dec 5, 2025

Commit

596a54e

verified ·

1 Parent(s): a5c9478

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -3,48 +3,42 @@ from pydantic import BaseModel
 from transformers import AutoTokenizer, AutoModelForSequenceClassification
 import torch
-app = FastAPI()
-MODEL_NAME = "monologg/distilbiobert"
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
-model = AutoModelForSequenceClassification.from_pretrained(
-    MODEL_NAME,
-    num_labels=12  # عدد أنواع السرطان (أنت تتحكم به)
-)
 LABELS = [
- "breast_cancer",
- "lung_cancer",
- "prostate_cancer",
- "colon_cancer",
- "lymphoma",
- "melanoma",
- "thyroid_cancer",
- "kidney_cancer",
- "pancreatic_cancer",
- "ovarian_cancer",
- "cervical_cancer",
- "brain_tumor"
 ]
 class Input(BaseModel):
     text: str
 @app.post("/predict")
 def predict(data: Input):
     inputs = tokenizer(data.text, return_tensors="pt", truncation=True)
     outputs = model(**inputs)
-    probs = torch.nn.functional.softmax(outputs.logits, dim=1)
-    label_id = torch.argmax(probs).item()
-    confidence = float(torch.max(probs))
     return {
-        "prediction": LABELS[label_id],
-        "confidence": confidence
     }
-@app.get("/")
-def home():
-    return {"status": "Model is running"}

 from transformers import AutoTokenizer, AutoModelForSequenceClassification
 import torch
+app = FastAPI(
+    title="Medical Text Classifier",
+    description="Simple medical text classifier using a lightweight BioBERT model.",
+    version="1.0"
+)
+MODEL_NAME = "d4data/biobert-v1.1-finetuned-MedICAL"
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
+model = AutoModelForSequenceClassification.from_pretrained(MODEL_NAME)
+# Example labels (you can change them to cancer types)
 LABELS = [
+    "disease_related",
+    "treatment_related",
+    "test_related",
+    "symptom_related"
 ]
 class Input(BaseModel):
     text: str
+@app.get("/")
+def home():
+    return {"status": "Medical classifier running successfully"}
 @app.post("/predict")
 def predict(data: Input):
     inputs = tokenizer(data.text, return_tensors="pt", truncation=True)
     outputs = model(**inputs)
+    probs = torch.softmax(outputs.logits, dim=1)
+    label_id = probs.argmax().item()
     return {
+        "input": data.text,
+        "predicted_label": LABELS[label_id] if label_id < len(LABELS) else label_id,
+        "confidence": float(probs.max())
     }