Spaces:

adityabalaji
/

eduprompt-api

Sleeping

App Files Files Community

adityabalaji commited on Oct 21, 2025

Commit

82fc3eb

verified ·

1 Parent(s): 7aa47a6

Update app.py

Browse files

Files changed (1) hide show

app.py +97 -40

app.py CHANGED Viewed

@@ -1,8 +1,14 @@
-# app.py — EduPrompt API (per-task lazy load, cache-safe, no cache_dir in inference)
-import os
-# ---------- Force ALL caches to /tmp ----------
 BASE = "/tmp"
 os.environ["HF_HOME"] = f"{BASE}/hf"
 os.environ["HF_HUB_CACHE"] = f"{BASE}/hf"
@@ -11,58 +17,99 @@ os.environ["TRANSFORMERS_CACHE"] = f"{BASE}/hf/transformers"
 os.environ["XDG_CACHE_HOME"] = f"{BASE}/xdg"
 os.environ["TORCH_HOME"] = f"{BASE}/torch"
 os.environ["SENTENCEPIECE_CACHE"] = f"{BASE}/sp"
-for d in [
-    os.environ["HF_HOME"], os.environ["HF_HUB_CACHE"], os.environ["HUGGINGFACE_HUB_CACHE"],
-    os.environ["TRANSFORMERS_CACHE"], os.environ["XDG_CACHE_HOME"],
-    os.environ["TORCH_HOME"], os.environ["SENTENCEPIECE_CACHE"]
-]:
     os.makedirs(d, exist_ok=True)
-import time
-from fastapi import FastAPI
-from pydantic import BaseModel
-from fastapi.middleware.cors import CORSMiddleware
-from transformers import pipeline
 app = FastAPI(title="EduPrompt API")
 app.add_middleware(
     CORSMiddleware,
-    allow_origins=["*"],  # tighten in prod
     allow_methods=["*"],
     allow_headers=["*"],
 )
 @app.get("/")
 def health():
-    # prove /tmp is writable
     try:
         with open(f"{BASE}/eduprompt_write_test.txt", "w") as f:
             f.write("ok")
-        writable = True
     except Exception:
         writable = False
     return {
         "ok": True,
         "service": "eduprompt-api",
         "tmpWritable": writable,
-        "TRANSFORMERS_CACHE": os.environ["TRANSFORMERS_CACHE"]
     }
-# ---------- lazy singletons ----------
 _summarizer = None
 _rewriter = None
 _proofreader = None
 _code_explainer = None
 def safe_pipeline(task: str, model_id: str):
-    """Cache every model in its own /tmp subdir. CPU-only."""
-    model_cache = os.path.join(os.environ["TRANSFORMERS_CACHE"], model_id.replace("/", "_"))
-    os.makedirs(model_cache, exist_ok=True)
-    print(f"Loading model '{model_id}' for task '{task}' into cache dir: {model_cache}")
-    return pipeline(task, model=model_id, cache_dir=model_cache, trust_remote_code=True, device=-1)
 def get_model(task: str):
-    """Load ONLY the model needed for this task."""
     global _summarizer, _rewriter, _proofreader, _code_explainer
     if task == "summarize":
         if _summarizer is None:
@@ -82,58 +129,68 @@ def get_model(task: str):
         return _code_explainer, "Salesforce/codet5p-220m"
     raise ValueError(f"Unsupported task '{task}'")
 class InputData(BaseModel):
     task: str                  # summarize | rewrite | proofread | explain_code
     input: str
     params: dict | None = None
-def filter_model_kwargs(params):
-    # Remove keys not accepted by model.__call__()
     forbidden = {"cache_dir"}
     return {k: v for k, v in (params or {}).items() if k not in forbidden}
 @app.post("/run")
 async def run_task(data: InputData):
-    start = time.time()
     task = (data.task or "").strip().lower()
     text = (data.input or "").strip()
     if not text:
         return {"error": "Empty input text."}
     if task not in {"summarize", "rewrite", "proofread", "explain_code"}:
         return {"error": f"Unsupported task '{task}'."}
-    # Load only what we need
     try:
         model, model_used = get_model(task)
     except Exception as e:
-        import traceback
-        print(traceback.format_exc())
         return {"error": f"model_load_failed: {type(e).__name__}: {str(e)}"}
-    # Filter out forbidden kwargs
-    params = filter_model_kwargs(data.params)
     try:
         if task == "summarize":
             prompt = f"You are an expert explainer. Summarize clearly and concisely:\n{text}"
-            output = model(prompt, max_length=120, min_length=30, truncation=True, do_sample=False, **params)[0]["summary_text"]
         elif task == "rewrite":
             prompt = f"You are a writing assistant. Rewrite this text for clarity and tone:\n{text}"
-            output = model(prompt, max_new_tokens=150, truncation=True, **params)[0]["generated_text"]
         elif task == "proofread":
             prompt = f"Correct and improve grammar and style:\n{text}"
-            output = model(prompt, max_new_tokens=150, truncation=True, **params)[0]["generated_text"]
         else:  # explain_code
             prompt = f"Explain what this code does in simple language:\n{text}"
-            output = model(prompt, max_new_tokens=200, truncation=True, **params)[0]["generated_text"]
     except Exception as e:
         import traceback
         print(traceback.format_exc())
         return {"error": f"inference_failed: {type(e).__name__}: {str(e)}"}
     return {
         "enhancedPrompt": prompt,
-        "output": output,
         "model": model_used,
-        "latencyMs": round((time.time() - start) * 1000, 2),
-    }

+# app.py — EduPrompt API (final: per-task load, Spaces-safe caches, smart retries)
+import os, time
+from fastapi import FastAPI
+from pydantic import BaseModel
+from fastapi.middleware.cors import CORSMiddleware
+from transformers import pipeline
+# =========================
+# Hard-force ALL caches to /tmp (writable on Spaces)
+# =========================
 BASE = "/tmp"
 os.environ["HF_HOME"] = f"{BASE}/hf"
 os.environ["HF_HUB_CACHE"] = f"{BASE}/hf"
 os.environ["XDG_CACHE_HOME"] = f"{BASE}/xdg"
 os.environ["TORCH_HOME"] = f"{BASE}/torch"
 os.environ["SENTENCEPIECE_CACHE"] = f"{BASE}/sp"
+for d in (
+    os.environ["HF_HOME"],
+    os.environ["HF_HUB_CACHE"],
+    os.environ["HUGGINGFACE_HUB_CACHE"],
+    os.environ["TRANSFORMERS_CACHE"],
+    os.environ["XDG_CACHE_HOME"],
+    os.environ["TORCH_HOME"],
+    os.environ["SENTENCEPIECE_CACHE"],
+):
     os.makedirs(d, exist_ok=True)
+# =========================
+# FastAPI app + CORS
+# =========================
 app = FastAPI(title="EduPrompt API")
 app.add_middleware(
     CORSMiddleware,
+    allow_origins=["*"],   # tighten in prod
     allow_methods=["*"],
     allow_headers=["*"],
 )
 @app.get("/")
 def health():
+    # prove /tmp is writable and show cache path
+    writable = True
     try:
         with open(f"{BASE}/eduprompt_write_test.txt", "w") as f:
             f.write("ok")
     except Exception:
         writable = False
     return {
         "ok": True,
         "service": "eduprompt-api",
         "tmpWritable": writable,
+        "TRANSFORMERS_CACHE": os.environ["TRANSFORMERS_CACHE"],
     }
+# =========================
+# Lazy singletons (loaded per task)
+# =========================
 _summarizer = None
 _rewriter = None
 _proofreader = None
 _code_explainer = None
+def _model_cache_dir(model_id: str) -> str:
+    # each model gets its own directory to avoid lock fights
+    p = os.path.join(os.environ["TRANSFORMERS_CACHE"], model_id.replace("/", "_"))
+    os.makedirs(p, exist_ok=True)
+    return p
 def safe_pipeline(task: str, model_id: str):
+    """
+    Build a pipeline that caches to /tmp per model.
+    Some pipelines reject 'cache_dir' -> retry without it.
+    Also handles rare permission/lock races by a short retry.
+    """
+    cache_dir = _model_cache_dir(model_id)
+    print(f"[init] task={task} model={model_id} cache={cache_dir}")
+    # Try with cache_dir
+    try:
+        return pipeline(task, model=model_id, cache_dir=cache_dir,
+                        trust_remote_code=True, device=-1)
+    except ValueError as e:
+        # Some models complain: "model_kwargs not used: ['cache_dir']"
+        if "cache_dir" in str(e):
+            print(f"[init] {model_id} rejects cache_dir, retrying without it")
+            return pipeline(task, model=model_id, trust_remote_code=True, device=-1)
+        raise
+    except OSError as e:
+        # Permission/lock race — wait and retry once
+        print(f"[init] OSError on {model_id}: {e}; retrying once")
+        time.sleep(1.5)
+        # Re-assert env (some libs re-read)
+        os.environ["HF_HOME"] = f"{BASE}/hf"
+        os.environ["HF_HUB_CACHE"] = f"{BASE}/hf"
+        os.environ["TRANSFORMERS_CACHE"] = f"{BASE}/hf/transformers"
+        try:
+            return pipeline(task, model=model_id, cache_dir=cache_dir,
+                            trust_remote_code=True, device=-1)
+        except ValueError as e2:
+            if "cache_dir" in str(e2):
+                print(f"[init] {model_id} rejects cache_dir on retry, fallback no cache_dir")
+                return pipeline(task, model=model_id, trust_remote_code=True, device=-1)
+            raise
+        except Exception as e2:
+            raise
 def get_model(task: str):
+    """
+    Load ONLY the model needed for this task.
+    """
     global _summarizer, _rewriter, _proofreader, _code_explainer
     if task == "summarize":
         if _summarizer is None:
         return _code_explainer, "Salesforce/codet5p-220m"
     raise ValueError(f"Unsupported task '{task}'")
+# =========================
+# Request schema
+# =========================
 class InputData(BaseModel):
     task: str                  # summarize | rewrite | proofread | explain_code
     input: str
     params: dict | None = None
+def _clean_params(params: dict | None):
+    # Block params that some pipelines reject in generate/forward
     forbidden = {"cache_dir"}
     return {k: v for k, v in (params or {}).items() if k not in forbidden}
+# =========================
+# Core endpoint
+# =========================
 @app.post("/run")
 async def run_task(data: InputData):
+    t0 = time.time()
     task = (data.task or "").strip().lower()
     text = (data.input or "").strip()
     if not text:
         return {"error": "Empty input text."}
     if task not in {"summarize", "rewrite", "proofread", "explain_code"}:
         return {"error": f"Unsupported task '{task}'."}
+    # load only what we need
     try:
         model, model_used = get_model(task)
     except Exception as e:
         return {"error": f"model_load_failed: {type(e).__name__}: {str(e)}"}
+    params = _clean_params(data.params)
     try:
         if task == "summarize":
             prompt = f"You are an expert explainer. Summarize clearly and concisely:\n{text}"
+            out = model(prompt, max_length=120, min_length=30,
+                        truncation=True, do_sample=False, **params)[0]["summary_text"]
         elif task == "rewrite":
             prompt = f"You are a writing assistant. Rewrite this text for clarity and tone:\n{text}"
+            out = model(prompt, max_new_tokens=150, truncation=True, **params)[0]["generated_text"]
         elif task == "proofread":
             prompt = f"Correct and improve grammar and style:\n{text}"
+            out = model(prompt, max_new_tokens=150, truncation=True, **params)[0]["generated_text"]
         else:  # explain_code
             prompt = f"Explain what this code does in simple language:\n{text}"
+            out = model(prompt, max_new_tokens=200, truncation=True, **params)[0]["generated_text"]
     except Exception as e:
+        # print full stack to logs for debugging; return friendly message to client
         import traceback
         print(traceback.format_exc())
         return {"error": f"inference_failed: {type(e).__name__}: {str(e)}"}
     return {
         "enhancedPrompt": prompt,
+        "output": out,
         "model": model_used,
+        "latencyMs": round((time.time() - t0) * 1000, 2),
+    }