Spaces:

sagarchapara
/

openenv-summarization

Sleeping

App Files Files Community

Sagar Chapara commited on Apr 8

Commit

f8a321a

1 Parent(s): d1221ff

Polish Space startup and root route

Browse files

Files changed (3) hide show

Dockerfile +8 -8
server/app.py +17 -0
server/environment.py +13 -4

Dockerfile CHANGED Viewed

@@ -26,14 +26,14 @@ COPY inference.py .
 # Pre-download datasets at build time to avoid cold-start delays
 # (Falls back to hardcoded samples if download fails)
-RUN python -c "\
-try:\
-    from datasets import load_dataset;\
-    load_dataset('rajpurkar/squad', split='validation[:200]');\
-    print('SQuAD cached.');\
-except Exception as e:\
-    print(f'SQuAD cache skipped: {e}');\
-" || true
 # Hugging Face Spaces commonly uses 7860, while local OpenEnv docker providers
 # often inject PORT=8000. Support both.

 # Pre-download datasets at build time to avoid cold-start delays
 # (Falls back to hardcoded samples if download fails)
+RUN python - <<'PY' || true
+try:
+    from datasets import load_dataset
+    load_dataset("rajpurkar/squad", split="validation[:200]")
+    print("SQuAD cached.")
+except Exception as e:
+    print(f"SQuAD cache skipped: {e}")
+PY
 # Hugging Face Spaces commonly uses 7860, while local OpenEnv docker providers
 # often inject PORT=8000. Support both.

server/app.py CHANGED Viewed

@@ -26,6 +26,23 @@ app = create_fastapi_app(
 )
 def main() -> None:
     """Run the environment server for local validation and script entrypoints."""
     port = int(os.environ.get("PORT", "7860"))

 )
+@app.get("/")
+def root() -> dict:
+    """Friendly landing page for Spaces and browser visits."""
+    return {
+        "name": "Long-Context Summarization",
+        "status": "healthy",
+        "docs": {
+            "health": "/health",
+            "schema": "/schema",
+            "metadata": "/metadata",
+            "reset": "POST /reset",
+            "step": "POST /step",
+            "state": "GET /state",
+        },
+    }
 def main() -> None:
     """Run the environment server for local validation and script entrypoints."""
     port = int(os.environ.get("PORT", "7860"))

server/environment.py CHANGED Viewed

@@ -38,8 +38,8 @@ class SummarizationEnvironment(Environment):
     SUPPORTS_CONCURRENT_SESSIONS = False
     def __init__(self):
-        logger.info("Initialising SummarizationEnvironment — loading datasets...")
-        self._tasks = {name: get_task(name) for name in ("easy", "medium", "hard")}
         self._reset_episode_state()
         logger.info("Environment ready.")
@@ -61,6 +61,15 @@ class SummarizationEnvironment(Environment):
         # Hard task only: second chunk shown after first summary
         self._hard_chunk2: Optional[str] = None
     # ------------------------------------------------------------------
     # OpenEnv API
     # ------------------------------------------------------------------
@@ -93,7 +102,7 @@ class SummarizationEnvironment(Environment):
         self._episode_id = episode_id or f"ep_{random.randint(10000, 99999)}"
         rng_seed = seed
-        task = self._tasks[task_name]
         sample = task.get_sample(seed=rng_seed)
         # Store episode data
@@ -129,7 +138,7 @@ class SummarizationEnvironment(Environment):
         # Append model response to conversation history
         self._messages.append({"role": "assistant", "content": response})
-        task = self._tasks[self._task_name]
         # ── Summarize step ─────────────────────────────────────────────
         if self._step_type == "summarize":

     SUPPORTS_CONCURRENT_SESSIONS = False
     def __init__(self):
+        logger.info("Initialising SummarizationEnvironment...")
+        self._tasks: Dict[str, Any] = {}
         self._reset_episode_state()
         logger.info("Environment ready.")
         # Hard task only: second chunk shown after first summary
         self._hard_chunk2: Optional[str] = None
+    def _get_task(self, task_name: str):
+        """Lazily initialize tasks so app startup stays fast on Spaces."""
+        task = self._tasks.get(task_name)
+        if task is None:
+            logger.info("Loading task '%s'...", task_name)
+            task = get_task(task_name)
+            self._tasks[task_name] = task
+        return task
     # ------------------------------------------------------------------
     # OpenEnv API
     # ------------------------------------------------------------------
         self._episode_id = episode_id or f"ep_{random.randint(10000, 99999)}"
         rng_seed = seed
+        task = self._get_task(task_name)
         sample = task.get_sample(seed=rng_seed)
         # Store episode data
         # Append model response to conversation history
         self._messages.append({"role": "assistant", "content": response})
+        task = self._get_task(self._task_name)
         # ── Summarize step ─────────────────────────────────────────────
         if self._step_type == "summarize":