Spaces:

AlgoCore
/

support-ticket-env

Sleeping

App Files Files Community

Vighnesh commited on Apr 26

Commit

d771897

1 Parent(s): 95dc191

Fix: add gradio to pyproject.toml deps, update README structure to match actual files

Browse files

Files changed (2) hide show

README.md +24 -14
pyproject.toml +1 -0

README.md CHANGED Viewed

@@ -77,30 +77,38 @@ Rewards provide partial progress signals throughout the trajectory:
 ```
 support_ticket_env/
-├── __init__.py          # Package exports
-├── models.py            # SupportAction, SupportObservation, SupportState
-├── tickets.py           # Ticket dataset with ground-truth labels
-├── graders.py           # Reward/grader functions for all 3 tasks
-├── client.py            # EnvClient subclass
-├── baseline.py          # Baseline inference script
-├── openenv.yaml         # Environment metadata
-├── Dockerfile           # Container definition
 └── server/
-    ├── app.py           # FastAPI entry point
-    └── support_environment.py  # Environment logic
 ```
 ## Setup
 ```bash
 # Install dependencies
-pip install openenv-core fastapi uvicorn pydantic gradio openai
 # Run locally
-cd support_ticket_env
-uvicorn server.app:app --host 0.0.0.0 --port 7860
-# Docker
 docker build -t support-ticket-env .
 docker run -p 7860:7860 support-ticket-env
@@ -108,6 +116,8 @@ docker run -p 7860:7860 support-ticket-env
 python run_tests.py
 ```
 ## Baseline Scores
 Measured with `gpt-4o-mini`, seeds `[42, 7, 123]`:

 ```
 support_ticket_env/
+├── __init__.py               # Package exports
+├── models.py                 # SupportAction, SupportObservation, SupportState
+├── tickets.py                # Ticket dataset with ground-truth labels
+├── graders.py                # Reward/grader functions for all 3 tasks
+├── client.py                 # EnvClient subclass
+├── baseline.py               # Baseline inference script
+├── get_baseline.py           # Fetch & save baseline results
+├── gradio_ui.py              # Interactive Gradio playground UI
+├── make_chart.py             # Plot training reward curves
+├── plot_results.py           # Visualise evaluation results
+├── grpo_results.png          # GRPO training results chart
+├── reward_chart.png          # Reward curve chart
+├── openenv.yaml              # Environment metadata
+├── Dockerfile                # Container definition
+├── train_sft.ipynb           # Step 1: SFT pre-training notebook
+├── train_grpo.ipynb          # Step 2: GRPO fine-tuning notebook
 └── server/
+    ├── app.py                # FastAPI entry point (+ Gradio UI mounted at /playground)
+    ├── support_environment.py # Environment logic
+    └── requirements.txt      # Server dependencies
 ```
 ## Setup
 ```bash
 # Install dependencies
+pip install openenv-core fastapi uvicorn pydantic gradio openai pyyaml
 # Run locally
+uvicorn support_ticket_env.server.app:app --host 0.0.0.0 --port 7860
+# Or via Docker
 docker build -t support-ticket-env .
 docker run -p 7860:7860 support-ticket-env
 python run_tests.py
 ```
+> 🎮 **Playground UI** available at `http://localhost:7860/playground` once the server is running.
 ## Baseline Scores
 Measured with `gpt-4o-mini`, seeds `[42, 7, 123]`:

pyproject.toml CHANGED Viewed

@@ -16,6 +16,7 @@ dependencies = [
     "pydantic>=2.0.0",
     "openai>=1.0.0",
     "pyyaml>=6.0",
 ]
 [project.optional-dependencies]

     "pydantic>=2.0.0",
     "openai>=1.0.0",
     "pyyaml>=6.0",
+    "gradio>=4.0.0",
 ]
 [project.optional-dependencies]