Spaces:

ArshVerma
/

CodeLens

Sleeping

App Files Files Community

AIMLxDIV commited on Apr 3

Commit

545fe42

unverified ·

1 Parent(s): 8ae0c62

Revert "feat: add API hardening, rate limiting, and resource management"

Browse files

Files changed (4) hide show

app.py +31 -135
codereview_env/config.py +0 -23
requirements.txt +0 -3
tests/test_api.py +2 -4

app.py CHANGED Viewed

@@ -1,105 +1,57 @@
 import uuid
-import logging
-import asyncio
-from typing import Dict, List, Optional
-from datetime import datetime, timezone
-from fastapi import FastAPI, HTTPException, WebSocket, WebSocketDisconnect, Depends, Security, Query, BackgroundTasks, Request
-from fastapi.responses import JSONResponse
-from fastapi.exceptions import RequestValidationError
-from fastapi.security.api_key import APIKeyHeader
 from pydantic import BaseModel
-from slowapi import Limiter, _rate_limit_exceeded_handler
-from slowapi.util import get_remote_address
-from slowapi.errors import RateLimitExceeded
 from codereview_env.models import (
     TaskId, Action, ResetResult, StepResult, EpisodeResult
 )
 from codereview_env.env import CodeReviewEnv
-from codereview_env.config import get_settings
-# ── Logging ───────────────────────────────────────────────────────────────────
-settings = get_settings()
-logging.basicConfig(
-    level=getattr(logging, settings.log_level),
-    format="%(asctime)s [%(levelname)s] %(name)s: %(message)s"
-)
-logger = logging.getLogger("codereview_env")
-# ── App Initialization ────────────────────────────────────────────────────────
 app = FastAPI(
     title="AgentOrg CodeReview OpenEnv API",
     description=(
         "AI Senior Code Reviewer evaluation environment. "
         "Trains agents to detect bugs, security vulnerabilities, and architectural issues "
-        "in realistic Python PRs."
     ),
     version="1.0.0",
 )
-# ── Rate Limiting ─────────────────────────────────────────────────────────────
-limiter = Limiter(key_func=get_remote_address, default_limits=[f"{settings.rate_limit_per_minute}/minute"])
-app.state.limiter = limiter
-app.add_exception_handler(RateLimitExceeded, _rate_limit_exceeded_handler)
-# ── API Key Authentication ────────────────────────────────────────────────────
-API_KEY_HEADER = APIKeyHeader(name="X-API-Key", auto_error=False)
-async def verify_api_key(api_key: str = Security(API_KEY_HEADER)):
-    if not settings.api_key_enabled:
-        return  # Auth disabled in development
-    if api_key != settings.api_key:
-        raise HTTPException(status_code=403, detail="Invalid or missing API key")
-# ── Storage & TTL ─────────────────────────────────────────────────────────────
-episodes: Dict[str, CodeReviewEnv] = {}
-episode_timestamps: Dict[str, datetime] = {}
-async def cleanup_expired_episodes():
-    """Remove episodes older than TTL."""
-    while True:
-        await asyncio.sleep(300)  # run every 5 minutes
-        cutoff = datetime.now(timezone.utc).timestamp() - settings.episode_ttl_seconds
-        expired = [
-            eid for eid, ts in episode_timestamps.items()
-            if ts.timestamp() < cutoff
-        ]
-        for eid in expired:
-            episodes.pop(eid, None)
-            episode_timestamps.pop(eid, None)
-        if expired:
-            logger.info(f"Cleaned up {len(expired)} expired episodes")
-@app.on_event("startup")
-async def startup_event():
-    asyncio.create_task(cleanup_expired_episodes())
-    logger.info(f"CodeReview API started on port {settings.app_port}")
-# ── Models ────────────────────────────────────────────────────────────────────
 class ResetRequest(BaseModel):
     task_id: TaskId
     seed:    int = 42
 class ResetResponse(BaseModel):
     episode_id: str
     result:     ResetResult
-leaderboard: Dict[TaskId, List[dict]] = {
     TaskId.BUG_DETECTION:        [],
     TaskId.SECURITY_AUDIT:       [],
     TaskId.ARCHITECTURAL_REVIEW: []
 }
 class SubmitScore(BaseModel):
     agent_name: str
     task_id:    TaskId
     score:      float
     seed:       int
 # ── WebSocket clients ─────────────────────────────────────────────────────────
 clients = set()
 async def broadcast_event(data: dict):
     from fastapi.encoders import jsonable_encoder
     import json
@@ -112,55 +64,30 @@ async def broadcast_event(data: dict):
             dead.add(client)
     clients.difference_update(dead)
-# ── Error Handlers ────────────────────────────────────────────────────────────
-@app.exception_handler(RequestValidationError)
-async def validation_exception_handler(request, exc):
-    return JSONResponse(
-        status_code=422,
-        content={
-            "error": "validation_error",
-            "detail": str(exc),
-            "status_code": 422
-        }
-    )
-@app.exception_handler(HTTPException)
-async def http_exception_handler(request, exc):
-    logger.warning(f"HTTP {exc.status_code}: {exc.detail} \u2014 {request.url}")
-    return JSONResponse(
-        status_code=exc.status_code,
-        content={
-            "error": exc.detail,
-            "status_code": exc.status_code
-        }
-    )
 # ── Endpoints ─────────────────────────────────────────────────────────────────
 @app.get("/health")
 def health_check():
     return {
-        "status": "ok",
-        "version": "1.0.0",
         "env_ready": True,
-        "env": settings.app_env,
         "active_episodes": len(episodes),
-        "auth_enabled": settings.api_key_enabled
     }
 @app.post("/reset", response_model=ResetResponse)
-@limiter.limit(f"{settings.rate_limit_per_minute}/minute")
-def reset_env(request: Request, req: ResetRequest, _: None = Depends(verify_api_key)):
     episode_id = str(uuid.uuid4())
     env        = CodeReviewEnv()
     result     = env.reset(req.task_id, req.seed)
     episodes[episode_id] = env
-    episode_timestamps[episode_id] = datetime.now(timezone.utc)
     return ResetResponse(episode_id=episode_id, result=result)
 @app.post("/step/{episode_id}", response_model=StepResult)
-@limiter.limit(f"{settings.rate_limit_per_minute}/minute")
-async def step_env(request: Request, episode_id: str, action: Action, _: None = Depends(verify_api_key)):
     if episode_id not in episodes:
         raise HTTPException(status_code=404, detail="Episode not found")
@@ -172,61 +99,29 @@ async def step_env(request: Request, episode_id: str, action: Action, _: None =
     except RuntimeError as e:
         raise HTTPException(status_code=400, detail=str(e))
 @app.get("/result/{episode_id}", response_model=EpisodeResult)
-def get_result(episode_id: str, _: None = Depends(verify_api_key)):
     if episode_id not in episodes:
         raise HTTPException(status_code=404, detail="Episode not found")
     return episodes[episode_id].get_final_result()
 @app.get("/leaderboard")
-def get_leaderboard(
-    task_id: Optional[TaskId] = None,
-    limit: int = Query(default=10, ge=1, le=50),
-    offset: int = Query(default=0, ge=0)
-):
-    if task_id:
-        entries = leaderboard.get(task_id, [])
-        return {
-            "task_id": task_id,
-            "entries": entries[offset:offset+limit],
-            "total": len(entries)
-        }
-    return {
-        task: {
-            "entries": entries[offset:offset+limit],
-            "total": len(entries)
-        }
-        for task, entries in leaderboard.items()
-    }
 @app.post("/submit")
-@limiter.limit(f"{settings.rate_limit_per_minute}/minute")
-def submit_to_leaderboard(request: Request, submission: SubmitScore, _: None = Depends(verify_api_key)):
     entries   = leaderboard.get(submission.task_id, [])
     new_entry = submission.model_dump()
     entries.append(new_entry)
     entries.sort(key=lambda x: x["score"], reverse=True)
     rank = entries.index(new_entry) + 1   # capture rank before slicing
-    leaderboard[submission.task_id] = entries[:settings.leaderboard_max_entries]
-    in_top_n = rank <= settings.leaderboard_max_entries
-    return {"status": "submitted", "rank": rank if in_top_n else None}
-@app.get("/episodes")
-def list_episodes(
-    _: None = Depends(verify_api_key),
-    limit: int = Query(default=20, ge=1, le=100)
-):
-    episode_list = [
-        {
-            "episode_id": eid,
-            "task_id": env.task_id,
-            "step_count": env.observation.step_count,
-            "done": env.done,
-            "created_at": episode_timestamps.get(eid, "").isoformat() if episode_timestamps.get(eid) else ""
-        }
-        for eid, env in list(episodes.items())[:limit]
-    ]
-    return {"episodes": episode_list, "total": len(episodes)}
 @app.websocket("/ws/events")
 async def websocket_endpoint(websocket: WebSocket):
@@ -240,6 +135,7 @@ async def websocket_endpoint(websocket: WebSocket):
     finally:
         clients.discard(websocket)
 if __name__ == "__main__":
     import uvicorn
-    uvicorn.run(app, host=settings.app_host, port=settings.app_port)

 import uuid
+from typing import Dict
+from fastapi import FastAPI, HTTPException, WebSocket, WebSocketDisconnect
 from pydantic import BaseModel
 from codereview_env.models import (
     TaskId, Action, ResetResult, StepResult, EpisodeResult
 )
 from codereview_env.env import CodeReviewEnv
 app = FastAPI(
     title="AgentOrg CodeReview OpenEnv API",
     description=(
         "AI Senior Code Reviewer evaluation environment. "
         "Trains agents to detect bugs, security vulnerabilities, and architectural issues "
+        "in realistic Python PRs grounded in real-world incident patterns."
     ),
     version="1.0.0",
 )
+# Simple in-memory storage for active episodes
+episodes: Dict[str, CodeReviewEnv] = {}
 class ResetRequest(BaseModel):
     task_id: TaskId
     seed:    int = 42
 class ResetResponse(BaseModel):
     episode_id: str
     result:     ResetResult
+# In-memory leaderboard
+leaderboard: Dict[TaskId, list] = {
     TaskId.BUG_DETECTION:        [],
     TaskId.SECURITY_AUDIT:       [],
     TaskId.ARCHITECTURAL_REVIEW: []
 }
 class SubmitScore(BaseModel):
     agent_name: str
     task_id:    TaskId
     score:      float
     seed:       int
 # ── WebSocket clients ─────────────────────────────────────────────────────────
 clients = set()
 async def broadcast_event(data: dict):
     from fastapi.encoders import jsonable_encoder
     import json
             dead.add(client)
     clients.difference_update(dead)
 # ── Endpoints ─────────────────────────────────────────────────────────────────
 @app.get("/health")
 def health_check():
     return {
+        "status":    "ok",
+        "version":   "1.0.0",
         "env_ready": True,
         "active_episodes": len(episodes),
     }
 @app.post("/reset", response_model=ResetResponse)
+def reset_env(req: ResetRequest):
     episode_id = str(uuid.uuid4())
     env        = CodeReviewEnv()
     result     = env.reset(req.task_id, req.seed)
     episodes[episode_id] = env
     return ResetResponse(episode_id=episode_id, result=result)
 @app.post("/step/{episode_id}", response_model=StepResult)
+async def step_env(episode_id: str, action: Action):
     if episode_id not in episodes:
         raise HTTPException(status_code=404, detail="Episode not found")
     except RuntimeError as e:
         raise HTTPException(status_code=400, detail=str(e))
 @app.get("/result/{episode_id}", response_model=EpisodeResult)
+def get_result(episode_id: str):
     if episode_id not in episodes:
         raise HTTPException(status_code=404, detail="Episode not found")
     return episodes[episode_id].get_final_result()
 @app.get("/leaderboard")
+def get_leaderboard():
+    return leaderboard
 @app.post("/submit")
+def submit_to_leaderboard(submission: SubmitScore):
     entries   = leaderboard.get(submission.task_id, [])
     new_entry = submission.model_dump()
     entries.append(new_entry)
     entries.sort(key=lambda x: x["score"], reverse=True)
     rank = entries.index(new_entry) + 1   # capture rank before slicing
+    leaderboard[submission.task_id] = entries[:5]
+    return {"status": "submitted", "rank": rank if rank <= 5 else None}
 @app.websocket("/ws/events")
 async def websocket_endpoint(websocket: WebSocket):
     finally:
         clients.discard(websocket)
 if __name__ == "__main__":
     import uvicorn
+    uvicorn.run(app, host="0.0.0.0", port=7860)

codereview_env/config.py DELETED Viewed

@@ -1,23 +0,0 @@
-from functools import lru_cache
-from pydantic_settings import BaseSettings, SettingsConfigDict
-class Settings(BaseSettings):
-    model_config = SettingsConfigDict(env_file=".env", env_file_encoding="utf-8", extra="ignore")
-    app_host: str = "0.0.0.0"
-    app_port: int = 7860
-    app_env: str = "development"
-    api_key: str = "changeme"
-    api_key_enabled: bool = False
-    leaderboard_max_entries: int = 10
-    log_level: str = "INFO"
-    episode_ttl_seconds: int = 3600        # episodes expire after 1 hour
-    rate_limit_per_minute: int = 60        # requests per minute per IP
-@lru_cache
-def get_settings() -> Settings:
-    return Settings()

requirements.txt CHANGED Viewed

@@ -6,6 +6,3 @@ requests>=2.31.0
 websockets>=12.0
 httpx<0.28.0
 openai>=1.0.0
-pydantic-settings==2.2.1
-slowapi==0.1.9
-python-dotenv==1.0.1

 websockets>=12.0
 httpx<0.28.0
 openai>=1.0.0

tests/test_api.py CHANGED Viewed

@@ -50,10 +50,8 @@ def test_api_leaderboard():
     # Check leaderboard
     lb_resp = client.get("/leaderboard")
     assert lb_resp.status_code == 200
-    lb_data = lb_resp.json()
-    bug_entries = lb_data["bug_detection"]["entries"]
-    assert len(bug_entries) > 0
-    assert bug_entries[0]["agent_name"] == "test_agent"
 def test_api_invalid_episode():
     client = TestClient(app)

     # Check leaderboard
     lb_resp = client.get("/leaderboard")
     assert lb_resp.status_code == 200
+    assert len(lb_resp.json()["bug_detection"]) > 0
+    assert lb_resp.json()["bug_detection"][0]["agent_name"] == "test_agent"
 def test_api_invalid_episode():
     client = TestClient(app)