Spaces:

llm-semantic-router
/

README

Running

App Files Files Community

Xunzhuo commited on Aug 24

Commit

115e965

verified ·

1 Parent(s): 4c9c979

Update README.md

Browse files

Files changed (1) hide show

README.md +6 -32

README.md CHANGED Viewed

@@ -40,39 +40,12 @@ Intelligently routes requests to specialized models based on semantic understand
 Our testing shows significant improvements in model accuracy through specialized routing.
 ## 🛠️ Architecture Overview
-```mermaid
-graph TB
-    Client[Client Request] --> Envoy[Envoy Proxy]
-    Envoy --> Router[Semantic Router ExtProc]
-    subgraph "Classification Modules"
-        direction LR
-        PII[PII Detector]
-        Jailbreak[Jailbreak Guard]
-        Category[Category Classifier]
-        Cache[Semantic Cache]
-    end
-    Router --> PII
-    Router --> Jailbreak
-    Router --> Category
-    Router --> Cache
-    PII --> Decision{Security Check}
-    Jailbreak --> Decision
-    Decision -->|Block| Block[Block Request]
-    Decision -->|Pass| Category
-    Category --> Models[Route to Specialized Model]
-    Cache -->|Hit| FastResponse[Return Cached Response]
-    Models --> Math[Math Model]
-    Models --> Creative[Creative Model]
-    Models --> Code[Code Model]
-    Models --> General[General Model]
-```
 ## 🎯 Use Cases
@@ -88,6 +61,8 @@ The router provides comprehensive monitoring through:
 - **Prometheus Metrics**: Detailed routing statistics and performance data
 - **Request Tracing**: Full visibility into routing decisions and performance
 ## 📖 Documentation
 For comprehensive documentation including detailed setup instructions, architecture guides, and API references, visit:
@@ -99,5 +74,4 @@ The documentation includes:
 - **[Quick Start](https://llm-semantic-router.readthedocs.io/en/latest/getting-started/quick-start/)** - Get running in 5 minutes
 - **[System Architecture](https://llm-semantic-router.readthedocs.io/en/latest/architecture/system-architecture/)** - Technical deep dive
 - **[Model Training](https://llm-semantic-router.readthedocs.io/en/latest/training/training-overview/)** - How classification models work
-- **[API Reference](https://llm-semantic-router.readthedocs.io/en/latest/api/router/)** - Complete API documentation

 Our testing shows significant improvements in model accuracy through specialized routing.
+![image/webp](https://cdn-uploads.huggingface.co/production/uploads/66f8caead3186746f4524419/efbREtUgJWTsU3iu5Xhu9.webp)
 ## 🛠️ Architecture Overview
+![image/png](https://cdn-uploads.huggingface.co/production/uploads/66f8caead3186746f4524419/jBZuH9Uy-lsVfGel5p5FT.png)
 ## 🎯 Use Cases
 - **Prometheus Metrics**: Detailed routing statistics and performance data
 - **Request Tracing**: Full visibility into routing decisions and performance
+![image/png](https://cdn-uploads.huggingface.co/production/uploads/66f8caead3186746f4524419/ZfofBg68tHlXaHEz2arCh.png)
 ## 📖 Documentation
 For comprehensive documentation including detailed setup instructions, architecture guides, and API references, visit:
 - **[Quick Start](https://llm-semantic-router.readthedocs.io/en/latest/getting-started/quick-start/)** - Get running in 5 minutes
 - **[System Architecture](https://llm-semantic-router.readthedocs.io/en/latest/architecture/system-architecture/)** - Technical deep dive
 - **[Model Training](https://llm-semantic-router.readthedocs.io/en/latest/training/training-overview/)** - How classification models work
+- **[API Reference](https://llm-semantic-router.readthedocs.io/en/latest/api/router/)** - Complete API documentation