Spaces:

codey-lab
/

Multi-LLM-API-Gateway

Sleeping

App Files Files Community

Alibrown commited on Mar 9

Commit

86c46c5

verified ·

1 Parent(s): e3b0257

Update app/providers.py

Browse files

Files changed (1) hide show

app/providers.py +172 -49

app/providers.py CHANGED Viewed

@@ -1,5 +1,6 @@
 # =============================================================================
-# # app/providers.py
 # Universal MCP Hub (Sandboxed) - based on PyFundaments Architecture
 # Copyright 2026 - Volkan Kücükbudak
 # Apache License V. 2 + ESOL 1.1
@@ -10,77 +11,99 @@
 #   NO direct access to fundaments/*, .env, or Guardian (main.py).
 #   All config comes from app/.pyfun via app/config.py.
 #
-#
-# TOOL REGISTRATION PRINCIPLE:
-#   Tools are registered via providers.py and models.py .
 #   No key = no provider = no tool = no crash.
-#   Adding a new provider = update .pyfun + providers.py only. Never touch mcp.py!
 #
 # DEPENDENCY CHAIN (app/* only, no fundaments!):
 #   config.py    → parses app/.pyfun — single source of truth
-#   providers.py → LLM + Search provider registry + fallback chain
-#   models.py    → model limits, costs, capabilities from .pyfun [MODELS]
-#   db_sync.py   → internal SQLite IPC (app/* state) — NOT postgresql.py!
-#   mcp.py       → registers tools only, delegates all logic to providers/*
 # =============================================================================
-from . import config
 import os
-import httpx
 import logging
 logger = logging.getLogger("providers")
 # =============================================================================
-# Base Provider — gemeinsame Logic EINMAL
 # =============================================================================
 class BaseProvider:
     def __init__(self, name: str, cfg: dict):
-        self.name      = name
-        self.key       = os.getenv(cfg.get("env_key", ""))
-        self.base_url  = cfg.get("base_url", "")
-        self.fallback  = cfg.get("fallback_to", "")
-        self.timeout   = int(config.get_limits().get("REQUEST_TIMEOUT_SEC", "60"))
-        self.model     = cfg.get("default_model", "")
     async def complete(self, prompt: str, model: str, max_tokens: int) -> str:
         raise NotImplementedError
     async def _post(self, url: str, headers: dict, payload: dict) -> dict:
-        """EINMAL — alle Provider nutzen das!"""
         async with httpx.AsyncClient() as client:
             r = await client.post(
                 url,
                 headers=headers,
                 json=payload,
-                timeout=self.timeout
             )
             r.raise_for_status()
             return r.json()
 # =============================================================================
-# Provider Implementierungen — nur parse logic verschieden
 # =============================================================================
 class AnthropicProvider(BaseProvider):
     async def complete(self, prompt: str, model: str = None, max_tokens: int = 1024) -> str:
-        cfg = config.get_active_llm_providers().get("anthropic", {})
         data = await self._post(
             f"{self.base_url}/messages",
             headers={
-                "x-api-key":           self.key,
-                "anthropic-version":   cfg.get("api_version_header", "2023-06-01"),
-                "content-type":        "application/json",
             },
             payload={
                 "model":      model or self.model,
                 "max_tokens": max_tokens,
                 "messages":   [{"role": "user", "content": prompt}],
-            }
         )
         return data["content"][0]["text"]
 class GeminiProvider(BaseProvider):
     async def complete(self, prompt: str, model: str = None, max_tokens: int = 1024) -> str:
         m = model or self.model
         async with httpx.AsyncClient() as client:
@@ -88,16 +111,18 @@ class GeminiProvider(BaseProvider):
                 f"{self.base_url}/models/{m}:generateContent",
                 params={"key": self.key},
                 json={
-                    "contents":       [{"parts": [{"text": prompt}]}],
-                    "generationConfig":{"maxOutputTokens": max_tokens},
                 },
-                timeout=self.timeout
             )
             r.raise_for_status()
             return r.json()["candidates"][0]["content"]["parts"][0]["text"]
 class OpenRouterProvider(BaseProvider):
     async def complete(self, prompt: str, model: str = None, max_tokens: int = 1024) -> str:
         data = await self._post(
             f"{self.base_url}/chat/completions",
@@ -107,17 +132,19 @@ class OpenRouterProvider(BaseProvider):
                 "content-type":  "application/json",
             },
             payload={
-                "model":    model or self.model,
                 "max_tokens": max_tokens,
-                "messages": [{"role": "user", "content": prompt}],
-            }
         )
         return data["choices"][0]["message"]["content"]
 class HuggingFaceProvider(BaseProvider):
     async def complete(self, prompt: str, model: str = None, max_tokens: int = 512) -> str:
-        m = model or self.model
         data = await self._post(
             f"{self.base_url}/{m}/v1/chat/completions",
             headers={
@@ -128,14 +155,17 @@ class HuggingFaceProvider(BaseProvider):
                 "model":      m,
                 "max_tokens": max_tokens,
                 "messages":   [{"role": "user", "content": prompt}],
-            }
         )
         return data["choices"][0]["message"]["content"]
 # =============================================================================
-# Provider Registry — gebaut aus .pyfun
 # =============================================================================
 _PROVIDER_CLASSES = {
     "anthropic":   AnthropicProvider,
     "gemini":      GeminiProvider,
@@ -145,8 +175,13 @@ _PROVIDER_CLASSES = {
 _registry: dict = {}
 def initialize() -> None:
-    """Build provider registry from .pyfun — called by app.py"""
     global _registry
     active = config.get_active_llm_providers()
@@ -163,20 +198,35 @@ def initialize() -> None:
         logger.info(f"Provider registered: {name}")
-async def complete(
     prompt: str,
     provider_name: str = None,
     model: str = None,
-    max_tokens: int = 1024
 ) -> str:
     """
-    Complete with fallback chain from .pyfun.
-    anthropic → fails → openrouter → fails → error
     """
-    # default provider aus [TOOL.llm_complete] → default_provider
     if not provider_name:
-        tools = config.get_active_tools()
-        provider_name = tools.get("llm_complete", {}).get("default_provider", "anthropic")
     visited = set()
     current = provider_name
@@ -193,18 +243,91 @@ async def complete(
             except Exception as e:
                 logger.warning(f"Provider '{current}' failed: {e} — trying fallback.")
-        # Fallback aus .pyfun
-        cfg = config.get_active_llm_providers().get(current, {})
         current = cfg.get("fallback_to", "")
     raise RuntimeError("All providers failed — no fallback available.")
 def get(name: str) -> BaseProvider:
-    """Get a specific provider by name."""
     return _registry.get(name)
-def list_active() -> list:
-    """List all active provider names."""
-    return list(_registry.keys())

 # =============================================================================
+# app/providers.py
+# LLM + Search Provider Registry + Fallback Chain
 # Universal MCP Hub (Sandboxed) - based on PyFundaments Architecture
 # Copyright 2026 - Volkan Kücükbudak
 # Apache License V. 2 + ESOL 1.1
 #   NO direct access to fundaments/*, .env, or Guardian (main.py).
 #   All config comes from app/.pyfun via app/config.py.
 #
+# PROVIDER PRINCIPLE:
 #   No key = no provider = no tool = no crash.
+#   Server always starts, just with fewer providers.
+#   Adding a new provider = update .pyfun + add class here. Never touch mcp.py!
+#
+# FALLBACK CHAIN:
+#   Defined in .pyfun per provider via fallback_to field.
+#   anthropic → fails → openrouter → fails → RuntimeError
+#   Visited set prevents infinite loops.
 #
 # DEPENDENCY CHAIN (app/* only, no fundaments!):
 #   config.py    → parses app/.pyfun — single source of truth
+#   providers.py → LLM + Search registry + fallback chain
+#   tools.py     → calls providers.llm_complete() / providers.search()
+#   mcp.py       → calls providers.list_active_llm() / list_active_search()
 # =============================================================================
 import os
 import logging
+import httpx
+from . import config
 logger = logging.getLogger("providers")
 # =============================================================================
+# SECTION 1 — Base Provider
+# Shared HTTP logic — implemented ONCE, reused by all providers.
 # =============================================================================
 class BaseProvider:
+    """
+    Base class for all LLM providers.
+    Subclasses only implement complete() — HTTP logic lives here.
+    """
     def __init__(self, name: str, cfg: dict):
+        self.name     = name
+        self.key      = os.getenv(cfg.get("env_key", ""))
+        self.base_url = cfg.get("base_url", "")
+        self.fallback = cfg.get("fallback_to", "")
+        self.timeout  = int(config.get_limits().get("REQUEST_TIMEOUT_SEC", "60"))
+        self.model    = cfg.get("default_model", "")
     async def complete(self, prompt: str, model: str, max_tokens: int) -> str:
+        """Override in each provider subclass."""
         raise NotImplementedError
     async def _post(self, url: str, headers: dict, payload: dict) -> dict:
+        """
+        Shared HTTP POST — used by all providers.
+        Raises httpx.HTTPStatusError on non-2xx responses.
+        """
         async with httpx.AsyncClient() as client:
             r = await client.post(
                 url,
                 headers=headers,
                 json=payload,
+                timeout=self.timeout,
             )
             r.raise_for_status()
             return r.json()
 # =============================================================================
+# SECTION 2 — LLM Provider Implementations
+# Only the API-specific parsing logic differs per provider.
 # =============================================================================
 class AnthropicProvider(BaseProvider):
+    """Anthropic Claude API — Messages endpoint."""
     async def complete(self, prompt: str, model: str = None, max_tokens: int = 1024) -> str:
+        cfg  = config.get_active_llm_providers().get("anthropic", {})
         data = await self._post(
             f"{self.base_url}/messages",
             headers={
+                "x-api-key":         self.key,
+                "anthropic-version": cfg.get("api_version_header", "2023-06-01"),
+                "content-type":      "application/json",
             },
             payload={
                 "model":      model or self.model,
                 "max_tokens": max_tokens,
                 "messages":   [{"role": "user", "content": prompt}],
+            },
         )
         return data["content"][0]["text"]
 class GeminiProvider(BaseProvider):
+    """Google Gemini API — generateContent endpoint."""
     async def complete(self, prompt: str, model: str = None, max_tokens: int = 1024) -> str:
         m = model or self.model
         async with httpx.AsyncClient() as client:
                 f"{self.base_url}/models/{m}:generateContent",
                 params={"key": self.key},
                 json={
+                    "contents":        [{"parts": [{"text": prompt}]}],
+                    "generationConfig": {"maxOutputTokens": max_tokens},
                 },
+                timeout=self.timeout,
             )
             r.raise_for_status()
             return r.json()["candidates"][0]["content"]["parts"][0]["text"]
 class OpenRouterProvider(BaseProvider):
+    """OpenRouter API — OpenAI-compatible chat completions endpoint."""
     async def complete(self, prompt: str, model: str = None, max_tokens: int = 1024) -> str:
         data = await self._post(
             f"{self.base_url}/chat/completions",
                 "content-type":  "application/json",
             },
             payload={
+                "model":      model or self.model,
                 "max_tokens": max_tokens,
+                "messages":   [{"role": "user", "content": prompt}],
+            },
         )
         return data["choices"][0]["message"]["content"]
 class HuggingFaceProvider(BaseProvider):
+    """HuggingFace Inference API — chat completions endpoint."""
     async def complete(self, prompt: str, model: str = None, max_tokens: int = 512) -> str:
+        m    = model or self.model
         data = await self._post(
             f"{self.base_url}/{m}/v1/chat/completions",
             headers={
                 "model":      m,
                 "max_tokens": max_tokens,
                 "messages":   [{"role": "user", "content": prompt}],
+            },
         )
         return data["choices"][0]["message"]["content"]
 # =============================================================================
+# SECTION 3 — Provider Registry
+# Built from .pyfun [LLM_PROVIDERS] at initialize().
+# Maps provider names to classes — add new providers here.
 # =============================================================================
 _PROVIDER_CLASSES = {
     "anthropic":   AnthropicProvider,
     "gemini":      GeminiProvider,
 _registry: dict = {}
 def initialize() -> None:
+    """
+    Build provider registry from .pyfun [LLM_PROVIDERS].
+    Called once by mcp.py during startup sequence.
+    Skips providers with missing ENV keys — no crash, just fewer tools.
+    """
     global _registry
     active = config.get_active_llm_providers()
         logger.info(f"Provider registered: {name}")
+# =============================================================================
+# SECTION 4 — LLM Execution + Fallback Chain
+# =============================================================================
+async def llm_complete(
     prompt: str,
     provider_name: str = None,
     model: str = None,
+    max_tokens: int = 1024,
 ) -> str:
     """
+    Send prompt to LLM provider with automatic fallback chain.
+    Fallback order is defined in .pyfun via fallback_to field.
+    Raises RuntimeError if all providers in the chain fail.
+    Args:
+        prompt:        Input text to send to the model.
+        provider_name: Provider name override. Defaults to default_provider
+                       from .pyfun [TOOL.llm_complete].
+        model:         Model name override. Defaults to provider's default_model.
+        max_tokens:    Max tokens in response. Default: 1024.
+    Returns:
+        Model response as plain text string.
     """
+    # Default provider from .pyfun [TOOL.llm_complete] → default_provider
     if not provider_name:
+        tools_cfg     = config.get_active_tools()
+        provider_name = tools_cfg.get("llm_complete", {}).get("default_provider", "anthropic")
     visited = set()
     current = provider_name
             except Exception as e:
                 logger.warning(f"Provider '{current}' failed: {e} — trying fallback.")
+        # Next in fallback chain from .pyfun
+        cfg     = config.get_active_llm_providers().get(current, {})
         current = cfg.get("fallback_to", "")
     raise RuntimeError("All providers failed — no fallback available.")
+# Alias — used internally by tools.py
+complete = llm_complete
+# =============================================================================
+# SECTION 5 — Search Execution
+# Search providers not yet implemented — returns placeholder.
+# Add BraveProvider, TavilyProvider here when ready.
+# =============================================================================
+async def search(
+    query: str,
+    provider_name: str = None,
+    max_results: int = 5,
+) -> str:
+    """
+    Search the web via configured search provider.
+    Search providers not yet implemented — placeholder until BraveProvider ready.
+    Args:
+        query:         Search query string.
+        provider_name: Provider name override (e.g. 'brave', 'tavily').
+        max_results:   Maximum number of results. Default: 5.
+    Returns:
+        Formatted search results as plain text string.
+    """
+    # TODO: implement BraveProvider, TavilyProvider
+    # Same pattern as LLM providers — add class + register in _SEARCH_REGISTRY
+    logger.info(f"web_search called — query: '{query}' — search providers not yet active.")
+    return f"Search not yet implemented. Query was: {query}"
+# =============================================================================
+# SECTION 6 — Registry Helpers
+# Used by mcp.py for tool registration decisions.
+# =============================================================================
+def list_active_llm() -> list:
+    """
+    List all active LLM provider names.
+    Used by mcp.py to decide whether to register llm_complete tool.
+    Returns:
+        List of active LLM provider name strings.
+    """
+    return list(_registry.keys())
+def list_active_search() -> list:
+    """
+    List all active search provider names.
+    Used by mcp.py to decide whether to register web_search tool.
+    Returns empty list until search providers are implemented.
+    Returns:
+        List of active search provider name strings.
+    """
+    # TODO: return list(_search_registry.keys()) when search providers are ready
+    return []
 def get(name: str) -> BaseProvider:
+    """
+    Get a specific provider instance by name.
+    Args:
+        name: Provider name (e.g. 'anthropic', 'huggingface').
+    Returns:
+        Provider instance, or None if not registered.
+    """
     return _registry.get(name)
+# =============================================================================
+# Direct execution guard
+# =============================================================================
+if __name__ == "__main__":
+    print("WARNING: Run via main.py → app.py, not directly.")