Spaces:

Madras1
/

Lancer

Sleeping

App Files Files Community

Madras1 commited on Jan 6

Commit

9d1dc1d

verified ·

1 Parent(s): f4e0ac2

Upload 35 files

Browse files

Files changed (1) hide show

app/agents/llm_client.py +17 -42

app/agents/llm_client.py CHANGED Viewed

@@ -4,7 +4,9 @@ Supports Groq and OpenRouter for LLM inference.
 """
 import httpx
 from typing import Optional
 from app.config import get_settings
@@ -15,18 +17,7 @@ async def generate_completion(
     temperature: float = 0.3,
     max_tokens: int = 2048,
 ) -> str:
-    """
-    Generate a completion using the configured LLM provider.
-    Args:
-        messages: List of message dicts with 'role' and 'content'
-        model: Model override (uses settings default if None)
-        temperature: Sampling temperature
-        max_tokens: Maximum tokens to generate
-    Returns:
-        Generated text content
-    """
     settings = get_settings()
     provider = settings.llm_provider
     model = model or settings.llm_model
@@ -77,13 +68,12 @@ async def _call_openrouter(
     temperature: float,
     max_tokens: int,
 ) -> str:
-    """Call OpenRouter API."""
     settings = get_settings()
     if not settings.openrouter_api_key:
         raise ValueError("OPENROUTER_API_KEY not configured")
-    # OpenRouter requires specific headers
     headers = {
         "Authorization": f"Bearer {settings.openrouter_api_key}",
         "Content-Type": "application/json",
@@ -91,37 +81,22 @@ async def _call_openrouter(
         "X-Title": "Lancer Search API",
     }
     payload = {
         "model": model,
         "messages": messages,
-        "temperature": temperature,
-        "max_tokens": max_tokens,
     }
-    print(f"[OpenRouter] Calling model: {model}")
-    print(f"[OpenRouter] URL: https://openrouter.ai/api/v1/chat/completions")
     async with httpx.AsyncClient(timeout=120.0) as client:
-        try:
-            response = await client.post(
-                "https://openrouter.ai/api/v1/chat/completions",
-                headers=headers,
-                json=payload,
-            )
-            print(f"[OpenRouter] Status: {response.status_code}")
-            if response.status_code != 200:
-                error_text = response.text
-                print(f"[OpenRouter] Error: {error_text}")
-                raise ValueError(f"OpenRouter error {response.status_code}: {error_text}")
-            data = response.json()
-            return data["choices"][0]["message"]["content"]
-        except httpx.HTTPStatusError as e:
-            print(f"[OpenRouter] HTTPStatusError: {e}")
-            raise
-        except Exception as e:
-            print(f"[OpenRouter] Exception: {e}")
-            raise

 """
 import httpx
+import json
 from typing import Optional
+import asyncio
 from app.config import get_settings
     temperature: float = 0.3,
     max_tokens: int = 2048,
 ) -> str:
+    """Generate a completion using the configured LLM provider."""
     settings = get_settings()
     provider = settings.llm_provider
     model = model or settings.llm_model
     temperature: float,
     max_tokens: int,
 ) -> str:
+    """Call OpenRouter API - following official docs exactly."""
     settings = get_settings()
     if not settings.openrouter_api_key:
         raise ValueError("OPENROUTER_API_KEY not configured")
     headers = {
         "Authorization": f"Bearer {settings.openrouter_api_key}",
         "Content-Type": "application/json",
         "X-Title": "Lancer Search API",
     }
+    # Payload exactly like official docs
     payload = {
         "model": model,
         "messages": messages,
     }
     async with httpx.AsyncClient(timeout=120.0) as client:
+        response = await client.post(
+            "https://openrouter.ai/api/v1/chat/completions",
+            headers=headers,
+            content=json.dumps(payload),  # Using content= with json.dumps like official docs
+        )
+        if response.status_code != 200:
+            error_text = response.text
+            raise ValueError(f"OpenRouter error {response.status_code}: {error_text}")
+        data = response.json()
+        return data["choices"][0]["message"]["content"]