Spaces:

NavyDevilDoc
/

Semantic_Search

Sleeping

NavyDevilDoc commited on Dec 18, 2025

Commit

d27c2a1

verified ·

1 Parent(s): 34f2da9

Update src/llm_client.py

Files changed (1) hide show

src/llm_client.py CHANGED Viewed

@@ -14,7 +14,7 @@ def ask_granite(query, context):
     payload = {
         "text": f"USER QUESTION: {query}\n\nDOCUMENT CONTEXT:\n{context[:6000]}",
         "persona": "You are a question answering Subject Matter Expert. Answer strictly based on the provided context.",
-        "model": "granite4:latest", # Or gemma3:latest
         "max_tokens": 5000
     }
@@ -24,7 +24,7 @@ def ask_granite(query, context):
     }
     try:
-        response = requests.post(api_url, json=payload, headers=headers, timeout=120)
         if response.status_code == 200:
             return response.json().get("response", "Error: Empty response.")
         else:

     payload = {
         "text": f"USER QUESTION: {query}\n\nDOCUMENT CONTEXT:\n{context[:6000]}",
         "persona": "You are a question answering Subject Matter Expert. Answer strictly based on the provided context.",
+        "model": "gemma3:latest", # granite4:latest or gemma3:latest
         "max_tokens": 5000
     }
     }
     try:
+        response = requests.post(api_url, json=payload, headers=headers, timeout=600)
         if response.status_code == 200:
             return response.json().get("response", "Error: Empty response.")
         else: