Spaces:

Asish22
/

code-crawler

Running

Asish Karthikeya Gogineni commited on Jan 30

Commit

5d60881

1 Parent(s): 27fbe66

fix: Robust 429 handling in Linear RAG

- Added automatic rate limit handling to standard chat
- Swaps to next Gemini model (e.g. 2.5-flash -> 1.5-flash) on RESOURCE_EXHAUSTED
- Prevents user-facing errors when free tier quota is hit

Files changed (1) hide show

code_chatbot/rag.py +7 -0

code_chatbot/rag.py CHANGED Viewed

@@ -374,6 +374,13 @@ class ChatEngine:
             response_msg = self.llm.invoke(messages)
             answer = response_msg.content
         except Exception as e:
             logger.error(f"Error in linear chat invoke: {e}")
             return f"Error consuming LLM: {e}", []

             response_msg = self.llm.invoke(messages)
             answer = response_msg.content
         except Exception as e:
+            # Check for Rate Limit in Linear Chat
+            error_str = str(e)
+            if any(err in error_str for err in ["429", "RESOURCE_EXHAUSTED", "quota"]):
+                 if self.provider == "gemini" and self._try_next_gemini_model():
+                     logger.info(f"Linear RAG: Switched to {self.model_name} due to rate limit, retrying...")
+                     return self._linear_chat(question) # Retry with new model
             logger.error(f"Error in linear chat invoke: {e}")
             return f"Error consuming LLM: {e}", []