Spaces:

CosmicMagnetar
/

OpenTriage_AI

Running

App Files Files Community

KrishnaCosmic commited on Jan 16

Commit

8ff58c6

1 Parent(s): 07355a1

Fix: RAG auto-fetches README, remove unused chat_history

Browse files

Files changed (3) hide show

main.py +2 -1
models/__init__.py +2 -3
services/rag_chatbot_service.py +42 -2

main.py CHANGED Viewed

@@ -232,7 +232,8 @@ async def rag_chat(request: RAGChatRequest):
         result = await rag_chatbot_service.answer_question(
             question=request.question,
             repo_name=request.repo_name,
-            top_k=request.top_k
         )
         return result
     except Exception as e:

         result = await rag_chatbot_service.answer_question(
             question=request.question,
             repo_name=request.repo_name,
+            top_k=request.top_k,
+            github_access_token=request.github_access_token
         )
         return result
     except Exception as e:

models/__init__.py CHANGED Viewed

@@ -2,7 +2,7 @@ from .user import User, UserRole
 from .repository import Repository
 from .issue import Issue
 from .triage import IssueTriageData, Template, Classification, Sentiment
-from .chat import ChatHistory
 __all__ = [
     'User',
@@ -12,6 +12,5 @@ __all__ = [
     'IssueTriageData',
     'Template',
     'Classification',
-    'Sentiment',
-    'ChatHistory'
 ]

 from .repository import Repository
 from .issue import Issue
 from .triage import IssueTriageData, Template, Classification, Sentiment
+# ChatHistory removed - not used (AI chat uses ephemeral history)
 __all__ = [
     'User',
     'IssueTriageData',
     'Template',
     'Classification',
+    'Sentiment'
 ]

services/rag_chatbot_service.py CHANGED Viewed

@@ -42,7 +42,8 @@ class RAGChatbotService:
         self,
         question: str,
         repo_name: Optional[str] = None,
-        top_k: int = 5
     ) -> RAGAnswer:
         """
         Answer a question using RAG.
@@ -51,16 +52,55 @@ class RAGChatbotService:
             question: The question to answer
             repo_name: Optional repo context
             top_k: Number of documents to retrieve
         Returns:
             RAGAnswer with the response and sources
         """
-        # Search for relevant documents
         relevant_docs = await self.search_documents(question, repo_name, top_k)
         # Build context from documents
         context = self._build_context(relevant_docs)
         # Generate answer using AI
         answer, confidence = await self._generate_answer(question, context, repo_name)

         self,
         question: str,
         repo_name: Optional[str] = None,
+        top_k: int = 5,
+        github_access_token: Optional[str] = None
     ) -> RAGAnswer:
         """
         Answer a question using RAG.
             question: The question to answer
             repo_name: Optional repo context
             top_k: Number of documents to retrieve
+            github_access_token: Optional GitHub token for README fetching
         Returns:
             RAGAnswer with the response and sources
         """
+        from config.database import db
+        # Check if we have any indexed content for this repo
+        has_indexed_content = False
+        readme_content = None
+        if repo_name:
+            # Check for existing RAG chunks
+            existing_chunks = await db.rag_chunks.count_documents({"sourceRepo": repo_name})
+            has_indexed_content = existing_chunks > 0
+            # If no indexed content, try to fetch README directly from GitHub
+            if not has_indexed_content:
+                logger.info(f"No indexed content for {repo_name}, fetching README directly...")
+                try:
+                    from services.github_service import github_service
+                    readme_content = await github_service.fetch_repository_readme(
+                        repo_name,
+                        github_access_token
+                    )
+                    if readme_content:
+                        logger.info(f"Fetched README for {repo_name} ({len(readme_content)} chars)")
+                except Exception as e:
+                    logger.warning(f"Could not fetch README for {repo_name}: {e}")
+        # Search for relevant documents (from indexed chunks)
         relevant_docs = await self.search_documents(question, repo_name, top_k)
         # Build context from documents
         context = self._build_context(relevant_docs)
+        # If we have a fresh README but no indexed content, prepend it to context
+        if readme_content and not has_indexed_content:
+            # Truncate README if too long (keep first 4000 chars)
+            truncated_readme = readme_content[:4000] if len(readme_content) > 4000 else readme_content
+            context = f"[PROJECT README]\n{truncated_readme}\n\n---\n\n{context}"
+            # Add README to sources
+            relevant_docs.insert(0, {
+                "id": f"{repo_name}_readme_live",
+                "title": "Project README (Live)",
+                "type": "readme",
+                "relevance": 1.0
+            })
         # Generate answer using AI
         answer, confidence = await self._generate_answer(question, context, repo_name)