Spaces:

mmoise00
/

askchosmky

Runtime error

App Files Files Community

mmoise00 commited on Mar 31

Commit

fe55c4e

1 Parent(s): f6d0241

lazy-load RAG deps and pin frontend versions

Browse files

Files changed (3) hide show

backend/api.py +1 -2
frontend/package.json +8 -8
main.py +51 -17

backend/api.py CHANGED Viewed

@@ -34,7 +34,6 @@ from pydantic import BaseModel
 from main import (
     CITATION_SYSTEM_PROMPT,
     DEFAULT_WORKING_DIR,
-    QueryParam,
     initialize_rag,
     llm_model_func,
     query_rag,
@@ -343,7 +342,7 @@ def _looks_like_no_answer(answer: str) -> bool:
 def _dynamic_query_param(
     mode: str, original: str, rewritten: str, retry_level: int
-) -> QueryParam:
     base_top_k = int(os.getenv("TOP_K", "40"))
     base_chunk_top_k = int(os.getenv("CHUNK_TOP_K", "20"))
     text = f"{original} {rewritten}".lower()

 from main import (
     CITATION_SYSTEM_PROMPT,
     DEFAULT_WORKING_DIR,
     initialize_rag,
     llm_model_func,
     query_rag,
 def _dynamic_query_param(
     mode: str, original: str, rewritten: str, retry_level: int
+) -> "QueryParam":
     base_top_k = int(os.getenv("TOP_K", "40"))
     base_chunk_top_k = int(os.getenv("CHUNK_TOP_K", "20"))
     text = f"{original} {rewritten}".lower()

frontend/package.json CHANGED Viewed

@@ -8,18 +8,18 @@
     "start": "next start"
   },
   "dependencies": {
-    "@xyflow/react": "^12.10.2",
     "next": "16.2.1",
     "react": "19.2.4",
     "react-dom": "19.2.4",
-    "react-markdown": "^10.1.0"
   },
   "devDependencies": {
-    "@tailwindcss/postcss": "^4",
-    "@types/node": "^20",
-    "@types/react": "^19",
-    "@types/react-dom": "^19",
-    "tailwindcss": "^4",
-    "typescript": "^5"
   }
 }

     "start": "next start"
   },
   "dependencies": {
+    "@xyflow/react": "12.10.2",
     "next": "16.2.1",
     "react": "19.2.4",
     "react-dom": "19.2.4",
+    "react-markdown": "10.1.0"
   },
   "devDependencies": {
+    "@tailwindcss/postcss": "4.0.0",
+    "@types/node": "20.0.0",
+    "@types/react": "19.0.0",
+    "@types/react-dom": "19.0.0",
+    "tailwindcss": "4.0.0",
+    "typescript": "5.0.0"
   }
 }

main.py CHANGED Viewed

@@ -6,7 +6,7 @@ import os
 import re
 import sys
 from functools import lru_cache
-from typing import Any
 def ensure_project_venv() -> None:
@@ -30,7 +30,12 @@ ensure_project_venv()
 import numpy as np
 from datasets import load_dataset
 from dotenv import load_dotenv
-from sentence_transformers import SentenceTransformer
 load_dotenv()
@@ -61,11 +66,15 @@ def configure_logging() -> None:
 configure_logging()
-from lightrag import LightRAG, QueryParam
-from lightrag.llm.openai import openai_complete_if_cache
-from lightrag.utils import EmbeddingFunc
-# LightRAG configures its own logger during import, so apply our level again.
 configure_logging()
@@ -142,7 +151,11 @@ def configure_langfuse() -> bool:
 @lru_cache(maxsize=1)
-def get_embedder() -> SentenceTransformer:
     return SentenceTransformer(EMBED_MODEL)
@@ -166,6 +179,9 @@ async def llm_model_func(
     keyword_extraction=False,
     **kwargs,
 ) -> str:
     api_key = os.getenv("openrouter_key")
     if not api_key:
         raise ValueError("Missing openrouter_key in .env")
@@ -186,7 +202,12 @@ async def llm_model_func(
     )
-async def initialize_rag(working_dir: str = DEFAULT_WORKING_DIR) -> LightRAG:
     os.makedirs(working_dir, exist_ok=True)
     rag = LightRAG(
@@ -222,7 +243,9 @@ def load_corpus_texts(limit: int) -> list[str]:
     return texts
-async def ingest_corpus(doc_limit: int = 200, working_dir: str = DEFAULT_WORKING_DIR) -> int:
     rag = None
     try:
         rag = await initialize_rag(working_dir)
@@ -342,7 +365,7 @@ async def query_rag(
         rewritten_question: str,
         *,
         retry_level: int = 0,
-    ) -> QueryParam:
         base_top_k = int(os.getenv("TOP_K", "40"))
         base_chunk_top_k = int(os.getenv("CHUNK_TOP_K", "20"))
@@ -425,7 +448,9 @@ async def query_rag(
             if verdict in {"supported", ""} or not isinstance(unsupported_claims, list):
                 return ""
-            cleaned_claims = [str(c).strip() for c in unsupported_claims if str(c).strip()][:5]
             if not cleaned_claims:
                 return ""
@@ -464,7 +489,9 @@ async def query_rag(
                 break
         if selected_result is None:
-            return "I do not have enough information to answer from the retrieved corpus."
         answer_text = _extract_llm_text(selected_result)
         references = _extract_references(selected_result)
@@ -481,7 +508,9 @@ async def query_rag(
 def parse_args() -> argparse.Namespace:
     parser = argparse.ArgumentParser(description="LightRAG over the Chomsky corpus")
-    parser.add_argument("--ingest", action="store_true", help="Index dataset into LightRAG")
     parser.add_argument("--query", type=str, help="Question to ask")
     parser.add_argument(
         "--mode",
@@ -490,7 +519,9 @@ def parse_args() -> argparse.Namespace:
         choices=["naive", "local", "global", "hybrid", "mix"],
         help="LightRAG query mode",
     )
-    parser.add_argument("--doc-limit", type=int, default=200, help="How many docs to index")
     parser.add_argument(
         "--working-dir",
         type=str,
@@ -502,11 +533,15 @@ def parse_args() -> argparse.Namespace:
 async def run_cli(args: argparse.Namespace) -> None:
     if args.ingest:
-        count = await ingest_corpus(doc_limit=args.doc_limit, working_dir=args.working_dir)
         print(f"Indexed {count} documents into LightRAG store: {args.working_dir}")
     if args.query:
-        answer = await query_rag(args.query, mode=args.mode, working_dir=args.working_dir)
         print(f"\nQ: {args.query}")
         print(f"\nA: {answer}")
@@ -516,4 +551,3 @@ async def run_cli(args: argparse.Namespace) -> None:
 if __name__ == "__main__":
     asyncio.run(run_cli(parse_args()))

 import re
 import sys
 from functools import lru_cache
+from typing import Any, TYPE_CHECKING
 def ensure_project_venv() -> None:
 import numpy as np
 from datasets import load_dataset
 from dotenv import load_dotenv
+if TYPE_CHECKING:
+    # Imported only for type checking; the actual import of
+    # SentenceTransformer happens lazily inside get_embedder to
+    # keep module import (and thus API startup) lightweight.
+    from sentence_transformers import SentenceTransformer
 load_dotenv()
 configure_logging()
+if TYPE_CHECKING:
+    # These imports are heavy (transitively pull in torch, CUDA, etc.).
+    # Import them only for type checking; at runtime we import lazily.
+    from lightrag import LightRAG, QueryParam
+    from lightrag.llm.openai import openai_complete_if_cache
+    from lightrag.utils import EmbeddingFunc
+# LightRAG configures its own logger during import, so apply our level again
+# once we actually import it lazily at runtime (see initialize_rag).
 configure_logging()
 @lru_cache(maxsize=1)
+def get_embedder() -> "SentenceTransformer":
+    # Lazy import avoids loading heavy ML stacks during module import,
+    # which helps services like Render bind the HTTP port quickly.
+    from sentence_transformers import SentenceTransformer
     return SentenceTransformer(EMBED_MODEL)
     keyword_extraction=False,
     **kwargs,
 ) -> str:
+    # Import here to avoid pulling in heavy dependencies during module import.
+    from lightrag.llm.openai import openai_complete_if_cache
     api_key = os.getenv("openrouter_key")
     if not api_key:
         raise ValueError("Missing openrouter_key in .env")
     )
+async def initialize_rag(working_dir: str = DEFAULT_WORKING_DIR) -> "LightRAG":
+    # Lazy imports keep startup fast and avoid loading the full
+    # LightRAG/torch stack until we actually need RAG functionality.
+    from lightrag import LightRAG
+    from lightrag.utils import EmbeddingFunc
     os.makedirs(working_dir, exist_ok=True)
     rag = LightRAG(
     return texts
+async def ingest_corpus(
+    doc_limit: int = 200, working_dir: str = DEFAULT_WORKING_DIR
+) -> int:
     rag = None
     try:
         rag = await initialize_rag(working_dir)
         rewritten_question: str,
         *,
         retry_level: int = 0,
+    ) -> "QueryParam":
         base_top_k = int(os.getenv("TOP_K", "40"))
         base_chunk_top_k = int(os.getenv("CHUNK_TOP_K", "20"))
             if verdict in {"supported", ""} or not isinstance(unsupported_claims, list):
                 return ""
+            cleaned_claims = [
+                str(c).strip() for c in unsupported_claims if str(c).strip()
+            ][:5]
             if not cleaned_claims:
                 return ""
                 break
         if selected_result is None:
+            return (
+                "I do not have enough information to answer from the retrieved corpus."
+            )
         answer_text = _extract_llm_text(selected_result)
         references = _extract_references(selected_result)
 def parse_args() -> argparse.Namespace:
     parser = argparse.ArgumentParser(description="LightRAG over the Chomsky corpus")
+    parser.add_argument(
+        "--ingest", action="store_true", help="Index dataset into LightRAG"
+    )
     parser.add_argument("--query", type=str, help="Question to ask")
     parser.add_argument(
         "--mode",
         choices=["naive", "local", "global", "hybrid", "mix"],
         help="LightRAG query mode",
     )
+    parser.add_argument(
+        "--doc-limit", type=int, default=200, help="How many docs to index"
+    )
     parser.add_argument(
         "--working-dir",
         type=str,
 async def run_cli(args: argparse.Namespace) -> None:
     if args.ingest:
+        count = await ingest_corpus(
+            doc_limit=args.doc_limit, working_dir=args.working_dir
+        )
         print(f"Indexed {count} documents into LightRAG store: {args.working_dir}")
     if args.query:
+        answer = await query_rag(
+            args.query, mode=args.mode, working_dir=args.working_dir
+        )
         print(f"\nQ: {args.query}")
         print(f"\nA: {answer}")
 if __name__ == "__main__":
     asyncio.run(run_cli(parse_args()))