Spaces:

MrSimple01
/

RAG_AIEXP_01

Sleeping

MrSimple07 commited on Oct 8, 2025

Commit

03dd25b

1 Parent(s): 95bcac7

top k = 50 + topk rerank = 20 + max chunk size is 4000 + max rows =30 + sim cut off = 0.25

Files changed (3) hide show

config.py CHANGED Viewed

@@ -52,8 +52,8 @@ DEFAULT_MODEL = "Gemini 2.5 Flash"
 CHUNK_SIZE = 1500
 CHUNK_OVERLAP = 128
-MAX_CHARS_TABLE = 1024
-MAX_ROWS_TABLE = 5
 CUSTOM_PROMPT = """
 Вы являетесь высокоспециализированным Ассистентом для анализа нормативных документов (AIEXP). Ваша цель - предоставлять точные, корректные и контекстно релевантные ответы исключительно на основе предоставленного контекста из нормативной документации.

 CHUNK_SIZE = 1500
 CHUNK_OVERLAP = 128
+MAX_CHARS_TABLE = 4000
+MAX_ROWS_TABLE = 10
 CUSTOM_PROMPT = """
 Вы являетесь высокоспециализированным Ассистентом для анализа нормативных документов (AIEXP). Ваша цель - предоставлять точные, корректные и контекстно релевантные ответы исключительно на основе предоставленного контекста из нормативной документации.

index_retriever.py CHANGED Viewed

@@ -46,18 +46,18 @@ def create_query_engine(vector_index):
         bm25_retriever = BM25Retriever.from_defaults(
             docstore=vector_index.docstore,
-            similarity_top_k=100
         )
         vector_retriever = VectorIndexRetriever(
             index=vector_index,
-            similarity_top_k=100,
             similarity_cutoff=0.25
         )
         hybrid_retriever = QueryFusionRetriever(
             [vector_retriever, bm25_retriever],
-            similarity_top_k=150,
             num_queries=1
         )

         bm25_retriever = BM25Retriever.from_defaults(
             docstore=vector_index.docstore,
+            similarity_top_k=50
         )
         vector_retriever = VectorIndexRetriever(
             index=vector_index,
+            similarity_top_k=50,
             similarity_cutoff=0.25
         )
         hybrid_retriever = QueryFusionRetriever(
             [vector_retriever, bm25_retriever],
+            similarity_top_k=50,
             num_queries=1
         )

utils.py CHANGED Viewed

@@ -189,7 +189,7 @@ def answer_question(question, query_engine, reranker, current_model, chunks_df=N
         log_message(f"UNIQUE NODES: {len(unique_retrieved)} nodes")
         # Simple reranking
-        reranked_nodes = rerank_nodes(question, unique_retrieved, reranker, top_k=30)
         # Direct query without formatting
         response = query_engine.query(question)

         log_message(f"UNIQUE NODES: {len(unique_retrieved)} nodes")
         # Simple reranking
+        reranked_nodes = rerank_nodes(question, unique_retrieved, reranker, top_k=20)
         # Direct query without formatting
         response = query_engine.query(question)