MrSimple07 commited on
Commit
03dd25b
·
1 Parent(s): 95bcac7

top k = 50 + topk rerank = 20 + max chunk size is 4000 + max rows =30 + sim cut off = 0.25

Browse files
Files changed (3) hide show
  1. config.py +2 -2
  2. index_retriever.py +3 -3
  3. utils.py +1 -1
config.py CHANGED
@@ -52,8 +52,8 @@ DEFAULT_MODEL = "Gemini 2.5 Flash"
52
  CHUNK_SIZE = 1500
53
  CHUNK_OVERLAP = 128
54
 
55
- MAX_CHARS_TABLE = 1024
56
- MAX_ROWS_TABLE = 5
57
 
58
  CUSTOM_PROMPT = """
59
  Вы являетесь высокоспециализированным Ассистентом для анализа нормативных документов (AIEXP). Ваша цель - предоставлять точные, корректные и контекстно релевантные ответы исключительно на основе предоставленного контекста из нормативной документации.
 
52
  CHUNK_SIZE = 1500
53
  CHUNK_OVERLAP = 128
54
 
55
+ MAX_CHARS_TABLE = 4000
56
+ MAX_ROWS_TABLE = 10
57
 
58
  CUSTOM_PROMPT = """
59
  Вы являетесь высокоспециализированным Ассистентом для анализа нормативных документов (AIEXP). Ваша цель - предоставлять точные, корректные и контекстно релевантные ответы исключительно на основе предоставленного контекста из нормативной документации.
index_retriever.py CHANGED
@@ -46,18 +46,18 @@ def create_query_engine(vector_index):
46
 
47
  bm25_retriever = BM25Retriever.from_defaults(
48
  docstore=vector_index.docstore,
49
- similarity_top_k=100
50
  )
51
 
52
  vector_retriever = VectorIndexRetriever(
53
  index=vector_index,
54
- similarity_top_k=100,
55
  similarity_cutoff=0.25
56
  )
57
 
58
  hybrid_retriever = QueryFusionRetriever(
59
  [vector_retriever, bm25_retriever],
60
- similarity_top_k=150,
61
  num_queries=1
62
  )
63
 
 
46
 
47
  bm25_retriever = BM25Retriever.from_defaults(
48
  docstore=vector_index.docstore,
49
+ similarity_top_k=50
50
  )
51
 
52
  vector_retriever = VectorIndexRetriever(
53
  index=vector_index,
54
+ similarity_top_k=50,
55
  similarity_cutoff=0.25
56
  )
57
 
58
  hybrid_retriever = QueryFusionRetriever(
59
  [vector_retriever, bm25_retriever],
60
+ similarity_top_k=50,
61
  num_queries=1
62
  )
63
 
utils.py CHANGED
@@ -189,7 +189,7 @@ def answer_question(question, query_engine, reranker, current_model, chunks_df=N
189
  log_message(f"UNIQUE NODES: {len(unique_retrieved)} nodes")
190
 
191
  # Simple reranking
192
- reranked_nodes = rerank_nodes(question, unique_retrieved, reranker, top_k=30)
193
 
194
  # Direct query without formatting
195
  response = query_engine.query(question)
 
189
  log_message(f"UNIQUE NODES: {len(unique_retrieved)} nodes")
190
 
191
  # Simple reranking
192
+ reranked_nodes = rerank_nodes(question, unique_retrieved, reranker, top_k=20)
193
 
194
  # Direct query without formatting
195
  response = query_engine.query(question)