MrSimple07 commited on
Commit
95bcac7
·
1 Parent(s): 35eb459

top k = 100 + topk rerank = 30 + max chunk size is 1024 + max rows =5 + sim cut off = 0.25

Browse files
Files changed (3) hide show
  1. config.py +2 -1
  2. index_retriever.py +3 -3
  3. utils.py +1 -1
config.py CHANGED
@@ -52,11 +52,12 @@ DEFAULT_MODEL = "Gemini 2.5 Flash"
52
  CHUNK_SIZE = 1500
53
  CHUNK_OVERLAP = 128
54
 
55
- MAX_CHARS_TABLE = 4000
56
  MAX_ROWS_TABLE = 5
57
 
58
  CUSTOM_PROMPT = """
59
  Вы являетесь высокоспециализированным Ассистентом для анализа нормативных документов (AIEXP). Ваша цель - предоставлять точные, корректные и контекстно релевантные ответы исключительно на основе предоставленного контекста из нормативной документации.
 
60
 
61
  ПРАВИЛА АНАЛИЗА ЗАПРОСА:
62
 
 
52
  CHUNK_SIZE = 1500
53
  CHUNK_OVERLAP = 128
54
 
55
+ MAX_CHARS_TABLE = 1024
56
  MAX_ROWS_TABLE = 5
57
 
58
  CUSTOM_PROMPT = """
59
  Вы являетесь высокоспециализированным Ассистентом для анализа нормативных документов (AIEXP). Ваша цель - предоставлять точные, корректные и контекстно релевантные ответы исключительно на основе предоставленного контекста из нормативной документации.
60
+ СТРОГО ОТВЕТИТЬ ТОЛЬКО НА РУССКОМ!
61
 
62
  ПРАВИЛА АНАЛИЗА ЗАПРОСА:
63
 
index_retriever.py CHANGED
@@ -46,13 +46,13 @@ def create_query_engine(vector_index):
46
 
47
  bm25_retriever = BM25Retriever.from_defaults(
48
  docstore=vector_index.docstore,
49
- similarity_top_k=150
50
  )
51
 
52
  vector_retriever = VectorIndexRetriever(
53
  index=vector_index,
54
- similarity_top_k=150,
55
- similarity_cutoff=0.45
56
  )
57
 
58
  hybrid_retriever = QueryFusionRetriever(
 
46
 
47
  bm25_retriever = BM25Retriever.from_defaults(
48
  docstore=vector_index.docstore,
49
+ similarity_top_k=100
50
  )
51
 
52
  vector_retriever = VectorIndexRetriever(
53
  index=vector_index,
54
+ similarity_top_k=100,
55
+ similarity_cutoff=0.25
56
  )
57
 
58
  hybrid_retriever = QueryFusionRetriever(
utils.py CHANGED
@@ -189,7 +189,7 @@ def answer_question(question, query_engine, reranker, current_model, chunks_df=N
189
  log_message(f"UNIQUE NODES: {len(unique_retrieved)} nodes")
190
 
191
  # Simple reranking
192
- reranked_nodes = rerank_nodes(question, unique_retrieved, reranker, top_k=20)
193
 
194
  # Direct query without formatting
195
  response = query_engine.query(question)
 
189
  log_message(f"UNIQUE NODES: {len(unique_retrieved)} nodes")
190
 
191
  # Simple reranking
192
+ reranked_nodes = rerank_nodes(question, unique_retrieved, reranker, top_k=30)
193
 
194
  # Direct query without formatting
195
  response = query_engine.query(question)