MrSimple07 commited on
Commit
46dedf9
·
1 Parent(s): 8e8dddf

top k 200, 150 + max chunk size = 10 000, max chunk row = 40

Browse files
Files changed (3) hide show
  1. config.py +1 -1
  2. index_retriever.py +1 -1
  3. utils.py +1 -1
config.py CHANGED
@@ -53,7 +53,7 @@ CHUNK_SIZE = 1500
53
  CHUNK_OVERLAP = 128
54
 
55
  MAX_CHARS_TABLE = 10000
56
- MAX_ROWS_TABLE = 20
57
 
58
  CUSTOM_PROMPT = """
59
  Вы являетесь высокоспециализированным Ассистентом для анализа нормативных документов (AIEXP). Ваша цель - предоставлять точные, корректные и контекстно релевантные ответы исключительно на основе предоставленного контекста из нормативной документации.
 
53
  CHUNK_OVERLAP = 128
54
 
55
  MAX_CHARS_TABLE = 10000
56
+ MAX_ROWS_TABLE = 40
57
 
58
  CUSTOM_PROMPT = """
59
  Вы являетесь высокоспециализированным Ассистентом для анализа нормативных документов (AIEXP). Ваша цель - предоставлять точные, корректные и контекстно релевантные ответы исключительно на основе предоставленного контекста из нормативной документации.
index_retriever.py CHANGED
@@ -51,7 +51,7 @@ def create_query_engine(vector_index):
51
 
52
  vector_retriever = VectorIndexRetriever(
53
  index=vector_index,
54
- similarity_top_k=150,
55
  similarity_cutoff=0.35
56
  )
57
 
 
51
 
52
  vector_retriever = VectorIndexRetriever(
53
  index=vector_index,
54
+ similarity_top_k=200,
55
  similarity_cutoff=0.35
56
  )
57
 
utils.py CHANGED
@@ -210,7 +210,7 @@ def answer_question(question, query_engine, reranker, current_model, chunks_df=N
210
  unique_retrieved = deduplicate_nodes(retrieved_nodes)
211
 
212
  # DEBUG: Log what was retrieved
213
- log_message(f"RETRIEVED: {len(unique_retrieved)} nodes")
214
  for i, node in enumerate(unique_retrieved): # All debug
215
  table_num = node.metadata.get('table_number', 'N/A')
216
  table_title = node.metadata.get('table_title', 'N/A')
 
210
  unique_retrieved = deduplicate_nodes(retrieved_nodes)
211
 
212
  # DEBUG: Log what was retrieved
213
+ log_message(f"RETRIEVED: unique {len(unique_retrieved)} nodes")
214
  for i, node in enumerate(unique_retrieved): # All debug
215
  table_num = node.metadata.get('table_number', 'N/A')
216
  table_title = node.metadata.get('table_title', 'N/A')