Spaces:
Sleeping
Sleeping
Commit
·
46dedf9
1
Parent(s):
8e8dddf
top k 200, 150 + max chunk size = 10 000, max chunk row = 40
Browse files- config.py +1 -1
- index_retriever.py +1 -1
- utils.py +1 -1
config.py
CHANGED
|
@@ -53,7 +53,7 @@ CHUNK_SIZE = 1500
|
|
| 53 |
CHUNK_OVERLAP = 128
|
| 54 |
|
| 55 |
MAX_CHARS_TABLE = 10000
|
| 56 |
-
MAX_ROWS_TABLE =
|
| 57 |
|
| 58 |
CUSTOM_PROMPT = """
|
| 59 |
Вы являетесь высокоспециализированным Ассистентом для анализа нормативных документов (AIEXP). Ваша цель - предоставлять точные, корректные и контекстно релевантные ответы исключительно на основе предоставленного контекста из нормативной документации.
|
|
|
|
| 53 |
CHUNK_OVERLAP = 128
|
| 54 |
|
| 55 |
MAX_CHARS_TABLE = 10000
|
| 56 |
+
MAX_ROWS_TABLE = 40
|
| 57 |
|
| 58 |
CUSTOM_PROMPT = """
|
| 59 |
Вы являетесь высокоспециализированным Ассистентом для анализа нормативных документов (AIEXP). Ваша цель - предоставлять точные, корректные и контекстно релевантные ответы исключительно на основе предоставленного контекста из нормативной документации.
|
index_retriever.py
CHANGED
|
@@ -51,7 +51,7 @@ def create_query_engine(vector_index):
|
|
| 51 |
|
| 52 |
vector_retriever = VectorIndexRetriever(
|
| 53 |
index=vector_index,
|
| 54 |
-
similarity_top_k=
|
| 55 |
similarity_cutoff=0.35
|
| 56 |
)
|
| 57 |
|
|
|
|
| 51 |
|
| 52 |
vector_retriever = VectorIndexRetriever(
|
| 53 |
index=vector_index,
|
| 54 |
+
similarity_top_k=200,
|
| 55 |
similarity_cutoff=0.35
|
| 56 |
)
|
| 57 |
|
utils.py
CHANGED
|
@@ -210,7 +210,7 @@ def answer_question(question, query_engine, reranker, current_model, chunks_df=N
|
|
| 210 |
unique_retrieved = deduplicate_nodes(retrieved_nodes)
|
| 211 |
|
| 212 |
# DEBUG: Log what was retrieved
|
| 213 |
-
log_message(f"RETRIEVED: {len(unique_retrieved)} nodes")
|
| 214 |
for i, node in enumerate(unique_retrieved): # All debug
|
| 215 |
table_num = node.metadata.get('table_number', 'N/A')
|
| 216 |
table_title = node.metadata.get('table_title', 'N/A')
|
|
|
|
| 210 |
unique_retrieved = deduplicate_nodes(retrieved_nodes)
|
| 211 |
|
| 212 |
# DEBUG: Log what was retrieved
|
| 213 |
+
log_message(f"RETRIEVED: unique {len(unique_retrieved)} nodes")
|
| 214 |
for i, node in enumerate(unique_retrieved): # All debug
|
| 215 |
table_num = node.metadata.get('table_number', 'N/A')
|
| 216 |
table_title = node.metadata.get('table_title', 'N/A')
|