Spaces:

MrSimple01
/

RAG_AIEXP_01

Sleeping

App Files Files Community

MrSimple07 commited on Sep 12, 2025

Commit

a7e15db

1 Parent(s): 0486693

fixed add_to_history error

Browse files

Files changed (3) hide show

app.py +16 -54
chat_handler.py +1 -1
index_retriever.py +177 -179

app.py CHANGED Viewed

@@ -2,9 +2,9 @@ import gradio as gr
 import os
 import sys
 import logging
-from config import *
 from documents_prep import DocumentsPreparation
-import index_retriever
 from chat_handler import ChatHandler
 REPO_ID = "MrSimple01/AIEXP_RAG_FILES"
@@ -14,6 +14,7 @@ logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(
 logger = logging.getLogger(__name__)
 doc_prep = None
 chat_handler = None
 def log_message(message):
@@ -22,12 +23,13 @@ def log_message(message):
     sys.stdout.flush()
 def initialize_system():
-    global doc_prep, chat_handler
     try:
         log_message("Запуск инициализации системы AIEXP")
         doc_prep = DocumentsPreparation(REPO_ID, HF_TOKEN)
         log_message("Подготовка документов")
         all_documents = doc_prep.prepare_all_documents()
@@ -41,7 +43,7 @@ def initialize_system():
             log_message("Не удалось инициализировать модели")
             return False
-        chat_handler = ChatHandler(None)
         log_message("Система успешно инициализирована")
         return True
@@ -53,57 +55,17 @@ def initialize_system():
 def handle_question(question):
     if chat_handler is None:
         return "Система не инициализирована", ""
-    try:
-        answer = index_retriever.query(question)
-        sources = get_sources_for_question(question)
-        # chat_handler.add_to_history(question, answer)
-        return answer, sources
-    except Exception as e:
-        error_msg = f"Ошибка обработки вопроса: {str(e)}"
-        log_message(error_msg)
-        return error_msg, ""
-def get_sources_for_question(question):
-    try:
-        nodes = index_retriever.retrieve_nodes(question)
-        if not nodes:
-            return "<div style='background-color: #2d3748; color: white; padding: 20px; border-radius: 10px; text-align: center;'>Источники не найдены</div>"
-        sources_html = "<div style='background-color: #2d3748; color: white; padding: 15px; border-radius: 10px;'>"
-        sources_html += "<h3 style='color: #4fd1c7; margin-top: 0;'>📚 Источники:</h3>"
-        for i, node in enumerate(nodes[:5], 1):
-            source_text = node.text[:200] + "..." if len(node.text) > 200 else node.text
-            sources_html += f"<div style='margin: 10px 0; padding: 10px; background-color: #4a5568; border-radius: 5px;'>"
-            sources_html += f"<strong>Источник {i}:</strong><br>"
-            sources_html += f"<small>{source_text}</small>"
-            sources_html += "</div>"
-        sources_html += "</div>"
-        return sources_html
-    except Exception as e:
-        log_message(f"Ошибка получения источников: {str(e)}")
-        return "<div style='background-color: #2d3748; color: white; padding: 20px; border-radius: 10px; text-align: center;'>Ошибка загрузки источников</div>"
 def handle_model_switch(model_name):
-    try:
-        return index_retriever.switch_model(model_name)
-    except Exception as e:
-        error_msg = f"Ошибка переключения модели: {str(e)}"
-        log_message(error_msg)
-        return f"❌ {error_msg}"
 def get_current_model_status():
-    try:
-        if not index_retriever.is_initialized():
-            return "Система не инициализирована"
-        return f"Текущая модель: {index_retriever.get_current_model()}"
-    except Exception as e:
-        return "Ошибка получения статуса модели"
 def get_chat_history_html():
     if chat_handler is None:
@@ -130,8 +92,8 @@ def create_demo_interface():
             with gr.Row():
                 with gr.Column(scale=2):
                     model_dropdown = gr.Dropdown(
-                        choices=list(AVAILABLE_MODELS.keys()),
-                        value=DEFAULT_MODEL,
                         label="🤖 Выберите языковую модель",
                         info="Выберите модель для генерации ответов"
                     )
@@ -167,7 +129,7 @@ def create_demo_interface():
                 with gr.Column(scale=2):
                     answer_output = gr.HTML(
                         label="",
-                        value=f"<div style='background-color: #2d3748; color: white; padding: 20px; border-radius: 10px; text-align: center;'>Здесь появится ответ на ваш вопрос...<br><small>Текущая модель: {DEFAULT_MODEL}</small></div>",
                     )
                 with gr.Column(scale=1):

 import os
 import sys
 import logging
+import config
 from documents_prep import DocumentsPreparation
+from index_retriever import IndexRetriever
 from chat_handler import ChatHandler
 REPO_ID = "MrSimple01/AIEXP_RAG_FILES"
 logger = logging.getLogger(__name__)
 doc_prep = None
+index_retriever = None
 chat_handler = None
 def log_message(message):
     sys.stdout.flush()
 def initialize_system():
+    global doc_prep, index_retriever, chat_handler
     try:
         log_message("Запуск инициализации системы AIEXP")
         doc_prep = DocumentsPreparation(REPO_ID, HF_TOKEN)
+        index_retriever = IndexRetriever(config=config)
         log_message("Подготовка документов")
         all_documents = doc_prep.prepare_all_documents()
             log_message("Не удалось инициализировать модели")
             return False
+        chat_handler = ChatHandler(index_retriever)
         log_message("Система успешно инициализирована")
         return True
 def handle_question(question):
     if chat_handler is None:
         return "Система не инициализирована", ""
+    return chat_handler.answer_question(question)
 def handle_model_switch(model_name):
+    if index_retriever is None:
+        return "Система не инициализирована"
+    return index_retriever.switch_model(model_name)
 def get_current_model_status():
+    if index_retriever is None:
+        return "Система не инициализирована"
+    return f"Текущая модель: {index_retriever.get_current_model()}"
 def get_chat_history_html():
     if chat_handler is None:
             with gr.Row():
                 with gr.Column(scale=2):
                     model_dropdown = gr.Dropdown(
+                        choices=list(config.AVAILABLE_MODELS.keys()),
+                        value=config.DEFAULT_MODEL,
                         label="🤖 Выберите языковую модель",
                         info="Выберите модель для генерации ответов"
                     )
                 with gr.Column(scale=2):
                     answer_output = gr.HTML(
                         label="",
+                        value=f"<div style='background-color: #2d3748; color: white; padding: 20px; border-radius: 10px; text-align: center;'>Здесь появится ответ на ваш вопрос...<br><small>Текущая модель: {config.DEFAULT_MODEL}</small></div>",
                     )
                 with gr.Column(scale=1):

chat_handler.py CHANGED Viewed

@@ -147,7 +147,7 @@ class ChatHandler:
             html += f"<div style='margin-bottom: 10px; font-size: 14px;'>{entry['question']}</div>"
             html += f"<div style='color: #63b3ed; font-weight: bold; margin-bottom: 8px;'>Ответ ({entry['model']}):</div>"
             html += f"<div style='margin-bottom: 10px; font-size: 14px; line-height: 1.4;'>{entry['answer'][:300]}{'...' if len(entry['answer']) > 300 else ''}</div>"
-            html += f"<div style='color: #a0aec0; font-size: 12px;'>Время: {entry['processing_time']:.2f}с | Источников: {entry['nodes_count']}</div>"
             html += "</div>"
         html += "</div>"

             html += f"<div style='margin-bottom: 10px; font-size: 14px;'>{entry['question']}</div>"
             html += f"<div style='color: #63b3ed; font-weight: bold; margin-bottom: 8px;'>Ответ ({entry['model']}):</div>"
             html += f"<div style='margin-bottom: 10px; font-size: 14px; line-height: 1.4;'>{entry['answer'][:300]}{'...' if len(entry['answer']) > 300 else ''}</div>"
+            html += f"<div style='color: #a0aec0; font-size: 12px;'>Время: {entry['processing_time']:.2f}с</div>"
             html += "</div>"
         html += "</div>"

index_retriever.py CHANGED Viewed

@@ -14,196 +14,194 @@ from config import *
 logger = logging.getLogger(__name__)
-vector_index = None
-query_engine = None
-reranker = None
-current_model = DEFAULT_MODEL
 def log_message(message):
     logger.info(message)
     print(message, flush=True)
-def get_llm_model(model_name):
-    try:
-        model_config = AVAILABLE_MODELS.get(model_name)
-        if not model_config:
-            log_message(f"Модель {model_name} не найдена, использую модель по умолчанию")
-            model_config = AVAILABLE_MODELS[DEFAULT_MODEL]
-        if not model_config.get("api_key"):
-            raise Exception(f"API ключ не найден для модели {model_name}")
-        if model_config["provider"] == "google":
-            return GoogleGenAI(
-                model=model_config["model_name"],
-                api_key=model_config["api_key"]
-            )
-        elif model_config["provider"] == "openai":
-            return OpenAI(
-                model=model_config["model_name"],
-                api_key=model_config["api_key"]
-            )
-        else:
-            raise Exception(f"Неподдерживаемый провайдер: {model_config['provider']}")
-    except Exception as e:
-        log_message(f"Ошибка создания модели {model_name}: {str(e)}")
-        return GoogleGenAI(model="gemini-2.0-flash", api_key=GOOGLE_API_KEY)
-def initialize_models(documents):
-    global vector_index, query_engine, reranker, current_model
-    try:
-        log_message("Инициализация моделей и индекса")
-        embed_model = HuggingFaceEmbedding(model_name="sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2")
-        llm = get_llm_model(current_model)
-        log_message("Инициализирую переранкер")
-        reranker = CrossEncoder('cross-encoder/ms-marco-MiniLM-L-12-v2')
-        Settings.embed_model = embed_model
-        Settings.llm = llm
-        log_message(f"Строю векторный индекс из {len(documents)} документов")
-        vector_index = VectorStoreIndex.from_documents(documents)
-        create_query_engine()
-        log_message(f"Модели и индекс успешно инициализированы с моделью: {current_model}")
-        return True
-    except Exception as e:
-        log_message(f"Ошибка инициализации моделей: {str(e)}")
-        return False
-def create_query_engine():
-    global query_engine
-    try:
-        log_message(f"Применяется промпт: {PROMPT_SIMPLE_POISK[:100]}...")
-        bm25_retriever = BM25Retriever.from_defaults(
-            docstore=vector_index.docstore,
-            similarity_top_k=15
-        )
-        vector_retriever = VectorIndexRetriever(
-            index=vector_index,
-            similarity_top_k=20,
-            similarity_cutoff=0.5
-        )
-        hybrid_retriever = QueryFusionRetriever(
-            [vector_retriever, bm25_retriever],
-            similarity_top_k=30,
-            num_queries=1
-        )
-        custom_prompt_template = PromptTemplate(PROMPT_SIMPLE_POISK)
-        response_synthesizer = get_response_synthesizer(
-            response_mode=ResponseMode.TREE_SUMMARIZE,
-            text_qa_template=custom_prompt_template
-        )
-        query_engine = RetrieverQueryEngine(
-            retriever=hybrid_retriever,
-            response_synthesizer=response_synthesizer
-        )
-        log_message("Query engine успешно создан с кастомным промптом")
-    except Exception as e:
-        log_message(f"Ошибка создания query engine: {str(e)}")
-        raise
-def query(question):
-    if query_engine is None:
-        log_message("❌ Query engine не инициализирован")
-        return "❌ Система не инициализирована"
-    try:
-        log_message(f"Получен вопрос: {question}")
-        log_message(f"Используется модель: {current_model}")
-        log_message(f"Применяется промпт: {PROMPT_SIMPLE_POISK[:150]}...")
-        log_message(f"Обрабатываю запрос: {question}")
-        response = query_engine.query(question)
-        log_message(f"Ответ получен, длина: {len(str(response))}")
-        return str(response)
-    except Exception as e:
-        error_msg = f"Ошибка обработки запроса: {str(e)}"
-        log_message(error_msg)
-        return f"❌ {error_msg}"
-def switch_model(model_name):
-    global current_model
-    try:
-        log_message(f"Переключение на модель: {model_name}")
-        new_llm = get_llm_model(model_name)
-        Settings.llm = new_llm
-        if vector_index is not None:
-            create_query_engine()
-            current_model = model_name
-            log_message(f"Модель успешно переключена на: {model_name}")
-            return f"✅ Модель переключена на: {model_name}"
-        else:
-            return "❌ Ошибка: система не инициализирована"
-    except Exception as e:
-        error_msg = f"Ошибка переключения модели: {str(e)}"
-        log_message(error_msg)
-        return f"❌ {error_msg}"
-def rerank_nodes(query_text, nodes, top_k=10):
-    if not nodes or not reranker:
-        return nodes[:top_k]
-    try:
-        log_message(f"Переранжирую {len(nodes)} узлов")
-        pairs = []
-        for node in nodes:
-            pairs.append([query_text, node.text])
-        scores = reranker.predict(pairs)
-        scored_nodes = list(zip(nodes, scores))
-        scored_nodes.sort(key=lambda x: x[1], reverse=True)
-        reranked_nodes = [node for node, score in scored_nodes[:top_k]]
-        log_message(f"Возвращаю топ-{len(reranked_nodes)} переранжированных узлов")
-        return reranked_nodes
-    except Exception as e:
-        log_message(f"Ошибка переранжировки: {str(e)}")
-        return nodes[:top_k]
-def retrieve_nodes(question):
-    if query_engine is None:
-        return []
-    try:
-        log_message(f"Извлекаю релевантные узлы для вопроса: {question}")
-        retrieved_nodes = query_engine.retriever.retrieve(question)
-        log_message(f"Извлечено {len(retrieved_nodes)} узлов")
-        log_message("Применяю переранжировку")
-        reranked_nodes = rerank_nodes(question, retrieved_nodes, top_k=10)
-        return reranked_nodes
-    except Exception as e:
-        log_message(f"Ошибка извлечения узлов: {str(e)}")
-        return []
-def get_current_model():
-    return current_model
-def is_initialized():
-    return query_engine is not None

 logger = logging.getLogger(__name__)
 def log_message(message):
     logger.info(message)
     print(message, flush=True)
+class IndexRetriever:
+    def __init__(self, config):
+        self.config = config
+        self.vector_index = None
+        self.query_engine = None
+        self.reranker = None
+        self.current_model = config.DEFAULT_MODEL
+    def get_llm_model(self, model_name):
+        try:
+            model_config = self.config.AVAILABLE_MODELS.get(model_name)
+            if not model_config:
+                log_message(f"Модель {model_name} не найдена, использую модель по умолчанию")
+                model_config = self.config.AVAILABLE_MODELS[self.config.DEFAULT_MODEL]
+            if not model_config.get("api_key"):
+                raise Exception(f"API ключ не найден для модели {model_name}")
+            if model_config["provider"] == "google":
+                return GoogleGenAI(
+                    model=model_config["model_name"],
+                    api_key=model_config["api_key"]
+                )
+            elif model_config["provider"] == "openai":
+                return OpenAI(
+                    model=model_config["model_name"],
+                    api_key=model_config["api_key"]
+                )
+            else:
+                raise Exception(f"Неподдерживаемый провайдер: {model_config['provider']}")
+        except Exception as e:
+            log_message(f"Ошибка создания модели {model_name}: {str(e)}")
+            return GoogleGenAI(model="gemini-2.0-flash", api_key=self.config.GOOGLE_API_KEY)
+    def initialize_models(self, documents):
+        try:
+            log_message("Инициализация моделей и индекса")
+            embed_model = HuggingFaceEmbedding(model_name="sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2")
+            llm = self.get_llm_model(self.current_model)
+            log_message("Инициализирую переранкер")
+            self.reranker = CrossEncoder('cross-encoder/ms-marco-MiniLM-L-12-v2')
+            Settings.embed_model = embed_model
+            Settings.llm = llm
+            log_message(f"Строю векторный индекс из {len(documents)} документов")
+            self.vector_index = VectorStoreIndex.from_documents(documents)
+            self.create_query_engine()
+            log_message(f"Модели и индекс успешно инициализированы с моделью: {self.current_model}")
+            return True
+        except Exception as e:
+            log_message(f"Ошибка инициализации моделей: {str(e)}")
+            return False
+    def create_query_engine(self):
+        try:
+            log_message(f"Применяется промпт: {self.config.PROMPT_SIMPLE_POISK[:100]}...")
+            bm25_retriever = BM25Retriever.from_defaults(
+                docstore=self.vector_index.docstore,
+                similarity_top_k=15
+            )
+            vector_retriever = VectorIndexRetriever(
+                index=self.vector_index,
+                similarity_top_k=20,
+                similarity_cutoff=0.5
+            )
+            hybrid_retriever = QueryFusionRetriever(
+                [vector_retriever, bm25_retriever],
+                similarity_top_k=30,
+                num_queries=1
+            )
+            custom_prompt_template = PromptTemplate(self.config.PROMPT_SIMPLE_POISK)
+            response_synthesizer = get_response_synthesizer(
+                response_mode=ResponseMode.TREE_SUMMARIZE,
+                text_qa_template=custom_prompt_template
+            )
+            self.query_engine = RetrieverQueryEngine(
+                retriever=hybrid_retriever,
+                response_synthesizer=response_synthesizer
+            )
+            log_message("Query engine успешно создан с кастомным промптом")
+        except Exception as e:
+            log_message(f"Ошибка создания query engine: {str(e)}")
+            raise
+    def query(self, question):
+        """Метод для выполнения запроса с применением промпта"""
+        if self.query_engine is None:
+            log_message("❌ Query engine не инициализирован")
+            return "❌ Система не инициализирована"
+        try:
+            log_message(f"Получен вопрос: {question}")
+            log_message(f"Используется модель: {self.current_model}")
+            log_message(f"Применяется промпт: {self.config.PROMPT_SIMPLE_POISK[:150]}...")
+            log_message(f"Обрабатываю запрос: {question}")
+            response = self.query_engine.query(question)
+            log_message(f"Ответ получен, длина: {len(str(response))}")
+            return str(response)
+        except Exception as e:
+            error_msg = f"Ошибка обработки запроса: {str(e)}"
+            log_message(error_msg)
+            return f"❌ {error_msg}"
+    def switch_model(self, model_name):
+        try:
+            log_message(f"Переключение на модель: {model_name}")
+            new_llm = self.get_llm_model(model_name)
+            Settings.llm = new_llm
+            if self.vector_index is not None:
+                self.create_query_engine()
+                self.current_model = model_name
+                log_message(f"Модель успешно переключена на: {model_name}")
+                return f"✅ Модель переключена на: {model_name}"
+            else:
+                return "❌ Ошибка: система не инициализирована"
+        except Exception as e:
+            error_msg = f"Ошибка переключения модели: {str(e)}"
+            log_message(error_msg)
+            return f"❌ {error_msg}"
+    def rerank_nodes(self, query, nodes, top_k=10):
+        if not nodes or not self.reranker:
+            return nodes[:top_k]
+        try:
+            log_message(f"Переранжирую {len(nodes)} узлов")
+            pairs = []
+            for node in nodes:
+                pairs.append([query, node.text])
+            scores = self.reranker.predict(pairs)
+            scored_nodes = list(zip(nodes, scores))
+            scored_nodes.sort(key=lambda x: x[1], reverse=True)
+            reranked_nodes = [node for node, score in scored_nodes[:top_k]]
+            log_message(f"Возвращаю топ-{len(reranked_nodes)} переранжированных узлов")
+            return reranked_nodes
+        except Exception as e:
+            log_message(f"Ошибка переранжировки: {str(e)}")
+            return nodes[:top_k]
+    def retrieve_nodes(self, question):
+        if self.query_engine is None:
+            return []
+        try:
+            log_message(f"Извлекаю релевантные узлы для вопроса: {question}")
+            retrieved_nodes = self.query_engine.retriever.retrieve(question)
+            log_message(f"Извлечено {len(retrieved_nodes)} узлов")
+            log_message("Применяю переранжировку")
+            reranked_nodes = self.rerank_nodes(question, retrieved_nodes, top_k=10)
+            return reranked_nodes
+        except Exception as e:
+            log_message(f"Ошибка извлечения узлов: {str(e)}")
+            return []
+    def get_current_model(self):
+        return self.current_model
+    def is_initialized(self):
+        return self.query_engine is not None