Spaces:

LevinAleksey
/

managerChat

Sleeping

App Files Files Community

LevinAleksey commited on Jan 26

Commit

26f1d37

verified ·

1 Parent(s): 3a9dec5

Update app.py

Browse files

Files changed (1) hide show

app.py +68 -53

app.py CHANGED Viewed

@@ -4,99 +4,114 @@ from huggingface_hub import InferenceClient
 from qdrant_client import QdrantClient
 from sentence_transformers import SentenceTransformer
-# --- КОНФИГУРАЦИЯ ---
-st.set_page_config(page_title="AI Assistant RAG", page_icon="🤖", layout="centered")
-# Настройки API (Берем из секретов)
 HF_TOKEN = os.getenv("HF_TOKEN")
 QDRANT_URL = os.getenv("QDRANT_URL")
 QDRANT_API_KEY = os.getenv("QDRANT_API_KEY")
-# Модель для чата
-MODEL_ID = "Qwen/Qwen2.5-7B-Instruct"
-# --- ИНИЦИАЛИЗАЦИЯ ---
 @st.cache_resource
 def load_resources():
-    # 1. Клиент HF (Чат)
-    hf_client = InferenceClient(MODEL_ID, token=HF_TOKEN)
-    # 2. Клиент Qdrant (База знаний) - инициализируем, если есть ключи
     q_client = None
     if QDRANT_URL and QDRANT_API_KEY:
         try:
             q_client = QdrantClient(url=QDRANT_URL, api_key=QDRANT_API_KEY)
-        except:
-            pass
-    # 3. Модель для векторизации (чтобы искать в базе)
-    # Используем маленькую и быструю модель, она скачается сама
     encoder = SentenceTransformer('all-MiniLM-L6-v2')
     return hf_client, q_client, encoder
 client, qdrant, encoder = load_resources()
-# --- ЛОГИКА RAG (ПОИСК) ---
 def get_context(query):
-    if not qdrant:
-        return "" # Если база не подключена, возвращаем пустоту
     try:
-        # Превращаем вопрос пользователя в цифры (вектор)
         vector = encoder.encode(query).tolist()
-        # Ищем похожие куски в базе (коллекция должна называться "knowledge_base")
         search_result = qdrant.search(
-            collection_name="knowledge_base",
-            query_vector=vector,
             limit=3
         )
-        # Собираем найденный текст
-        context_text = "\n\n".join([hit.payload.get("text", "") for hit in search_result])
-        return context_text
     except Exception as e:
         return ""
-# --- ИНТЕРФЕЙС (КАК ПО ССЫЛКЕ) ---
-st.title("🤖 AI Assistant (RAG)")
-st.caption("Чат с базой знаний на Qwen 2.5")
 if "messages" not in st.session_state:
-    st.session_state.messages = [{"role": "assistant", "content": "Привет! Я готов к работе. Чем помочь?"}]
 # Показываем историю
 for msg in st.session_state.messages:
-    st.chat_message(msg["role"]).write(msg["content"])
-# Поле ввода
-if prompt := st.chat_input():
     st.session_state.messages.append({"role": "user", "content": prompt})
-    st.chat_message("user").write(prompt)
-    # 1. ИЩЕМ ИНФУ В QDRANT
     context = get_context(prompt)
-    # 2. ФОРМИРУЕМ ПРОМПТ
-    system_msg = """Ты полезный ассистент.
-    Используй информацию из КОНТЕКСТА ниже, чтобы ответить на вопрос.
-    Если в контексте нет ответа, отвечай опираясь на свои знания, но предупреди об этом.
-    """
     if context:
-        final_prompt = f"КОНТЕКСТ:\n{context}\n\nВОПРОС: {prompt}"
-    else:
-        final_prompt = prompt
-    messages_api = [
-        {"role": "system", "content": system_msg},
-        {"role": "user", "content": final_prompt}
-    ]
-    # 3. ГЕНЕРИРУЕМ ОТВЕТ
     with st.chat_message("assistant"):
-        stream = client.chat_completion(messages_api, max_tokens=1024, stream=True)
-        response = st.write_stream(stream)
-    st.session_state.messages.append({"role": "assistant", "content": response})

 from qdrant_client import QdrantClient
 from sentence_transformers import SentenceTransformer
+# --- НАСТРОЙКИ ---
+st.set_page_config(page_title="Sales AI + RAG", page_icon="💼", layout="centered")
+st.title("💼 Виртуальный Отдел Продаж")
+st.caption("Чат с базой знаний (RAG) на Qwen 2.5")
+# --- КЛЮЧИ ---
 HF_TOKEN = os.getenv("HF_TOKEN")
 QDRANT_URL = os.getenv("QDRANT_URL")
 QDRANT_API_KEY = os.getenv("QDRANT_API_KEY")
+if not HF_TOKEN:
+    st.error("⚠️ Нет HF_TOKEN!")
+    st.stop()
+# --- ЗАГРУЗКА РЕСУРСОВ (ОДИН РАЗ) ---
 @st.cache_resource
 def load_resources():
+    # 1. Чат-модель
+    hf_client = InferenceClient("Qwen/Qwen2.5-7B-Instruct", token=HF_TOKEN)
+    # 2. База знаний (Qdrant)
     q_client = None
     if QDRANT_URL and QDRANT_API_KEY:
         try:
             q_client = QdrantClient(url=QDRANT_URL, api_key=QDRANT_API_KEY)
+            print("✅ Qdrant подключен")
+        except Exception as e:
+            print(f"❌ Ошибка Qdrant: {e}")
+    # 3. Модель для поиска (Embeddings)
     encoder = SentenceTransformer('all-MiniLM-L6-v2')
     return hf_client, q_client, encoder
 client, qdrant, encoder = load_resources()
+# --- ФУНКЦИЯ ПОИСКА В БАЗЕ (RAG) ---
 def get_context(query):
+    if not qdrant:
+        return ""
     try:
+        # Превращаем вопрос в вектор
         vector = encoder.encode(query).tolist()
+        # Ищем в коллекции "sales_knowledge" (или создадим её позже)
         search_result = qdrant.search(
+            collection_name="sales_knowledge",
+            query_vector=vector,
             limit=3
         )
+        # Собираем текст из найденного
+        return "\n\n".join([hit.payload.get("text", "") for hit in search_result])
     except Exception as e:
+        print(f"Ошибка поиска: {e}")
         return ""
+# --- ЧАТ ---
 if "messages" not in st.session_state:
+    st.session_state.messages = []
 # Показываем историю
 for msg in st.session_state.messages:
+    with st.chat_message(msg["role"]):
+        st.markdown(msg["content"])
+# Обработка ввода
+if prompt := st.chat_input("Ваш вопрос..."):
+    # 1. Сохраняем вопрос юзера
     st.session_state.messages.append({"role": "user", "content": prompt})
+    with st.chat_message("user"):
+        st.markdown(prompt)
+    # 2. ИЩЕМ КОНТЕКСТ В QDRANT
     context = get_context(prompt)
+    # 3. Формируем системный промпт
+    system_instruction = "Ты — менеджер по продажам. Отвечай коротко и по делу."
     if context:
+        system_instruction += f"\n\nИспользуй эту информацию из базы знаний для ответа:\n{context}"
+        print(f"Нашел в базе: {context[:100]}...") # Для отладки в логах
+    # Собираем сообщения для API
+    api_messages = [{"role": "system", "content": system_instruction}]
+    for m in st.session_state.messages:
+        api_messages.append({"role": m["role"], "content": m["content"]})
+    # 4. Генерируем ответ
     with st.chat_message("assistant"):
+        message_placeholder = st.empty()
+        full_response = ""
+        try:
+            stream = client.chat_completion(
+                messages=api_messages,
+                max_tokens=512,
+                stream=True,
+                temperature=0.7
+            )
+            for chunk in stream:
+                content = chunk.choices[0].delta.content
+                if content:
+                    full_response += content
+                    message_placeholder.markdown(full_response + "▌")
+            message_placeholder.markdown(full_response)
+        except Exception as e:
+            st.error(f"Ошибка API: {e}")
+    st.session_state.messages.append({"role": "assistant", "content": full_response})