Spaces:

LevinAleksey
/

managerChat

Sleeping

App Files Files Community

LevinAleksey commited on Jan 26

Commit

adfda88

verified ·

1 Parent(s): 73b5dd2

Update app.py

Browse files

Files changed (1) hide show

app.py +58 -29

app.py CHANGED Viewed

@@ -4,42 +4,54 @@ from huggingface_hub import InferenceClient
 from qdrant_client import QdrantClient
 from sentence_transformers import SentenceTransformer
-# --- НАСТРОЙКИ ---
 HF_TOKEN = os.getenv("HF_TOKEN")
 QDRANT_URL = os.getenv("QDRANT_URL")
 QDRANT_API_KEY = os.getenv("QDRANT_API_KEY")
 MODEL_ID = "Qwen/Qwen2.5-7B-Instruct"
-# --- ИНИЦИАЛИЗАЦИЯ ПРИ СТАРТЕ ЧАТА ---
 @cl.on_chat_start
 async def start():
-    # 1. Показываем загрузку
-    msg = cl.Message(content="Загружаю базы знаний и подключаюсь к нейросетям...")
-    await msg.send()
-    # 2. Инициализируем клиентов (сохраняем в сессию пользователя)
     hf_client = InferenceClient(MODEL_ID, token=HF_TOKEN)
     q_client = None
     if QDRANT_URL and QDRANT_API_KEY:
         try:
             q_client = QdrantClient(url=QDRANT_URL, api_key=QDRANT_API_KEY)
-            print("✅ Qdrant OK")
         except:
             print("❌ Qdrant Error")
     encoder = SentenceTransformer('all-MiniLM-L6-v2')
-    # Сохраняем в сессию, чтобы использовать при каждом сообщении
     cl.user_session.set("hf_client", hf_client)
     cl.user_session.set("q_client", q_client)
     cl.user_session.set("encoder", encoder)
-    # 3. Обновляем сообщение на приветствие
-    msg.content = "👋 Привет! Я готов к работе. Задай вопрос по базе знаний."
-    await msg.update()
-# --- ФУНКЦИЯ RAG (ПОИСК) ---
 def get_context(query, q_client, encoder):
     if not q_client: return ""
     try:
@@ -55,39 +67,56 @@ def get_context(query, q_client, encoder):
 # --- ОБРАБОТКА СООБЩЕНИЯ ---
 @cl.on_message
 async def main(message: cl.Message):
-    # Достаем инструменты из сессии
     hf_client = cl.user_session.get("hf_client")
     q_client = cl.user_session.get("q_client")
     encoder = cl.user_session.get("encoder")
-    # 1. Ищем контекст в RAG
     context = get_context(message.content, q_client, encoder)
-    # 2. Формируем промпт
-    system_prompt = "Ты полезный ассистент. Отвечай на русском языке."
     if context:
-        system_prompt += f"\n\nИспользуй эту информацию для ответа:\n{context}"
-        # Можно показать найденный контекст в UI (опционально)
-        # await cl.Message(content=f"📚 Наше�� в базе:\n{context[:100]}...").send()
-    messages = [
-        {"role": "system", "content": system_prompt},
-        {"role": "user", "content": message.content}
-    ]
-    # 3. Отправляем в Qwen и стримим ответ
     msg = cl.Message(content="")
-    await msg.send() # Создаем пустой пузрь
     try:
-        stream = hf_client.chat_completion(messages, max_tokens=1024, stream=True, temperature=0.7)
         for chunk in stream:
             token = chunk.choices[0].delta.content
             if token:
                 await msg.stream_token(token)
-        await msg.update() # Финализируем сообщение
     except Exception as e:
         await cl.Message(content=f"Ошибка: {str(e)}").send()

 from qdrant_client import QdrantClient
 from sentence_transformers import SentenceTransformer
+# --- КОНФИГУРАЦИЯ ---
 HF_TOKEN = os.getenv("HF_TOKEN")
 QDRANT_URL = os.getenv("QDRANT_URL")
 QDRANT_API_KEY = os.getenv("QDRANT_API_KEY")
 MODEL_ID = "Qwen/Qwen2.5-7B-Instruct"
+# --- МОЩНЫЙ ПРОМПТ ПРОДАЖНИКА ---
+SALES_SYSTEM_PROMPT = """
+Ты — ведущий эксперт по внедрению ИИ и автоматизации (n8n, RAG, Chatbots).
+Твоя задача: Квалифицировать клиента и продать услуги агентства.
+ТВОИ ПРАВИЛА:
+1. Тон: Уверенный, деловой, экспертный. Не будь "роботом-слугой". Ты — партнер по бизнесу.
+2. Цель: Не просто ответить на вопрос, а вывести клиента на следующий шаг (звонок, аудит, КП).
+3. Если спрашивают цену: Не называй цифру "в лоб" без контекста. Сначала спроси детали задачи, объясни ценность, потом дай вилку "от...".
+4. Работа с возражениями: Если говорят "дорого", объясни, сколько денег они теряют без автоматизации.
+5. Краткость: Пиши емко. Максимум 3-4 предложения за раз.
+6. В конце ответа ВСЕГДА задавай вовлекающий вопрос.
+"""
+# --- СТАРТ СЕССИИ ---
 @cl.on_chat_start
 async def start():
+    # 1. Приветствие
+    await cl.Message(content="👋 Привет! Я AI-архитектор. Готов обсудить автоматизацию твоего бизнеса. Какую задачу решаем?").send()
+    # 2. Инициализация (сохраняем в сессию, чтобы не грузить каждый раз)
     hf_client = InferenceClient(MODEL_ID, token=HF_TOKEN)
     q_client = None
     if QDRANT_URL and QDRANT_API_KEY:
         try:
             q_client = QdrantClient(url=QDRANT_URL, api_key=QDRANT_API_KEY)
+            print("✅ Qdrant Connected")
         except:
             print("❌ Qdrant Error")
     encoder = SentenceTransformer('all-MiniLM-L6-v2')
     cl.user_session.set("hf_client", hf_client)
     cl.user_session.set("q_client", q_client)
     cl.user_session.set("encoder", encoder)
+    # 3. СОЗДАЕМ ИСТОРИЮ СООБЩЕНИЙ (ПАМЯТЬ)
+    # Сразу кладем туда системный промпт, но без RAG-контекста (он добавится динамически)
+    cl.user_session.set("message_history", [])
+# --- ПОИСК В БАЗЕ (RAG) ---
 def get_context(query, q_client, encoder):
     if not q_client: return ""
     try:
 # --- ОБРАБОТКА СООБЩЕНИЯ ---
 @cl.on_message
 async def main(message: cl.Message):
     hf_client = cl.user_session.get("hf_client")
     q_client = cl.user_session.get("q_client")
     encoder = cl.user_session.get("encoder")
+    history = cl.user_session.get("message_history")
+    # 1. Поиск в базе знаний по ТЕКУЩЕМУ вопросу
     context = get_context(message.content, q_client, encoder)
+    # 2. Формируем актуальный системный промпт с найденными знаниями
+    current_system_prompt = SALES_SYSTEM_PROMPT
     if context:
+        current_system_prompt += f"\n\nВАЖНАЯ ИНФОРМАЦИЯ ИЗ БАЗЫ ЗНАНИЙ КОМПАНИИ:\n{context}\nИспользуй это для ответа."
+    # 3. Собираем массив сообщений для нейросети
+    # Сначала идет системный промпт (свежий, с контекстом)
+    messages_payload = [{"role": "system", "content": current_system_prompt}]
+    # Потом добавляем историю переписки (последние 10 сообщений, чтобы не перегружать)
+    # Это и есть "Память"
+    for msg in history[-10:]:
+        messages_payload.append(msg)
+    # И в конце - текущий вопрос пользователя
+    messages_payload.append({"role": "user", "content": message.content})
+    # 4. Отправляем в Qwen
     msg = cl.Message(content="")
+    await msg.send()
+    full_response = ""
     try:
+        stream = hf_client.chat_completion(
+            messages=messages_payload,
+            max_tokens=1024,
+            stream=True,
+            temperature=0.7
+        )
         for chunk in stream:
             token = chunk.choices[0].delta.content
             if token:
+                full_response += token
                 await msg.stream_token(token)
+        await msg.update()
+        # 5. ВАЖНО: Обновляем историю (запоминаем этот диалог)
+        history.append({"role": "user", "content": message.content})
+        history.append({"role": "assistant", "content": full_response})
+        cl.user_session.set("message_history", history)
     except Exception as e:
         await cl.Message(content=f"Ошибка: {str(e)}").send()