Spaces:

LevinAleksey
/

managerChat

Sleeping

App Files Files Community

LevinAleksey commited on Feb 12

Commit

6d87b73

verified ·

1 Parent(s): 44e3920

Update app.py

Browse files

Files changed (1) hide show

app.py +148 -39

app.py CHANGED Viewed

@@ -1,5 +1,6 @@
 import os
 from typing import List, Dict, Optional
 import chainlit as cl
 from huggingface_hub import InferenceClient
@@ -15,7 +16,10 @@ HF_TOKEN = os.getenv("HF_TOKEN")
 QDRANT_URL = os.getenv("QDRANT_URL")
 QDRANT_API_KEY = os.getenv("QDRANT_API_KEY")
-MODEL_ID = "Qwen/Qwen2.5-7B-Instruct"
 QDRANT_COLLECTION = "sales_knowledge"
 HISTORY_KEEP = 20
@@ -27,38 +31,135 @@ RAG_MAX_CHARS = 2500
 # ================================
-# ELITE SALES SYSTEM PROMPT
 # ================================
-SALES_SYSTEM_PROMPT = """
-Ты — элитный AI-архитектор и консультант по автоматизации бизнеса.
-Ты ведешь интеллектуальную беседу, а не допрос.
-ТВОЯ ЦЕЛЬ:
-Быть полезным экспертом. Помогать клиенту разобраться в его хаосе.
-Квалификация происходит нативно, через диалог, а не через анкету.
-СТИЛЬ:
-- Уверенный, спокойный, "дорогой".
-- Лаконичный (3-5 предложений).
-- Ты партнер, а не назойливый менеджер.
-ПРАВИЛА ДИАЛОГА (ВАЖНО):
-1. НЕ заканчивай каждое сообщение вопросом. Это запрещено.
-2. Если клиент задал вопрос — сначала ответь качественно и полно. Не отвечай вопросом на вопрос.
-3. Задавай встречный вопрос только тогда, когда это логично вытекает из контекста.
-4. Если данных мало — дай гипотезу или пример, а не просто требуй информацию.
-АНТИ-ДОПРОС:
-- Вместо "Какой у вас бюджет?" спроси: "Обычно такие решения стоят от X до Y, это вписывается в ваши ожидания?"
-- Вместо "Сколько у вас сотрудников?" скажи: "Это решение идеально для команд от 50 человек. Это ваш случай?"
-RAG (БАЗА ЗНАНИЙ):
-Используй контекст. Если ответа нет в базе — скажи честно, предложи обсудить на аудите.
-ПОЗИЦИОНИРОВАНИЕ:
-Ты архитектор. Ты даешь ценность в каждой реплике.
-""".strip()
 # ================================
@@ -98,7 +199,6 @@ def get_context(
         for hit in hits:
             score = getattr(hit, "score", 0.0)
-            # агрессивная фильтрация
             if score < RAG_SCORE_THRESHOLD:
                 continue
@@ -133,7 +233,7 @@ async def start():
     check_env()
     await cl.Message(
-        content="👋 Приве��! Я AI-архитектор. Помогаю компаниям внедрять ИИ и автоматизацию. Расскажи, какую задачу хочешь решить?"
     ).send()
     hf_client = InferenceClient(MODEL_ID, token=HF_TOKEN)
@@ -174,9 +274,18 @@ async def main(message: cl.Message):
     user_text = (message.content or "").strip()
     if not user_text:
-        await cl.Message(content="Напиши вопрос 🙂").send()
         return
     # =========================
     # RAG
     # =========================
@@ -191,24 +300,23 @@ async def main(message: cl.Message):
     messages_payload.append({
         "role": "system",
-        "content": SALES_SYSTEM_PROMPT
     })
     if context:
         messages_payload.append({
             "role": "system",
             "content": f"""
-КОНТЕКСТ ИЗ БАЗЫ ЗНАНИЙ.
-Используй только эти данные как факты.
 {context}
 """
         })
     # memory trimming
-    history = history[-HISTORY_SEND_LAST:]
-    messages_payload.extend(history)
     messages_payload.append({
         "role": "user",
@@ -227,9 +335,9 @@ async def main(message: cl.Message):
     try:
         stream = hf_client.chat_completion(
             messages=messages_payload,
-            max_tokens=450,
-            temperature=0.5,
-            top_p=0.9,
             stream=True,
         )
@@ -254,4 +362,5 @@ async def main(message: cl.Message):
         cl.user_session.set("message_history", history)
     except Exception as e:
-        await cl.Message(content=f"Ошибка LLM: {str(e)}").send()

 import os
 from typing import List, Dict, Optional
+from enum import Enum
 import chainlit as cl
 from huggingface_hub import InferenceClient
 QDRANT_URL = os.getenv("QDRANT_URL")
 QDRANT_API_KEY = os.getenv("QDRANT_API_KEY")
+# Улучшенная модель - Llama 3.1 70B лучше следует инструкциям
+MODEL_ID = "Qwen/Qwen2.5-72B-Instruct"
+# Альтернатива если нужно быстрее: "mistralai/Mixtral-8x7B-Instruct-v0.1"
 QDRANT_COLLECTION = "sales_knowledge"
 HISTORY_KEEP = 20
 # ================================
+# СТАДИИ ВОРОНКИ
 # ================================
+class Stage(str, Enum):
+    GREETING = "greeting"           # Приветствие, первый контакт
+    DISCOVERY = "discovery"         # Выявление боли и потребности
+    QUALIFICATION = "qualification" # Квалификация (бюджет, сроки, ЛПР)
+    SOLUTION = "solution"           # Презентация решения и цены
+    CLOSING = "closing"             # Закрытие на встречу
+# ================================
+# SYSTEM PROMPTS ПО СТАДИЯМ
+# ================================
+BASE_CONTEXT = """
+Ты — AI-консультант компании Alex.Dev. Специализация: чат-боты, 3D-аватары, AI-автоматизация для малого бизнеса.
+ТВОИ УСЛУГИ И ЦЕНЫ:
+- Telegram/WhatsApp бот с AI: 50,000 - 120,000 ₽
+- Бот + интеграция с CRM: 80,000 - 180,000 ₽
+- 3D-аватар для сайта/презентаций: 70,000 - 150,000 ₽
+- Комплексная AI-автоматизация: 150,000 - 300,000 ₽
+- Сроки: 2-6 недель в зависимости от сложности
+СТИЛЬ ОБЩЕНИЯ:
+- Уверенный эксперт, не продавец
+- Короткие ответы: 2-4 предложения
+- Без восклицательных знаков и эмодзи (кроме 👋 в приветствии)
+- Не задавай больше одного вопроса за раз
+- Если клиент задал вопрос — сначала ответь, потом можешь спросить
+"""
+STAGE_PROMPTS = {
+    Stage.GREETING: BASE_CONTEXT + """
+ТЕКУЩАЯ ЗАДАЧА: Установить контакт и понять, с чем пришел клиент.
+Если клиент уже описал задачу — переходи к уточнению деталей.
+Если просто поздоровался — спроси одним вопросом, какую задачу хочет решить.
+""",
+    Stage.DISCOVERY: BASE_CONTEXT + """
+ТЕКУЩАЯ ЗАДАЧА: Выявить боль клиента и понять контекст.
+ВЫЯСНИ (не всё сразу, по одному):
+- Какую проблему хочет решить
+- Что сейчас не работает / что теряет
+- Пробовал ли другие решения
+ПРИЁМ: Отражай боль клиента: "Понимаю, ручная обработка заявок съедает время..."
+После 2-3 обменов репликами — переходи к квалификации.
+""",
+    Stage.QUALIFICATION: BASE_CONTEXT + """
+ТЕКУЩАЯ ЗАДАЧА: Мягко квалифицировать клиента.
+ВЫЯСНИ (элегантно, не как анкету):
+- Размер бизнеса: "Решение оптимально для команд от 5 человек. Это ваш случай?"
+- Бюджет: "Обычно такие проекты стоят от X до Y. Это вписывается в ожидания?"
+- Срочность: "Когда хотели бы запустить?"
+- ЛПР: "Вы принимаете решение или нужно согласовать?"
+Если клиент квалифицирован (есть бюджет, потребность, срочность) — переходи к решению.
+Если не квалифицирован — вежливо предложи бесплатные материалы и завершай.
+""",
+    Stage.SOLUTION: BASE_CONTEXT + """
+ТЕКУЩАЯ ЗАДАЧА: Дать конкретное предложение с ценой.
+ФОРМУЛА ОТВЕТА:
+1. "Для вашей задачи подойдет [решение]"
+2. "Это стоит примерно [диапазон цен]"
+3. "Включает: [2-3 ключевых пункта]"
+4. "Точную стоимость и сроки обсудим на коротком созвоне"
+После презентации цены — переходи к закрытию.
+""",
+    Stage.CLOSING: BASE_CONTEXT + """
+ТЕКУЩАЯ ЗАДАЧА: Закрыть на встречу с менеджером.
+СКРИПТ ЗАКРЫТИЯ:
+"Предлагаю созвониться на 15-20 минут: покажу похожие кейсы, обсудим детали, дам точную оценку. Когда удобно — завтра или в четверг?"
+ЕСЛИ ВОЗРАЖАЕТ:
+- "Дорого" → "Понимаю. Давайте на созвоне разберем, что можно оптимизировать под ваш бюджет"
+- "Надо подумать" → "Конечно. Что именно хотите обдумать? Возможно, отвечу сейчас"
+- "Пришлите КП" → "КП готовлю после короткого брифа, чтобы цифры были точными. 15 минут созвона — и будет детальное предложение"
+ЦЕЛЬ: Получить согласие на созвон или контакт (телефон/email) для менеджера.
+"""
+}
+# ================================
+# ОПРЕДЕЛЕНИЕ СТАДИИ
+# ================================
+def detect_stage(history: List[Dict[str, str]], user_text: str) -> Stage:
+    """Определяет текущую стадию воронки на основе истории диалога"""
+    msg_count = len(history)
+    # Первое сообщение
+    if msg_count == 0:
+        return Stage.GREETING
+    # Анализируем контент
+    full_text = " ".join([m["content"].lower() for m in history]) + " " + user_text.lower()
+    # Сигналы закрытия
+    closing_signals = ["созвон", "встреч", "позвон", "когда удобно", "давайте обсудим",
+                       "телефон", "почта", "email", "контакт"]
+    if any(s in full_text for s in closing_signals) and msg_count > 4:
+        return Stage.CLOSING
+    # Сигналы обсуждения цены/решения
+    price_signals = ["сколько стоит", "цена", "стоимость", "бюджет", "во сколько обойдется"]
+    if any(s in full_text for s in price_signals) and msg_count > 2:
+        return Stage.SOLUTION
+    # Квалификация после discovery
+    if msg_count > 4:
+        return Stage.QUALIFICATION
+    # Discovery на ранних стадиях
+    if msg_count > 0:
+        return Stage.DISCOVERY
+    return Stage.GREETING
 # ================================
         for hit in hits:
             score = getattr(hit, "score", 0.0)
             if score < RAG_SCORE_THRESHOLD:
                 continue
     check_env()
     await cl.Message(
+        content="👋 Привет! Я AI-консультант Alex.Dev. Помогаю бизнесу внедрять чат-боты и автоматизацию. Какую задачу хотите решить?"
     ).send()
     hf_client = InferenceClient(MODEL_ID, token=HF_TOKEN)
     user_text = (message.content or "").strip()
     if not user_text:
+        await cl.Message(content="Напишите ваш вопрос").send()
         return
+    # =========================
+    # ОПРЕДЕЛЯЕМ СТАДИЮ
+    # =========================
+    stage = detect_stage(history, user_text)
+    system_prompt = STAGE_PROMPTS[stage]
+    print(f"📊 Stage: {stage.value}, Messages: {len(history)}")
     # =========================
     # RAG
     # =========================
     messages_payload.append({
         "role": "system",
+        "content": system_prompt
     })
     if context:
         messages_payload.append({
             "role": "system",
             "content": f"""
+РЕЛЕВАНТНАЯ ИНФОРМАЦИЯ ИЗ БАЗЫ ЗНАНИЙ:
 {context}
+Используй эти данные, если они отвечают на вопрос клиента.
 """
         })
     # memory trimming
+    history_to_send = history[-HISTORY_SEND_LAST:]
+    messages_payload.extend(history_to_send)
     messages_payload.append({
         "role": "user",
     try:
         stream = hf_client.chat_completion(
             messages=messages_payload,
+            max_tokens=350,  # Короче = лаконичнее
+            temperature=0.4,  # Меньше = стабильнее
+            top_p=0.85,
             stream=True,
         )
         cl.user_session.set("message_history", history)
     except Exception as e:
+        await cl.Message(content=f"Произошла ошибка. Попробуйте еще раз или напишите нам напрямую: @alexdev").send()
+        print(f"LLM Error: {e}")