Spaces:

LevinAleksey
/

managerChat

Sleeping

App Files Files Community

LevinAleksey commited on Jan 26

Commit

cbbdda1

verified ·

1 Parent(s): 8c3d8d7

Create app.py

Browse files

Files changed (1) hide show

app.py +102 -0

app.py ADDED Viewed

	@@ -0,0 +1,102 @@

+import streamlit as st
+import os
+from huggingface_hub import InferenceClient
+from qdrant_client import QdrantClient
+from sentence_transformers import SentenceTransformer
+# --- КОНФИГУРАЦИЯ ---
+st.set_page_config(page_title="AI Assistant RAG", page_icon="🤖", layout="centered")
+# Настройки API (Берем из секретов)
+HF_TOKEN = os.getenv("HF_TOKEN")
+QDRANT_URL = os.getenv("QDRANT_URL")
+QDRANT_API_KEY = os.getenv("QDRANT_API_KEY")
+# Модель для чата
+MODEL_ID = "Qwen/Qwen2.5-7B-Instruct"
+# --- ИНИЦИАЛИЗАЦИЯ ---
+@st.cache_resource
+def load_resources():
+    # 1. Клиент HF (Чат)
+    hf_client = InferenceClient(MODEL_ID, token=HF_TOKEN)
+    # 2. Клиент Qdrant (База знаний) - инициализируем, если есть ключи
+    q_client = None
+    if QDRANT_URL and QDRANT_API_KEY:
+        try:
+            q_client = QdrantClient(url=QDRANT_URL, api_key=QDRANT_API_KEY)
+        except:
+            pass
+    # 3. Модель для векторизации (чтобы искать в базе)
+    # Используем маленькую и быструю модель, она скачается сама
+    encoder = SentenceTransformer('all-MiniLM-L6-v2')
+    return hf_client, q_client, encoder
+client, qdrant, encoder = load_resources()
+# --- ЛОГИКА RAG (ПОИСК В БАЗЕ) ---
+def get_context(query):
+    if not qdrant:
+        return "" # Если база не подключена, возвращаем пустоту
+    try:
+        # Превращаем вопрос пользователя в цифры (вектор)
+        vector = encoder.encode(query).tolist()
+        # Ищем похожие куски в базе (коллекция должна называться "knowledge_base")
+        search_result = qdrant.search(
+            collection_name="knowledge_base",
+            query_vector=vector,
+            limit=3
+        )
+        # Собираем найденный текст
+        context_text = "\n\n".join([hit.payload.get("text", "") for hit in search_result])
+        return context_text
+    except Exception as e:
+        return ""
+# --- ИНТЕРФЕЙС (КАК ПО ССЫЛКЕ) ---
+st.title("🤖 AI Assistant (RAG)")
+st.caption("Чат с базой знаний на Qwen 2.5")
+if "messages" not in st.session_state:
+    st.session_state.messages = [{"role": "assistant", "content": "Привет! Я готов к работе. Чем помочь?"}]
+# Показываем историю
+for msg in st.session_state.messages:
+    st.chat_message(msg["role"]).write(msg["content"])
+# Поле ввода
+if prompt := st.chat_input():
+    st.session_state.messages.append({"role": "user", "content": prompt})
+    st.chat_message("user").write(prompt)
+    # 1. ИЩЕМ ИНФУ В QDRANT
+    context = get_context(prompt)
+    # 2. ФОРМИРУЕМ ПРОМПТ
+    system_msg = """Ты полезный ассистент.
+    Используй информацию из КОНТЕКСТА ниже, чтобы ответить на вопрос.
+    Если в контексте нет ответа, отвечай опираясь на свои знания, но предупреди об этом.
+    """
+    if context:
+        final_prompt = f"КОНТЕКСТ:\n{context}\n\nВОПРОС: {prompt}"
+    else:
+        final_prompt = prompt
+    messages_api = [
+        {"role": "system", "content": system_msg},
+        {"role": "user", "content": final_prompt}
+    ]
+    # 3. ГЕНЕРИРУЕМ ОТВЕТ
+    with st.chat_message("assistant"):
+        stream = client.chat_completion(messages_api, max_tokens=1024, stream=True)
+        response = st.write_stream(stream)
+    st.session_state.messages.append({"role": "assistant", "content": response})