Spaces:

SimrusDenuvo
/

chat

Sleeping

App Files Files Community

SimrusDenuvo commited on May 15

Commit

5dee7eb

verified ·

1 Parent(s): 57645e8

Update app.py

Browse files

Files changed (1) hide show

app.py +52 -33

app.py CHANGED Viewed

@@ -1,36 +1,55 @@
-from transformers import AutoTokenizer, AutoModelForCausalLM
-import torch
 import gradio as gr
-model_name = "ai-forever/rugpt3large_based_on_gpt2"
-tokenizer = AutoTokenizer.from_pretrained(model_name)
-model = AutoModelForCausalLM.from_pretrained(model_name)
-def generate_response(user_query):
-    prompt = f"Клиент: {user_query}\nБанк:"
-    input_ids = tokenizer.encode(prompt, return_tensors="pt")
-    with torch.no_grad():
-        output_ids = model.generate(
-            input_ids,
-            max_new_tokens=100,
-            do_sample=True,
-            temperature=0.7,
-            top_k=50,
-            top_p=0.95,
-            pad_token_id=tokenizer.eos_token_id
-        )
-    generated_text = tokenizer.decode(output_ids[0], skip_special_tokens=True)
-    response = generated_text[len(prompt):].strip()
-    return response
-gr.Interface(
-    fn=generate_response,
-    inputs=gr.Textbox(lines=3, label="Введите банковский запрос"),
-    outputs=gr.Textbox(lines=5, label="Ответ модели"),
-    title="🤖 Русский банковский помощник",
-    description="Генерация ответа на русском языке с использованием модели RuGPT-3 от AI-Forever."
-).launch(share=True)

+import os
+import requests
 import gradio as gr
+# Токен берётся из Secrets Hugging Face
+HF_TOKEN = os.environ.get("HF_TOKEN")
+if not HF_TOKEN:
+    raise ValueError("❌ Токен не найден. Добавьте HF_TOKEN в Secrets!")
+# Настройки модели (используем облегчённую версию для стабильности)
+MODEL_NAME = "IlyaGusev/saiga_mistral_7b-lora"  # Альтернатива: "IlyaGusev/saiga_mistral_7b"
+API_URL = f"https://api-inference.huggingface.co/models/{MODEL_NAME}"
+headers = {"Authorization": f"Bearer {HF_TOKEN}"}
+def generate_response(prompt, history):
+    """Генерация ответа с учётом истории диалога"""
+    try:
+        # Форматируем историю для модели (если нужно)
+        formatted_prompt = f"Диалог:\n{history}\nПользователь: {prompt}\nАссистент:"
+        payload = {
+            "inputs": formatted_prompt,
+            "parameters": {
+                "max_new_tokens": 500,
+                "temperature": 0.7,
+                "do_sample": True,
+            }
+        }
+        response = requests.post(API_URL, headers=headers, json=payload)
+        if response.status_code == 200:
+            return response.json()[0]["generated_text"]
+        else:
+            return f"⚠️ Ошибка API: {response.text}"
+    except Exception as e:
+        return f"❌ Ошибка: {str(e)}"
+# Интерфейс Gradio (аналог ChatGPT)
+with gr.Blocks(title="🇷🇺 Russian Saiga Chat") as demo:
+    gr.Markdown("## 💬 Чат с Saiga Mistral 7B (через HF API)")
+    chatbot = gr.Chatbot(label="Диалог")
+    msg = gr.Textbox(label="Сообщение", placeholder="Напишите что-то...")
+    clear = gr.Button("Очистить")
+    def respond(message, chat_history):
+        bot_message = generate_response(message, chat_history)
+        chat_history.append((message, bot_message))
+        return "", chat_history
+    msg.submit(respond, [msg, chatbot], [msg, chatbot])
+    clear.click(lambda: None, None, chatbot, queue=False)
+demo.launch(debug=True)