Spaces:

DINGDINGBELLS
/

clicklezGPT

Running

App Files Files Community

DINGDINGBELLS commited on Feb 28

Commit

2b6f383

verified ·

1 Parent(s): 3bff0ab

Update app.py

Browse files

Files changed (1) hide show

app.py +99 -44

app.py CHANGED Viewed

@@ -1,30 +1,17 @@
-import os
-import telebot
 import torch
 import re
 import random
 from transformers import AutoModelForCausalLM, AutoTokenizer
-from flask import Flask
-# --- ДЛЯ ТОГО ЧТОБЫ SPACE НЕ ПАДАЛ (Веб-заглушка) ---
-app = Flask(__name__)
-@app.route('/')
-def index():
-    return "ClicklezGPT Telegram Bot is Running!"
-# --- КОНФИГ ---
-TOKEN = '8667018016:AAGj3o5qpVKvAiwx4lbsWxvz98xxMB5rvt0'
-# Используем "." так как файлы модели лежат прямо в Space
 MODEL_PATH = "./"
-# СПИСОК МУСОРА
-SHIZA_WASTE = [
-    "лучшая подруга", "решением знаний", "систему cn", "обновления системы",
-    "мои знания", "тестового ключа", "python_dict", "максимизировать их ошибки"
-]
-# --- ЗАГРУЗКА ---
 tokenizer = AutoTokenizer.from_pretrained(MODEL_PATH)
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_PATH,
@@ -32,21 +19,50 @@ model = AutoModelForCausalLM.from_pretrained(
     device_map="auto"
 )
-# Лимиты
 model.config.max_position_embeddings = 128
 model.config.use_cache = False
 tokenizer.pad_token = tokenizer.eos_token
-bot = telebot.TeleBot(TOKEN)
-# --- ЛОГИКА ---
-@bot.message_handler(func=lambda message: True)
-def handle_dialog(message):
-    input_text = f"User: {message.text[:60]}\nAI:"
-    inputs = tokenizer(input_text, return_tensors="pt").to(model.device)
     curr_len = inputs.input_ids.shape[1]
     max_to_gen = 128 - curr_len - 1
     try:
         with torch.no_grad():
@@ -54,33 +70,72 @@ def handle_dialog(message):
                 **inputs,
                 max_new_tokens=max_to_gen,
                 do_sample=True,
-                temperature=0.2,
-                repetition_penalty=1.7,
                 top_k=20,
                 pad_token_id=tokenizer.pad_token_id
             )
         answer = tokenizer.decode(output_tokens[0][curr_len:], skip_special_tokens=True).strip()
         answer = re.split(r'User:|AI:|\n', answer)[0].strip()
-        # Анти-Бред фильтры
-        if re.search(r'[A-Z_]{8,}', answer) or "(" in answer:
             answer = random.choice(["Завязывай с кодами.", "Чё?", "Ясно."])
-        for waste in SHIZA_WASTE:
-            if waste in answer.lower():
-                answer = "Опять ты за своё..."
-                break
-        bot.reply_to(message, answer if len(answer) > 1 else "...")
-    except:
-        bot.reply_to(message, "Ошибка в матрице.")
-# --- ЗАПУСК БОТА В ПОТОКЕ ---
-import threading
-threading.Thread(target=lambda: bot.infinity_polling(timeout=10, long_polling_timeout=5)).start()
-if __name__ == "__main__":
-    # Space требует биндинг на порт 7860
-    app.run(host="0.0.0.0", port=7860)

+import gradio as gr
 import torch
 import re
 import random
 from transformers import AutoModelForCausalLM, AutoTokenizer
+import os
+# ==========================================
+# 1. ЗАГРУЗКА МОДЕЛИ И ТОКЕНАЙЗЕРА
+# ==========================================
+# Используем ".", так как файлы модели лежат прямо в Space
 MODEL_PATH = "./"
+print("--- [1/2] Загрузка BananaGPT ---")
 tokenizer = AutoTokenizer.from_pretrained(MODEL_PATH)
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_PATH,
     device_map="auto"
 )
+# Жесткие лимиты под твои 128 токенов
 model.config.max_position_embeddings = 128
 model.config.use_cache = False
 tokenizer.pad_token = tokenizer.eos_token
+model.config.pad_token_id = tokenizer.pad_token_id
+print("--- [2/2] Модель загружена. Запуск интерфейса ---")
+# СПИСОК МУСОРА (Шиза)
+SHIZA_WASTE = [
+    "лучшая подруга", "решением знаний", "систему cn", "обновления системы",
+    "мои знания", "тестового ключа", "python_dict", "максимизировать их ошибки",
+    "в густом тумане войны", "сегодня ты меня боишься", "CROME_", "RESMALA"
+]
+# ==========================================
+# 2. ЛОГИКА ГЕНЕРАЦИИ С ПАМЯТЬЮ
+# ==========================================
+def predict(message, history):
+    # message - текущий вопрос пользователя
+    # history - список прошлых сообщений [[user, bot], [user, bot]]
+    # 1. Формируем контекст из истории (последние 2 сообщения, чтобы влезть в 128)
+    history_str = ""
+    for h in history[-2:]: # Берем только последние 2 пары
+        history_str += f"User: {h[0][:40]} AI: {h[1][:40]}\n"
+    # Полный промпт (максимум 70 токенов, чтобы оставить место на ответ)
+    current_input = f"User: {message[:60]}"
+    full_prompt = f"{history_str}{current_input}\nAI:"
+    # Токенизируем
+    inputs = tokenizer(full_prompt, return_tensors="pt").to(model.device)
     curr_len = inputs.input_ids.shape[1]
+    # Рассчитываем свободное место до физического лимита в 128
     max_to_gen = 128 - curr_len - 1
+    if max_to_gen <= 1:
+        # Если контекст забит, обнуляем историю и пробуем снова
+        full_prompt = f"User: {message[:60]}\nAI:"
+        inputs = tokenizer(full_prompt, return_tensors="pt").to(model.device)
+        curr_len = inputs.input_ids.shape[1]
+        max_to_gen = 128 - curr_len - 1
     try:
         with torch.no_grad():
                 **inputs,
                 max_new_tokens=max_to_gen,
                 do_sample=True,
+                temperature=0.35,      # Твоя температура!
+                repetition_penalty=1.8, # Усиливаем защиту от повторов
                 top_k=20,
+                top_p=0.8,
                 pad_token_id=tokenizer.pad_token_id
             )
+        # Декодируем только ответ
         answer = tokenizer.decode(output_tokens[0][curr_len:], skip_special_tokens=True).strip()
+        # 2. Срезаем лишние диалоги
         answer = re.split(r'User:|AI:|\n', answer)[0].strip()
+        # 3. ЛЮТЫЙ ДЕТЕКТОР ШИЗЫ (новое)
+        low_answer = answer.lower()
+        # Если она опять начнет про "токены" или "обновление знаний"
+        for waste in SHIZA_WASTE:
+            if waste in low_answer:
+                # Режем всё сообщение, если там началась эта ересь
+                answer = answer.split(waste)[0].strip()
+        # Дополнительная защита: если она пишет капсом или ставит коды
+        if re.search(r'[A-Z_]{7,}', answer) or "(" in answer and ")" in answer:
+            import random
             answer = random.choice(["Завязывай с кодами.", "Чё?", "Ясно."])
+        # Финальная проверка на пустоту
+        if not answer or len(answer) < 2:
+            answer = random.choice(["Мда...", "Проехали.", "Ясно."])
+        return answer
+    except Exception as e:
+        print(f"Error: {e}")
+        return "У меня мозг в тумане войны потерялся."
+# ==========================================
+# 3. КРАСИВЫЙ ИНТЕРФЕЙС GRADIO
+# ==========================================
+# Тема "soft" выглядит современно и чисто
+with gr.Blocks(theme=gr.themes.Soft()) as demo:
+    gr.Markdown("# 🍌 ClicklezGPT: Режим «Адекватный Хам»")
+    gr.Markdown("Твоя нейронка с температурой **0.35** и защитой от технического бреда.")
+    chatbot = gr.Chatbot(
+        label="Чат с BananaGPT",
+        avatar_images=(None, "https://api.iconify.design/emojione:banana.svg")
+    )
+    with gr.Row():
+        txt = gr.Textbox(
+            show_label=False,
+            placeholder="Напиши что-нибудь...",
+            scale=10
+        )
+        submit_btn = gr.Button("Оправить", scale=2)
+    clear = gr.Button("Очистить историю")
+    # Связываем элементы
+    # predict - функция генерации, inputs - ввод пользователя, outputs - чат
+    txt.submit(predict, [txt, chatbot], [chatbot])
+    submit_btn.click(predict, [txt, chatbot], [chatbot])
+    # Очистка истории
+    clear.click(lambda: None, None, chatbot, queue=False)
+demo.launch(server_name="0.0.0.0", server_port=7860)