Spaces:

MarkProMaster229
/

BasicSmall

Sleeping

App Files Files Community

MarkProMaster229 commited on 17 days ago

Commit

d53a92a

verified ·

1 Parent(s): 807907a

Update app.py

Browse files

Files changed (1) hide show

app.py +170 -60

app.py CHANGED Viewed

@@ -1,70 +1,180 @@
 import gradio as gr
-from huggingface_hub import InferenceClient
-def respond(
-    message,
-    history: list[dict[str, str]],
-    system_message,
-    max_tokens,
-    temperature,
-    top_p,
-    hf_token: gr.OAuthToken,
-):
-    """
-    For more information on `huggingface_hub` Inference API support, please check the docs: https://huggingface.co/docs/huggingface_hub/v0.22.2/en/guides/inference
-    """
-    client = InferenceClient(token=hf_token.token, model="openai/gpt-oss-20b")
-    messages = [{"role": "system", "content": system_message}]
-    messages.extend(history)
-    messages.append({"role": "user", "content": message})
-    response = ""
-    for message in client.chat_completion(
-        messages,
-        max_tokens=max_tokens,
-        stream=True,
-        temperature=temperature,
-        top_p=top_p,
-    ):
-        choices = message.choices
-        token = ""
-        if len(choices) and choices[0].delta.content:
-            token = choices[0].delta.content
-        response += token
-        yield response
-"""
-For information on how to customize the ChatInterface, peruse the gradio docs: https://www.gradio.app/docs/chatinterface
-"""
-chatbot = gr.ChatInterface(
-    respond,
-    type="messages",
-    additional_inputs=[
-        gr.Textbox(value="You are a friendly Chatbot.", label="System message"),
-        gr.Slider(minimum=1, maximum=2048, value=512, step=1, label="Max new tokens"),
-        gr.Slider(minimum=0.1, maximum=4.0, value=0.7, step=0.1, label="Temperature"),
-        gr.Slider(
-            minimum=0.1,
-            maximum=1.0,
-            value=0.95,
-            step=0.05,
-            label="Top-p (nucleus sampling)",
-        ),
-    ],
-)
-with gr.Blocks() as demo:
-    with gr.Sidebar():
-        gr.LoginButton()
-    chatbot.render()
 if __name__ == "__main__":
-    demo.launch()

 import gradio as gr
+from decoderOnly import TransformerRun
+from transformers import AutoTokenizer
+import torch
+import os
+class ChatBot:
+    def __init__(self, model_path="."):
+        """
+        Инициализация бота.
+        В Space файлы модели должны находиться в корневой директории.
+        """
+        print(f"Загрузка модели из: {model_path}")
+        try:
+            # Загружаем токенизатор
+            self.tokenizer = AutoTokenizer.from_pretrained(model_path)
+            print("Токенизатор загружен успешно.")
+            # Если у токенизатора нет pad_token, устанавливаем его
+            if self.tokenizer.pad_token is None:
+                self.tokenizer.pad_token = self.tokenizer.eos_token if self.tokenizer.eos_token else "[PAD]"
+                print(f"Установлен pad_token: {self.tokenizer.pad_token}")
+            # Создаем модель с параметрами токенизатора
+            self.model = TransformerRun(
+                vocabSize=len(self.tokenizer),
+                maxLong=256,
+                sizeVector=128,
+                block=2
+            )
+            # Загружаем веса модели (в Space файл будет в корне)
+            weights_path = f"{model_path}/model_weights.pth"
+            if not os.path.exists(weights_path):
+                # Пробуем найти веса без подпапки
+                weights_path = "model_weights.pth"
+            print(f"Загрузка весов из: {weights_path}")
+            self.model.load_state_dict(
+                torch.load(weights_path, map_location='cpu', weights_only=True)
+            )
+            # Настраиваем устройство
+            self.device = torch.device("cpu")
+            self.model.to(self.device)
+            self.model.eval()
+            print("Модель загружена и готова к работе!")
+        except Exception as e:
+            print(f"Ошибка при загрузке модели: {e}")
+            raise
+    def generate(self, prompt, max_length=100, temperature=0.5, top_k=50):
+        """
+        Генерация ответа на промпт пользователя.
+        """
+        try:
+            if not prompt or prompt.strip() == "":
+                return "Пожалуйста, введите сообщение."
+            print(f"Генерация ответа для промпта: '{prompt[:50]}...'")
+            # Токенизируем промпт
+            inputs = self.tokenizer(prompt, return_tensors="pt", truncation=True, max_length=200)
+            input_ids = inputs["input_ids"].to(self.device)
+            # Если последовательность пустая после токенизации
+            if input_ids.size(1) == 0:
+                return "Не удалось обработать запрос. Попробуйте другие слова."
+            generated_ids = input_ids.clone()
+            with torch.no_grad():
+                for _ in range(max_length):
+                    # Прямой проход модели
+                    outputs = self.model(generated_ids)
+                    logits = outputs[0, -1, :] / temperature  # учитываем температуру
+                    # Top-k sampling
+                    if top_k > 0:
+                        topk_values, topk_indices = torch.topk(logits, min(top_k, logits.size(-1)))
+                        probs = torch.zeros_like(logits).scatter(0, topk_indices, torch.softmax(topk_values, dim=-1))
+                    else:
+                        probs = torch.softmax(logits, dim=-1)
+                    # Выбираем следующий токен
+                    next_token = torch.multinomial(probs, num_samples=1)
+                    # Добавляем к сгенерированной последовательности
+                    generated_ids = torch.cat([generated_ids, next_token.unsqueeze(0)], dim=1)
+                    # Останавливаемся на EOS или PAD
+                    stop_tokens = []
+                    if self.tokenizer.eos_token_id is not None:
+                        stop_tokens.append(self.tokenizer.eos_token_id)
+                    if self.tokenizer.pad_token_id is not None:
+                        stop_tokens.append(self.tokenizer.pad_token_id)
+                    if next_token.item() in stop_tokens:
+                        print(f"Остановка на токене: {next_token.item()}")
+                        break
+            # Декодируем обратно в текст
+            response = self.tokenizer.decode(generated_ids[0], skip_special_tokens=True)
+            # Убираем оригинальный промпт из ответа
+            if response.startswith(prompt):
+                response = response[len(prompt):].strip()
+            print(f"Сгенерирован ответ длиной {len(response)} символов.")
+            return response
+        except Exception as e:
+            print(f"Ошибка при генерации: {e}")
+            return f"Произошла ошибка: {str(e)}"
+def create_interface():
+    """
+    Создание Gradio интерфейса.
+    """
+    try:
+        # Инициализируем бота
+        # В Space модель будет находиться в корневой директории
+        bot = ChatBot(model_path=".")
+        print("Интерфейс запускается...")
+        def respond(message, history):
+            """
+            Функция для обработки сообщений в интерфейсе чата.
+            """
+            # history содержит предыдущие сообщения в формате [[user1, bot1], [user2, bot2], ...]
+            # Мы будем генерировать ответ только на последнее сообщение
+            response = bot.generate(
+                prompt=message,
+                max_length=100,
+                temperature=0.7,
+                top_k=50
+            )
+            return response
+        # Создаем интерфейс чата
+        demo = gr.ChatInterface(
+            fn=respond,
+            title="BasicSmall ChatBot",
+            description="Демонстрация модели MarkProMaster229/BasicSmall. Напишите сообщение и нажмите Submit.",
+            examples=["Привет!", "Расскажи что-нибудь интересное", "Как дела?"],
+            theme="soft"
+        )
+        return demo
+    except Exception as e:
+        print(f"Критическая ошибка при создании интерфейса: {e}")
+        # Создаем простой интерфейс с сообщением об ошибке
+        def error_response(message, history):
+            return f"Модель не загружена. Ошибка: {str(e)}"
+        return gr.ChatInterface(
+            fn=error_response,
+            title="BasicSmall ChatBot (Ошибка)",
+            description="Не удалось загрузить модель. Проверьте файлы модели."
+        )
+# Создаем и запускаем интерфейс
 if __name__ == "__main__":
+    # Устанавливаем уровень логирования
+    import logging
+    logging.basicConfig(level=logging.INFO)
+    # Создаем интерфейс
+    demo = create_interface()
+    # Запускаем с параметрами для Hugging Face Spaces
+    demo.launch(
+        server_name="0.0.0.0",  # Обязательно для Spaces
+        server_port=7860,        # Стандартный порт для Spaces
+        share=False              # Не создавать публичную ссылку (в Spaces это не нужно)
+    )