Spaces:

AugustLight
/

LLight-3.2-3b-Instruct

Sleeping

App Files Files Community

AugustLight commited on Oct 26, 2024

Commit

9f5efd5

verified ·

1 Parent(s): 437bce8

Update app.py

Browse files

Files changed (1) hide show

app.py +1 -5

app.py CHANGED Viewed

@@ -11,7 +11,6 @@ def load_model():
     try:
         print("Начинаем загрузку модели из Hub...")
-        # Загружаем файл модели из Hub
         model_path = hf_hub_download(
             repo_id="AugustLight/LLight-3.2-3B-Instruct",
             filename="Llight.Q8_0.gguf",
@@ -20,7 +19,6 @@ def load_model():
         print(f"Модель загружена в: {model_path}")
-        # Инициализируем модель через llama-cpp
         model = Llama(
             model_path=model_path,
             n_ctx=2048,        # Размер контекста
@@ -41,7 +39,6 @@ def respond(message, history, system_message, max_new_tokens, temperature, top_p
         if model is None:
             model = load_model()
-        # Формируем контекст из истории
         context = f"{system_message}\n\n"
         for user_msg, assistant_msg in history:
             context += f"User: {user_msg}\nAssistant: {assistant_msg}\n"
@@ -49,7 +46,6 @@ def respond(message, history, system_message, max_new_tokens, temperature, top_p
         print(f"Генерируем ответ для контекста длиной {len(context)} символов")
-        # Генерируем ответ используя llama-cpp
         response = model(
             prompt=context,
             max_tokens=max_new_tokens,
@@ -73,7 +69,7 @@ demo = gr.ChatInterface(
     respond,
     additional_inputs=[
         gr.Textbox(
-            value="Ты дружелюбный и полезный ассистент. Ты всегда отвечаешь кратко и по делу.",
             label="System message"
         ),
         gr.Slider(

     try:
         print("Начинаем загрузку модели из Hub...")
         model_path = hf_hub_download(
             repo_id="AugustLight/LLight-3.2-3B-Instruct",
             filename="Llight.Q8_0.gguf",
         print(f"Модель загружена в: {model_path}")
         model = Llama(
             model_path=model_path,
             n_ctx=2048,        # Размер контекста
         if model is None:
             model = load_model()
         context = f"{system_message}\n\n"
         for user_msg, assistant_msg in history:
             context += f"User: {user_msg}\nAssistant: {assistant_msg}\n"
         print(f"Генерируем ответ для контекста длиной {len(context)} символов")
         response = model(
             prompt=context,
             max_tokens=max_new_tokens,
     respond,
     additional_inputs=[
         gr.Textbox(
+            value="Ты дружелюбный и полезный ассистент. Отвечай обдуманно и по делу.",
             label="System message"
         ),
         gr.Slider(