Spaces:

VOIDER
/

VisualQuality-R1-7B

Build error

App Files Files Community

VOIDER commited on Jan 6

Commit

d7d7f03

verified ·

1 Parent(s): 578ee8e

Update app.py

Browse files

Files changed (1) hide show

app.py +27 -16

app.py CHANGED Viewed

@@ -2,20 +2,19 @@ import os
 import sys
 import subprocess
-# --- ХАК ДЛЯ УСТАНОВКИ LLAMA-CPP-PYTHON ---
-# Устанавливаем библиотеку при запуске, чтобы избежать компиляции во время сборки Space
 try:
     import llama_cpp
-    print("llama-cpp-python уже установлен.")
 except ImportError:
-    print("Установка llama-cpp-python из пресобранного wheel (CPU)...")
-    # Используем pre-built wheel для Linux x86_64 (избегаем компиляции)
     subprocess.check_call([
         sys.executable, "-m", "pip", "install",
-        "llama-cpp-python",
-        "--extra-index-url", "https://abetlen.github.io/llama-cpp-python/whl/cpu"
     ])
-    print("Установка завершена!")
     import llama_cpp
 # ------------------------------------------
@@ -41,16 +40,17 @@ def load_model():
                 repo_id=REPO_ID,
                 filename=MODEL_FILENAME
             )
             llm = Llama(
                 model_path=model_path,
-                n_ctx=8192,
-                n_gpu_layers=0,
                 verbose=True,
                 chat_format="chatml-function-calling"
             )
             print("Модель успешно загружена!")
         except Exception as e:
-            print(f"Ошибка загрузки: {e}")
             raise e
     return llm
@@ -63,7 +63,8 @@ def evaluate_image(image, progress=gr.Progress()):
     if image is None:
         return "Пожалуйста, загрузите изображение.", ""
-    # Ленивая загрузка модели при первом запросе
     model = load_model()
     system_prompt = "You are doing the image quality assessment task."
@@ -74,6 +75,7 @@ def evaluate_image(image, progress=gr.Progress()):
         "Please only output the final answer with only one score in <answer> </answer> tags."
     )
     base64_image = image_to_base64(image)
     image_url = f"data:image/jpeg;base64,{base64_image}"
@@ -91,9 +93,10 @@ def evaluate_image(image, progress=gr.Progress()):
     full_response = ""
     print("Начало генерации...")
     stream = model.create_chat_completion(
         messages=messages,
-        max_tokens=1024,
         temperature=0.6,
         stream=True
     )
@@ -104,16 +107,19 @@ def evaluate_image(image, progress=gr.Progress()):
             if "content" in delta and delta["content"]:
                 content = delta["content"]
                 full_response += content
                 yield full_response, "Вычисляется..."
     score_match = re.search(r'<answer>\s*([\d\.]+)\s*</answer>', full_response)
     final_score = score_match.group(1) if score_match else "Не найдено"
     yield full_response, final_score
 with gr.Blocks(title="VisualQuality-R1 (Q8 GGUF)") as demo:
     gr.Markdown("# 👁️ VisualQuality-R1 (7B Q8)")
-    gr.Markdown("Оценка качества изображений (Chain of Thought). Работает на CPU.")
     with gr.Row():
         with gr.Column():
@@ -122,9 +128,14 @@ with gr.Blocks(title="VisualQuality-R1 (Q8 GGUF)") as demo:
         with gr.Column():
             output_score = gr.Label(label="Итоговая оценка")
-            output_text = gr.Textbox(label="Ход мыслей (CoT)", lines=15, show_copy_button=True)
-    run_btn.click(evaluate_image, inputs=[input_img], outputs=[output_text, output_score])
 if __name__ == "__main__":
     demo.queue().launch()

 import sys
 import subprocess
+# --- БЛОК УСТАНОВКИ БИБЛИОТЕК ПРИ ЗАПУСКЕ ---
+# Это позволяет избежать ошибок сборки и компилировать библиотеку уже в работающем контейнере
 try:
     import llama_cpp
+    print("Библиотека llama-cpp-python уже установлена.")
 except ImportError:
+    print("Установка llama-cpp-python... (Это может занять пару минут при первом запуске)")
+    # Устанавливаем версию 0.3.16 (или новее), которая поддерживает Qwen2-VL
     subprocess.check_call([
         sys.executable, "-m", "pip", "install",
+        "llama-cpp-python"
     ])
+    print("Установка завершена! Запускаем приложение...")
     import llama_cpp
 # ------------------------------------------
                 repo_id=REPO_ID,
                 filename=MODEL_FILENAME
             )
+            # Инициализация модели
             llm = Llama(
                 model_path=model_path,
+                n_ctx=8192,           # Контекст
+                n_gpu_layers=0,       # 0 слоев на GPU (работаем на CPU)
                 verbose=True,
                 chat_format="chatml-function-calling"
             )
             print("Модель успешно загружена!")
         except Exception as e:
+            print(f"Ошибка загрузки модели: {e}")
             raise e
     return llm
     if image is None:
         return "Пожалуйста, загрузите изображение.", ""
+    # Загружаем модель только когда пользователь нажмет кнопку (экономит память при старте)
+    progress(0, desc="Загрузка модели...")
     model = load_model()
     system_prompt = "You are doing the image quality assessment task."
         "Please only output the final answer with only one score in <answer> </answer> tags."
     )
+    progress(0.2, desc="Обработка изображения...")
     base64_image = image_to_base64(image)
     image_url = f"data:image/jpeg;base64,{base64_image}"
     full_response = ""
     print("Начало генерации...")
+    # Запуск генерации
     stream = model.create_chat_completion(
         messages=messages,
+        max_tokens=2048, # Увеличил лимит токенов для длинных рассуждений
         temperature=0.6,
         stream=True
     )
             if "content" in delta and delta["content"]:
                 content = delta["content"]
                 full_response += content
+                # Стримим ответ в текстовое поле
                 yield full_response, "Вычисляется..."
+    # Поиск оценки в ответе
     score_match = re.search(r'<answer>\s*([\d\.]+)\s*</answer>', full_response)
     final_score = score_match.group(1) if score_match else "Не найдено"
     yield full_response, final_score
+# Интерфейс
 with gr.Blocks(title="VisualQuality-R1 (Q8 GGUF)") as demo:
     gr.Markdown("# 👁️ VisualQuality-R1 (7B Q8)")
+    gr.Markdown("Оценка качества изображений. Запущено на CPU, генерация может занять 1-2 минуты.")
     with gr.Row():
         with gr.Column():
         with gr.Column():
             output_score = gr.Label(label="Итоговая оценка")
+            # Исправлено: убрал аргумент show_copy_button, вызывавший ошибку
+            output_text = gr.Textbox(label="Ход мыслей (CoT) и ответ", lines=15)
+    run_btn.click(
+        fn=evaluate_image,
+        inputs=[input_img],
+        outputs=[output_text, output_score]
+    )
 if __name__ == "__main__":
     demo.queue().launch()