Vilyam888
/

Code_analyze.1.0

@@ -21,11 +21,23 @@ widget:
 # Code Analyzer Model
-Fine-tuned версия модели Qwen2.5-Coder-3B-Instruct для анализа кода и ответов на вопросы о программировании.
 ## Описание модели
-Эта модель была обучена на датасете ITOG для анализа кода и предоставления ответов на вопросы, связанные с программированием. Модель основана на Qwen2.5-Coder-3B-Instruct и дообучена с использованием LoRA (Low-Rank Adaptation).
 ## Быстрый старт
@@ -40,13 +52,23 @@ Fine-tuned версия модели Qwen2.5-Coder-3B-Instruct для анали
 Если опция "Inference" не отображается в меню "Use this model", создайте интерактивный Gradio Space:
-1. Перейдите на https://huggingface.co/spaces
-2. Нажмите "Create new Space"
-3. Выберите SDK: **Gradio**
-4. Загрузите файлы `app.py` и `requirements.txt` из этой модели
-5. Space автоматически создаст интерактивный интерфейс!
-Подробные инструкции в файле `README_SPACE.md`
 ### Вариант 2: Использование локально (Python)
@@ -57,22 +79,54 @@ pip install transformers torch
 **Простой пример использования:**
 ```python
-from transformers import pipeline
-# Создаем pipeline для генерации текста
-generator = pipeline(
-    "text-generation",
-    model="Vilyam888/Code_analyze.1.0",
     trust_remote_code=True
 )
-# Задаем вопрос
-prompt = "Проанализируй этот код:\ndef hello():\n    print('Hello, World!')"
-text = f"{prompt}\n\nОтвет:\n"
-# Генерируем ответ
-result = generator(text, max_new_tokens=512, temperature=0.7)
-print(result[0]["generated_text"])
 ```
 **Или используйте готовые скрипты из репозитория:**

 # Code Analyzer Model
+Fine-tuned версия модели Qwen2.5-Coder-3B-Instruct для анализа кода студента на основе условия задачи.
 ## Описание модели
+Эта модель была обучена на датасете ITOG для анализа кода студента. Модель принимает:
+- **Условие задачи** (текстовое описание)
+- **Код решения студента** (Python код)
+И возвращает детальный анализ в формате JSON, включающий:
+- Оценку правильности решения
+- Анализ соответствия требованиям задачи
+- Оценку качества кода
+- Сильные и слабые стороны решения
+- Рекомендации по улучшению
+- Детальный анализ с обоснованием
+Модель основана на Qwen2.5-Coder-3B-Instruct и дообучена с использованием LoRA (Low-Rank Adaptation).
 ## Быстрый старт
 Если опция "Inference" не отображается в меню "Use this model", создайте интерактивный Gradio Space:
+**Быстрая инструкция:**
+1. Перейдите на https://huggingface.co/spaces
+2. Нажмите **"Create new Space"**
+3. Заполните форму:
+   - **Space name**: `code-analyzer-demo` (или любое другое)
+   - **SDK**: выберите **Gradio**
+   - **Hardware**: **CPU Basic** (бесплатно)
+   - **Visibility**: **Public**
+4. Нажмите **"Create Space"**
+5. Загрузите файлы:
+   - `app.py` (из этой модели)
+   - `requirements_gradio.txt` → переименуйте в `requirements.txt`
+6. Дождитесь автоматического запуска (2-5 минут)
+7. Готово! Интерфейс будет доступен на странице Space
+**Подробная инструкция:** См. файл `GRADIO_SPACE_INSTRUCTIONS.md` в корне проекта
 ### Вариант 2: Использование локально (Python)
 **Простой пример использования:**
 ```python
+from transformers import AutoModelForCausalLM, AutoTokenizer
+import torch
+import json
+model_name = "Vilyam888/Code_analyze.1.0"
+# Загрузка модели
+tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
+model = AutoModelForCausalLM.from_pretrained(
+    model_name,
+    torch_dtype=torch.bfloat16,
+    device_map="auto",
     trust_remote_code=True
 )
+# Условие задачи
+task = "Напишите функцию, которая принимает список чисел и возвращает сумму всех элементов."
+# Код студента
+code = """def sum_list(numbers):
+    total = 0
+    for num in numbers:
+        total += num
+    return total"""
+# Форматирование входа
+input_text = f"Задача:\n{task}\n\nРешение (код):\n```python\n{code}\n```"
+prompt = f"{input_text}\n\nОтвет:\n"
+# Генерация анализа
+inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
+with torch.no_grad():
+    outputs = model.generate(
+        **inputs,
+        max_new_tokens=1024,
+        temperature=0.7,
+        top_p=0.8,
+        top_k=20,
+        repetition_penalty=1.05,
+        do_sample=True
+    )
+# Декодирование и парсинг JSON
+response = tokenizer.decode(outputs[0], skip_special_tokens=True)
+result = response.split("Ответ:")[-1].strip()
+analysis = json.loads(result)
+print(json.dumps(analysis, ensure_ascii=False, indent=2))
 ```
 **Или используйте готовые скрипты из репозитория:**

README_SPACE.md ADDED Viewed

	@@ -0,0 +1,27 @@

+# Как создать Gradio Space для интерактивного использования
+Если опция "Inference" не появляется в меню "Use this model", создайте Gradio Space:
+## Шаг 1: Создайте новый Space на Hugging Face
+1. Перейдите на https://huggingface.co/spaces
+2. Нажмите "Create new Space"
+3. Заполните:
+   - **Space name**: `code-analyzer-demo` (или любое другое имя)
+   - **SDK**: выберите **Gradio**
+   - **Hardware**: выберите **CPU Basic** (бесплатно) или **GPU** (если доступно)
+   - **Visibility**: Public
+## Шаг 2: Загрузите файлы
+Загрузите в Space следующие файлы:
+- `app.py` (из этой папки)
+- `requirements_gradio.txt` (переименуйте в `requirements.txt`)
+## Шаг 3: Дождитесь запуска
+Space автоматически запустится и создаст интерактивный интерфейс для вашей модели!
+## Альтернатива: Используйте виджет на странице модели
+На странице модели должен быть виджет внизу страницы, даже если опция "Inference" не в меню.

app.py CHANGED Viewed

@@ -1,10 +1,11 @@
 """
 Gradio Space для интерактивного использования модели Code Analyzer
-Загрузите этот файл в Hugging Face Space для создания интерактивного интерфейса
 """
 import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
 # Загрузка модели (будет выполнена при первом запуске)
 MODEL_NAME = "Vilyam888/Code_analyze.1.0"
@@ -23,28 +24,41 @@ def load_model():
 # Глобальные переменные для модели
 model, tokenizer = None, None
-def analyze_code(question):
-    """Генерирует ответ на вопрос"""
     global model, tokenizer
     if model is None or tokenizer is None:
         return "⏳ Загрузка модели... Пожалуйста, подождите."
-    if not question.strip():
-        return "Пожалуйста, введите вопрос."
     try:
-        # Форматирование в стиле обучения
-        text = f"{question}\n\nОтвет:\n"
         # Токенизация
-        inputs = tokenizer(text, return_tensors="pt").to(model.device)
         # Генерация ответа
         with torch.no_grad():
             outputs = model.generate(
                 **inputs,
-                max_new_tokens=512,
                 temperature=0.7,
                 top_p=0.8,
                 top_k=20,
@@ -56,13 +70,21 @@ def analyze_code(question):
         # Декодирование ответа
         response = tokenizer.decode(outputs[0], skip_special_tokens=True)
-        # Извлечение только ответа
         if "Ответ:" in response:
-            answer = response.split("Ответ:")[-1].strip()
         else:
-            answer = response
-        return answer
     except Exception as e:
         return f"❌ Ошибка: {str(e)}"
@@ -71,55 +93,80 @@ with gr.Blocks(title="Code Analyzer Model", theme=gr.themes.Soft()) as demo:
     gr.Markdown("""
     # 🔍 Code Analyzer Model
-    Fine-tuned модель для анализа кода и ответов на вопросы о программировании.
-    **Примеры вопросов:**
-    - Проанализируй этот код: `def hello(): print('Hello, World!')`
-    - Объясни, что делает эта функция: `def factorial(n): ...`
-    - Найди ошибку в коде: `def divide(a, b): return a / b`
     """)
     with gr.Row():
         with gr.Column():
-            question_input = gr.Textbox(
-                label="Ваш вопрос",
-                placeholder="Введите вопрос о коде...",
                 lines=5
             )
-            submit_btn = gr.Button("Анализировать", variant="primary")
         with gr.Column():
-            answer_output = gr.Textbox(
-                label="Ответ модели",
-                lines=10,
                 interactive=False
             )
     # Примеры
     gr.Examples(
         examples=[
-            ["Проанализируй этот код:\ndef hello():\n    print('Hello, World!')"],
-            ["Объясни, что делает эта функция:\ndef factorial(n):\n    if n <= 1:\n        return 1\n    return n * factorial(n-1)"],
-            ["Найди ошибку в коде:\ndef divide(a, b):\n    return a / b\n\nresult = divide(10, 0)"],
         ],
-        inputs=question_input
     )
     # Загрузка модели при старте
     demo.load(load_model, outputs=None)
     # Обработчик кнопки
     submit_btn.click(
-        fn=analyze_code,
-        inputs=question_input,
-        outputs=answer_output
     )
-    # Обработчик Enter
-    question_input.submit(
-        fn=analyze_code,
-        inputs=question_input,
-        outputs=answer_output
     )
 if __name__ == "__main__":

 """
 Gradio Space для интерактивного использования модели Code Analyzer
+Модель анализирует код студента на основе условия задачи
 """
 import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
+import json
 # Загрузка модели (будет выполнена при первом запуске)
 MODEL_NAME = "Vilyam888/Code_analyze.1.0"
 # Глобальные переменные для модели
 model, tokenizer = None, None
+def build_input(task, code):
+    """Форматирует вход в том же формате, что использовался при обучении"""
+    parts = []
+    if task.strip():
+        parts.append(f"Задача:\n{task.strip()}")
+    if code.strip():
+        parts.append(f"Решение (код):\n```python\n{code.strip()}\n```")
+    return "\n\n".join(parts)
+def analyze_code(task, code):
+    """Анализирует код студента и возвращает результат в формате JSON"""
     global model, tokenizer
     if model is None or tokenizer is None:
         return "⏳ Загрузка модели... Пожалуйста, подождите."
+    if not task.strip():
+        return "❌ Пожалуйста, введите условие задачи."
+    if not code.strip():
+        return "❌ Пожалуйста, введите код решения студента."
     try:
+        # Форматирование входа в стиле обучения
+        input_text = build_input(task, code)
+        prompt = f"{input_text}\n\nОтвет:\n"
         # Токенизация
+        inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
         # Генерация ответа
         with torch.no_grad():
             outputs = model.generate(
                 **inputs,
+                max_new_tokens=1024,  # Увеличено для JSON ответа
                 temperature=0.7,
                 top_p=0.8,
                 top_k=20,
         # Декодирование ответа
         response = tokenizer.decode(outputs[0], skip_special_tokens=True)
+        # Извлечение JSON ответа
         if "Ответ:" in response:
+            json_str = response.split("Ответ:")[-1].strip()
         else:
+            json_str = response
+        # Попытка распарсить JSON
+        try:
+            result = json.loads(json_str)
+            # Форматируем JSON для красивого отображения
+            return json.dumps(result, ensure_ascii=False, indent=2)
+        except json.JSONDecodeError:
+            # Если не JSON, возвращаем как есть
+            return json_str
     except Exception as e:
         return f"❌ Ошибка: {str(e)}"
     gr.Markdown("""
     # 🔍 Code Analyzer Model
+    Модель для анализа кода студента на основе условия задачи.
+    **Как использовать:**
+    1. Введите условие задачи в первое поле
+    2. Введите код решения студента во второе поле
+    3. Нажмите "Анализировать код"
+    4. Получите детальный анализ в формате JSON
     """)
     with gr.Row():
         with gr.Column():
+            task_input = gr.Textbox(
+                label="Условие задачи",
+                placeholder="Введите условие задачи...",
                 lines=5
             )
+            code_input = gr.Textbox(
+                label="Код решения студента",
+                placeholder="Введите код решения...",
+                lines=10
+            )
+            submit_btn = gr.Button("Анализировать код", variant="primary", size="lg")
         with gr.Column():
+            result_output = gr.JSON(
+                label="Результат анализа",
+                label_visibility="visible"
+            )
+            # Также показываем как текст для удобства копирования
+            result_text = gr.Textbox(
+                label="Результат (JSON текст)",
+                lines=15,
                 interactive=False
             )
     # Примеры
     gr.Examples(
         examples=[
+            [
+                "Напишите функцию, которая принимает список чисел и возвращает сумму всех элементов.",
+                "def sum_list(numbers):\n    total = 0\n    for num in numbers:\n        total += num\n    return total"
+            ],
+            [
+                "Создайте функцию для вычисления факториала числа.",
+                "def factorial(n):\n    if n <= 1:\n        return 1\n    return n * factorial(n-1)"
+            ],
         ],
+        inputs=[task_input, code_input]
     )
+    def analyze_and_format(task, code):
+        """Анализирует код и форматирует результат"""
+        result_str = analyze_code(task, code)
+        try:
+            result_json = json.loads(result_str)
+            return result_json, result_str
+        except:
+            return None, result_str
     # Загрузка модели при старте
     demo.load(load_model, outputs=None)
     # Обработчик кнопки
     submit_btn.click(
+        fn=analyze_and_format,
+        inputs=[task_input, code_input],
+        outputs=[result_output, result_text]
     )
+    # Обработчик Enter в поле кода
+    code_input.submit(
+        fn=analyze_and_format,
+        inputs=[task_input, code_input],
+        outputs=[result_output, result_text]
     )
 if __name__ == "__main__":

inference.py CHANGED Viewed

@@ -19,21 +19,33 @@ def load_model_and_tokenizer(model_name: str):
     return model, tokenizer
 def generate_response(
     model,
     tokenizer,
-    prompt: str,
-    max_new_tokens: int = 512,
     temperature: float = 0.7,
     top_p: float = 0.8,
     top_k: int = 20,
     repetition_penalty: float = 1.05,
 ):
-    """Generate response for a given prompt"""
-    # Format prompt in training style
-    text = f"{prompt}\n\nОтвет:\n"
-    inputs = tokenizer(text, return_tensors="pt").to(model.device)
     with torch.no_grad():
         outputs = model.generate(
@@ -57,15 +69,31 @@ def generate_response(
 if __name__ == "__main__":
     # Example usage
     model_name = "Vilyam888/Code_analyze.1.0"
     print("Loading model...")
     model, tokenizer = load_model_and_tokenizer(model_name)
-    prompt = "Проанализируй этот код:\ndef hello():\n    print('Hello, World!')"
-    print(f"\nPrompt: {prompt}\n")
-    print("Generating response...")
-    response = generate_response(model, tokenizer, prompt)
-    print(f"\nResponse: {response}")

     return model, tokenizer
+def build_input(task, code):
+    """Build input in the same format as used during training"""
+    parts = []
+    if task.strip():
+        parts.append(f"Задача:\n{task.strip()}")
+    if code.strip():
+        parts.append(f"Решение (код):\n```python\n{code.strip()}\n```")
+    return "\n\n".join(parts)
 def generate_response(
     model,
     tokenizer,
+    task: str,
+    code: str,
+    max_new_tokens: int = 1024,
     temperature: float = 0.7,
     top_p: float = 0.8,
     top_k: int = 20,
     repetition_penalty: float = 1.05,
 ):
+    """Generate analysis response for task and student code"""
+    # Format input in training style
+    input_text = build_input(task, code)
+    prompt = f"{input_text}\n\nОтвет:\n"
+    inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
     with torch.no_grad():
         outputs = model.generate(
 if __name__ == "__main__":
     # Example usage
+    import json
     model_name = "Vilyam888/Code_analyze.1.0"
     print("Loading model...")
     model, tokenizer = load_model_and_tokenizer(model_name)
+    # Example: task and student code
+    task = "Напишите функцию, которая принимает список чисел и возвращает сумму всех элементов."
+    code = """def sum_list(numbers):
+    total = 0
+    for num in numbers:
+        total += num
+    return total"""
+    print(f"\nЗадача: {task}")
+    print(f"\nКод студента:\n{code}\n")
+    print("Generating analysis...")
+    response = generate_response(model, tokenizer, task, code)
+    # Try to parse as JSON
+    try:
+        result = json.loads(response)
+        print(f"\nРезультат анализа (JSON):")
+        print(json.dumps(result, ensure_ascii=False, indent=2))
+    except json.JSONDecodeError:
+        print(f"\nРезультат анализа:\n{response}")