Spaces:

vydrking
/

test1

Sleeping

App Files Files Community

vydrking commited on Aug 15, 2025

Commit

490fb9e

verified ·

1 Parent(s): 53fe915

Upload 22 files

Browse files

Files changed (5) hide show

__pycache__/knowledge_base.cpython-310.pyc +0 -0
app.py +12 -0
app_simple_fixed.py +206 -0
chatbot.py +12 -2
test_data.py +24 -0

__pycache__/knowledge_base.cpython-310.pyc ADDED Viewed

Binary file (9.91 kB). View file

app.py CHANGED Viewed

@@ -26,6 +26,18 @@ def chat_with_bot(message, history):
         if not response or response.startswith('[') or len(response.strip()) < 5:
             response = 'К сожалению, не смог сгенерировать ответ. Попробуйте переформулировать вопрос.'
         return history + [[message, response]], ''
     except Exception as e:
         print(f'Ошибка в чате: {e}')

         if not response or response.startswith('[') or len(response.strip()) < 5:
             response = 'К сожалению, не смог сгенерировать ответ. Попробуйте переформулировать вопрос.'
+        # Убираем лишние скобки и форматирование
+        if response.startswith('[[') and response.endswith(']]'):
+            # Извлекаем только текст ответа из формата [['user', 'bot_response']]
+            try:
+                import ast
+                parsed = ast.literal_eval(response)
+                if isinstance(parsed, list) and len(parsed) > 0 and isinstance(parsed[0], list) and len(parsed[0]) > 1:
+                    response = parsed[0][1]
+            except:
+                # Если не удалось распарсить, берем как есть
+                pass
         return history + [[message, response]], ''
     except Exception as e:
         print(f'Ошибка в чате: {e}')

app_simple_fixed.py ADDED Viewed

	@@ -0,0 +1,206 @@

+import gradio as gr
+from knowledge_base import KnowledgeBase
+# Инициализация базы знаний
+kb = KnowledgeBase()
+def is_itmo_query(message):
+    itmo_keywords = [
+        'итмо', 'магистратура', 'учебный план', 'дисциплина', 'курс',
+        'ии', 'ai', 'ai product', 'институт ии', 'программа',
+        'машинное обучение', 'глубокое обучение', 'nlp', 'компьютерное зрение'
+    ]
+    message_lower = message.lower()
+    return any(keyword in message_lower for keyword in itmo_keywords)
+def simple_search(query, courses):
+    query_lower = query.lower()
+    results = []
+    for course in courses:
+        course_text = f"{course['name']} {course.get('short_desc', '')}".lower()
+        if any(word in course_text for word in query_lower.split()):
+            results.append(course)
+    return results[:3]  # Возвращаем топ-3 результата
+def chat_with_bot(message, history):
+    if not message.strip():
+        return history, ''
+    if not is_itmo_query(message):
+        return history + [[message, '''Похоже, вопрос не относится к магистратурам ITMO и их учебным планам.
+Попробуйте спросить, например:
+• "Какие дисциплины по NLP в 1 семестре программы ИИ?"
+• "Расскажи о программе AI Product"
+• "Какие курсы по машинному обучению есть в программе ИИ?"
+• "Сколько кредитов за дисциплину 'Глубокое обучение'?"''']], ''
+    results = simple_search(message, kb.courses)
+    if not results:
+        response = 'К сожалению, не нашел релевантной информации в учебных планах ITMO. Попробуйте переформулировать вопрос.'
+    else:
+        response = 'Найденные курсы:\n\n'
+        for i, course in enumerate(results, 1):
+            response += f'{i}. {course["name"]} ({course["semester"]} семестр, {course["credits"]} кредитов)\n'
+            if course.get('short_desc'):
+                response += f'   {course["short_desc"]}\n'
+            response += '\n'
+    return history + [[message, response]], ''
+def get_recommendations(programming_exp, math_level, interests, semester, skills):
+    if not semester:
+        return 'Пожалуйста, укажите семестр для получения рекомендаций.'
+    try:
+        semester = int(semester)
+    except ValueError:
+        return 'Пожалуйста, выберите корректный семестр.'
+    filtered_courses = kb.get_courses_by_semester(semester)
+    if not filtered_courses:
+        return f'К сожалению, не найдено курсов для {semester} семестра.'
+    # Простая логика рекомендаций
+    recommendations = []
+    for course in filtered_courses[:5]:  # Топ-5 курсов
+        score = 0
+        why_reasons = []
+        # Оценка по интересам
+        all_interests = interests + skills
+        matching_tags = [tag for tag in all_interests if tag in course.get('tags', [])]
+        if matching_tags:
+            score += 2
+            why_reasons.append(f'соответствует вашим интересам: {", ".join(matching_tags)}')
+        # Оценка по опыту программирования
+        if programming_exp >= 3 and any(tag in course.get('tags', []) for tag in ['ml', 'dl', 'systems']):
+            score += 1
+            why_reasons.append('подходит для вашего уровня программирования')
+        # Оценка по математике
+        if math_level >= 3 and any(tag in course.get('tags', []) for tag in ['math', 'stats', 'dl']):
+            score += 1
+            why_reasons.append('соответствует вашему уровню математики')
+        if score > 0:
+            recommendations.append({
+                'name': course['name'],
+                'credits': course['credits'],
+                'why': '; '.join(why_reasons) if why_reasons else 'курс из учебного плана программы'
+            })
+    if not recommendations:
+        # Если нет подходящих, показываем все курсы
+        for course in filtered_courses[:3]:
+            recommendations.append({
+                'name': course['name'],
+                'credits': course['credits'],
+                'why': 'курс из учебного плана программы'
+            })
+    result = f'🎯 Рекомендуемые курсы для {semester} семестра:\n\n'
+    for i, rec in enumerate(recommendations, 1):
+        result += f'{i}. {rec["name"]} ({rec["credits"]} кредитов)\n'
+        result += f'   {rec["why"]}\n\n'
+    return result
+def update_data_ui():
+    return 'Данные успешно обновлены! (Используются данные из базы знаний)'
+def update_data_thread():
+    return gr.update(value='Обновление данных...', interactive=False)
+with gr.Blocks(title='ITMO Магистратура - Чат-бот', theme=gr.themes.Soft()) as demo:
+    gr.Markdown('# 🤖 Чат-бот для абитуриентов магистратур ITMO')
+    gr.Markdown('Задавайте вопросы о программах ИИ и AI Product, получайте персональные рекомендации по курсам.')
+    with gr.Row():
+        with gr.Column(scale=2):
+            chatbot_interface = gr.ChatInterface(
+                chat_with_bot,
+                title='💬 Чат с ботом',
+                description='Спрашивайте о дисциплинах, программах, учебных планах',
+                examples=[
+                    'Какие дисциплины по NLP в 1 семестре программы ИИ?',
+                    'Расскажи о программе AI Product',
+                    'Какие курсы по машинному обучению есть в программе ИИ?',
+                    'Сколько кредитов за дисциплину "Глубокое обучение"?'
+                ]
+            )
+        with gr.Column(scale=1):
+            gr.Markdown('### 👤 Профиль для рекомендаций')
+            with gr.Row():
+                programming_exp = gr.Slider(
+                    minimum=0, maximum=5, value=2, step=1,
+                    label='Опыт программирования (0-5)',
+                    info='0 - нет опыта, 5 - эксперт'
+                )
+                math_level = gr.Slider(
+                    minimum=0, maximum=4, value=2, step=1,
+                    label='Уровень математики (0-4)',
+                    info='0 - базовый, 4 - продвинутый'
+                )
+            gr.Markdown('**Интересы:**')
+            interests = gr.CheckboxGroup(
+                choices=['ml', 'dl', 'nlp', 'cv', 'product', 'business', 'research', 'data', 'systems'],
+                value=['ml'],
+                label='Области интересов',
+                info='Выберите интересующие направления'
+            )
+            gr.Markdown('**Навыки:**')
+            skills = gr.CheckboxGroup(
+                choices=['python', 'java', 'sql', 'git', 'docker', 'aws', 'tensorflow', 'pytorch', 'scikit-learn'],
+                value=['python'],
+                label='Технические навыки',
+                info='Выберите имеющиеся навыки'
+            )
+            semester = gr.Dropdown(
+                choices=['1', '2', '3', '4'],
+                label='Целевой семестр',
+                info='Для получения рекомендаций'
+            )
+            recommend_btn = gr.Button('🎯 Получить рекомендации', variant='primary')
+            recommendations_output = gr.Textbox(
+                label='Рекомендации',
+                lines=12,
+                interactive=False
+            )
+            recommend_btn.click(
+                get_recommendations,
+                inputs=[programming_exp, math_level, interests, semester, skills],
+                outputs=recommendations_output
+            )
+    with gr.Row():
+        update_btn = gr.Button('🔄 Обновить данные', variant='secondary')
+        update_status = gr.Textbox(
+            label='Статус обновления',
+            interactive=False,
+            visible=False
+        )
+        update_btn.click(
+            update_data_thread,
+            outputs=update_status
+        ).then(
+            update_data_ui,
+            outputs=update_status
+        )
+if __name__ == '__main__':
+    demo.launch(server_name='0.0.0.0', server_port=7860)

chatbot.py CHANGED Viewed

@@ -107,12 +107,22 @@ class ITMOChatbot:
             answer = response[0]['generated_text'].strip()
-            # Очистка ответа
             if answer.startswith('Ответ:'):
                 answer = answer[6:].strip()
             elif answer.startswith('Бот:'):
                 answer = answer[4:].strip()
             # Проверяем, что ответ не пустой и не содержит технических деталей
             if answer and len(answer) > 10 and not answer.startswith('['):
                 return answer
@@ -158,7 +168,7 @@ class ITMOChatbot:
     def _build_prompt(self, message: str, context: List[Dict], history: List[List[str]]) -> str:
         # Системные инструкции
-        system_prompt = '''Ты - помощник для абитуриентов магистратур ITMO. Отвечай на вопросы о программах и курсах на основе предоставленного контекста. Отвечай кратко, дружелюбно и по делу. Если информации недостаточно, скажи об этом прямо.'''
         # История диалога (последние 3 хода)
         history_text = ''

             answer = response[0]['generated_text'].strip()
+            # Очистка ответа от лишних элементов
             if answer.startswith('Ответ:'):
                 answer = answer[6:].strip()
             elif answer.startswith('Бот:'):
                 answer = answer[4:].strip()
+            # Убираем лишние скобки и форматирование
+            if answer.startswith('[[') and answer.endswith(']]'):
+                try:
+                    import ast
+                    parsed = ast.literal_eval(answer)
+                    if isinstance(parsed, list) and len(parsed) > 0 and isinstance(parsed[0], list) and len(parsed[0]) > 1:
+                        answer = parsed[0][1]
+                except:
+                    answer = self._fallback_answer(context)
             # Проверяем, что ответ не пустой и не содержит технических деталей
             if answer and len(answer) > 10 and not answer.startswith('['):
                 return answer
     def _build_prompt(self, message: str, context: List[Dict], history: List[List[str]]) -> str:
         # Системные инструкции
+        system_prompt = '''Ты - помощник для абитуриентов магистратур ITMO. Отвечай на вопросы о программах и курсах на основе предоставленного контекста. Отвечай кратко, дружелюбно и по делу. Если информации недостаточно, скажи об этом прямо. НЕ используй скобки или специальное форматирование в ответе.'''
         # История диалога (последние 3 хода)
         history_text = ''

test_data.py ADDED Viewed

	@@ -0,0 +1,24 @@

+from knowledge_base import KnowledgeBase
+def test_data():
+    print("Тестирование базы знаний...")
+    kb = KnowledgeBase()
+    print(f"Курсов в базе: {len(kb.courses)}")
+    if kb.courses:
+        print("Первые 3 курса:")
+        for i, course in enumerate(kb.courses[:3], 1):
+            print(f"{i}. {course['name']} (семестр {course.get('semester', 'N/A')})")
+    else:
+        print("Курсы не найдены!")
+    print(f"Программ в базе: {len(kb.programs)}")
+    # Тест поиска по семестрам
+    for semester in [1, 2, 3, 4]:
+        courses = kb.get_courses_by_semester(semester)
+        print(f"Семестр {semester}: {len(courses)} курсов")
+if __name__ == '__main__':
+    test_data()