Spaces:

trashchenkov
/

advantages

Sleeping

App Files Files Community

trashchenkov commited on Feb 21, 2025

Commit

71fe5dc

verified ·

1 Parent(s): 965b4c8

Update app.py

Browse files

Files changed (1) hide show

app.py +47 -91

app.py CHANGED Viewed

@@ -4,7 +4,6 @@ import pymorphy3
 import re
 import gradio as gr
 # Инициализация pymorphy3 (лемматизатор)
 morph = pymorphy3.MorphAnalyzer()
@@ -31,62 +30,36 @@ personalization_keywords = {
     "Стадия бизнеса Эксперт": ["максимизация", "высокий", "лимит", "снижение", "ставка", "комиссия", "выгода", "оптимизация"]
 }
-# Функция для классификации одного текста преимущества
-def classify_advantage(text, keywords_dict):
-    """
-    Возвращает список кортежей вида:
-    [
-      (category, { 'count': int, 'matched_lemmas': set([...]) }),
-      ...
-    ]
-    отсортированных по убыванию count.
-    """
-    lemmas = tokenize_and_lemmatize(text)
-    category_matches = {}
-    # Проходим по всем категориям и считаем число совпадений лемм
-    for category, keywords in keywords_dict.items():
-        matches = set(lemmas) & set(keywords)  # Пересечение множеств
-        if matches:
-            category_matches[category] = {
-                'count': len(matches),
-                'matched_lemmas': matches
-            }
-    # Сортируем категории по количеству совпадений (по убыванию)
-    sorted_matches = sorted(
-        category_matches.items(),
-        key=lambda x: x[1]['count'],
-        reverse=True
-    )
-    return sorted_matches
 # Глобальная переменная для хранения DataFrame
 df = None
 def load_excel(file):
-    """
-    Функция для загрузки Excel-файла.
-    Возвращает список уникальных продуктов и сообщение о статусе загрузки.
-    """
     global df
     if file is None:
         return [], "Файл не загружен. Загрузите Excel-файл."
     try:
-        # Читаем Excel в DataFrame
         df = pd.read_excel(file.name, usecols=["Продукт", "Преимущество"])
         unique_products = df["Продукт"].unique().tolist()
         return unique_products, "Файл успешно загружен!"
     except Exception as e:
         return [], f"Ошибка при чтении файла: {str(e)}"
 def analyze(product):
-    """
-    Функция, вызываемая при выборе продукта в выпадающем списке.
-    Анализирует все преимущества, соответствующие данному продукту,
-    и возвращает подробный отчёт и визуализацию графа.
-    """
     global df
     if df is None:
         return "Сначала загрузите файл.", None
@@ -94,24 +67,22 @@ def analyze(product):
     if not product:
         return "Пожалуйста, выберите продукт.", None
-    # Фильтруем DataFrame по выбранному продукту
     product_advantages = df[df["Продукт"] == product]["Преимущество"]
-    # Создаём граф
     graph_html = create_category_graph(product, product_advantages, personalization_keywords)
-    # Собираем результаты
     results = []
     for advantage in product_advantages:
         matches = classify_advantage(advantage, personalization_keywords)
-        # Формируем текстовый отчёт по каждому преимуществу
         advantage_text = f"**Преимущество**: {advantage}\n\n"
         advantage_text += f"**Леммы**: {tokenize_and_lemmatize(advantage)}\n\n"
         advantage_text += "**Совпадающие категории:**\n"
         if matches:
             for category, data in matches:
-                # Выводим и количество совпадений, и сами совпавшие леммы
                 matched_lemmas_str = ", ".join(sorted(data['matched_lemmas']))
                 advantage_text += f"- {category}: {data['count']} совпадений (леммы: {matched_lemmas_str})\n"
         else:
@@ -119,83 +90,68 @@ def analyze(product):
         advantage_text += "\n---\n"
         results.append(advantage_text)
-    if not results:
-        return "Для выбранного продукта не найдено преимуществ.", None
     return "\n".join(results), graph_html
 def create_category_graph(product, advantages, personalization_keywords):
-    """
-    Создаёт граф связей между продуктом, его преимуществами и категориями персонализации.
-    Возвращает HTML-код для отображения графа в iframe.
-    """
-    net = Network(notebook=False, height="500px", width="100%", directed=True, cdn_resources='in_line')  # Используем встроенные ресурсы
-    # Добавляем узел для продукта
     net.add_node(product, label=product, color="lightblue", size=30)
-    # Проходим по всем преимуществам продукта
     for advantage in advantages:
-        # Добавляем узел для преимущества
         net.add_node(advantage, label=advantage, color="orange", size=20)
-        net.add_edge(product, advantage)  # Связь продукта с преимуществом
-        # Анализируем преимущество и добавляем связи с категориями
         matches = classify_advantage(advantage, personalization_keywords)
         for category, data in matches:
             net.add_node(category, label=category, color="green", size=15)
-            net.add_edge(advantage, category)  # Связь преимущества с категорией
-    # Генерируем HTML-код для графа
     html = net.generate_html(notebook=False)
-    # Заменяем одинарные кавычки на двойные
-    html = html.replace("'", '&quot;')
-    # Возвращаем iframe с HTML-кодом графа
-    return f"""
     <iframe
-            width="100%"
-            height="600"
-            frameborder="0"
-            srcdoc='{html}'>
     </iframe>
     """
 with gr.Blocks() as demo:
     gr.Markdown("## Классификация преимуществ по признакам персонализации")
     gr.Markdown("**Шаг 1:** Загрузите Excel-файл с двумя столбцами: 'Продукт' и 'Преимущество'.")
     file_input = gr.File(label="Загрузите Excel-файл", file_types=[".xlsx"])
     load_button = gr.Button("Загрузить файл")
     load_status = gr.Markdown("")
-    gr.Markdown("**Шаг 2:** Выберите продукт из списка (по умолчанию ничего не выбрано).")
     product_dropdown = gr.Dropdown(choices=[], label="Продукты", value=None)
     analyze_button = gr.Button("Анализировать")
     output_text = gr.Markdown("")
     output_graph = gr.HTML(label="Визуализация графа")
-    # Логика при нажатии "Загрузить файл"
     def on_file_upload(file):
         unique_products, status_message = load_excel(file)
         return gr.update(choices=unique_products), status_message
     load_button.click(
         fn=on_file_upload,
         inputs=file_input,
         outputs=[product_dropdown, load_status]
     )
-    # Логика при нажатии "Анализировать"
     analyze_button.click(
         fn=analyze,
         inputs=product_dropdown,
         outputs=[output_text, output_graph]
     )
-# Запускаем демо
 if __name__ == "__main__":
-    demo.launch(debug=True)

 import re
 import gradio as gr
 # Инициализация pymorphy3 (лемматизатор)
 morph = pymorphy3.MorphAnalyzer()
     "Стадия бизнеса Эксперт": ["максимизация", "высокий", "лимит", "снижение", "ставка", "комиссия", "выгода", "оптимизация"]
 }
 # Глобальная переменная для хранения DataFrame
 df = None
 def load_excel(file):
     global df
     if file is None:
         return [], "Файл не загружен. Загрузите Excel-файл."
     try:
         df = pd.read_excel(file.name, usecols=["Продукт", "Преимущество"])
         unique_products = df["Продукт"].unique().tolist()
         return unique_products, "Файл успешно загружен!"
     except Exception as e:
         return [], f"Ошибка при чтении файла: {str(e)}"
+def classify_advantage(text, keywords_dict):
+    lemmas = tokenize_and_lemmatize(text)
+    category_matches = {}
+    for category, keywords in keywords_dict.items():
+        matches = set(lemmas) & set(keywords)
+        if matches:
+            category_matches[category] = {
+                'count': len(matches),
+                'matched_lemmas': matches
+            }
+    sorted_matches = sorted(category_matches.items(), key=lambda x: x[1]['count'], reverse=True)
+    return sorted_matches
 def analyze(product):
     global df
     if df is None:
         return "Сначала загрузите файл.", None
     if not product:
         return "Пожалуйста, выберите продукт.", None
     product_advantages = df[df["Продукт"] == product]["Преимущество"]
+    if product_advantages.empty:
+        return "Для выбранного продукта не найдено преимуществ.", None
     graph_html = create_category_graph(product, product_advantages, personalization_keywords)
     results = []
     for advantage in product_advantages:
         matches = classify_advantage(advantage, personalization_keywords)
         advantage_text = f"**Преимущество**: {advantage}\n\n"
         advantage_text += f"**Леммы**: {tokenize_and_lemmatize(advantage)}\n\n"
         advantage_text += "**Совпадающие категории:**\n"
         if matches:
             for category, data in matches:
                 matched_lemmas_str = ", ".join(sorted(data['matched_lemmas']))
                 advantage_text += f"- {category}: {data['count']} совпадений (леммы: {matched_lemmas_str})\n"
         else:
         advantage_text += "\n---\n"
         results.append(advantage_text)
     return "\n".join(results), graph_html
 def create_category_graph(product, advantages, personalization_keywords):
+    net = Network(height="500px", width="100%", directed=True, cdn_resources='in_line')
     net.add_node(product, label=product, color="lightblue", size=30)
     for advantage in advantages:
         net.add_node(advantage, label=advantage, color="orange", size=20)
+        net.add_edge(product, advantage)
         matches = classify_advantage(advantage, personalization_keywords)
         for category, data in matches:
             net.add_node(category, label=category, color="green", size=15)
+            net.add_edge(advantage, category)
     html = net.generate_html(notebook=False)
+    html_escaped = html.replace('"', '&quot;').replace("'", "&#39;")
+    iframe_html = f"""
     <iframe
+        width="100%"
+        height="600"
+        frameborder="0"
+        srcdoc="{html_escaped}">
     </iframe>
     """
+    print("Generated HTML:", iframe_html[:500])  # Выводим первые 500 символов для отладки
+    return iframe_html
 with gr.Blocks() as demo:
     gr.Markdown("## Классификация преимуществ по признакам персонализации")
     gr.Markdown("**Шаг 1:** Загрузите Excel-файл с двумя столбцами: 'Продукт' и 'Преимущество'.")
     file_input = gr.File(label="Загрузите Excel-файл", file_types=[".xlsx"])
     load_button = gr.Button("Загрузить файл")
     load_status = gr.Markdown("")
+    gr.Markdown("**Шаг 2:** Выберите продукт из списка.")
     product_dropdown = gr.Dropdown(choices=[], label="Продукты", value=None)
     analyze_button = gr.Button("Анализировать")
     output_text = gr.Markdown("")
     output_graph = gr.HTML(label="Визуализация графа")
     def on_file_upload(file):
         unique_products, status_message = load_excel(file)
         return gr.update(choices=unique_products), status_message
     load_button.click(
         fn=on_file_upload,
         inputs=file_input,
         outputs=[product_dropdown, load_status]
     )
     analyze_button.click(
         fn=analyze,
         inputs=product_dropdown,
         outputs=[output_text, output_graph]
     )
 if __name__ == "__main__":
+    demo.launch(debug=True)