Spaces:

Yermek68
/

eroha-agentapi

Sleeping

App Files Files Community

Yermek68 commited on 22 days ago

Commit

206e908

verified ·

1 Parent(s): 0a66e53

Update app.py

Browse files

Files changed (1) hide show

app.py +43 -41

app.py CHANGED Viewed

@@ -7,13 +7,11 @@ from docx import Document
 from fpdf import FPDF
 from langdetect import detect
 import urllib.request
-import gradio.themes as gt
-# === 🗂️ Создание папок и установка шрифта ===
 os.makedirs("/app/models", exist_ok=True)
 FONT_PATH = "DejaVuSans.ttf"
-# Если шрифт отсутствует — скачиваем
 if not os.path.exists(FONT_PATH):
     print("⬇️ Загружаю шрифт DejaVuSans.ttf ...")
     urllib.request.urlretrieve(
@@ -21,7 +19,7 @@ if not os.path.exists(FONT_PATH):
         FONT_PATH
     )
-# === ⚙️ Загрузка моделей один раз при запуске ===
 def load_model(task, model_name):
     print(f"🔹 Загружается модель: {model_name}")
     return pipeline(task, model=model_name, cache_dir="/app/models")
@@ -32,13 +30,12 @@ summarizers = {
     "kz": load_model("summarization", "csebuetnlp/mT5_multilingual_XLSum")
 }
-# === 📄 Функция чтения текстов из файлов ===
 def read_file(file):
     if not file:
         return ""
     filename = file.name.lower()
     text = ""
     try:
         if filename.endswith(".pdf"):
             with pdfplumber.open(file.name) as pdf:
@@ -52,7 +49,6 @@ def read_file(file):
             text = file.read().decode("utf-8", errors="ignore")
     except Exception as e:
         return f"⚠️ Ошибка при чтении файла: {e}"
     return text.strip()
 # === 🌐 Определение языка ===
@@ -68,18 +64,17 @@ def detect_language(text):
     except:
         return "en"
-# === 🧠 Суммаризация текста ===
 def summarize_text(text):
     if not text or len(text) < 50:
         return "⚠️ Недостаточно текста для анализа.", "❌", "❌", 0, 0, "❌"
     lang = detect_language(text)
     model = summarizers.get(lang, summarizers["en"])
     flags = {"ru": "🇷🇺 Русский", "kz": "🇰🇿 Қазақ тілі", "en": "🇬🇧 English"}
     lang_label = flags.get(lang, "🌍 Unknown")
     model_label = model.model.name_or_path if hasattr(model.model, "name_or_path") else "Custom"
     chunk_size = 2500
     overlap = 200
     summaries = []
@@ -99,7 +94,7 @@ def summarize_text(text):
     return summary, lang_label, model_label, src_len, sum_len, f"{compression}%"
-# === 💾 Сохранение файлов ===
 def save_summary_as_txt(summary_text):
     path = "summary.txt"
     with open(path, "w", encoding="utf-8") as f:
@@ -124,7 +119,7 @@ def save_summary_as_pdf(summary_text):
     pdf.output(path)
     return path
-# === 🚀 Главная функция обработки ===
 def summarize_file(file):
     text = read_file(file)
     if text.startswith("⚠️"):
@@ -141,34 +136,41 @@ def summarize_file(file):
     return summary, lang_label, model_label, src_len, sum_len, compression, txt_path, docx_path, pdf_path
-# === 🎨 Интерфейс Gradio ===
-custom_theme = gt.Default(
-    primary_hue="purple",
-    secondary_hue="violet",
-).set(
-    body_background_fill="#f8f6ff",
-    button_primary_background_fill="linear-gradient(90deg, #7e3ff2, #c084fc)",
-    button_primary_background_fill_hover="linear-gradient(90deg, #6b21a8, #9333ea)",
-)
-demo = gr.Interface(
-    fn=summarize_file,
-    inputs=gr.File(label="📂 Загрузите документ (.pdf, .docx, .txt)"),
-    outputs=[
-        gr.Textbox(label="🧾 Краткое резюме"),
-        gr.Textbox(label="🌍 Определённый язык"),
-        gr.Textbox(label="🧠 Используемая модель"),
-        gr.Number(label="📄 Длина исходного текста"),
-        gr.Number(label="📝 Длина резюме"),
-        gr.Textbox(label="📉 Степень сокращения"),
-        gr.File(label="📄 Скачать TXT"),
-        gr.File(label="📘 Скачать DOCX"),
-        gr.File(label="📕 Скачать PDF"),
-    ],
-    title="🧠 Eroha Summarizer PRO (Автономная версия)",
-    description="🚀 Определяет язык (🇷🇺 / 🇰🇿 / 🇬🇧), создаёт краткое резюме и сохраняет в TXT, DOCX, PDF с поддержкой кириллицы.",
-    theme=custom_theme,
-    allow_flagging="never"
-)
 demo.launch(server_name="0.0.0.0", server_port=7860)

 from fpdf import FPDF
 from langdetect import detect
 import urllib.request
+# === 🗂️ Подготовка окружения и шрифта ===
 os.makedirs("/app/models", exist_ok=True)
 FONT_PATH = "DejaVuSans.ttf"
 if not os.path.exists(FONT_PATH):
     print("⬇️ Загружаю шрифт DejaVuSans.ttf ...")
     urllib.request.urlretrieve(
         FONT_PATH
     )
+# === ⚙️ Загрузка моделей ===
 def load_model(task, model_name):
     print(f"🔹 Загружается модель: {model_name}")
     return pipeline(task, model=model_name, cache_dir="/app/models")
     "kz": load_model("summarization", "csebuetnlp/mT5_multilingual_XLSum")
 }
+# === 📄 Чтение документов ===
 def read_file(file):
     if not file:
         return ""
     filename = file.name.lower()
     text = ""
     try:
         if filename.endswith(".pdf"):
             with pdfplumber.open(file.name) as pdf:
             text = file.read().decode("utf-8", errors="ignore")
     except Exception as e:
         return f"⚠️ Ошибка при чтении файла: {e}"
     return text.strip()
 # === 🌐 Определение языка ===
     except:
         return "en"
+# === 🧠 Суммаризация ===
 def summarize_text(text):
     if not text or len(text) < 50:
         return "⚠️ Недостаточно текста для анализа.", "❌", "❌", 0, 0, "❌"
     lang = detect_language(text)
     model = summarizers.get(lang, summarizers["en"])
     flags = {"ru": "🇷🇺 Русский", "kz": "🇰🇿 Қазақ тілі", "en": "🇬🇧 English"}
     lang_label = flags.get(lang, "🌍 Unknown")
     model_label = model.model.name_or_path if hasattr(model.model, "name_or_path") else "Custom"
     chunk_size = 2500
     overlap = 200
     summaries = []
     return summary, lang_label, model_label, src_len, sum_len, f"{compression}%"
+# === 💾 Сохранение результатов ===
 def save_summary_as_txt(summary_text):
     path = "summary.txt"
     with open(path, "w", encoding="utf-8") as f:
     pdf.output(path)
     return path
+# === 🚀 Основная функция ===
 def summarize_file(file):
     text = read_file(file)
     if text.startswith("⚠️"):
     return summary, lang_label, model_label, src_len, sum_len, compression, txt_path, docx_path, pdf_path
+# === 🧩 Современный интерфейс через Blocks (Gradio 4.44+) ===
+with gr.Blocks(css=".gradio-container {max-width: 900px !important}") as demo:
+    gr.Markdown("## 🧠 Eroha Summarizer PRO (автономная версия)")
+    gr.Markdown("🚀 Определяет язык (🇷🇺 / 🇰🇿 / 🇬🇧), создаёт краткое резюме и сохраняет в TXT, DOCX, PDF с поддержкой кириллицы.")
+    with gr.Row():
+        file_input = gr.File(label="📂 Загрузите документ (.pdf, .docx, .txt)")
+    with gr.Row():
+        summary_output = gr.Textbox(label="🧾 Краткое резюме", lines=10)
+    with gr.Row():
+        lang_output = gr.Textbox(label="🌍 Определённый язык")
+        model_output = gr.Textbox(label="🧠 Используемая модель")
+    with gr.Row():
+        src_len = gr.Number(label="📄 Длина исходного текста")
+        sum_len = gr.Number(label="📝 Длина резюме")
+        compression = gr.Textbox(label="📉 Степень сокращения")
+    with gr.Row():
+        txt_file = gr.File(label="📄 TXT файл")
+        docx_file = gr.File(label="📘 DOCX файл")
+        pdf_file = gr.File(label="📕 PDF файл")
+    run_btn = gr.Button("🔍 Сгенерировать резюме", variant="primary")
+    run_btn.click(
+        summarize_file,
+        inputs=[file_input],
+        outputs=[
+            summary_output, lang_output, model_output,
+            src_len, sum_len, compression,
+            txt_file, docx_file, pdf_file
+        ]
+    )
 demo.launch(server_name="0.0.0.0", server_port=7860)