Spaces:

Yermek68
/

eroha-agentapi

Running

App Files Files Community

Yermek68 commited on 19 days ago

Commit

cbb7d22

verified ·

1 Parent(s): d93b7e1

Update app.py

Browse files

Files changed (1) hide show

app.py +32 -16

app.py CHANGED Viewed

@@ -7,17 +7,21 @@ from docx import Document
 from fpdf import FPDF
 from langdetect import detect
 import urllib.request
-# === Папки и шрифт ===
 os.makedirs("/app/models", exist_ok=True)
 FONT_PATH = "DejaVuSans.ttf"
 if not os.path.exists(FONT_PATH):
     urllib.request.urlretrieve(
         "https://github.com/dejavu-fonts/dejavu-fonts/raw/master/ttf/DejaVuSans.ttf",
         FONT_PATH
     )
-# === Загрузка моделей ===
 def load_model(task, model_name):
     print(f"🔹 Загружается модель: {model_name}")
     return pipeline(task, model=model_name, cache_dir="/app/models")
@@ -28,12 +32,13 @@ summarizers = {
     "kz": load_model("summarization", "csebuetnlp/mT5_multilingual_XLSum")
 }
-# === Чтение файлов ===
 def read_file(file):
     if not file:
         return ""
     filename = file.name.lower()
     text = ""
     try:
         if filename.endswith(".pdf"):
             with pdfplumber.open(file.name) as pdf:
@@ -47,9 +52,10 @@ def read_file(file):
             text = file.read().decode("utf-8", errors="ignore")
     except Exception as e:
         return f"⚠️ Ошибка при чтении файла: {e}"
     return text.strip()
-# === Определение языка ===
 def detect_language(text):
     try:
         lang = detect(text)
@@ -62,17 +68,18 @@ def detect_language(text):
     except:
         return "en"
-# === Суммаризация ===
 def summarize_text(text):
     if not text or len(text) < 50:
         return "⚠️ Недостаточно текста для анализа.", "❌", "❌", 0, 0, "❌"
     lang = detect_language(text)
     model = summarizers.get(lang, summarizers["en"])
     flags = {"ru": "🇷🇺 Русский", "kz": "🇰🇿 Қазақ тілі", "en": "🇬🇧 English"}
     lang_label = flags.get(lang, "🌍 Unknown")
-    model_label = model.model.name_or_path if hasattr(model.model, "name_or_path") else "Custom"
     chunk_size = 2500
     overlap = 200
     summaries = []
@@ -92,7 +99,7 @@ def summarize_text(text):
     return summary, lang_label, model_label, src_len, sum_len, f"{compression}%"
-# === Сохранение результатов ===
 def save_summary_as_txt(summary_text):
     path = "summary.txt"
     with open(path, "w", encoding="utf-8") as f:
@@ -117,7 +124,7 @@ def save_summary_as_pdf(summary_text):
     pdf.output(path)
     return path
-# === Главная функция ===
 def summarize_file(file):
     text = read_file(file)
     if text.startswith("⚠️"):
@@ -134,7 +141,16 @@ def summarize_file(file):
     return summary, lang_label, model_label, src_len, sum_len, compression, txt_path, docx_path, pdf_path
-# === Интерфейс ===
 demo = gr.Interface(
     fn=summarize_file,
     inputs=gr.File(label="📂 Загрузите документ (.pdf, .docx, .txt)"),
@@ -144,14 +160,14 @@ demo = gr.Interface(
         gr.Textbox(label="🧠 Используемая модель"),
         gr.Number(label="📄 Длина исходного текста"),
         gr.Number(label="📝 Длина резюме"),
-        gr.Textbox(label="📉 Сжатие"),
-        gr.File(label="📄 TXT"),
-        gr.File(label="📘 DOCX"),
-        gr.File(label="📕 PDF"),
     ],
-    title="🧠 Eroha Summarizer PRO (автономная версия)",
-    description="🚀 Определяет язык (🇷🇺 / 🇰🇿 / 🇬🇧), создаёт краткое резюме и сохраняет в TXT, DOCX, PDF.",
-    theme="soft",
     allow_flagging="never"
 )

 from fpdf import FPDF
 from langdetect import detect
 import urllib.request
+import gradio.themes as gt
+# === 🗂️ Создание папок и установка шрифта ===
 os.makedirs("/app/models", exist_ok=True)
 FONT_PATH = "DejaVuSans.ttf"
+# Если шрифт отсутствует — скачиваем
 if not os.path.exists(FONT_PATH):
+    print("⬇️ Загружаю шрифт DejaVuSans.ttf ...")
     urllib.request.urlretrieve(
         "https://github.com/dejavu-fonts/dejavu-fonts/raw/master/ttf/DejaVuSans.ttf",
         FONT_PATH
     )
+# === ⚙️ Загрузка моделей один раз при запуске ===
 def load_model(task, model_name):
     print(f"🔹 Загружается модель: {model_name}")
     return pipeline(task, model=model_name, cache_dir="/app/models")
     "kz": load_model("summarization", "csebuetnlp/mT5_multilingual_XLSum")
 }
+# === 📄 Функция чтения текстов из файлов ===
 def read_file(file):
     if not file:
         return ""
     filename = file.name.lower()
     text = ""
     try:
         if filename.endswith(".pdf"):
             with pdfplumber.open(file.name) as pdf:
             text = file.read().decode("utf-8", errors="ignore")
     except Exception as e:
         return f"⚠️ Ошибка при чтении файла: {e}"
     return text.strip()
+# === 🌐 Определение языка ===
 def detect_language(text):
     try:
         lang = detect(text)
     except:
         return "en"
+# === 🧠 Суммаризация текста ===
 def summarize_text(text):
     if not text or len(text) < 50:
         return "⚠️ Недостаточно текста для анализа.", "❌", "❌", 0, 0, "❌"
     lang = detect_language(text)
     model = summarizers.get(lang, summarizers["en"])
     flags = {"ru": "🇷🇺 Русский", "kz": "🇰🇿 Қазақ тілі", "en": "🇬🇧 English"}
     lang_label = flags.get(lang, "🌍 Unknown")
+    model_label = model.model.name_or_path if hasattr(model.model, "name_or_path") else "Custom"
     chunk_size = 2500
     overlap = 200
     summaries = []
     return summary, lang_label, model_label, src_len, sum_len, f"{compression}%"
+# === 💾 Сохранение файлов ===
 def save_summary_as_txt(summary_text):
     path = "summary.txt"
     with open(path, "w", encoding="utf-8") as f:
     pdf.output(path)
     return path
+# === 🚀 Главная функция обработки ===
 def summarize_file(file):
     text = read_file(file)
     if text.startswith("⚠️"):
     return summary, lang_label, model_label, src_len, sum_len, compression, txt_path, docx_path, pdf_path
+# === 🎨 Интерфейс Gradio ===
+custom_theme = gt.Default(
+    primary_hue="purple",
+    secondary_hue="violet",
+).set(
+    body_background_fill="#f8f6ff",
+    button_primary_background_fill="linear-gradient(90deg, #7e3ff2, #c084fc)",
+    button_primary_background_fill_hover="linear-gradient(90deg, #6b21a8, #9333ea)",
+)
 demo = gr.Interface(
     fn=summarize_file,
     inputs=gr.File(label="📂 Загрузите документ (.pdf, .docx, .txt)"),
         gr.Textbox(label="🧠 Используемая модель"),
         gr.Number(label="📄 Длина исходного текста"),
         gr.Number(label="📝 Длина резюме"),
+        gr.Textbox(label="📉 Степень сокращения"),
+        gr.File(label="📄 Скачать TXT"),
+        gr.File(label="📘 Скачать DOCX"),
+        gr.File(label="📕 Скачать PDF"),
     ],
+    title="🧠 Eroha Summarizer PRO (Автономная версия)",
+    description="🚀 Определяет язык (🇷🇺 / 🇰🇿 / 🇬🇧), создаёт краткое резюме и сохраняет в TXT, DOCX, PDF с поддержкой кириллицы.",
+    theme=custom_theme,
     allow_flagging="never"
 )