Spaces:

Yermek68
/

eroha-agentapi

Running

App Files Files Community

Yermek68 commited on 21 days ago

Commit

03170fb

verified ·

1 Parent(s): ae2c86a

Update app.py

Browse files

Files changed (1) hide show

app.py +34 -30

app.py CHANGED Viewed

@@ -7,8 +7,10 @@ from docx import Document
 from fpdf import FPDF
 from langdetect import detect
 import urllib.request
-# === 🗂️ Подготовка окружения и шрифта ===
 os.makedirs("/app/models", exist_ok=True)
 FONT_PATH = "DejaVuSans.ttf"
@@ -19,6 +21,7 @@ if not os.path.exists(FONT_PATH):
         FONT_PATH
     )
 # === ⚙️ Загрузка моделей ===
 def load_model(task, model_name):
     print(f"🔹 Загружается модель: {model_name}")
@@ -30,7 +33,8 @@ summarizers = {
     "kz": load_model("summarization", "csebuetnlp/mT5_multilingual_XLSum")
 }
-# === 📄 Чтение документов ===
 def read_file(file):
     if not file:
         return ""
@@ -40,9 +44,8 @@ def read_file(file):
         if filename.endswith(".pdf"):
             with pdfplumber.open(file.name) as pdf:
                 for page in pdf.pages:
-                    page_text = page.extract_text()
-                    if page_text:
-                        text += page_text + "\n"
         elif filename.endswith(".docx"):
             text = docx2txt.process(file.name)
         else:
@@ -51,6 +54,7 @@ def read_file(file):
         return f"⚠️ Ошибка при чтении файла: {e}"
     return text.strip()
 # === 🌐 Определение языка ===
 def detect_language(text):
     try:
@@ -64,6 +68,7 @@ def detect_language(text):
     except:
         return "en"
 # === 🧠 Суммаризация ===
 def summarize_text(text):
     if not text or len(text) < 50:
@@ -73,8 +78,8 @@ def summarize_text(text):
     model = summarizers.get(lang, summarizers["en"])
     flags = {"ru": "🇷🇺 Русский", "kz": "🇰🇿 Қазақ тілі", "en": "🇬🇧 English"}
     lang_label = flags.get(lang, "🌍 Unknown")
-    model_label = model.model.name_or_path if hasattr(model.model, "name_or_path") else "Custom"
     chunk_size = 2500
     overlap = 200
     summaries = []
@@ -94,7 +99,8 @@ def summarize_text(text):
     return summary, lang_label, model_label, src_len, sum_len, f"{compression}%"
-# === 💾 Сохранение результатов ===
 def save_summary_as_txt(summary_text):
     path = "summary.txt"
     with open(path, "w", encoding="utf-8") as f:
@@ -119,7 +125,8 @@ def save_summary_as_pdf(summary_text):
     pdf.output(path)
     return path
-# === 🚀 Основная функция ===
 def summarize_file(file):
     text = read_file(file)
     if text.startswith("⚠️"):
@@ -136,33 +143,30 @@ def summarize_file(file):
     return summary, lang_label, model_label, src_len, sum_len, compression, txt_path, docx_path, pdf_path
-# === 🧩 Современный интерфейс через Blocks (Gradio 4.44+) ===
-with gr.Blocks(css=".gradio-container {max-width: 900px !important}") as demo:
     gr.Markdown("## 🧠 Eroha Summarizer PRO (автономная версия)")
     gr.Markdown("🚀 Определяет язык (🇷🇺 / 🇰🇿 / 🇬🇧), создаёт краткое резюме и сохраняет в TXT, DOCX, PDF с поддержкой кириллицы.")
-    with gr.Row():
-        file_input = gr.File(label="📂 Загрузите документ (.pdf, .docx, .txt)")
-    with gr.Row():
-        summary_output = gr.Textbox(label="🧾 Краткое резюме", lines=10)
-    with gr.Row():
-        lang_output = gr.Textbox(label="🌍 Определённый язык")
-        model_output = gr.Textbox(label="🧠 Используемая модель")
-    with gr.Row():
-        src_len = gr.Number(label="📄 Длина исходного текста")
-        sum_len = gr.Number(label="📝 Длина резюме")
-        compression = gr.Textbox(label="📉 Степень сокращения")
-    with gr.Row():
-        txt_file = gr.File(label="📄 TXT файл")
-        docx_file = gr.File(label="📘 DOCX файл")
-        pdf_file = gr.File(label="📕 PDF файл")
     run_btn = gr.Button("🔍 Сгенерировать резюме", variant="primary")
     run_btn.click(
         summarize_file,
         inputs=[file_input],

 from fpdf import FPDF
 from langdetect import detect
 import urllib.request
+import gradio.themes.base as base_theme
+# === 🗂️ Создание директорий и шрифта ===
 os.makedirs("/app/models", exist_ok=True)
 FONT_PATH = "DejaVuSans.ttf"
         FONT_PATH
     )
 # === ⚙️ Загрузка моделей ===
 def load_model(task, model_name):
     print(f"🔹 Загружается модель: {model_name}")
     "kz": load_model("summarization", "csebuetnlp/mT5_multilingual_XLSum")
 }
+# === 📄 Чтение документа ===
 def read_file(file):
     if not file:
         return ""
         if filename.endswith(".pdf"):
             with pdfplumber.open(file.name) as pdf:
                 for page in pdf.pages:
+                    if page.extract_text():
+                        text += page.extract_text() + "\n"
         elif filename.endswith(".docx"):
             text = docx2txt.process(file.name)
         else:
         return f"⚠️ Ошибка при чтении файла: {e}"
     return text.strip()
 # === 🌐 Определение языка ===
 def detect_language(text):
     try:
     except:
         return "en"
 # === 🧠 Суммаризация ===
 def summarize_text(text):
     if not text or len(text) < 50:
     model = summarizers.get(lang, summarizers["en"])
     flags = {"ru": "🇷🇺 Русский", "kz": "🇰🇿 Қазақ тілі", "en": "🇬🇧 English"}
     lang_label = flags.get(lang, "🌍 Unknown")
+    model_label = model.model.name_or_path if hasattr(model.model, "name_or_path") else "Custom"
     chunk_size = 2500
     overlap = 200
     summaries = []
     return summary, lang_label, model_label, src_len, sum_len, f"{compression}%"
+# === 💾 Сохранение ===
 def save_summary_as_txt(summary_text):
     path = "summary.txt"
     with open(path, "w", encoding="utf-8") as f:
     pdf.output(path)
     return path
+# === 🚀 Главная функция ===
 def summarize_file(file):
     text = read_file(file)
     if text.startswith("⚠️"):
     return summary, lang_label, model_label, src_len, sum_len, compression, txt_path, docx_path, pdf_path
+# === 🎨 Интерфейс (Gradio 4.44+, без css/theme аргументов) ===
+theme = base_theme.Base().set(
+    primary_hue="violet",
+    neutral_hue="gray"
+)
+with gr.Blocks(theme=theme) as demo:
     gr.Markdown("## 🧠 Eroha Summarizer PRO (автономная версия)")
     gr.Markdown("🚀 Определяет язык (🇷🇺 / 🇰🇿 / 🇬🇧), создаёт краткое резюме и сохраняет в TXT, DOCX, PDF с поддержкой кириллицы.")
+    file_input = gr.File(label="📂 Загрузите документ (.pdf, .docx, .txt)")
     run_btn = gr.Button("🔍 Сгенерировать резюме", variant="primary")
+    summary_output = gr.Textbox(label="🧾 Краткое резюме", lines=10)
+    lang_output = gr.Textbox(label="🌍 Определённый язык")
+    model_output = gr.Textbox(label="���� Используемая модель")
+    src_len = gr.Number(label="📄 Длина исходного текста")
+    sum_len = gr.Number(label="📝 Длина резюме")
+    compression = gr.Textbox(label="📉 Степень сокращения")
+    txt_file = gr.File(label="📄 TXT файл")
+    docx_file = gr.File(label="📘 DOCX файл")
+    pdf_file = gr.File(label="📕 PDF файл")
     run_btn.click(
         summarize_file,
         inputs=[file_input],