Spaces:

Yermek68
/

eroha-agentapi

Sleeping

App Files Files Community

Yermek68 commited on Dec 2, 2025

Commit

0dfa820

verified ·

1 Parent(s): a3b5165

Update app.py

Browse files

Files changed (1) hide show

app.py +50 -28

app.py CHANGED Viewed

@@ -6,7 +6,7 @@ import os
 # --- Ленивая загрузка модели ---
 summarizer = None
-def get_summarizer():
     global summarizer
     if summarizer is None:
         summarizer = pipeline(
@@ -15,47 +15,69 @@ def get_summarizer():
         )
     return summarizer
-# --- Чтение текста из файла ---
-def read_text_from_file(file):
-    if file is None:
-        return ""
-    filepath = file   # Gradio отдаёт именно путь к временному файлу
-    filepath_lower = filepath.lower()
-    # PDF
-    if filepath_lower.endswith(".pdf"):
-        text = ""
-        with pdfplumber.open(filepath) as pdf:
-            for page in pdf.pages:
-                text += page.extract_text() or ""
-        return text
-    # TXT / другие
-    with open(filepath, "r", encoding="utf-8", errors="ignore") as f:
-        return f.read()
 # --- Основная функция ---
-def summarize_file(file):
-    text = read_text_from_file(file)
     if not text.strip():
-        return "⚠️ Не удалось извлечь текст из файла."
-    if len(text) < 50:
-        return "⚠️ Слишком короткий текст для суммаризации."
-    model = get_summarizer()
-    summary = model(text, max_length=200, min_length=50, do_sample=False)
-    return summary[0]["summary_text"]
-# --- Интерфейс ---
 demo = gr.Interface(
     fn=summarize_file,
-    inputs=gr.File(label="Загрузите файл (.pdf или .txt)", type="filepath"),
     outputs=gr.Textbox(label="Результат суммаризации"),
     title="Eroha Summarizer 🧠",
-    description="Загрузите документ (PDF или TXT), и модель создаст краткое резюме.",
 )
 if __name__ == "__main__":

 # --- Ленивая загрузка модели ---
 summarizer = None
+def load_model():
     global summarizer
     if summarizer is None:
         summarizer = pipeline(
         )
     return summarizer
+# --- Безопасное чтение PDF ---
+def extract_pdf_text(path):
+    text = ""
+    try:
+        with pdfplumber.open(path) as pdf:
+            for page in pdf.pages:
+                chunk = page.extract_text()
+                if chunk:
+                    text += chunk + "\n"
+    except Exception as e:
+        return "", f"Ошибка при чтении PDF: {e}"
+    return text, None
+# --- Универсальное чтение файла ---
+def read_file(path):
+    if not path:
+        return "", "Файл не передан."
+    path = str(path).strip()
+    if path.lower().endswith(".pdf"):
+        return extract_pdf_text(path)
+    try:
+        with open(path, "r", encoding="utf-8", errors="ignore") as f:
+            return f.read(), None
+    except Exception as e:
+        return "", f"Ошибка при чтении TXT: {e}"
 # --- Основная функция ---
+def summarize_file(path):
+    text, err = read_file(path)
+    if err:
+        return f"⚠️ {err}"
     if not text.strip():
+        return "⚠️ Не удалось извлечь текст."
+    if len(text) < 80:
+        return "⚠️ Слишком мало текста для суммаризации."
+    model = load_model()
+    # Ограничиваем текст для избежания OOM
+    text = text[:4000]
+    try:
+        summary = model(
+            text,
+            max_length=180,
+            min_length=60,
+            do_sample=False
+        )
+        return summary[0]["summary_text"]
+    except Exception as e:
+        return f"⚠️ Ошибка суммаризации: {e}"
+# --- Интерфейс Gradio ---
 demo = gr.Interface(
     fn=summarize_file,
+    inputs=gr.File(type="filepath", label="Загрузите файл (.pdf или .txt)"),
     outputs=gr.Textbox(label="Результат суммаризации"),
     title="Eroha Summarizer 🧠",
+    description="Загрузите документ (PDF или TXT), и модель создаст краткое резюме."
 )
 if __name__ == "__main__":