Spaces:

Overglitch
/

document-summarizer

Build error

App Files Files Community

Overglitch commited on Dec 14, 2024

Commit

8dec98c

verified ·

1 Parent(s): 7ac661d

Update app.py

Browse files

Files changed (1) hide show

app.py +33 -4

app.py CHANGED Viewed

@@ -9,25 +9,54 @@ summarizers = load_summarizers()
 # Función para procesar el archivo cargado
 def process_file(file):
     if file is not None:
         pdf_processor = PDFProcessor()
         input_text = pdf_processor.pdf_to_text(file.name)
-        return input_text
     return "Por favor, cargue un archivo válido."
 # Función principal para generar resúmenes
 def summarize(input_text, file, summary_type, method, num_sentences, model_name, max_length, num_beams):
     preprocessor = Preprocessor()
     if file is not None:
-        pdf_processor = PDFProcessor()
-        input_text = pdf_processor.pdf_to_text(file.name)
-    if not input_text:
         return "Por favor, ingrese texto o cargue un archivo válido."
     cleaned_text = preprocessor.clean_text(input_text)
     if summary_type == "Extractivo":
         if method == "TF-IDF":
             summarizer = TFIDFSummarizer()

 # Función para procesar el archivo cargado
 def process_file(file):
+    """
+    Procesa un archivo cargado y extrae texto si es un PDF válido.
+    Args:
+        file (UploadedFile): Archivo subido por el usuario.
+    Returns:
+        str: Texto extraído del archivo o mensaje de error.
+    """
     if file is not None:
         pdf_processor = PDFProcessor()
         input_text = pdf_processor.pdf_to_text(file.name)
+        if input_text.strip():
+            return input_text
+        return "El archivo no contiene texto procesable."
     return "Por favor, cargue un archivo válido."
 # Función principal para generar resúmenes
 def summarize(input_text, file, summary_type, method, num_sentences, model_name, max_length, num_beams):
+    """
+    Genera un resumen basado en el texto de entrada o archivo cargado.
+    Args:
+        input_text (str): Texto ingresado por el usuario.
+        file (UploadedFile): Archivo subido por el usuario.
+        summary_type (str): Tipo de resumen: Extractivo, Abstractivo o Combinado.
+        method (str): Método de resumen extractivo.
+        num_sentences (int): Número de oraciones para el resumen extractivo.
+        model_name (str): Nombre del modelo para resumen abstractivo.
+        max_length (int): Longitud máxima del resumen generado.
+        num_beams (int): Número de haces para búsqueda en el modelo.
+    Returns:
+        str: Resumen generado o mensaje de error.
+    """
     preprocessor = Preprocessor()
+    # Procesar archivo si se sube uno
     if file is not None:
+        input_text = process_file(file)
+    # Validar que haya texto para resumir
+    if not input_text.strip():
         return "Por favor, ingrese texto o cargue un archivo válido."
     cleaned_text = preprocessor.clean_text(input_text)
+    # Procesar según el tipo de resumen seleccionado
     if summary_type == "Extractivo":
         if method == "TF-IDF":
             summarizer = TFIDFSummarizer()