Spaces:

DaniFera
/

PDFree

Sleeping

App Files Files Community

DaniFera commited on Jan 19

Commit

38af16a

verified ·

1 Parent(s): e5e7fa1

Update core.py

Browse files

Files changed (1) hide show

core.py +12 -35

core.py CHANGED Viewed

@@ -1,10 +1,10 @@
-# Versión 2.4
 import os
 import zipfile
 import uuid
 import subprocess
 import difflib
-import io
 import pdfplumber
 import pandas as pd
 from pypdf import PdfWriter, PdfReader, Transformation
@@ -14,14 +14,13 @@ from PIL import Image
 from pptx import Presentation
 from pptx.util import Inches
-# ReportLab para generar PDFs (Informes y Capas de texto)
 from reportlab.lib.pagesizes import A4, letter
 from reportlab.lib import colors
 from reportlab.platypus import SimpleDocTemplate, Paragraph, Spacer
 from reportlab.lib.styles import getSampleStyleSheet, ParagraphStyle
 from reportlab.lib.enums import TA_JUSTIFY
-from reportlab.pdfgen import canvas
-from reportlab.lib.units import inch
 from config import TEMP_DIR
@@ -102,29 +101,25 @@ class PDFEngine:
                 except ValueError: continue
         return sorted(list(set(key_pages)))
-    # --- CORE PDF TOOLS ---
     def merge_pdfs(self, file_paths: list, order_indices: list = None, use_numbering: bool = False) -> str:
         if not file_paths: raise ValueError("No hay archivos.")
-        # 1. Ordenar
         ordered = []
         if order_indices and len(order_indices) == len(file_paths):
             try: ordered = [file_paths[int(i)] for i in order_indices]
             except: ordered = file_paths
         else: ordered = file_paths
-        # 2. Unir
         m = PdfWriter()
         for p in ordered: m.append(p)
         temp_out = self._get_output_path("temp_unido.pdf")
         with open(temp_out, "wb") as f: m.write(f)
-        # 3. Numerar (Si se solicitó)
         if use_numbering:
             final_out = self._add_page_numbers(temp_out)
-            # Intentar borrar el intermedio para no acumular basura (aunque el cron lo haría)
             try: os.remove(temp_out)
             except: pass
             return final_out
@@ -137,25 +132,16 @@ class PDFEngine:
         num_pages = len(reader.pages)
         for i, page in enumerate(reader.pages):
-            # Crear un PDF en memoria con solo el número de página
             packet = io.BytesIO()
-            # Usamos canvas de reportlab
             can = canvas.Canvas(packet, pagesize=letter)
-            # Obtener tamaño de la página original para centrar el número
             page_width = float(page.mediabox.width)
-            # Dibujar texto: "Página X de Y" en el centro inferior
             text = f"Página {i+1} de {num_pages}"
             can.setFont("Helvetica", 10)
-            can.drawCentredString(page_width / 2.0, 20, text) # 20 puntos desde abajo
             can.save()
-            # Mover al inicio del buffer
             packet.seek(0)
             new_pdf = PdfReader(packet)
-            # Fusionar la capa del número con la página original
             page.merge_page(new_pdf.pages[0])
             writer.add_page(page)
@@ -169,16 +155,14 @@ class PDFEngine:
         reader = PdfReader(file_path)
         writer = PdfWriter()
-        # Crear la marca de agua en memoria una sola vez
         packet = io.BytesIO()
         can = canvas.Canvas(packet, pagesize=letter)
         can.setFont("Helvetica-Bold", 50)
-        can.setFillColorRGB(0.5, 0.5, 0.5, 0.3) # Gris semi-transparente
-        # Guardar estado, rotar y escribir en el centro (aprox)
         can.saveState()
-        can.translate(300, 400) # Mover origen al centro aprox
-        can.rotate(45) # Rotar 45 grados
         can.drawCentredString(0, 0, text)
         can.restoreState()
         can.save()
@@ -187,9 +171,7 @@ class PDFEngine:
         watermark_pdf = PdfReader(packet)
         watermark_page = watermark_pdf.pages[0]
-        # Aplicar a todas las páginas
         for page in reader.pages:
-            # Es necesario clonar el objeto watermark para cada pagina o pypdf se queja a veces
             page.merge_page(watermark_page)
             writer.add_page(page)
@@ -197,21 +179,16 @@ class PDFEngine:
         with open(out, "wb") as f: writer.write(f)
         return out
-    # --- NUEVO: Reparador (Ghostscript) ---
     def repair_pdf(self, file_path: str) -> str:
         if not file_path: raise ValueError("Falta archivo.")
         out = self._get_output_path("reparado.pdf")
-        # Comando mágico de Ghostscript para regenerar PDFs
-        # -sDEVICE=pdfwrite : Reescribe el PDF
-        # -dPDFSETTINGS=/default : Calidad normal
         cmd = [
             "gs",
-            "-o", out,               # Output file
             "-sDEVICE=pdfwrite",
             "-dPDFSETTINGS=/default",
-            "-dInteract=N",          # No interactivo
             "-dNOPAUSE", "-dQUIET", "-dBATCH",
             file_path
         ]

+## Versión Alfa 1.0
 import os
 import zipfile
 import uuid
 import subprocess
 import difflib
+import io
 import pdfplumber
 import pandas as pd
 from pypdf import PdfWriter, PdfReader, Transformation
 from pptx import Presentation
 from pptx.util import Inches
 from reportlab.lib.pagesizes import A4, letter
 from reportlab.lib import colors
 from reportlab.platypus import SimpleDocTemplate, Paragraph, Spacer
 from reportlab.lib.styles import getSampleStyleSheet, ParagraphStyle
 from reportlab.lib.enums import TA_JUSTIFY
+from reportlab.pdfgen import canvas
+from reportlab.lib.units import inch
 from config import TEMP_DIR
                 except ValueError: continue
         return sorted(list(set(key_pages)))
+    # --- HERRAMIENTAS PRINCIPALES ---
     def merge_pdfs(self, file_paths: list, order_indices: list = None, use_numbering: bool = False) -> str:
         if not file_paths: raise ValueError("No hay archivos.")
         ordered = []
         if order_indices and len(order_indices) == len(file_paths):
             try: ordered = [file_paths[int(i)] for i in order_indices]
             except: ordered = file_paths
         else: ordered = file_paths
         m = PdfWriter()
         for p in ordered: m.append(p)
         temp_out = self._get_output_path("temp_unido.pdf")
         with open(temp_out, "wb") as f: m.write(f)
         if use_numbering:
             final_out = self._add_page_numbers(temp_out)
             try: os.remove(temp_out)
             except: pass
             return final_out
         num_pages = len(reader.pages)
         for i, page in enumerate(reader.pages):
             packet = io.BytesIO()
             can = canvas.Canvas(packet, pagesize=letter)
             page_width = float(page.mediabox.width)
             text = f"Página {i+1} de {num_pages}"
             can.setFont("Helvetica", 10)
+            can.drawCentredString(page_width / 2.0, 20, text)
             can.save()
             packet.seek(0)
             new_pdf = PdfReader(packet)
             page.merge_page(new_pdf.pages[0])
             writer.add_page(page)
         reader = PdfReader(file_path)
         writer = PdfWriter()
         packet = io.BytesIO()
         can = canvas.Canvas(packet, pagesize=letter)
         can.setFont("Helvetica-Bold", 50)
+        can.setFillColorRGB(0.5, 0.5, 0.5, 0.3)
         can.saveState()
+        can.translate(300, 400)
+        can.rotate(45)
         can.drawCentredString(0, 0, text)
         can.restoreState()
         can.save()
         watermark_pdf = PdfReader(packet)
         watermark_page = watermark_pdf.pages[0]
         for page in reader.pages:
             page.merge_page(watermark_page)
             writer.add_page(page)
         with open(out, "wb") as f: writer.write(f)
         return out
     def repair_pdf(self, file_path: str) -> str:
         if not file_path: raise ValueError("Falta archivo.")
         out = self._get_output_path("reparado.pdf")
         cmd = [
             "gs",
+            "-o", out,
             "-sDEVICE=pdfwrite",
             "-dPDFSETTINGS=/default",
+            "-dInteract=N",
             "-dNOPAUSE", "-dQUIET", "-dBATCH",
             file_path
         ]