Spaces:

Ramzan0553
/

PDF_Manipulation

Sleeping

App Files Files Community

Ramzan0553 commited on Apr 4, 2025

Commit

68c7f3b

verified ·

1 Parent(s): 15a335d

Update app.py

Browse files

Files changed (1) hide show

app.py +23 -22

app.py CHANGED Viewed

@@ -2,7 +2,6 @@ import gradio as gr
 import fitz  # PyMuPDF
 import os
 import tempfile
-import shutil
 import zipfile
 def extract_text(pdf_file):
@@ -10,7 +9,7 @@ def extract_text(pdf_file):
     text = ""
     for page in doc:
         text += page.get_text()
-    return text
 def extract_images(pdf_file):
     doc = fitz.open(stream=pdf_file.read(), filetype="pdf")
@@ -35,7 +34,6 @@ def extract_images(pdf_file):
     if img_count == 0:
         return "No images found in the PDF.", None
-    # Zip all extracted images
     zip_path = os.path.join(output_dir, "images.zip")
     with zipfile.ZipFile(zip_path, "w") as zipf:
         for fname in os.listdir(output_dir):
@@ -51,7 +49,7 @@ def merge_pdfs(pdf_files):
             merged_pdf.insert_pdf(doc)
     temp_path = tempfile.mktemp(suffix=".pdf")
     merged_pdf.save(temp_path)
-    return temp_path
 def split_pdf(pdf_file):
     doc = fitz.open(stream=pdf_file.read(), filetype="pdf")
@@ -67,53 +65,56 @@ def split_pdf(pdf_file):
         for fname in os.listdir(output_dir):
             if fname.endswith(".pdf"):
                 zipf.write(os.path.join(output_dir, fname), fname)
-    return zip_path
-def pdf_tool(task, pdf_input1=None, pdf_input2=None):
     if task == "Extract Text":
         if not pdf_input1:
             return "Please upload a PDF file.", None
-        return extract_text(pdf_input1), None
     elif task == "Extract Images":
         if not pdf_input1:
             return "Please upload a PDF file.", None
-        msg, zip_path = extract_images(pdf_input1)
-        return msg, zip_path
     elif task == "Merge PDFs":
         if not pdf_input1 or not pdf_input2:
             return "Please upload two PDF files to merge.", None
-        merged_path = merge_pdfs([pdf_input1, pdf_input2])
-        return "PDFs merged successfully.", merged_path
     elif task == "Split PDF":
         if not pdf_input1:
             return "Please upload a PDF file.", None
-        zip_path = split_pdf(pdf_input1)
-        return "PDF split into separate pages.", zip_path
     else:
         return "Invalid task selected.", None
 with gr.Blocks() as demo:
     gr.Markdown("## 🛠️ PDF Utility Tool")
-    task = gr.Radio(choices=["Extract Text", "Extract Images", "Merge PDFs", "Split PDF"], label="Select a Task")
-    with gr.Row():
-        pdf_input1 = gr.File(label="PDF File 1", file_types=[".pdf"])
-        pdf_input2 = gr.File(label="PDF File 2 (for Merge only)", file_types=[".pdf"], visible=True)
-    task.change(lambda t: gr.update(visible=(t == "Merge PDFs")), inputs=task, outputs=pdf_input2)
-    run_button = gr.Button("Run")
-    output_text = gr.Textbox(label="Output Text")
-    output_file = gr.File(label="Download Result", file_types=[".pdf", ".zip"], visible=False)
     def process(task, pdf_input1, pdf_input2):
         result_text, result_file = pdf_tool(task, pdf_input1, pdf_input2)
-        return result_text, gr.update(value=result_file, visible=bool(result_file))
     run_button.click(process, inputs=[task, pdf_input1, pdf_input2], outputs=[output_text, output_file])
 demo.launch()

 import fitz  # PyMuPDF
 import os
 import tempfile
 import zipfile
 def extract_text(pdf_file):
     text = ""
     for page in doc:
         text += page.get_text()
+    return text, None
 def extract_images(pdf_file):
     doc = fitz.open(stream=pdf_file.read(), filetype="pdf")
     if img_count == 0:
         return "No images found in the PDF.", None
     zip_path = os.path.join(output_dir, "images.zip")
     with zipfile.ZipFile(zip_path, "w") as zipf:
         for fname in os.listdir(output_dir):
             merged_pdf.insert_pdf(doc)
     temp_path = tempfile.mktemp(suffix=".pdf")
     merged_pdf.save(temp_path)
+    return "PDFs merged successfully.", temp_path
 def split_pdf(pdf_file):
     doc = fitz.open(stream=pdf_file.read(), filetype="pdf")
         for fname in os.listdir(output_dir):
             if fname.endswith(".pdf"):
                 zipf.write(os.path.join(output_dir, fname), fname)
+    return "PDF split into separate pages.", zip_path
+def pdf_tool(task, pdf_input1, pdf_input2):
     if task == "Extract Text":
         if not pdf_input1:
             return "Please upload a PDF file.", None
+        return extract_text(pdf_input1)
     elif task == "Extract Images":
         if not pdf_input1:
             return "Please upload a PDF file.", None
+        return extract_images(pdf_input1)
     elif task == "Merge PDFs":
         if not pdf_input1 or not pdf_input2:
             return "Please upload two PDF files to merge.", None
+        return merge_pdfs([pdf_input1, pdf_input2])
     elif task == "Split PDF":
         if not pdf_input1:
             return "Please upload a PDF file.", None
+        return split_pdf(pdf_input1)
     else:
         return "Invalid task selected.", None
 with gr.Blocks() as demo:
     gr.Markdown("## 🛠️ PDF Utility Tool")
+    task = gr.Radio(
+        choices=["Extract Text", "Extract Images", "Merge PDFs", "Split PDF"],
+        label="Select a Task",
+        value="Extract Text"
+    )
+    pdf_input1 = gr.File(label="PDF File 1", file_types=[".pdf"])
+    pdf_input2 = gr.File(label="PDF File 2 (only for Merge)", file_types=[".pdf"], visible=False)
+    output_text = gr.Textbox(label="Result / Output", lines=5)
+    output_file = gr.File(label="Download File", visible=False)
+    def update_file2_visibility(t):
+        return gr.update(visible=(t == "Merge PDFs"))
+    task.change(update_file2_visibility, inputs=task, outputs=pdf_input2)
     def process(task, pdf_input1, pdf_input2):
         result_text, result_file = pdf_tool(task, pdf_input1, pdf_input2)
+        return result_text, gr.update(value=result_file, visible=result_file is not None)
+    run_button = gr.Button("Run")
     run_button.click(process, inputs=[task, pdf_input1, pdf_input2], outputs=[output_text, output_file])
 demo.launch()