Spaces:

kuroiikimono
/

splitpdf_streamlit

Paused

App Files Files Community

kuroiikimono commited on Feb 8, 2025

Commit

af64171

verified ·

1 Parent(s): fad0d5b

Create app.py

Browse files

Files changed (1) hide show

app.py +84 -0

app.py ADDED Viewed

	@@ -0,0 +1,84 @@

+import streamlit as st
+from pypdf import PdfReader, PdfWriter
+import io
+# ページごとに分割する関数
+def split_pdf_by_pages(reader):
+    total_pages = len(reader.pages)
+    split_files = {}
+    for page_num in range(total_pages):
+        try:
+            writer = PdfWriter()
+            writer.add_page(reader.pages[page_num])
+            output_pdf = io.BytesIO()
+            writer.write(output_pdf)
+            output_pdf.seek(0)
+            split_files[page_num] = output_pdf
+            st.write(f"Page {page_num + 1} processed.")  # Streamlit での表示
+        except Exception as e:
+            st.error(f"Error processing page {page_num + 1}: {e}")  # Streamlit でのエラー表示
+            raise
+    return split_files
+# グループごとにマージする関数
+def merge_pdfs_in_groups(split_files, group_size=50):
+    pdf_files = sorted(split_files.keys())
+    merged_files = {}
+    for i in range(0, len(pdf_files), group_size):
+        group = pdf_files[i:i + group_size]
+        try:
+            writer = PdfWriter()
+            for page_num in group:
+                pdf_file = split_files[page_num]
+                reader = PdfReader(pdf_file)
+                for page in reader.pages:
+                    writer.add_page(page)
+            output_pdf = io.BytesIO()
+            writer.write(output_pdf)
+            output_pdf.seek(0)
+            merged_files[i // group_size] = output_pdf
+            st.write(f"Merged group {i // group_size + 1} processed.")  # Streamlit での表示
+        except Exception as e:
+            st.error(f"Error merging group {i // group_size + 1}: {e}")  # Streamlit でのエラー表示
+            raise
+    return merged_files
+# ファイルをダウンロード用リンクとして表示する関数 (Streamlit 版)
+def create_download_link(file_data, display_name):
+    st.download_button(
+        label=f"Download {display_name}",
+        data=file_data,
+        file_name=display_name,
+        mime="application/pdf"
+    )
+# メイン処理
+def main():
+    st.title("PDF Splitter and Merger with Streamlit")
+    uploaded_file = st.file_uploader("Upload a PDF file", type="pdf")
+    group_size = st.number_input("Group size (pages per group)", min_value=1, value=20)
+    if uploaded_file is not None:
+        try:
+            file_bytes = uploaded_file.read()
+            reader = PdfReader(io.BytesIO(file_bytes))
+            split_files = split_pdf_by_pages(reader)
+            merged_files = merge_pdfs_in_groups(split_files, group_size)
+            for i, file_obj in split_files.items():
+                create_download_link(file_obj.getvalue(), f"page_{i+1}.pdf")
+            for i, file_obj in merged_files.items():
+                create_download_link(file_obj.getvalue(), f"group_{i+1}.pdf")
+        except Exception as e:
+            st.error(f"Error processing PDF: {e}")
+if __name__ == "__main__":
+    main()