Spaces:

NEXAS
/

Titan

Sleeping

App Files Files Community

NEXAS commited on Jan 8, 2025

Commit

4bffcf2

verified ·

1 Parent(s): a51682c

Update app.py

Browse files

Files changed (1) hide show

app.py +8 -25

app.py CHANGED Viewed

@@ -212,16 +212,13 @@ def process_pdf(pdf_path):
     return "image_collection", "text_collection", "video_collection"  # Replace with actual collections
 def page_1():
-    st.title("Page 1: Upload and Process Videos and PDFs")
-    # File uploader for multiple zip files containing videos
-    uploaded_video_zips = st.file_uploader("Upload ZIP files containing videos", type=["zip"], accept_multiple_files=True)
     # File uploader for PDF files
     uploaded_pdf_files = st.file_uploader("Upload PDF files", type=["pdf"], accept_multiple_files=True)
     # Button to trigger processing
-    if (uploaded_video_zips or uploaded_pdf_files) and st.button("Process Files"):
         # Temporary folder to store extracted files
         temp_folder = "/tmp/extracted_files"
         os.makedirs(temp_folder, exist_ok=True)
@@ -231,24 +228,10 @@ def page_1():
         status_text = st.empty()
         try:
-            total_files = len(uploaded_video_zips) + len(uploaded_pdf_files)
             files_processed = 0
             progress_step = 100 / total_files if total_files > 0 else 0
-            # Process video zip files
-            for uploaded_file in uploaded_video_zips:
-                zip_path = f"/tmp/{uploaded_file.name}"
-                with open(zip_path, "wb") as f:
-                    f.write(uploaded_file.getbuffer())
-                # Extract the content from the zip file
-                folder_name = os.path.splitext(uploaded_file.name)[0]
-                extract_to = os.path.join(temp_folder, folder_name)
-                if unzip_file(zip_path, extract_to):
-                    files_processed += 1
-                    progress_bar.progress(files_processed * progress_step)
-                    status_text.text(f"Extracting: {uploaded_file.name} ({files_processed}/{total_files})")
             # Process PDF files
             for uploaded_pdf in uploaded_pdf_files:
                 pdf_path = f"/tmp/{uploaded_pdf.name}"
@@ -260,18 +243,18 @@ def page_1():
                 progress_bar.progress(files_processed * progress_step)
                 status_text.text(f"Processing PDF: {uploaded_pdf.name} ({files_processed}/{total_files})")
-                # Call your actual PDF processing function here, e.g.
-                image_collection, text_collection, video_collection = process_pdf(pdf_path,temp_folder)
                 # Save collections to session state
                 st.session_state.image_collection = image_collection
                 st.session_state.text_collection = text_collection
                 st.session_state.video_collection = video_collection
-            # Update status after extraction and processing
-            status_text.text("Extraction and processing completed successfully!")
-            st.success("Videos and PDFs processed successfully! Collections saved to session state.")
         except Exception as e:
             progress_bar.progress(0)

     return "image_collection", "text_collection", "video_collection"  # Replace with actual collections
 def page_1():
+    st.title("Page 1: Upload and Process PDFs")
     # File uploader for PDF files
     uploaded_pdf_files = st.file_uploader("Upload PDF files", type=["pdf"], accept_multiple_files=True)
     # Button to trigger processing
+    if uploaded_pdf_files and st.button("Process Files"):
         # Temporary folder to store extracted files
         temp_folder = "/tmp/extracted_files"
         os.makedirs(temp_folder, exist_ok=True)
         status_text = st.empty()
         try:
+            total_files = len(uploaded_pdf_files)
             files_processed = 0
             progress_step = 100 / total_files if total_files > 0 else 0
             # Process PDF files
             for uploaded_pdf in uploaded_pdf_files:
                 pdf_path = f"/tmp/{uploaded_pdf.name}"
                 progress_bar.progress(files_processed * progress_step)
                 status_text.text(f"Processing PDF: {uploaded_pdf.name} ({files_processed}/{total_files})")
+                # Call your actual PDF processing function here
+                image_collection, text_collection, video_collection = process_pdf(pdf_path)
                 # Save collections to session state
                 st.session_state.image_collection = image_collection
                 st.session_state.text_collection = text_collection
                 st.session_state.video_collection = video_collection
+            # Update status after processing
+            status_text.text("Processing completed successfully!")
+            st.success("PDFs processed successfully! Collections saved to session state.")
         except Exception as e:
             progress_bar.progress(0)