Spaces:

yzweak
/

AutoPR

Build error

yzweak commited on Sep 24, 2025

Commit

ca1833b

1 Parent(s): ec5f146

Limit page processing to first 20 pages

Files changed (1) hide show

pragent/backend/figure_table_pipeline.py CHANGED Viewed

@@ -47,6 +47,10 @@ async def run_figure_extraction(pdf_path: str, base_work_dir: str, progress: Any
         tqdm.write(f"[!] 错误：加载或转换PDF时失败: {e}")
         return None
     tqdm.write(f"\n--- 步骤 2/3: 分析页面布局以裁剪图和表 ---")
     cropped_results_dir = os.path.join(base_work_dir, "cropped_results", pdf_stem)
     num_pages = len(page_image_paths)

         tqdm.write(f"[!] 错误：加载或转换PDF时失败: {e}")
         return None
+    if len(page_image_paths) > 20:
+        tqdm.write(f"[!] Warning: PDF has {len(page_image_paths)} pages. Processing only the first 20 pages to avoid timeout.")
+        page_image_paths = page_image_paths[:20]
     tqdm.write(f"\n--- 步骤 2/3: 分析页面布局以裁剪图和表 ---")
     cropped_results_dir = os.path.join(base_work_dir, "cropped_results", pdf_stem)
     num_pages = len(page_image_paths)