Spaces:

kevansoon
/

backend

Sleeping

KevanSoon commited on Aug 12, 2025

Commit

499661e

1 Parent(s): 2166263

added a dual ocr workflow

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1312,6 +1312,7 @@ async def translate_document_dual_ocr(
                 status_code=400,
                 detail="Neither Tesseract nor PaddleOCR could extract any data from the image.",
             )
         print("***** Step 1 Done: Finished OCR extraction ******")
         # === STEP 2: Translate both OCR outputs concurrently ===
@@ -1321,6 +1322,7 @@ async def translate_document_dual_ocr(
         translated_hocr, translated_paddle = await asyncio.gather(
             translated_hocr_task, translated_paddle_task
         )
         print("***** Step 2 Done: Finished translation ******")
         # === STEP 3: Generate final HTML from both translated outputs ===

                 status_code=400,
                 detail="Neither Tesseract nor PaddleOCR could extract any data from the image.",
             )
+        print(paddle_task)
         print("***** Step 1 Done: Finished OCR extraction ******")
         # === STEP 2: Translate both OCR outputs concurrently ===
         translated_hocr, translated_paddle = await asyncio.gather(
             translated_hocr_task, translated_paddle_task
         )
+        print(translated_paddle_task)
         print("***** Step 2 Done: Finished translation ******")
         # === STEP 3: Generate final HTML from both translated outputs ===