Spaces:

Seth0330
/

AIEXTRACT1

Sleeping

Seth0330 commited on 15 days ago

Commit

da57193

verified ·

1 Parent(s): b5224a9

Update backend/app/main.py

Files changed (1) hide show

backend/app/main.py CHANGED Viewed

@@ -104,6 +104,22 @@ async def extract_document(
         confidence = float(extracted.get("confidence", 90))
         fields = extracted.get("fields", {})
         fields_extracted = len(fields) if isinstance(fields, dict) else 0
         print(f"[INFO] Final stats - confidence: {confidence}, fields_count: {fields_extracted}")

         confidence = float(extracted.get("confidence", 90))
         fields = extracted.get("fields", {})
+        # Include full_text in fields if present (for frontend display)
+        full_text = extracted.get("full_text", "")
+        if full_text:
+            fields["full_text"] = full_text
+            full_text_words = len(str(full_text).split())
+            print(f"[INFO] Full text extracted: {full_text_words} words")
+        # Also check for pages array
+        pages_data = extracted.get("pages", [])
+        if pages_data and isinstance(pages_data, list):
+            print(f"[INFO] Extracted text from {len(pages_data)} page(s)")
+            # Add pages to fields for frontend
+            fields["pages"] = pages_data
+        # Count fields, including full_text if present
         fields_extracted = len(fields) if isinstance(fields, dict) else 0
         print(f"[INFO] Final stats - confidence: {confidence}, fields_count: {fields_extracted}")