Spaces:

eoeooe
/

OcrBroTest

Sleeping

App Files Files Community

eoeooe commited on Sep 1, 2025

Commit

c0cb8ff

verified ·

1 Parent(s): 8da2d7f

Update app.py

Browse files

Files changed (1) hide show

app.py +26 -13

app.py CHANGED Viewed

@@ -5,33 +5,46 @@ from PIL import Image
 from doctr.models import ocr_predictor
 from doctr.io import DocumentFile
 predictor = ocr_predictor(pretrained=True)
-def ocr_image_doctr_cv2(image):
     # PIL -> OpenCV
     img_cv = cv2.cvtColor(np.array(image), cv2.COLOR_RGB2BGR)
-    # Preprocessing: grayscale + threshold
     gray = cv2.cvtColor(img_cv, cv2.COLOR_BGR2GRAY)
     _, thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
-    # แปลงกลับเป็น PIL.Image
     processed_pil = Image.fromarray(cv2.cvtColor(thresh, cv2.COLOR_GRAY2RGB))
-    # ✅ ส่งเป็น list ของ PIL.Image เสมอ
-    doc = DocumentFile.from_images([processed_pil])
     result = predictor(doc)
-    # ดึงข้อความทั้งหมด
     text = "\n".join([block.content for page in result.pages for block in page.blocks])
     return text.strip()
 demo = gr.Interface(
-    fn=ocr_image_doctr_cv2,
     inputs=gr.Image(type="pil", label="อัปโหลดรูปภาพ"),
     outputs=gr.Textbox(label="ข้อความที่ OCR ได้"),
-    title="OCR ภาษาไทย (Doctr + OpenCV)",
-    description="อัปโหลดภาพแล้วระบบจะอ่านข้อความภาษาไทยออกมาโดยใช้ Doctr OCR พร้อม preprocessing ด้วย OpenCV"
 )
 if __name__ == "__main__":

 from doctr.models import ocr_predictor
 from doctr.io import DocumentFile
+# โหลดโมเดล
 predictor = ocr_predictor(pretrained=True)
+def to_docfile(img):
+    # กันพัง: รองรับทั้ง PIL, numpy, list
+    if isinstance(img, np.ndarray):
+        return DocumentFile.from_images([img])
+    elif isinstance(img, Image.Image):
+        return DocumentFile.from_images([img])
+    elif isinstance(img, list):
+        return DocumentFile.from_images(img)
+    else:
+        raise ValueError(f"Unsupported input type: {type(img)}")
+def ocr_image_doctr(image):
     # PIL -> OpenCV
     img_cv = cv2.cvtColor(np.array(image), cv2.COLOR_RGB2BGR)
+    # Preprocessing
     gray = cv2.cvtColor(img_cv, cv2.COLOR_BGR2GRAY)
     _, thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
+    # แปลงกลับเป็น PIL
     processed_pil = Image.fromarray(cv2.cvtColor(thresh, cv2.COLOR_GRAY2RGB))
+    # ✅ ใช้ wrapper ป้องกัน error
+    doc = to_docfile(processed_pil)
+    # OCR
     result = predictor(doc)
     text = "\n".join([block.content for page in result.pages for block in page.blocks])
     return text.strip()
+# Gradio
 demo = gr.Interface(
+    fn=ocr_image_doctr,
     inputs=gr.Image(type="pil", label="อัปโหลดรูปภาพ"),
     outputs=gr.Textbox(label="ข้อความที่ OCR ได้"),
+    title="OCR ภาษาไทย (Doctr)",
+    description="OCR ด้วย Doctr + Preprocessing"
 )
 if __name__ == "__main__":