Spaces:

saiful-ai-dev
/

OCR

Runtime error

App Files Files Community

saiful-ai-dev commited on 15 days ago

Commit

6446da8

verified ·

1 Parent(s): 62c83f8

Update app.py

Browse files

Files changed (1) hide show

app.py +12 -23

app.py CHANGED Viewed

@@ -1,39 +1,28 @@
 import gradio as gr
-from paddleocr import PaddleOCR
 import numpy as np
-# Reader টাকে একবার লোড করে রাখা (Bangla + English)
-# use_angle_cls=True → rotated text ভালো handle করে
-# lang='bn' for Bengali, অথবা 'en'/'multilingual' চাইলে change করো
-ocr = PaddleOCR(use_angle_cls=True, lang='bn')  # 'bn' for Bangla support
 def text_extraction(image):
     if image is None:
         return "দয়া করে একটি ছবি আপলোড করুন।"
-    # PaddleOCR দিয়ে টেক্সট রিড করা
-    # result হলো list of [ [bbox], (text, confidence) ]
-    results = ocr.ocr(image, cls=True)
-    # শুধু text extract করা (detail=0 এর মতো)
-    extracted_texts = []
-    for line in results[0] if results else []:  # results[0] because batch=1
-        text = line[1][0]  # text is at index 0 in tuple (text, score)
-        extracted_texts.append(text)
-    # সব টেক্সট জোড়া লাগানো (space দিয়ে, অথবা \n দিয়ে paragraph style চাইলে change করো)
-    full_text = " ".join(extracted_texts)
-    return full_text.strip() if full_text else "ছবিতে কোনো লেখা খুঁজে পাওয়া যায়নি।"
-# Gradio ইন্টারফেস তৈরি
 demo = gr.Interface(
     fn=text_extraction,
-    inputs=gr.Image(type="numpy"),  # numpy array হিসেবে নেয়া ভালো Paddle-এর জন্য
     outputs="text",
-    title="Education AI OCR (PaddleOCR Powered)",
-    description="আপনার বইয়ের পাতার ছবি আপলোড করুন। PaddleOCR দিয়ে লেখা বের করে দেবে (Bangla + English ভালো সাপোর্ট করে)।"
 )
-# সার্ভার চালু করা (Hugging Face Spaces-এ share=True দরকার নেই, auto handle করে)
 demo.launch()

 import gradio as gr
+import easyocr
 import numpy as np
+# Multiple languages load করা (Bangla + English + Hindi + আরও চাইলে add করো)
+# প্রথমবার load slow, পরে fast
+reader = easyocr.Reader(['bn', 'en', 'hi', 'ar', 'fr', 'es'], gpu=False)  # gpu=True যদি HF paid GPU থাকে
 def text_extraction(image):
     if image is None:
         return "দয়া করে একটি ছবি আপলোড করুন।"
+    # readtext-এ detail=0 দিয়ে শুধু text, paragraph=True দিয়ে grouped text (better for books)
+    results = reader.readtext(image, detail=0, paragraph=True, min_size=10, contrast_ths=0.1, adjust_contrast=0.5)
+    # results list of strings (paragraph mode-এ)
+    full_text = "\n\n".join(results)  # paragraph আলাদা করে দেখানো
+    return full_text if full_text.strip() else "ছবিতে কোনো লেখা খুঁজে পাওয়া যায়নি।"
 demo = gr.Interface(
     fn=text_extraction,
+    inputs=gr.Image(type="numpy"),
     outputs="text",
+    title="Education AI OCR - Any Language",
+    description="যেকোনো ভাষার (Bangla, English, Hindi, Arabic ইত্যাদি) বই/পাতার ছবি আপলোড করুন। Mixed language-ও detect করবে।"
 )
 demo.launch()