File size: 937 Bytes
2f276ad
 
3962088
 
 
 
2f276ad
 
3962088
 
 
 
 
2f276ad
 
3962088
2f276ad
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
import pytesseract
from PIL import Image
import os

class OCRReader:
    def __init__(self):
        # Tesseract نیازی به مدل سنگین ندارد، فقط باینری سیستم عامل را می‌خواند
        print("✅ موتور Tesseract OCR آماده است (سبک و سریع).")

    def extract_text(self, image_path: str) -> str:
        if not os.path.exists(image_path):
            raise FileNotFoundError(f"Image not found: {image_path}")

        # باز کردن عکس
        image = Image.open(image_path)
        
        # استخراج متن با استفاده از Tesseract
        # lang='eng' یعنی انگلیسی و اعداد
        try:
            text = pytesseract.image_to_string(image, lang='eng')
            return text
        except Exception as e:
            raise Exception(f"خطا در اجرای Tesseract: {str(e)} (ممکن است tesseract نصب نباشد)")