Spaces:

ranbac
/

OCR

Sleeping

App Files Files Community

ranbac commited on Feb 11

Commit

1bd8107

verified ·

1 Parent(s): 9fbe59a

Update app.py

Browse files

Files changed (1) hide show

app.py +19 -47

app.py CHANGED Viewed

@@ -1,17 +1,14 @@
 from fastapi import FastAPI, UploadFile, File, HTTPException
 from fastapi.responses import HTMLResponse
 from fastapi.middleware.cors import CORSMiddleware
-from paddleocr import PaddleOCR
-import paddleocr  # <-- Thêm dòng này để gọi lõi thư viện
 import numpy as np
 from PIL import Image
 import io
-import os         # <-- Thêm dòng này để xử lý đường dẫn
-# 1. Khởi tạo ứng dụng FastAPI
-app = FastAPI(title="PaddleOCR Tiếng Việt API")
-# Cấu hình CORS
 app.add_middleware(
     CORSMiddleware,
     allow_origins=["*"],
@@ -20,72 +17,47 @@ app.add_middleware(
     allow_headers=["*"],
 )
-# 2. Bắt buộc tìm và trỏ đích danh vào file từ điển Tiếng Việt
-vi_dict_path = os.path.join(os.path.dirname(paddleocr.__file__), 'ppocr', 'utils', 'dict', 'vi_dict.txt')
-print("Đang tải mô hình PaddleOCR (Tiếng Việt v3) vào RAM...")
-# Ép sử dụng PP-OCRv3 và file từ điển chuẩn
-ocr = PaddleOCR(
-    use_angle_cls=True,
-    lang='vi',
-    ocr_version='PP-OCRv3',          # Dùng v3 thay vì v4
-    rec_char_dict_path=vi_dict_path  # Trỏ thẳng vào từ điển tiếng Việt
-)
-print("Tải mô hình hoàn tất, sẵn sàng phục vụ!")
-# -----------------------------------------------------
-# -----------------------------------------------------
 # -----------------------------------------------------
-# ROUTE 1: Trả về giao diện người dùng (Frontend HTML)
 # -----------------------------------------------------
 @app.get("/", response_class=HTMLResponse)
 async def serve_frontend():
     try:
-        # Đọc và hiển thị nội dung file index.html
         with open("index.html", "r", encoding="utf-8") as f:
             return f.read()
     except FileNotFoundError:
-        return "<h1>Lỗi: Không tìm thấy file index.html. Vui lòng kiểm tra lại!</h1>"
 # -----------------------------------------------------
-# ROUTE 2: API Nhận ảnh và trích xuất chữ (Backend)
 # -----------------------------------------------------
 @app.post("/predict")
 async def predict_image(file: UploadFile = File(...)):
-    # Bước 1: Kiểm tra định dạng file (Chỉ nhận ảnh)
     if not file.content_type.startswith('image/'):
-        raise HTTPException(status_code=400, detail="Lỗi: Vui lòng tải lên một tệp hình ảnh (JPG, PNG...).")
     try:
-        # Bước 2: Đọc ảnh vào bộ nhớ RAM (Dưới dạng Byte) - Tuyệt đối không lưu file!
         contents = await file.read()
-        # Bước 3: Chuyển Byte thành cấu trúc ảnh RGB bằng thư viện Pillow (PIL)
         image = Image.open(io.BytesIO(contents)).convert('RGB')
-        # Bước 4: Chuyển ảnh thành ma trận số (Numpy Array) để PaddleOCR có thể đọc được
         img_array = np.array(image)
-        # Bước 5: Đưa vào mô hình OCR để nhận diện
-        result = ocr.ocr(img_array, cls=True)
-        extracted_text = ""
-        # Bước 6: Xử lý kết quả trả về
-        # Dữ liệu từ PaddleOCR có cấu trúc lồng nhau, ta cần bóc tách để lấy đoạn text
-        if result and result[0]:
-            # Bỏ qua tọa độ (bounding box) và độ chính xác (confidence), chỉ lấy text
-            texts = [line[1][0] for line in result[0]]
-            # Nối các dòng chữ lại với nhau, cách nhau bằng dấu xuống dòng
-            extracted_text = "\n".join(texts)
-        # Trả kết quả về cho Frontend dưới dạng JSON
         return {"text": extracted_text}
     except Exception as e:
-        # Bắt lỗi nếu ảnh bị hỏng hoặc có vấn đề trong quá trình xử lý
-        raise HTTPException(status_code=500, detail=f"Lỗi hệ thống trong quá trình OCR: {str(e)}")

 from fastapi import FastAPI, UploadFile, File, HTTPException
 from fastapi.responses import HTMLResponse
 from fastapi.middleware.cors import CORSMiddleware
+import easyocr
 import numpy as np
 from PIL import Image
 import io
+# 1. Khởi tạo FastAPI
+app = FastAPI(title="EasyOCR Tiếng Việt API")
 app.add_middleware(
     CORSMiddleware,
     allow_origins=["*"],
     allow_headers=["*"],
 )
+# 2. Khởi tạo mô hình EasyOCR (Chỉ chạy 1 lần)
+print("Đang tải mô hình EasyOCR (Tiếng Việt & Tiếng Anh) vào RAM...")
+# gpu=False: Khẳng định việc chạy trên CPU
+reader = easyocr.Reader(['vi', 'en'], gpu=False)
+print("Tải mô hình hoàn tất!")
 # -----------------------------------------------------
+# ROUTE 1: Giao diện Web
 # -----------------------------------------------------
 @app.get("/", response_class=HTMLResponse)
 async def serve_frontend():
     try:
         with open("index.html", "r", encoding="utf-8") as f:
             return f.read()
     except FileNotFoundError:
+        return "<h1>Lỗi: Không tìm thấy file index.html.</h1>"
 # -----------------------------------------------------
+# ROUTE 2: Xử lý OCR
 # -----------------------------------------------------
 @app.post("/predict")
 async def predict_image(file: UploadFile = File(...)):
     if not file.content_type.startswith('image/'):
+        raise HTTPException(status_code=400, detail="Vui lòng tải tệp hình ảnh.")
     try:
+        # Đọc ảnh vào RAM
         contents = await file.read()
         image = Image.open(io.BytesIO(contents)).convert('RGB')
         img_array = np.array(image)
+        # Đưa vào EasyOCR đọc chữ
+        # detail=0: Bỏ qua tọa độ, chỉ lấy thẳng danh sách các dòng chữ
+        results = reader.readtext(img_array, detail=0)
+        # Ghép các dòng chữ lại với nhau
+        extracted_text = "\n".join(results)
         return {"text": extracted_text}
     except Exception as e:
+        raise HTTPException(status_code=500, detail=f"Lỗi hệ thống: {str(e)}")