Spaces:

Unlimitedlevel19
/

LSB

Sleeping

App Files Files Community

QMonitor Admin commited on Mar 25, 2025

Commit

962157e

1 Parent(s): 723c64a

Simplify Gradio interface for better API compatibility

Browse files

Files changed (1) hide show

app.py +75 -97

app.py CHANGED Viewed

@@ -1,6 +1,6 @@
 import gradio as gr
 import pytesseract
-from PIL import Image, ImageEnhance
 import cv2
 import numpy as np
 import tempfile
@@ -78,45 +78,6 @@ def detect_checkboxes(image, orig_image):
     return jenis_pengamatan
-# Fungsi utama untuk OCR
-def perform_ocr(image):
-    # Simpan gambar ke file temporari
-    with tempfile.NamedTemporaryFile(delete=False, suffix='.jpg') as temp:
-        image_path = temp.name
-        img_pil = Image.fromarray(image)
-        img_pil.save(image_path)
-    # Preprocess gambar untuk OCR
-    preprocessed = preprocess_image(img_pil)
-    cv2.imwrite(image_path + '_processed.jpg', preprocessed)
-    # Lakukan OCR pada gambar yang telah diproses
-    text = pytesseract.image_to_string(Image.open(image_path + '_processed.jpg'), lang='ind')
-    # Hapus file temporari
-    os.unlink(image_path)
-    os.unlink(image_path + '_processed.jpg')
-    # Lakukan juga deteksi checkbox
-    jenis_pengamatan = detect_checkboxes(img_pil, image)
-    # Parse teks hasil OCR menjadi data terstruktur
-    data = parse_form_text(text)
-    # Tambahkan hasil deteksi checkbox ke data
-    data['jenis_pengamatan'] = []
-    for jenis, checked in jenis_pengamatan.items():
-        if checked:
-            data['jenis_pengamatan'].append(jenis)
-    # Gabungkan menjadi string
-    if data['jenis_pengamatan']:
-        data['jenis_pengamatan'] = ', '.join(data['jenis_pengamatan'])
-    else:
-        data['jenis_pengamatan'] = ''
-    return data
 # Fungsi untuk memparse teks dari form LSB
 def parse_form_text(text):
     lines = text.split('\n')
@@ -168,66 +129,83 @@ def parse_form_text(text):
     return data
-# API endpoint untuk prediksi
-def predict_api(img):
-    # Konversi file gambar ke numpy array jika tidak dalam format array numpy
-    if not isinstance(img, np.ndarray):
-        if hasattr(img, 'read'):  # jika img adalah file object
-            img = np.array(Image.open(io.BytesIO(img.read())))
-        else:  # jika img adalah Image dari gradio
-            img = np.array(img)
-    # Lakukan OCR
-    result = perform_ocr(img)
-    return result
-# Interface web dengan Gradio
-with gr.Blocks() as demo:
-    gr.Markdown("# LSB Form OCR")
-    gr.Markdown("Upload gambar formulir LSB untuk ekstraksi data otomatis")
-    with gr.Row():
-        with gr.Column():
-            input_image = gr.Image(type="pil", label="Upload Gambar Formulir LSB")
-            submit_btn = gr.Button("Proses OCR")
-        with gr.Column():
-            nama_output = gr.Textbox(label="Nama Pelapor")
-            posisi_output = gr.Textbox(label="Posisi/Jabatan")
-            lokasi_output = gr.Textbox(label="Lokasi Kejadian")
-            tanggal_output = gr.Textbox(label="Tanggal/Waktu")
-            jenis_output = gr.Textbox(label="Jenis Pengamatan")
-            uraian_output = gr.Textbox(label="Uraian Pengamatan")
-            tindakan_output = gr.Textbox(label="Tindakan Intervensi")
-    def process_image(img):
-        if img is None:
-            return ["No image uploaded"] * 7
-        result = perform_ocr(np.array(img))
-        return [
-            result['nama_pelapor'],
-            result['posisi_jabatan'],
-            result['lokasi_kejadian'],
-            result['tanggal_waktu'],
-            result['jenis_pengamatan'],
-            result['uraian_pengamatan'],
-            result['tindakan_intervensi']
-        ]
-    submit_btn.click(
-        process_image,
-        inputs=[input_image],
-        outputs=[nama_output, posisi_output, lokasi_output, tanggal_output,
-                jenis_output, uraian_output, tindakan_output]
-    )
-    # Menambahkan endpoint API
-    demo.queue()
-    gr.Interface(fn=predict_api, inputs=gr.Image(type="pil"), outputs="json").launch(share=True)
-# Konfigurasi API
-demo.queue()
-demo.launch(share=True)  # Mengaktifkan share=True untuk membuat API endpoint publik

 import gradio as gr
 import pytesseract
+from PIL import Image
 import cv2
 import numpy as np
 import tempfile
     return jenis_pengamatan
 # Fungsi untuk memparse teks dari form LSB
 def parse_form_text(text):
     lines = text.split('\n')
     return data
+# Fungsi utama untuk OCR
+def perform_ocr(image):
+    try:
+        # Jika image adalah PIL.Image, konversi ke numpy array
+        if not isinstance(image, np.ndarray):
+            image = np.array(image)
+        # Simpan gambar ke file temporari
+        with tempfile.NamedTemporaryFile(delete=False, suffix='.jpg') as temp:
+            image_path = temp.name
+            img_pil = Image.fromarray(image)
+            img_pil.save(image_path)
+        # Preprocess gambar untuk OCR
+        preprocessed = preprocess_image(img_pil)
+        cv2.imwrite(image_path + '_processed.jpg', preprocessed)
+        # Lakukan OCR pada gambar yang telah diproses
+        text = pytesseract.image_to_string(Image.open(image_path + '_processed.jpg'), lang='ind')
+        # Hapus file temporari
+        os.unlink(image_path)
+        os.unlink(image_path + '_processed.jpg')
+        # Lakukan juga deteksi checkbox
+        jenis_pengamatan = detect_checkboxes(img_pil, image)
+        # Parse teks hasil OCR menjadi data terstruktur
+        data = parse_form_text(text)
+        # Tambahkan hasil deteksi checkbox ke data
+        data['jenis_pengamatan'] = []
+        for jenis, checked in jenis_pengamatan.items():
+            if checked:
+                data['jenis_pengamatan'].append(jenis)
+        # Gabungkan menjadi string
+        if data['jenis_pengamatan']:
+            data['jenis_pengamatan'] = ', '.join(data['jenis_pengamatan'])
+        else:
+            data['jenis_pengamatan'] = ''
+        return data
+    except Exception as e:
+        print(f"Error in OCR: {e}")
+        return {
+            'error': str(e),
+            'nama_pelapor': '',
+            'posisi_jabatan': '',
+            'lokasi_kejadian': '',
+            'tanggal_waktu': '',
+            'uraian_pengamatan': '',
+            'tindakan_intervensi': '',
+            'jenis_pengamatan': ''
+        }
+# Buat interface Gradio sederhana
+def process_image(img):
+    if img is None:
+        return "No image uploaded"
+    # Proses OCR
+    result = perform_ocr(img)
+    # Return hasil sebagai string untuk ditampilkan
+    return str(result)
+# Buat interface yang sangat sederhana untuk API
+demo = gr.Interface(
+    fn=process_image,
+    inputs=gr.Image(type="pil"),
+    outputs="text",
+    title="LSB Form OCR API",
+    description="Upload gambar formulir LSB untuk ekstraksi data otomatis",
+    examples=[],
+    cache_examples=False,
+)
+# Launch dengan API enabled
+demo.launch(share=True)