Spaces:

rieffs
/

OCR-KTP

Sleeping

App Files Files Community

OCR-KTP / app.py

rieffs

Update app.py

b77a642 verified 12 days ago

raw

history blame contribute delete

7.73 kB

	import gradio as gr
	import cv2
	import easyocr
	import numpy as np
	import json

	# OCR Process - Inisialisasi Reader EasyOCR
	reader = easyocr.Reader(['id', 'en'])

	def detect_and_warp_ktp(input_img):
	"""
	Fungsi untuk mendeteksi tepi KTP, melakukan cropping,
	dan meluruskan perspektif gambar secara otomatis.
	"""
	clone = input_img.copy()
	gray = cv2.cvtColor(input_img, cv2.COLOR_RGB2GRAY)

	# Efek blur dan deteksi tepi untuk mengekstrak kontur kartu
	blurred = cv2.GaussianBlur(gray, (5, 5), 0)
	edged = cv2.Canny(blurred, 50, 200)

	# Contour Detection - Mencari 5 kontur terbesar (KTP biasanya berbentuk persegi panjang dominan)
	contours, _ = cv2.findContours(edged.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
	contours = sorted(contours, key=cv2.contourArea, reverse=True)[:5]

	ktp_contour = None
	for c in contours:
	peri = cv2.arcLength(c, True)
	approx = cv2.approxPolyDP(c, 0.02 * peri, True)

	# Jika kontur memiliki tepat 4 titik sudut, asumsikan sebagai KTP
	if len(approx) == 4:
	ktp_contour = approx
	break

	# Perspective Warp - Jika kartu terdeteksi, lakukan transformasi perspektif (Pelurusan)
	if ktp_contour is not None:
	pts = ktp_contour.reshape(4, 2)
	rect = np.zeros((4, 2), dtype="float32")

	# Mengurutkan koordinat titik sudut
	s = pts.sum(axis=1)
	rect[0] = pts[np.argmin(s)] # Top-left
	rect[2] = pts[np.argmax(s)] # Bottom-right

	diff = np.diff(pts, axis=1)
	rect[1] = pts[np.argmin(diff)] # Top-right
	rect[3] = pts[np.argmax(diff)] # Bottom-left

	# Standarisasi ukuran dimensi hasil crop (Rasio KTP standard)
	width = 600
	height = 380

	dst = np.array([
	[0, 0],
	[width - 1, 0],
	[width - 1, height - 1],
	[0, height - 1]], dtype="float32")

	M = cv2.getPerspectiveTransform(rect, dst)
	warped = cv2.warpPerspective(clone, M, (width, height))
	return warped

	# Jika gagal mendeteksi kartu, kembalikan gambar asli
	return input_img

	def process_ktp(input_img):
	if input_img is None:
	return None, "Mohon unggah gambar KTP."

	# TAHAP 1: Deteksi area kartu dan perbaikan perspektif secara dinamis
	img_cropped = detect_and_warp_ktp(input_img)

	# Standarisasi ukuran prapemrosesan akhir
	scale_percent = 150
	width = int(img_cropped.shape[1] * scale_percent / 100)
	height = int(img_cropped.shape[0] * scale_percent / 100)
	img = cv2.resize(img_cropped, (width, height), interpolation=cv2.INTER_CUBIC)

	display_img = img.copy()
	gray = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)

	# TAHAP 2: Jalankan OCR pada gambar yang sudah bersih dan lurus
	ocr_results = reader.readtext(gray, detail=1, paragraph=False)

	extracted_data = {
	"NIK": "-",
	"Nama": "-",
	"Tempat/Tgl Lahir": "-"
	}

	# Toleransi piksel vertikal (Y) menjadi sangat konsisten pasca pelurusan
	y_tolerance = 25

	# TAHAP 3: Proses Ekstraksi Dinamis Berdasarkan Kedekatan Koordinat
	for i, (bbox, text, prob) in enumerate(ocr_results):
	text_clean = text.upper().strip()
	(tl, tr, br, bl) = bbox
	key_y_center = (tl[1] + bl[1]) / 2
	key_x_max = tr[0]

	# --- DETEKSI NIK ---
	if "NIK" in text_clean:
	digits = ''.join(filter(str.isdigit, text_clean)) # Filtrasi Angka NIK
	if len(digits) >= 12:
	extracted_data["NIK"] = digits
	else:
	for sub_bbox, sub_text, _ in ocr_results:
	sub_y_center = (sub_bbox[0][1] + sub_bbox[3][1]) / 2
	if abs(sub_y_center - key_y_center) < y_tolerance and sub_bbox[0][0] > key_x_max:
	sub_digits = ''.join(filter(str.isdigit, sub_text))
	if len(sub_digits) >= 12:
	extracted_data["NIK"] = sub_digits
	cv2.rectangle(display_img, (int(sub_bbox[0][0]), int(sub_bbox[0][1])), (int(sub_bbox[2][0]), int(sub_bbox[2][1])), (0, 255, 0), 2)

	# --- DETEKSI NAMA ---
	elif "NAMA" in text_clean and not "IBU" in text_clean:
	for sub_bbox, sub_text, _ in ocr_results:
	sub_y_center = (sub_bbox[0][1] + sub_bbox[3][1]) / 2
	if abs(sub_y_center - key_y_center) < y_tolerance and sub_bbox[0][0] > key_x_max:
	extracted_data["Nama"] = sub_text.replace(":", "").strip()
	cv2.rectangle(display_img, (int(sub_bbox[0][0]), int(sub_bbox[0][1])), (int(sub_bbox[2][0]), int(sub_bbox[2][1])), (0, 255, 0), 2)

	# --- DETEKSI TEMPAT/TGL LAHIR ---
	elif "TEMPAT" in text_clean or "LAHIR" in text_clean or "TGL" in text_clean:
	ttl_parts = []
	for sub_bbox, sub_text, _ in ocr_results:
	sub_y_center = (sub_bbox[0][1] + sub_bbox[3][1]) / 2
	if abs(sub_y_center - key_y_center) < y_tolerance and sub_bbox[0][0] > key_x_max:
	clean_part = sub_text.replace(":", "").strip() # Cleaning Text
	if clean_part and clean_part not in ttl_parts:
	ttl_parts.append(clean_part)
	cv2.rectangle(display_img, (int(sub_bbox[0][0]), int(sub_bbox[0][1])), (int(sub_bbox[2][0]), int(sub_bbox[2][1])), (0, 255, 0), 2)

	if ttl_parts:
	extracted_data["Tempat/Tgl Lahir"] = " ".join(ttl_parts)

	# TAHAP 4: Post-Processing & Pembersihan Simbol Sisa
	final_json_dict = {}
	for key, val in extracted_data.items():
	if val.startswith(":") or val.startswith("."):
	val = val[1:].strip()

	# Mapping nama key menjadi lowercase untuk standarisasi JSON API
	if key == "NIK":
	final_json_dict["nik"] = val
	elif key == "Nama":
	final_json_dict["nama"] = val
	elif key == "Tempat/Tgl Lahir":
	final_json_dict["tempat_tgl_lahir"] = val

	# TAHAP 5: Konversi Dictionary ke Format Valid String JSON dengan Indentasi 4 Spasi
	json_output_string = json.dumps(final_json_dict, indent=4, ensure_ascii=False)

	return display_img, json_output_string

	# --- ANTARMUKA GRADIO ---
	with gr.Blocks(title="KTP Indonesia OCR Scanner") as demo:
	gr.Markdown("# 🪪 Indonesia ID Card (KTP) OCR Scanner")
	gr.Markdown("Aplikasi menggunakan EasyOCR dengan Deteksi Area Otomatis & Luaran Berformat JSON Standardized.")

	with gr.Row():
	with gr.Column():
	# MENAMBAHKAN parameter height agar ukuran kotak unggah terkunci (tidak melar)
	input_image = gr.Image(label="Unggah Foto KTP", height=350)
	btn = gr.Button("Ekstrak Data", variant="primary")

	with gr.Column():
	# MENAMBAHKAN parameter height yang sama agar visualisasi hasil simetris
	output_image = gr.Image(label="Visualisasi Hasil Scan", height=350)
	# Mengunci jumlah baris tampilan agar layout tidak melompat saat teks JSON masuk
	output_results = gr.Textbox(label="Data Terdeteksi (JSON format)", lines=10, max_lines=10)

	btn.click(fn=process_ktp, inputs=input_image, outputs=[output_image, output_results])

	if __name__ == "__main__":
	demo.launch()