binder-sa
/

OCR-pipeline

Model card Files Files and versions

OCR-pipeline / gemini_requestCR6.py

abdullah-1111's picture

gemini_prompts_all_ocr

65d15f6 verified 9 months ago

history blame contribute delete

3.55 kB

	import base64
	import json
	import re
	import requests
	import os

	# Your Gemini API key
	API_KEY = "your_gemini_api_key_here"

	# Path to the document image you want to extract data from
	image_path = r"C:\Users\ASUS\Downloads\CR_OCR_Cls.v4-original_images.folder\train\CR4\CS000130_CR_jpg.rf.b2528e60546ec399c3088ac69c6a66e2.jpg"


	# قراءة الصورة وتحويلها إلى base64
	with open(image_path, "rb") as f:
	image_b64 = base64.b64encode(f.read()).decode()

	prompt = """
	يرجى استخراج الحقول التالية من مستند السجل التجاري (CR6) بالصورة، باللغة العربية فقط:

	- الكيان التجاري
	- حالة السجل
	- مدة المنشأة
	- الرقم الوطني الموحد للمنشأة
	- رابط المتجر الإكتروني
	- رأس المال
	- المدينة
	- صندوق البريد
	- الرمز البريدي
	- هاتف
	- تاريخ اصدار السجل
	- تاريخ انتهاء السجل
	- الموقع الاكتروني
	- العنوان
	- النشاط التجاري

	أرجو إعادة النتيجة بصيغة JSON بهذه المفاتيح فقط، وإذا أي حقل غير موجود فضع قيمته null:

	{
	"الكيان التجاري": null,
	"حالة السجل": null,
	"مدة المنشأة": null,
	"الرقم الوطني الموحد للمنشأة": null,
	"رابط المتجر الإكتروني": null,
	"رأس المال": null,
	"المدينة": null,
	"صندوق البريد": null,
	"الرمز البريدي": null,
	"هاتف": null,
	"تاريخ اصدار السجل": null,
	"تاريخ انتهاء السجل": null,
	"الموقع الاكتروني": null,
	"العنوان": null,
	"النشاط التجاري": null
	}
	"""

	url = f"https://generativelanguage.googleapis.com/v1/models/gemini-1.5-flash:generateContent?key={API_KEY}"

	headers = {
	"Content-Type": "application/json"
	}

	data = {
	"contents": [
	{
	"role": "user",
	"parts": [
	{"text": prompt},
	{
	"inline_data": {
	"mime_type": "image/jpeg",
	"data": image_b64
	}
	}
	]
	}
	]
	}

	response = requests.post(url, headers=headers, json=data)

	try:
	response_text = response.json()['candidates'][0]['content']['parts'][0]['text']

	match = re.search(r"```json\s(\{.?\})\s*```", response_text, re.DOTALL)
	if match:
	json_text = match.group(1)
	result = json.loads(json_text)

	# حفظ النتيجة بنفس اسم ملف الصورة وداخل نفس المجلد
	folder = os.path.dirname(image_path)
	base_name = os.path.splitext(os.path.basename(image_path))[0]
	output_file = os.path.join(folder, base_name + ".json")

	with open(output_file, "w", encoding="utf-8") as f:
	json.dump(result, f, ensure_ascii=False, indent=2)

	print(f"✅ تم حفظ النتيجة في ملف: {output_file}")
	print(json.dumps(result, indent=2, ensure_ascii=False))
	else:
	print("❌ لم أتمكن من استخراج JSON نظيف من الرد:")
	print(response_text)

	except Exception as e:
	print(f"❌ حدث خطأ أثناء المعالجة: {e}")
	print("🔴 الرد الكامل من Gemini:")
	print(response.text)