OCR-pipeline / gemini_requestCR6.py
abdullah-1111's picture
gemini_prompts_all_ocr
65d15f6 verified
import base64
import json
import re
import requests
import os
# Your Gemini API key
API_KEY = "your_gemini_api_key_here"
# Path to the document image you want to extract data from
image_path = r"C:\Users\ASUS\Downloads\CR_OCR_Cls.v4-original_images.folder\train\CR4\CS000130_CR_jpg.rf.b2528e60546ec399c3088ac69c6a66e2.jpg"
# قراءة الصورة وتحويلها إلى base64
with open(image_path, "rb") as f:
image_b64 = base64.b64encode(f.read()).decode()
prompt = """
يرجى استخراج الحقول التالية من مستند السجل التجاري (CR6) بالصورة، باللغة العربية فقط:
- الكيان التجاري
- حالة السجل
- مدة المنشأة
- الرقم الوطني الموحد للمنشأة
- رابط المتجر الإكتروني
- رأس المال
- المدينة
- صندوق البريد
- الرمز البريدي
- هاتف
- تاريخ اصدار السجل
- تاريخ انتهاء السجل
- الموقع الاكتروني
- العنوان
- النشاط التجاري
أرجو إعادة النتيجة بصيغة JSON بهذه المفاتيح فقط، وإذا أي حقل غير موجود فضع قيمته null:
{
"الكيان التجاري": null,
"حالة السجل": null,
"مدة المنشأة": null,
"الرقم الوطني الموحد للمنشأة": null,
"رابط المتجر الإكتروني": null,
"رأس المال": null,
"المدينة": null,
"صندوق البريد": null,
"الرمز البريدي": null,
"هاتف": null,
"تاريخ اصدار السجل": null,
"تاريخ انتهاء السجل": null,
"الموقع الاكتروني": null,
"العنوان": null,
"النشاط التجاري": null
}
"""
url = f"https://generativelanguage.googleapis.com/v1/models/gemini-1.5-flash:generateContent?key={API_KEY}"
headers = {
"Content-Type": "application/json"
}
data = {
"contents": [
{
"role": "user",
"parts": [
{"text": prompt},
{
"inline_data": {
"mime_type": "image/jpeg",
"data": image_b64
}
}
]
}
]
}
response = requests.post(url, headers=headers, json=data)
try:
response_text = response.json()['candidates'][0]['content']['parts'][0]['text']
match = re.search(r"```json\s*(\{.*?\})\s*```", response_text, re.DOTALL)
if match:
json_text = match.group(1)
result = json.loads(json_text)
# حفظ النتيجة بنفس اسم ملف الصورة وداخل نفس المجلد
folder = os.path.dirname(image_path)
base_name = os.path.splitext(os.path.basename(image_path))[0]
output_file = os.path.join(folder, base_name + ".json")
with open(output_file, "w", encoding="utf-8") as f:
json.dump(result, f, ensure_ascii=False, indent=2)
print(f"✅ تم حفظ النتيجة في ملف: {output_file}")
print(json.dumps(result, indent=2, ensure_ascii=False))
else:
print("❌ لم أتمكن من استخراج JSON نظيف من الرد:")
print(response_text)
except Exception as e:
print(f"❌ حدث خطأ أثناء المعالجة: {e}")
print("🔴 الرد الكامل من Gemini:")
print(response.text)