gemini_prompts_all_ocr

This file contains structured prompt templates for Gemini used to extract Arabic-language fields from various Saudi government document types. Each prompt is tailored for a specific class such as CR1–CR7 (Commercial Registration), B1–B4 (Municipal Licenses), and V1–V3 (Tax Certificates).
These prompts are designed to guide Gemini API responses for accurate field extraction, with consistent output formatting per document type. Ideal for use in automated OCR pipelines.

Files changed (11) hide show

gemini_requestB.py +81 -0
gemini_requestCR1.py +128 -0
gemini_requestCR2.py +134 -0
gemini_requestCR3.py +140 -0
gemini_requestCR6.py +108 -0
gemini_requestCR7.py +103 -0
gemini_requestV1.py +77 -0
gemini_requestV2.py +82 -0
gemini_requestV3.py +95 -0
gemini_requestcr4.py +135 -0
gemini_requestcr5.py +118 -0

gemini_requestB.py ADDED Viewed

	@@ -0,0 +1,81 @@

+import base64
+import json
+import re
+import requests
+import os
+# Your Gemini API key
+API_KEY = "your_gemini_api_key_here"
+# Path to the document image you want to extract data from
+image_path = r"C:\Users\ASUS\Downloads\CR_OCR_Cls.v4-original_images.folder\train\CR4\CS000130_CR_jpg.rf.b2528e60546ec399c3088ac69c6a66e2.jpg"
+# قراءة الصورة وتحويلها إلى base64
+with open(image_path, "rb") as f:
+    image_b64 = base64.b64encode(f.read()).decode()
+prompt = """
+Please extract the following fields in Arabic and English from the government registration document image:
+- License Number
+- Owner's Name
+- ISIC Classification
+- Detailed Activity
+- Municipality
+- Sub-Municipality
+- District
+- Street
+- Shop's Total Area
+Return the result in a JSON format with these keys:
+en_license_number, en_owner_name, en_isic_classification, en_detailed_activity, en_municipality, en_sub_municipality, en_district, en_street, en_shop_total_area,
+ar_license_number, ar_owner_name, ar_isic_classification, ar_detailed_activity, ar_municipality, ar_sub_municipality, ar_district, ar_street, ar_shop_total_area
+If a field is missing, return null.
+"""
+url = f"https://generativelanguage.googleapis.com/v1/models/gemini-1.5-flash:generateContent?key={API_KEY}"
+headers = {
+    "Content-Type": "application/json"
+}
+data = {
+    "contents": [
+        {
+            "role": "user",
+            "parts": [
+                {"text": prompt},
+                {
+                    "inline_data": {
+                        "mime_type": "image/jpeg",
+                        "data": image_b64
+                    }
+                }
+            ]
+        }
+    ]
+}
+response = requests.post(url, headers=headers, json=data)
+response_text = response.json()['candidates'][0]['content']['parts'][0]['text']
+# تنظيف النص من ```json
+match = re.search(r"```json\s*(\{.*\})\s*```", response_text, re.DOTALL)
+if match:
+    json_text = match.group(1)
+    result = json.loads(json_text)
+    # استخراج اسم الصورة بدون الامتداد
+    image_name = os.path.splitext(os.path.basename(image_path))[0]
+    # استخراج مسار المجلد
+    image_dir = os.path.dirname(image_path)
+    # تحديد مسار ملف الجيسون
+    output_path = os.path.join(image_dir, f"{image_name}.json")
+    # حفظ الناتج
+    with open(output_path, "w", encoding="utf-8") as f:
+        json.dump(result, f, ensure_ascii=False, indent=2)
+    print(f"✅ تم حفظ النتيجة في: {output_path}")
+else:
+    print("❌ لم أتمكن من استخراج JSON من الرد:")
+    print(response_text)

gemini_requestCR1.py ADDED Viewed

	@@ -0,0 +1,128 @@

+import base64
+import json
+import re
+import requests
+import os
+# Your Gemini API key
+API_KEY = "your_gemini_api_key_here"
+# Path to the document image you want to extract data from
+image_path = r"C:\Users\ASUS\Downloads\CR_OCR_Cls.v4-original_images.folder\train\CR4\CS000130_CR_jpg.rf.b2528e60546ec399c3088ac69c6a66e2.jpg"
+# قراءة الصورة وتحويلها إلى base64
+with open(image_path, "rb") as f:
+    image_b64 = base64.b64encode(f.read()).decode()
+prompt = """
+يرجى استخراج الحقول التالية من صورة مستند السجل التجاري (CR1)، جميعها بالعربية فقط:
+- رقم الموحد
+- رقم المنشأة
+- الاسم التجاري للمؤسسة
+- مركزها الرئيسي
+- هاتف
+- الرمز البريدي
+- اسم التاجر
+- الجنسية
+- تاريخ الميلاد
+- رقم السجل المدني-الإقامة
+- تاريخه
+- مصدره
+- رقم الحفيظة-الجواز
+- تاريخه
+- مصدرة
+- النشاط
+- رأس المال
+- اسم المدير أو الوكيل المفوض
+- الجنسية
+- تاريخ الميلاد
+- رقم السجل المدني-الإقامة
+- تاريخه
+- مصدره
+- يشهد مكتب السجل التجاري بمدينة
+- بأنه تم تسجيل المؤسسة المذكورة أعلاه بمدينة
+- وتنتهي صلاحية الشهادات في
+- بموجب الإيصال رقم
+- وتاريخ
+أرجو إعادة النتيجة بصيغة JSON بهذه المفاتيح فقط، وإذا أي حقل غير موجود فضع قيمته null:
+{
+  "رقم الموحد": null,
+  "رقم المنشأة": null,
+  "الاسم التجاري للمؤسسة": null,
+  "مركزها الرئيسي": null,
+  "هاتف": null,
+  "الرمز البريدي": null,
+  "اسم التاجر": null,
+  "الجنسية": null,
+  "تاريخ الميلاد": null,
+  "رقم السجل المدني-الإقامة": null,
+  "تاريخه": null,
+  "مصدره": null,
+  "رقم الحفيظة-الجواز": null,
+  "تاريخه_2": null,
+  "مصدرة": null,
+  "النشاط": null,
+  "رأس المال": null,
+  "اسم المدير أو الوكيل المفوض": null,
+  "الجنسية_2": null,
+  "تاريخ الميلاد_2": null,
+  "رقم السجل المدني-الإقامة_2": null,
+  "تاريخه_3": null,
+  "مصدره_2": null,
+  "يشهد مكتب السجل التجاري بمدينة": null,
+  "بأنه تم تسجيل المؤسسة المذكورة أعلاه بمدينة": null,
+  "تنتهي صلاحية الشهادات في": null,
+  "بموجب الإيصال رقم": null,
+  "تاريخ_الإيصال": null
+}
+"""
+url = f"https://generativelanguage.googleapis.com/v1/models/gemini-1.5-flash:generateContent?key={API_KEY}"
+headers = {
+    "Content-Type": "application/json"
+}
+data = {
+    "contents": [
+        {
+            "role": "user",
+            "parts": [
+                {"text": prompt},
+                {
+                    "inline_data": {
+                        "mime_type": "image/jpeg",
+                        "data": image_b64
+                    }
+                }
+            ]
+        }
+    ]
+}
+response = requests.post(url, headers=headers, json=data)
+response_text = response.json()['candidates'][0]['content']['parts'][0]['text']
+# تنظيف النص من علامات ```json ... ```
+match = re.search(r"```json\s*(\{.*\})\s*```", response_text, re.DOTALL)
+if match:
+    json_text = match.group(1)
+    result = json.loads(json_text)
+    # هنا نحدد مسار ملف JSON بنفس مجلد الصورة وبنفس اسمها ولكن بامتداد json
+    folder = os.path.dirname(image_path)
+    base_name = os.path.splitext(os.path.basename(image_path))[0]
+    output_file = os.path.join(folder, base_name + ".json")
+    with open(output_file, "w", encoding="utf-8") as f:
+        json.dump(result, f, ensure_ascii=False, indent=2)
+    print(f"تم حفظ النتيجة في ملف {output_file}")
+    print(json.dumps(result, indent=2, ensure_ascii=False))
+else:
+    print("لم أتمكن من استخراج JSON نظيف من الرد:")
+    print(response_text)

gemini_requestCR2.py ADDED Viewed

	@@ -0,0 +1,134 @@

+import base64
+import json
+import re
+import requests
+import os
+# Your Gemini API key
+API_KEY = "your_gemini_api_key_here"
+# Path to the document image you want to extract data from
+image_path = r"C:\Users\ASUS\Downloads\CR_OCR_Cls.v4-original_images.folder\train\CR4\CS000130_CR_jpg.rf.b2528e60546ec399c3088ac69c6a66e2.jpg"
+# قراءة الصورة وتحويلها إلى base64
+with open(image_path, "rb") as f:
+    image_b64 = base64.b64encode(f.read()).decode()
+prompt = """
+يرجى استخراج الحقول التالية من صورة مستند CR2 (السجل التجاري 2)، جميعها بالعربية فقط:
+- الرقم
+- التاريخ
+- الرقم الموحد للمنشأة
+- الاسم التجاري للمؤسسة
+- مركزها الرئيسي
+- هاتف
+- الرمز البريدي
+- اسم التاجر
+- الجنسية
+- تاريخ الميلاد
+- رقم السجل المدني-الإقامة
+- تاريخه
+- مصدره
+- رقم الحفيظة-الجواز
+- تاريخه
+- مصدرة
+- النشاط
+- رأس المال
+- اسم المدير او الوكيل المفوض
+- الجنسية
+- تاريخ الميلاد
+- رقم السجل المدني-الإقامة
+- تاريخه
+- مصدره
+- سلطات المدير
+- يشهد مكتب السجل التجاري بمدينة
+- بأنه تم تسجيل المؤسسة المذكورة أعلاه بمدينة
+- وتنتهي صلاحية الشهادات في
+- بموجب الإيصال رقم
+- وتاريخ
+- مدير السجل التجاري
+أرجو إعادة النتيجة بصيغة JSON بهذه المفاتيح فقط، وإذا أي حقل غير موجود فضع قيمته null:
+{
+  "الرقم": null,
+  "التاريخ": null,
+  "الرقم الموحد للمنشأة": null,
+  "الاسم التجاري للمؤسسة": null,
+  "مركزها الرئيسي": null,
+  "هاتف": null,
+  "الرمز البريدي": null,
+  "اسم التاجر": null,
+  "الجنسية": null,
+  "تاريخ الميلاد": null,
+  "رقم السجل المدني-الإقامة": null,
+  "تاريخه": null,
+  "مصدره": null,
+  "رقم الحفيظة-الجواز": null,
+  "تاريخه_2": null,
+  "مصدرة": null,
+  "النشاط": null,
+  "رأس المال": null,
+  "اسم المدير او الوكيل المفوض": null,
+  "الجنسية_2": null,
+  "تاريخ الميلاد_2": null,
+  "رقم السجل المدني-الإقامة_2": null,
+  "تاريخه_3": null,
+  "مصدره_2": null,
+  "سلطات المدير": null,
+  "يشهد مكتب السجل التجاري بمدينة": null,
+  "بأنه تم تسجيل المؤسسة المذكورة أعلاه بمدينة": null,
+  "تنتهي صلاحية الشهادات في": null,
+  "بموجب الإيصال رقم": null,
+  "تاريخ_الإيصال": null,
+  "مدير السجل التجاري": null
+}
+"""
+url = f"https://generativelanguage.googleapis.com/v1/models/gemini-1.5-flash:generateContent?key={API_KEY}"
+headers = {
+    "Content-Type": "application/json"
+}
+data = {
+    "contents": [
+        {
+            "role": "user",
+            "parts": [
+                {"text": prompt},
+                {
+                    "inline_data": {
+                        "mime_type": "image/jpeg",
+                        "data": image_b64
+                    }
+                }
+            ]
+        }
+    ]
+}
+response = requests.post(url, headers=headers, json=data)
+response_text = response.json()['candidates'][0]['content']['parts'][0]['text']
+# تنظيف النص من علامات ```json ... ```
+match = re.search(r"```json\s*(\{.*\})\s*```", response_text, re.DOTALL)
+if match:
+    json_text = match.group(1)
+    result = json.loads(json_text)
+    # حفظ بنفس مجلد الصورة وبنفس اسمها بامتداد json
+    folder = os.path.dirname(image_path)
+    base_name = os.path.splitext(os.path.basename(image_path))[0]
+    output_file = os.path.join(folder, base_name + ".json")
+    with open(output_file, "w", encoding="utf-8") as f:
+        json.dump(result, f, ensure_ascii=False, indent=2)
+    print(f"تم حفظ النتيجة في ملف {output_file}")
+    print(json.dumps(result, indent=2, ensure_ascii=False))
+else:
+    print("لم أتمكن من استخراج JSON نظيف من الرد:")
+    print(response_text)

gemini_requestCR3.py ADDED Viewed

	@@ -0,0 +1,140 @@

+import base64
+import json
+import re
+import requests
+import os
+# Your Gemini API key
+API_KEY = "your_gemini_api_key_here"
+# Path to the document image you want to extract data from
+image_path = r"C:\Users\ASUS\Downloads\CR_OCR_Cls.v4-original_images.folder\train\CR4\CS000130_CR_jpg.rf.b2528e60546ec399c3088ac69c6a66e2.jpg"
+with open(image_path, "rb") as f:
+    image_b64 = base64.b64encode(f.read()).decode()
+prompt = """
+Extract the following fields from the CR3 document image. Return both Arabic and English text where available:
+الرقم
+التاريخ
+الرقم الموحد للمنشأة
+اسم التاجر
+الجنسية
+تاريخ الميلاد
+رقم السجل المدني-الإقامة
+تاريخه
+مصدرة
+مركزها الرئيسي
+هاتف
+الرمز البريدي
+رقم سجل المركز الرئيسي
+الاسم التجاري للفرع
+العنوان
+الرمز البريدي
+الهاتف
+النشاط
+رأس المال
+إسم المدير او الوكيل المفوض
+الجنسية
+تاريخ الميلاد
+رقم السجل المدني-الإقامة
+تاريخه
+مصدره
+سلطات المدير
+يشهد مكتب السجل التجاري بمدينة
+بأنه تم تسجيل المؤسسة المذكورة أعلاة بمدينة
+وتنتهي صلاحية الشهادات في
+بموجب الإيصال رقم
+وتاريخ
+مدير السجل التجاري
+Return as JSON with keys:
+{
+"الرقم": ...,
+"التاريخ": ...,
+"الرقم_الموحد_للمنشأة": ...,
+"اسم_التاجر": ...,
+"الجنسية": ...,
+"تاريخ_الميلاد": ...,
+"رقم_السجل_المدني_الإقامة": ...,
+"تاريخه": ...,
+"مصدرة": ...,
+"مركزها_الرئيسي": ...,
+"هاتف": ...,
+"الرمز_البريدي": ...,
+"رقم_سجل_المركز_الرئيسي": ...,
+"الاسم_التجاري_للفرع": ...,
+"العنوان": ...,
+"الرمز_البريدي_الفرع": ...,
+"الهاتف_الفرع": ...,
+"النشاط": ...,
+"رأس_المال": ...,
+"اسم_المدير_او_الوكيل_المفوض": ...,
+"الجنسية_المدير": ...,
+"تاريخ_ميلاد_المدير": ...,
+"رقم_السجل_المدني_الإقامة_المدير": ...,
+"تاريخه_المدير": ...,
+"مصدره_المدير": ...,
+"سلطات_المدير": ...,
+"يشهد_مكتب_السجل": ...,
+"تم_تسجيل_المؤسسة": ...,
+"تنتهي_صلاحية_الشهادة": ...,
+"الإيصال_رقم": ...,
+"الإيصال_تاريخ": ...,
+"مدير_السجل_التجاري": ...
+}
+If a field is missing, set it to null.
+"""
+url = f"https://generativelanguage.googleapis.com/v1/models/gemini-1.5-flash:generateContent?key={API_KEY}"
+headers = {
+    "Content-Type": "application/json"
+}
+data = {
+    "contents": [
+        {
+            "role": "user",
+            "parts": [
+                {"text": prompt},
+                {
+                    "inline_data": {
+                        "mime_type": "image/jpeg",
+                        "data": image_b64
+                    }
+                }
+            ]
+        }
+    ]
+}
+response = requests.post(url, headers=headers, json=data)
+try:
+    response_text = response.json()['candidates'][0]['content']['parts'][0]['text']
+    match = re.search(r"```json\s*(\{.*?\})\s*```", response_text, re.DOTALL)
+    if match:
+        json_text = match.group(1)
+        result = json.loads(json_text)
+        base_name = os.path.splitext(os.path.basename(image_path))[0]
+        folder = os.path.dirname(image_path)
+        json_path = os.path.join(folder, f"{base_name}.json")
+        with open(json_path, "w", encoding="utf-8") as f:
+            json.dump(result, f, ensure_ascii=False, indent=2)
+        print(f"✅ تم حفظ النتيجة في الملف: {json_path}")
+        print(json.dumps(result, indent=2, ensure_ascii=False))
+    else:
+        print("❌ لم أتمكن من استخراج JSON نظيف من الرد:")
+        print(response_text)
+except Exception as e:
+    print(f"❌ حدث خطأ أثناء المعالجة: {e}")
+    print("الرد الكامل من Gemini:")
+    print(response.text)

gemini_requestCR6.py ADDED Viewed

	@@ -0,0 +1,108 @@

+import base64
+import json
+import re
+import requests
+import os
+# Your Gemini API key
+API_KEY = "your_gemini_api_key_here"
+# Path to the document image you want to extract data from
+image_path = r"C:\Users\ASUS\Downloads\CR_OCR_Cls.v4-original_images.folder\train\CR4\CS000130_CR_jpg.rf.b2528e60546ec399c3088ac69c6a66e2.jpg"
+# قراءة الصورة وتحويلها إلى base64
+with open(image_path, "rb") as f:
+    image_b64 = base64.b64encode(f.read()).decode()
+prompt = """
+يرجى استخراج الحقول التالية من مستند السجل التجاري (CR6) بالصورة، باللغة العربية فقط:
+- الكيان التجاري
+- حالة السجل
+- مدة المنشأة
+- الرقم الوطني الموحد للمنشأة
+- رابط المتجر الإكتروني
+- رأس المال
+- المدينة
+- صندوق البريد
+- الرمز البريدي
+- هاتف
+- تاريخ اصدار السجل
+- تاريخ انتهاء السجل
+- الموقع الاكتروني
+- العنوان
+- النشاط التجاري
+أرجو إعادة النتيجة بصيغة JSON بهذه المفاتيح فقط، وإذا أي حقل غير موجود فضع قيمته null:
+{
+  "الكيان التجاري": null,
+  "حالة السجل": null,
+  "مدة المنشأة": null,
+  "الرقم الوطني الموحد للمنشأة": null,
+  "رابط المتجر الإكتروني": null,
+  "رأس المال": null,
+  "المدينة": null,
+  "صندوق البريد": null,
+  "الرمز البريدي": null,
+  "هاتف": null,
+  "تاريخ اصدار السجل": null,
+  "تاريخ انتهاء السجل": null,
+  "الموقع الاكتروني": null,
+  "العنوان": null,
+  "النشاط التجاري": null
+}
+"""
+url = f"https://generativelanguage.googleapis.com/v1/models/gemini-1.5-flash:generateContent?key={API_KEY}"
+headers = {
+    "Content-Type": "application/json"
+}
+data = {
+    "contents": [
+        {
+            "role": "user",
+            "parts": [
+                {"text": prompt},
+                {
+                    "inline_data": {
+                        "mime_type": "image/jpeg",
+                        "data": image_b64
+                    }
+                }
+            ]
+        }
+    ]
+}
+response = requests.post(url, headers=headers, json=data)
+try:
+    response_text = response.json()['candidates'][0]['content']['parts'][0]['text']
+    match = re.search(r"```json\s*(\{.*?\})\s*```", response_text, re.DOTALL)
+    if match:
+        json_text = match.group(1)
+        result = json.loads(json_text)
+        # حفظ النتيجة بنفس اسم ملف الصورة وداخل نفس المجلد
+        folder = os.path.dirname(image_path)
+        base_name = os.path.splitext(os.path.basename(image_path))[0]
+        output_file = os.path.join(folder, base_name + ".json")
+        with open(output_file, "w", encoding="utf-8") as f:
+            json.dump(result, f, ensure_ascii=False, indent=2)
+        print(f"✅ تم حفظ النتيجة في ملف: {output_file}")
+        print(json.dumps(result, indent=2, ensure_ascii=False))
+    else:
+        print("❌ لم أتمكن من استخراج JSON نظيف من الرد:")
+        print(response_text)
+except Exception as e:
+    print(f"❌ حدث خطأ أثناء المعالجة: {e}")
+    print("🔴 الرد الكامل من Gemini:")
+    print(response.text)

gemini_requestCR7.py ADDED Viewed

	@@ -0,0 +1,103 @@

+import base64
+import json
+import re
+import requests
+import os
+# Your Gemini API key
+API_KEY = "your_gemini_api_key_here"
+#Path to the document image you want to extract data from
+image_path = r"C:\Users\ASUS\Downloads\OneDrive_1_7-30-2025\CR7\CS015431_CR.jpg"
+# قراءة الصورة وتحويلها إلى base64
+with open(image_path, "rb") as f:
+    image_b64 = base64.b64encode(f.read()).decode()
+prompt = """
+يرجى استخراج الحقول التالية من مستند السجل التجاري (CR7) بالصورة، باللغة العربية فقط:
+- اسم المنشأة
+- نوع السجل
+- حالة السجل
+- الرقم الموحد للمنشأة
+- رقم السجل التجاري
+- اسم المالك
+- نوع الكيان
+- تاريخ الاصدار
+- تاريخ الانتهاء
+- قائمة المدراء
+- المدينة
+- الموقع الإلكتروني
+- الانشطة التجارية
+أرجو إعادة النتيجة بصيغة JSON بهذه المفاتيح فقط، وإذا أي حقل غير موجود فضع قيمته null:
+{
+  "اسم المنشأة": null,
+  "نوع السجل": null,
+  "حالة السجل": null,
+  "الرقم الموحد للمنشأة": null,
+  "رقم السجل التجاري": null,
+  "اسم المالك": null,
+  "نوع الكيان": null,
+  "تاريخ الاصدار": null,
+  "تاريخ الانتهاء": null,
+  "قائمة المدراء": null,
+  "المدينة": null,
+  "الموقع الإلكتروني": null,
+  "الانشطة التجارية": null
+}
+"""
+url = f"https://generativelanguage.googleapis.com/v1/models/gemini-1.5-flash:generateContent?key={API_KEY}"
+headers = {
+    "Content-Type": "application/json"
+}
+data = {
+    "contents": [
+        {
+            "role": "user",
+            "parts": [
+                {"text": prompt},
+                {
+                    "inline_data": {
+                        "mime_type": "image/jpeg",
+                        "data": image_b64
+                    }
+                }
+            ]
+        }
+    ]
+}
+response = requests.post(url, headers=headers, json=data)
+try:
+    response_text = response.json()['candidates'][0]['content']['parts'][0]['text']
+    match = re.search(r"```json\s*(\{.*?\})\s*```", response_text, re.DOTALL)
+    if match:
+        json_text = match.group(1)
+        result = json.loads(json_text)
+        # حفظ النتيجة بنفس اسم ملف الصورة وداخل نفس المجلد
+        folder = os.path.dirname(image_path)
+        base_name = os.path.splitext(os.path.basename(image_path))[0]
+        output_file = os.path.join(folder, base_name + ".json")
+        with open(output_file, "w", encoding="utf-8") as f:
+            json.dump(result, f, ensure_ascii=False, indent=2)
+        print(f"✅ تم حفظ النتيجة في ملف: {output_file}")
+        print(json.dumps(result, indent=2, ensure_ascii=False))
+    else:
+        print("❌ لم أتمكن من استخراج JSON نظيف من الرد:")
+        print(response_text)
+except Exception as e:
+    print(f"❌ حدث خطأ أثناء المعالجة: {e}")
+    print("🔴 الرد الكامل من Gemini:")
+    print(response.text)

gemini_requestV1.py ADDED Viewed

	@@ -0,0 +1,77 @@

+import base64
+import json
+import re
+import requests
+import os
+# Your Gemini API key
+API_KEY = "your_gemini_api_key_here"
+# Path to the document image you want to extract data from
+image_path = r"C:\Users\ASUS\Downloads\CR_OCR_Cls.v4-original_images.folder\train\CR4\CS000130_CR_jpg.rf.b2528e60546ec399c3088ac69c6a66e2.jpg"
+# قراءة الصورة وتحويلها إلى base64
+with open(image_path, "rb") as f:
+    image_b64 = base64.b64encode(f.read()).decode()
+prompt = """
+Please extract the following fields in Arabic and English from the tax registration document image:
+Taxpayer Name
+VAT Registration Number
+Effective Registration Date
+Taxpayer Address
+Return the result in a JSON format with these keys:
+en_taxpayer_name, en_vat_registration_number, en_effective_registration_date, en_taxpayer_address,
+ar_taxpayer_name, ar_vat_registration_number, ar_effective_registration_date, ar_taxpayer_address
+If a field is missing, return null.
+"""
+url = f"https://generativelanguage.googleapis.com/v1/models/gemini-1.5-flash:generateContent?key={API_KEY}"
+headers = {
+    "Content-Type": "application/json"
+}
+data = {
+    "contents": [
+        {
+            "role": "user",
+            "parts": [
+                {"text": prompt},
+                {
+                    "inline_data": {
+                        "mime_type": "image/jpeg",
+                        "data": image_b64
+                    }
+                }
+            ]
+        }
+    ]
+}
+response = requests.post(url, headers=headers, json=data)
+response_text = response.json()['candidates'][0]['content']['parts'][0]['text']
+# تنظيف النص من علامات ```json ... ```
+match = re.search(r"```json\s*(\{.*\})\s*```", response_text, re.DOTALL)
+if match:
+    json_text = match.group(1)
+    result = json.loads(json_text)
+    # استخراج اسم الصورة بدون الامتداد
+    image_name = os.path.splitext(os.path.basename(image_path))[0]
+    # استخراج مسار المجلد
+    image_dir = os.path.dirname(image_path)
+    # تحديد مسار ملف الجيسون
+    output_path = os.path.join(image_dir, f"{image_name}.json")
+    # حفظ الناتج في ملف بنفس اسم الصورة وبنفس المجلد
+    with open(output_path, "w", encoding="utf-8") as f:
+        json.dump(result, f, ensure_ascii=False, indent=2)
+    print(f"✅ تم حفظ النتيجة في: {output_path}")
+else:
+    print("❌ لم أتمكن من استخراج JSON نظيف من الرد:")
+    print(response_text)

gemini_requestV2.py ADDED Viewed

	@@ -0,0 +1,82 @@

+import base64
+import json
+import re
+import requests
+import os
+# Your Gemini API key
+API_KEY = "your_gemini_api_key_here"
+# Path to the document image you want to extract data from
+image_path = r"C:\Users\ASUS\Downloads\CR_OCR_Cls.v4-original_images.folder\train\CR4\CS000130_CR_jpg.rf.b2528e60546ec399c3088ac69c6a66e2.jpg"# قراءة الصورة وتحويلها إلى base64
+with open(image_path, "rb") as f:
+    image_b64 = base64.b64encode(f.read()).decode()
+prompt = """
+Please extract the following fields in Arabic and English from the tax document image:
+Taxpayer Name
+VAT Registration Number
+Effective Registration Date
+Taxpayer Address
+CR/License
+Contract/ID No
+Tax period
+First Filing due date
+Return the result in a JSON format with these keys:
+en_taxpayer_name, en_vat_registration_number, en_effective_registration_date, en_taxpayer_address,
+en_cr_license, en_contract_id_no, en_tax_period, en_first_filing_due_date,
+ar_taxpayer_name, ar_vat_registration_number, ar_effective_registration_date, ar_taxpayer_address,
+ar_cr_license, ar_contract_id_no, ar_tax_period, ar_first_filing_due_date
+If a field is missing, return null.
+"""
+url = f"https://generativelanguage.googleapis.com/v1/models/gemini-1.5-flash:generateContent?key={API_KEY}"
+headers = {
+    "Content-Type": "application/json"
+}
+data = {
+    "contents": [
+        {
+            "role": "user",
+            "parts": [
+                {"text": prompt},
+                {
+                    "inline_data": {
+                        "mime_type": "image/jpeg",
+                        "data": image_b64
+                    }
+                }
+            ]
+        }
+    ]
+}
+response = requests.post(url, headers=headers, json=data)
+response_text = response.json()['candidates'][0]['content']['parts'][0]['text']
+# تنظيف النص من علامات ```json ... ```
+match = re.search(r"```json\s*(\{.*\})\s*```", response_text, re.DOTALL)
+if match:
+    json_text = match.group(1)
+    result = json.loads(json_text)
+    # احصل على اسم الصورة بدون امتداد
+    image_name = os.path.splitext(os.path.basename(image_path))[0]
+    # احصل على مجلد الصورة
+    image_dir = os.path.dirname(image_path)
+    # مسار ملف JSON الجديد
+    output_path = os.path.join(image_dir, f"{image_name}.json")
+    # احفظ الناتج في ملف JSON بنفس اسم الصورة ونفس المجلد
+    with open(output_path, "w", encoding="utf-8") as f:
+        json.dump(result, f, ensure_ascii=False, indent=2)
+    print(f"✅ تم حفظ النتيجة في: {output_path}")
+    print(json.dumps(result, indent=2, ensure_ascii=False))
+else:
+    print("❌ لم أتمكن من استخراج JSON نظيف من الرد:")
+    print(response_text)

gemini_requestV3.py ADDED Viewed

	@@ -0,0 +1,95 @@

+import base64
+import json
+import re
+import requests
+import os
+# Your Gemini API key
+API_KEY = "your_gemini_api_key_here"
+# Path to the document image you want to extract data from
+image_path = r"C:\Users\ASUS\Downloads\CR_OCR_Cls.v4-original_images.folder\train\CR4\CS000130_CR_jpg.rf.b2528e60546ec399c3088ac69c6a66e2.jpg"
+with open(image_path, "rb") as f:
+    image_b64 = base64.b64encode(f.read()).decode()
+prompt = """
+استخرج الحقول التالية من مستند باللغة العربية فقط، وأرجعها بصيغة JSON:
+1. اسم المكلف
+2. عنوان المركز الرئيسي
+3. المدينة
+4. الحي
+5. صندوق البريد
+6. الرمز البريدي
+7. الهاتف
+الصيغة المطلوبة:
+{
+  "اسم المكلف": "...",
+  "عنوان المركز الرئيسي": "...",
+  "المدينة": "...",
+  "الحي": "...",
+  "صندوق البريد": "...",
+  "الرمز البريدي": "...",
+  "الهاتف": "..."
+}
+إذا لم يوجد حقل، أرجعه كـ null.
+"""
+url = f"https://generativelanguage.googleapis.com/v1/models/gemini-1.5-flash:generateContent?key={API_KEY}"
+headers = {
+    "Content-Type": "application/json"
+}
+data = {
+    "contents": [
+        {
+            "role": "user",
+            "parts": [
+                {"text": prompt},
+                {
+                    "inline_data": {
+                        "mime_type": "image/jpeg",
+                        "data": image_b64
+                    }
+                }
+            ]
+        }
+    ]
+}
+response = requests.post(url, headers=headers, json=data)
+try:
+    response_text = response.json()['candidates'][0]['content']['parts'][0]['text']
+    match = re.search(r"```json\s*(\{.*\})\s*```", response_text, re.DOTALL)
+    if match:
+        json_text = match.group(1)
+    else:
+        json_text = response_text
+    result = json.loads(json_text)
+    # استخراج اسم الصورة بدون امتداد ومسار المجلد
+    image_name = os.path.splitext(os.path.basename(image_path))[0]
+    image_dir = os.path.dirname(image_path)
+    # تحديد مسار ملف JSON بنفس اسم الصورة ونفس المجلد
+    output_file = os.path.join(image_dir, f"{image_name}.json")
+    # حفظ النتيجة في ملف JSON
+    with open(output_file, "w", encoding="utf-8") as f:
+        json.dump(result, f, ensure_ascii=False, indent=2)
+    print(f"✅ تم حفظ النتيجة في ملف {output_file}")
+    print(json.dumps(result, indent=2, ensure_ascii=False))
+except Exception as e:
+    print("❌ حدث خطأ أثناء معالجة الرد:")
+    print(response.text)
+    print(e)

gemini_requestcr4.py ADDED Viewed

	@@ -0,0 +1,135 @@

+import base64
+import json
+import re
+import requests
+import os
+# Your Gemini API key
+API_KEY = "your_gemini_api_key_here"
+#Path to the document image you want to extract data from
+image_path = r"C:\Users\ASUS\Downloads\CR_OCR_Cls.v4-original_images.folder\train\CR4\CS000130_CR_jpg.rf.b2528e60546ec399c3088ac69c6a66e2.jpg"
+with open(image_path, "rb") as f:
+    image_b64 = base64.b64encode(f.read()).decode()
+prompt = """
+Extract the following fields from the CR4 document image. Return both Arabic and English text where available:
+الرقم الموحد
+رقم المنشأة
+التاريخ
+الاسم التجاري للشركة
+نوعها
+جنسيتها
+مدة الشركة
+تبدأ من
+وتنتهي في
+مركزها الرئيسي
+هاتف
+الرمز البريدي
+النشاط
+رأس المال
+المديرون
+سلطات المدير/المديرون
+يشهد مكتب السجل التجاري بمدينة
+بأنه تم تسجيل المؤسسة المذكورة أعلاة بمدينة
+وتنتهي صلاحية الشهادات في
+بموجب الإيصال رقم
+وتاريخ
+Return as JSON with keys:
+{
+"رقم_موحد": ...,
+"رقم_المنشأة": ...,
+"التاريخ": ...,
+"الاسم_التجاري": ...,
+"نوعها": ...,
+"جنسيتها": ...,
+"مدة_الشركة": ...,
+"تبدأ_من": ...,
+"تنتهي_في": ...,
+"مركزها_الرئيسي": ...,
+"هاتف": ...,
+"الرمز_البريدي": ...,
+"النشاط": ...,
+"رأس_المال": ...,
+"المديرون": ...,
+"سلطات_المدير": ...,
+"يشهد_مكتب_السجل": ...,
+"تم_تسجيل_المؤسسة": ...,
+"تنتهي_صلاحية_الشهادة": ...,
+"الإيصال_رقم": ...,
+"الإيصال_تاريخ": ...
+}
+If a field is missing, set it to null.
+"""
+url = f"https://generativelanguage.googleapis.com/v1/models/gemini-1.5-flash:generateContent?key={API_KEY}"
+headers = {
+    "Content-Type": "application/json"
+}
+data = {
+    "contents": [
+        {
+            "role": "user",
+            "parts": [
+                {"text": prompt},
+                {
+                    "inline_data": {
+                        "mime_type": "image/jpeg",
+                        "data": image_b64
+                    }
+                }
+            ]
+        }
+    ]
+}
+response = requests.post(url, headers=headers, json=data)
+try:
+    response_text = response.json()['candidates'][0]['content']['parts'][0]['text']
+    # استخراج JSON من النص
+    match = re.search(r"```json\s*(\{.*?\})\s*```", response_text, re.DOTALL)
+    if match:
+        json_text = match.group(1)
+        result = json.loads(json_text)
+        base_name = os.path.splitext(os.path.basename(image_path))[0]
+        folder = os.path.dirname(image_path)
+        json_path = os.path.join(folder, f"{base_name}.json")
+        # إذا الملف موجود نقرأه ونضيف عليه
+        if os.path.exists(json_path):
+            with open(json_path, "r", encoding="utf-8") as f:
+                try:
+                    existing_data = json.load(f)
+                    if not isinstance(existing_data, list):
+                        existing_data = [existing_data]
+                except json.JSONDecodeError:
+                    existing_data = []
+        else:
+            existing_data = []
+        existing_data.append(result)
+        with open(json_path, "w", encoding="utf-8") as f:
+            json.dump(existing_data, f, ensure_ascii=False, indent=2)
+        print(f"✅ تم حفظ النتيجة في الملف: {json_path}")
+        print(json.dumps(result, indent=2, ensure_ascii=False))
+    else:
+        print("❌ لم أتمكن من استخراج JSON نظيف من الرد:")
+        print(response_text)
+except Exception as e:
+    print(f"❌ حدث خطأ أثناء المعالجة: {e}")
+    print("الرد الكامل من Gemini:")
+    print(response.text)

gemini_requestcr5.py ADDED Viewed

	@@ -0,0 +1,118 @@

+import base64
+import json
+import re
+import requests
+import os
+# Your Gemini API key
+API_KEY = "your_gemini_api_key_here"
+# Path to the document image you want to extract data from
+image_path = r"C:\Users\ASUS\Downloads\CR_OCR_Cls.v4-original_images.folder\train\CR4\CS000130_CR_jpg.rf.b2528e60546ec399c3088ac69c6a66e2.jpg"
+with open(image_path, "rb") as f:
+    image_b64 = base64.b64encode(f.read()).decode()
+prompt = """
+Extract the following fields from the CR5 document image. Return both Arabic and English text where available:
+الرقم
+التاريخ
+الرقم الموحد للمنشأة
+الاسم التجاري للشركة
+نوعها
+جنسيتها
+مدة الشركة
+تبدا من
+تنتهي في
+مركزها الرئيسي
+هاتف
+الرمز البريدي
+النشاط
+رأس المال
+المديرون
+سلطات المدير/المديرون
+يشهد مكتب السجل التجاري بمدينة
+بأنه تم تسجيل المؤسسة المذكورة أعلاة بمدينة
+وتنتهي صلاحية الشهادات في
+بموجب الإيصال رقم
+وتاريخ
+Return as JSON with keys:
+{
+"رقم": ...,
+"التاريخ": ...,
+"الرقم_الموحد_للمنشأة": ...,
+"الاسم_التجاري_للشركة": ...,
+"نوعها": ...,
+"جنسيتها": ...,
+"مدة_الشركة": ...,
+"تبدا_من": ...,
+"تنتهي_في": ...,
+"مركزها_الرئيسي": ...,
+"هاتف": ...,
+"الرمز_البريدي": ...,
+"النشاط": ...,
+"رأس_المال": ...,
+"المديرون": ...,
+"سلطات_المدير": ...,
+"يشهد_مكتب_السجل": ...,
+"تم_تسجيل_المؤسسة": ...,
+"تنتهي_صلاحية_الشهادة": ...,
+"الإيصال_رقم": ...,
+"الإيصال_تاريخ": ...
+}
+If a field is missing, set it to null.
+"""
+url = f"https://generativelanguage.googleapis.com/v1/models/gemini-1.5-flash:generateContent?key={API_KEY}"
+headers = {
+    "Content-Type": "application/json"
+}
+data = {
+    "contents": [
+        {
+            "role": "user",
+            "parts": [
+                {"text": prompt},
+                {
+                    "inline_data": {
+                        "mime_type": "image/jpeg",
+                        "data": image_b64
+                    }
+                }
+            ]
+        }
+    ]
+}
+response = requests.post(url, headers=headers, json=data)
+try:
+    response_text = response.json()['candidates'][0]['content']['parts'][0]['text']
+    match = re.search(r"```json\s*(\{.*?\})\s*```", response_text, re.DOTALL)
+    if match:
+        json_text = match.group(1)
+        result = json.loads(json_text)
+        base_name = os.path.splitext(os.path.basename(image_path))[0]
+        folder = os.path.dirname(image_path)
+        json_path = os.path.join(folder, f"{base_name}.json")
+        with open(json_path, "w", encoding="utf-8") as f:
+            json.dump(result, f, ensure_ascii=False, indent=2)
+        print(f"✅ تم حفظ النتيجة في الملف: {json_path}")
+        print(json.dumps(result, indent=2, ensure_ascii=False))
+    else:
+        print("❌ لم أتمكن من استخراج JSON نظيف من الرد:")
+        print(response_text)
+except Exception as e:
+    print(f"❌ حدث خطأ أثناء المعالجة: {e}")
+    print("الرد الكامل من Gemini:")
+    print(response.text)