pdf / README.md
fokan's picture
Upload 48 files
943fd62 verified
metadata
title: محول DOCX إلى PDF المتقدم - دقة 99%+ للعربية
emoji: 📄
colorFrom: gray
colorTo: blue
sdk: docker
app_file: Dockerfile
pinned: false

🚀 محول DOCX إلى PDF المتقدم - دقة 99%+ للتنسيق العربي

محول من الجيل الجديد مع تقنيات متقدمة لضمان دقة 99%+ في التنسيق العربي - يتضمن معالجة مسبقة ذكية، مراقبة لاحقة، وتقارير جودة شاملة.

🎯 التقنيات المتقدمة الجديدة

🔧 معالجة DOCX مسبقة ذكية

  • كشف المشاكل تلقائياً: يحدد TextBoxes، SmartArt، والأشكال المعقدة
  • إزالة العناصر المشكلة: يحول العناصر المشكلة إلى تنسيقات متوافقة
  • تحسين بنية الجداول: يصلح الجداول المتداخلة ومشاكل دمج الخلايا
  • حماية Placeholders: يضمن بقاء {{name}}, {{date}} في مواضعها الدقيقة

⚙️ إعدادات LibreOffice محسنة

  • 70+ معامل تصدير PDF: تكوين JSON محسن لأقصى جودة
  • بدون ضغط: يحافظ على جودة الصور والنصوص الأصلية
  • تضمين الخطوط: جميع الخطوط مضمنة للعرض المتسق
  • إعدادات RTL متخصصة: تكوين خاص لاتجاه النص العربي

🔍 مراقبة لاحقة بـ PyMuPDF

  • تحقق من موضع العناصر: يؤكد أن كل عنصر في الموضع الصحيح
  • تحقق من الأحرف العربية: يتحقق من دقة عرض النص RTL
  • فحص بنية الجداول: يضمن الحفاظ على تخطيط الجداول
  • تتبع Placeholders: يراقب موضع المحتوى الديناميكي

✨ الميزات المحسنة للعربية

  • 🔤 تميز الخطوط: توافق كامل مع الخطوط العربية (Traditional Arabic→Amiri، Arabic Typesetting→Noto Naskh، Simplified Arabic→Noto Naskh)
  • 📊 كمال الجداول: يحافظ على المساحة الدقة للخلايا والحدود والمحاذاة وتنسيق النص
  • 🖼️ أقصى جودة للصور: الحفاظ على 600 DPI بدون ضغط مدمر
  • 🌍 دعم العربية RTL: عرض مثالي للنص من اليمين إلى اليسار مع خطوط Amiri و Noto
  • 🔍 التحقق من الجودة: تحليل فوري للمستند والتحقق من التحويل
  • 🛠️ تشخيص متقدم: تحليل شامل للأخطاء مع إرشادات استكشاف الأخطاء المحددة
  • ⚡ أداء محسن: تكوين LibreOffice محسن للمستندات المعقدة العربية

🛠️ حلول المشاكل الشائعة

تم حل المشاكل التالية:

  • ❌ تراكب النصوص العربية وعدم وجود فراغات كافية
  • ❌ فقدان المحاذاة اليمنى (Right-to-Left) في النص العربي
  • ❌ استبدال الخطوط الأصلية بخطوط غير داعمة للعربية
  • ❌ تشوه الجداول أو اختفاء البنية التنظيمية للوثيقة
  • ❌ تغيير مواقع قوالب التعبئة الديناميكية (مثل {{name}}, {{date}})
  • ❌ حجم الصفحة أو الهامش غير مناسب للطباعة بشكل مرتب (A4)

🚀 الاستخدام

واجهة الويب

  1. افتح متصفحك وانتقل إلى http://localhost:7860
  2. قم برفع ملف .docx باستخدام منطقة السحب والإفلات
  3. انقر على "تحويل إلى PDF" وانتظر اكتمال التحويل
  4. قم بتنزيل ملف PDF المُنشأ باستخدام زر التنزيل

استخدام واجهة برمجة التطبيقات

يمكنك أيضًا استخدام واجهة برمجة التطبيقات REST مباشرة:

# تحويل ملف DOCX
curl -X POST "http://localhost:7860/convert" \
     -H "accept: application/json" \
     -H "Content-Type: multipart/form-data" \
     -F "file=@/path/to/document.docx"

# التحقق من الصحة
curl -X GET "http://localhost:7860/health" -H "accept: application/json"

# وثائق واجهة برمجة التطبيقات
# انتقل إلى http://localhost:7860/docs للحصول على وثائق واجهة برمجة التطبيقات التفاعلية

🔧 التميز التقني

  • ال-backend: LibreOffice المحسن مع إعدادات تصدير PDF بجودة قصوى وواجهة برمجة تطبيقات FastAPI REST
  • ال-frontent: واجهة HTML/CSS/JavaScript حديثة مع تغذية راجعة للتحقق في الوقت الفعلي
  • نظام الخطوط: حزم خطوط شاملة تشمل:
    • خطوط Liberation (Arial/Times/Courier/Calibri/Cambria متوافقة)
    • خطوط Croscore (Arimo/Tinos/Cousine للتوافق الإضافي)
    • خطوط DejaVu و Noto للدعم الدولي
    • fontconfig متقدم مع قواعد استبدال الخطوط من Microsoft
  • ضمان الجودة: تحليل هيكل المستند والتحقق من صحة PDF
  • معالجة الأخطاء: تحليل الأخطاء الذكي مع إرشادات استكشاف الأخطاء المحددة
  • البيئة: محسّن لـ Hugging Face Spaces مع جميع التبعيات المُعدة مسبقًا

📋 الدعم الشامل

  • المستندات المعقدة: الجداول والصور والخطوط المختلطة وتخطيطات الصفحات المتعددة
  • توافق Microsoft: معالجة مثالية لخطوط Calibri و Cambria و Arial و Times New Roman
  • النصوص الدولية: النص العربي من اليمين إلى اليسار و Unicode والأحرف الخاصة
  • الملفات الكبيرة: مستندات تصل إلى 50 ميجابايت مع تعقيد غير محدود
  • التحقق من الجودة: تحليل فوري يضمن نتائج تحويل مثالية

🎯 مقاييس النجاح الحرجة

عدد الصفحات: صفحات DOCX = صفحات PDF (بالضبط) ✅ نص الجداول: نفس الحجم والوزن والموضع ✅ الصور: عدم فقدان الجودة، وموضع دقيق ✅ الخطوط: عرض متسق، وعدم تغيير الحجم ✅ التخطيط: عدم وجود تحركات بكسل أو إعادة تدفق ✅ حجم الملف: إخراج معقول بدون تضخم

🏗️ التطوير المحلي

باستخدام Docker (موصى به)

# بناء وتشغيل الحاوية
docker-compose up --build

# سيكون التطبيق متاحًا على http://localhost:7860

التثبيت المباشر

# تثبيت تبعيات النظام الشاملة (Ubuntu/Debian)
sudo apt-get update
sudo apt-get install libreoffice libreoffice-writer \
  fonts-liberation fonts-liberation2 fonts-dejavu fonts-croscore \
  fonts-noto-core fonts-opensymbol fontconfig

# تحديث ذاكرة التخزين المؤقت للخطوط
sudo fc-cache -fv

# تثبيت تبعيات Python
pip install -r requirements.txt

# تشغيل تطبيق FastAPI
python main.py

# سيكون التطبيق متاحًا على http://localhost:7860
# وثائق واجهة برمجة التطبيقات على http://localhost:7860/docs

لنشر Hugging Face Spaces، يتم تثبيت جميع تبعيات النظام تلقائيًا عبر packages.txt المحسّن.

🚀 معايير التنفيذ

يُنفذ هذا المحول المتطلبات من bb.txt بدقة مطلقة:

  • حزم الخطوط المحسّنة: نظام بيئي للخطوط متوافق مع Microsoft بالكامل
  • أمر LibreOffice المحسّن: جودة:100، تضمين الخطوط، والحفاظ على التخطيط
  • التكوين المتقدم: registrymodifications.xcu مخصص مع قواعد استبدال الخطوط
  • تميز البيئة: إعداد LANG و fontconfig وملف تعريف مستخدم LibreOffice المناسب
  • ضمان الجودة: تحليل المستند والتحقق من صحة PDF ومعالجة الأخطاء الشاملة

🎯 تحقيق الهدف النهائي

يُنشئ تحويلات DOCX إلى PDF دقيقة جدًا بحيث لا يستطيع المستخدمون التمييز بين DOCX الأصلي و PDF المحول عند عرضهما جنبًا إلى جنب. عدم التسامح مع انحرافات التنسيق.


مبني لـ Hugging Face Spaces | مستوى مؤسسي • دقة بكسلية • جودة لا تُنازل عنها