title: محول DOCX إلى PDF المتقدم - دقة 99%+ للعربية
emoji: 📄
colorFrom: gray
colorTo: blue
sdk: docker
app_file: Dockerfile
pinned: false
🚀 محول DOCX إلى PDF المتقدم - دقة 99%+ للتنسيق العربي
محول من الجيل الجديد مع تقنيات متقدمة لضمان دقة 99%+ في التنسيق العربي - يتضمن معالجة مسبقة ذكية، مراقبة لاحقة، وتقارير جودة شاملة.
🎯 التقنيات المتقدمة الجديدة
🔧 معالجة DOCX مسبقة ذكية
- كشف المشاكل تلقائياً: يحدد TextBoxes، SmartArt، والأشكال المعقدة
- إزالة العناصر المشكلة: يحول العناصر المشكلة إلى تنسيقات متوافقة
- تحسين بنية الجداول: يصلح الجداول المتداخلة ومشاكل دمج الخلايا
- حماية Placeholders: يضمن بقاء {{name}}, {{date}} في مواضعها الدقيقة
⚙️ إعدادات LibreOffice محسنة
- 70+ معامل تصدير PDF: تكوين JSON محسن لأقصى جودة
- بدون ضغط: يحافظ على جودة الصور والنصوص الأصلية
- تضمين الخطوط: جميع الخطوط مضمنة للعرض المتسق
- إعدادات RTL متخصصة: تكوين خاص لاتجاه النص العربي
🔍 مراقبة لاحقة بـ PyMuPDF
- تحقق من موضع العناصر: يؤكد أن كل عنصر في الموضع الصحيح
- تحقق من الأحرف العربية: يتحقق من دقة عرض النص RTL
- فحص بنية الجداول: يضمن الحفاظ على تخطيط الجداول
- تتبع Placeholders: يراقب موضع المحتوى الديناميكي
✨ الميزات المحسنة للعربية
- 🔤 تميز الخطوط: توافق كامل مع الخطوط العربية (Traditional Arabic→Amiri، Arabic Typesetting→Noto Naskh، Simplified Arabic→Noto Naskh)
- 📊 كمال الجداول: يحافظ على المساحة الدقة للخلايا والحدود والمحاذاة وتنسيق النص
- 🖼️ أقصى جودة للصور: الحفاظ على 600 DPI بدون ضغط مدمر
- 🌍 دعم العربية RTL: عرض مثالي للنص من اليمين إلى اليسار مع خطوط Amiri و Noto
- 🔍 التحقق من الجودة: تحليل فوري للمستند والتحقق من التحويل
- 🛠️ تشخيص متقدم: تحليل شامل للأخطاء مع إرشادات استكشاف الأخطاء المحددة
- ⚡ أداء محسن: تكوين LibreOffice محسن للمستندات المعقدة العربية
🛠️ حلول المشاكل الشائعة
✅ تم حل المشاكل التالية:
- ❌ تراكب النصوص العربية وعدم وجود فراغات كافية
- ❌ فقدان المحاذاة اليمنى (Right-to-Left) في النص العربي
- ❌ استبدال الخطوط الأصلية بخطوط غير داعمة للعربية
- ❌ تشوه الجداول أو اختفاء البنية التنظيمية للوثيقة
- ❌ تغيير مواقع قوالب التعبئة الديناميكية (مثل {{name}}, {{date}})
- ❌ حجم الصفحة أو الهامش غير مناسب للطباعة بشكل مرتب (A4)
🚀 الاستخدام
واجهة الويب
- افتح متصفحك وانتقل إلى
http://localhost:7860 - قم برفع ملف .docx باستخدام منطقة السحب والإفلات
- انقر على "تحويل إلى PDF" وانتظر اكتمال التحويل
- قم بتنزيل ملف PDF المُنشأ باستخدام زر التنزيل
استخدام واجهة برمجة التطبيقات
يمكنك أيضًا استخدام واجهة برمجة التطبيقات REST مباشرة:
# تحويل ملف DOCX
curl -X POST "http://localhost:7860/convert" \
-H "accept: application/json" \
-H "Content-Type: multipart/form-data" \
-F "file=@/path/to/document.docx"
# التحقق من الصحة
curl -X GET "http://localhost:7860/health" -H "accept: application/json"
# وثائق واجهة برمجة التطبيقات
# انتقل إلى http://localhost:7860/docs للحصول على وثائق واجهة برمجة التطبيقات التفاعلية
🔧 التميز التقني
- ال-backend: LibreOffice المحسن مع إعدادات تصدير PDF بجودة قصوى وواجهة برمجة تطبيقات FastAPI REST
- ال-frontent: واجهة HTML/CSS/JavaScript حديثة مع تغذية راجعة للتحقق في الوقت الفعلي
- نظام الخطوط: حزم خطوط شاملة تشمل:
- خطوط Liberation (Arial/Times/Courier/Calibri/Cambria متوافقة)
- خطوط Croscore (Arimo/Tinos/Cousine للتوافق الإضافي)
- خطوط DejaVu و Noto للدعم الدولي
- fontconfig متقدم مع قواعد استبدال الخطوط من Microsoft
- ضمان الجودة: تحليل هيكل المستند والتحقق من صحة PDF
- معالجة الأخطاء: تحليل الأخطاء الذكي مع إرشادات استكشاف الأخطاء المحددة
- البيئة: محسّن لـ Hugging Face Spaces مع جميع التبعيات المُعدة مسبقًا
📋 الدعم الشامل
- ✅ المستندات المعقدة: الجداول والصور والخطوط المختلطة وتخطيطات الصفحات المتعددة
- ✅ توافق Microsoft: معالجة مثالية لخطوط Calibri و Cambria و Arial و Times New Roman
- ✅ النصوص الدولية: النص العربي من اليمين إلى اليسار و Unicode والأحرف الخاصة
- ✅ الملفات الكبيرة: مستندات تصل إلى 50 ميجابايت مع تعقيد غير محدود
- ✅ التحقق من الجودة: تحليل فوري يضمن نتائج تحويل مثالية
🎯 مقاييس النجاح الحرجة
✅ عدد الصفحات: صفحات DOCX = صفحات PDF (بالضبط) ✅ نص الجداول: نفس الحجم والوزن والموضع ✅ الصور: عدم فقدان الجودة، وموضع دقيق ✅ الخطوط: عرض متسق، وعدم تغيير الحجم ✅ التخطيط: عدم وجود تحركات بكسل أو إعادة تدفق ✅ حجم الملف: إخراج معقول بدون تضخم
🏗️ التطوير المحلي
باستخدام Docker (موصى به)
# بناء وتشغيل الحاوية
docker-compose up --build
# سيكون التطبيق متاحًا على http://localhost:7860
التثبيت المباشر
# تثبيت تبعيات النظام الشاملة (Ubuntu/Debian)
sudo apt-get update
sudo apt-get install libreoffice libreoffice-writer \
fonts-liberation fonts-liberation2 fonts-dejavu fonts-croscore \
fonts-noto-core fonts-opensymbol fontconfig
# تحديث ذاكرة التخزين المؤقت للخطوط
sudo fc-cache -fv
# تثبيت تبعيات Python
pip install -r requirements.txt
# تشغيل تطبيق FastAPI
python main.py
# سيكون التطبيق متاحًا على http://localhost:7860
# وثائق واجهة برمجة التطبيقات على http://localhost:7860/docs
لنشر Hugging Face Spaces، يتم تثبيت جميع تبعيات النظام تلقائيًا عبر packages.txt المحسّن.
🚀 معايير التنفيذ
يُنفذ هذا المحول المتطلبات من bb.txt بدقة مطلقة:
- حزم الخطوط المحسّنة: نظام بيئي للخطوط متوافق مع Microsoft بالكامل
- أمر LibreOffice المحسّن: جودة:100، تضمين الخطوط، والحفاظ على التخطيط
- التكوين المتقدم: registrymodifications.xcu مخصص مع قواعد استبدال الخطوط
- تميز البيئة: إعداد LANG و fontconfig وملف تعريف مستخدم LibreOffice المناسب
- ضمان الجودة: تحليل المستند والتحقق من صحة PDF ومعالجة الأخطاء الشاملة
🎯 تحقيق الهدف النهائي
يُنشئ تحويلات DOCX إلى PDF دقيقة جدًا بحيث لا يستطيع المستخدمون التمييز بين DOCX الأصلي و PDF المحول عند عرضهما جنبًا إلى جنب. عدم التسامح مع انحرافات التنسيق.
مبني لـ Hugging Face Spaces | مستوى مؤسسي • دقة بكسلية • جودة لا تُنازل عنها