|
|
---
|
|
|
title: محول DOCX إلى PDF المتقدم - دقة 99%+ للعربية
|
|
|
emoji: 📄
|
|
|
colorFrom: gray
|
|
|
colorTo: blue
|
|
|
sdk: docker
|
|
|
app_file: Dockerfile
|
|
|
pinned: false
|
|
|
---
|
|
|
|
|
|
# 🚀 محول DOCX إلى PDF المتقدم - دقة 99%+ للتنسيق العربي
|
|
|
|
|
|
محول من الجيل الجديد مع **تقنيات متقدمة لضمان دقة 99%+ في التنسيق العربي** - يتضمن معالجة مسبقة ذكية، مراقبة لاحقة، وتقارير جودة شاملة.
|
|
|
|
|
|
## 🎯 التقنيات المتقدمة الجديدة
|
|
|
|
|
|
### 🔧 معالجة DOCX مسبقة ذكية
|
|
|
- **كشف المشاكل تلقائياً**: يحدد TextBoxes، SmartArt، والأشكال المعقدة
|
|
|
- **إزالة العناصر المشكلة**: يحول العناصر المشكلة إلى تنسيقات متوافقة
|
|
|
- **تحسين بنية الجداول**: يصلح الجداول المتداخلة ومشاكل دمج الخلايا
|
|
|
- **حماية Placeholders**: يضمن بقاء {{name}}, {{date}} في مواضعها الدقيقة
|
|
|
|
|
|
### ⚙️ إعدادات LibreOffice محسنة
|
|
|
- **70+ معامل تصدير PDF**: تكوين JSON محسن لأقصى جودة
|
|
|
- **بدون ضغط**: يحافظ على جودة الصور والنصوص الأصلية
|
|
|
- **تضمين الخطوط**: جميع الخطوط مضمنة للعرض المتسق
|
|
|
- **إعدادات RTL متخصصة**: تكوين خاص لاتجاه النص العربي
|
|
|
|
|
|
### 🔍 مراقبة لاحقة بـ PyMuPDF
|
|
|
- **تحقق من موضع العناصر**: يؤكد أن كل عنصر في الموضع الصحيح
|
|
|
- **تحقق من الأحرف العربية**: يتحقق من دقة عرض النص RTL
|
|
|
- **فحص بنية الجداول**: يضمن الحفاظ على تخطيط الجداول
|
|
|
- **تتبع Placeholders**: يراقب موضع المحتوى الديناميكي
|
|
|
|
|
|
## ✨ الميزات المحسنة للعربية
|
|
|
|
|
|
- **🔤 تميز الخطوط**: توافق كامل مع الخطوط العربية (Traditional Arabic→Amiri، Arabic Typesetting→Noto Naskh، Simplified Arabic→Noto Naskh)
|
|
|
- **📊 كمال الجداول**: يحافظ على المساحة الدقة للخلايا والحدود والمحاذاة وتنسيق النص
|
|
|
- **🖼️ أقصى جودة للصور**: الحفاظ على 600 DPI بدون ضغط مدمر
|
|
|
- **🌍 دعم العربية RTL**: عرض مثالي للنص من اليمين إلى اليسار مع خطوط Amiri و Noto
|
|
|
- **🔍 التحقق من الجودة**: تحليل فوري للمستند والتحقق من التحويل
|
|
|
- **🛠️ تشخيص متقدم**: تحليل شامل للأخطاء مع إرشادات استكشاف الأخطاء المحددة
|
|
|
- **⚡ أداء محسن**: تكوين LibreOffice محسن للمستندات المعقدة العربية
|
|
|
|
|
|
## 🛠️ حلول المشاكل الشائعة
|
|
|
|
|
|
✅ **تم حل المشاكل التالية:**
|
|
|
- ❌ تراكب النصوص العربية وعدم وجود فراغات كافية
|
|
|
- ❌ فقدان المحاذاة اليمنى (Right-to-Left) في النص العربي
|
|
|
- ❌ استبدال الخطوط الأصلية بخطوط غير داعمة للعربية
|
|
|
- ❌ تشوه الجداول أو اختفاء البنية التنظيمية للوثيقة
|
|
|
- ❌ تغيير مواقع قوالب التعبئة الديناميكية (مثل {{name}}, {{date}})
|
|
|
- ❌ حجم الصفحة أو الهامش غير مناسب للطباعة بشكل مرتب (A4)
|
|
|
|
|
|
## 🚀 الاستخدام
|
|
|
|
|
|
### واجهة الويب
|
|
|
1. افتح متصفحك وانتقل إلى `http://localhost:7860`
|
|
|
2. قم برفع ملف [.docx](file:///d:/New/hugging%20face/pdf-to%200.1/.docx) باستخدام منطقة السحب والإفلات
|
|
|
3. انقر على "تحويل إلى PDF" وانتظر اكتمال التحويل
|
|
|
4. قم بتنزيل ملف PDF المُنشأ باستخدام زر التنزيل
|
|
|
|
|
|
### استخدام واجهة برمجة التطبيقات
|
|
|
يمكنك أيضًا استخدام واجهة برمجة التطبيقات REST مباشرة:
|
|
|
|
|
|
```bash
|
|
|
# تحويل ملف DOCX
|
|
|
curl -X POST "http://localhost:7860/convert" \
|
|
|
-H "accept: application/json" \
|
|
|
-H "Content-Type: multipart/form-data" \
|
|
|
-F "file=@/path/to/document.docx"
|
|
|
|
|
|
# التحقق من الصحة
|
|
|
curl -X GET "http://localhost:7860/health" -H "accept: application/json"
|
|
|
|
|
|
# وثائق واجهة برمجة التطبيقات
|
|
|
# انتقل إلى http://localhost:7860/docs للحصول على وثائق واجهة برمجة التطبيقات التفاعلية
|
|
|
```
|
|
|
|
|
|
## 🔧 التميز التقني
|
|
|
|
|
|
- **ال-backend**: LibreOffice المحسن مع إعدادات تصدير PDF بجودة قصوى وواجهة برمجة تطبيقات FastAPI REST
|
|
|
- **ال-frontent**: واجهة HTML/CSS/JavaScript حديثة مع تغذية راجعة للتحقق في الوقت الفعلي
|
|
|
- **نظام الخطوط**: حزم خطوط شاملة تشمل:
|
|
|
- خطوط Liberation (Arial/Times/Courier/Calibri/Cambria متوافقة)
|
|
|
- خطوط Croscore (Arimo/Tinos/Cousine للتوافق الإضافي)
|
|
|
- خطوط DejaVu و Noto للدعم الدولي
|
|
|
- fontconfig متقدم مع قواعد استبدال الخطوط من Microsoft
|
|
|
- **ضمان الجودة**: تحليل هيكل المستند والتحقق من صحة PDF
|
|
|
- **معالجة الأخطاء**: تحليل الأخطاء الذكي مع إرشادات استكشاف الأخطاء المحددة
|
|
|
- **البيئة**: محسّن لـ Hugging Face Spaces مع جميع التبعيات المُعدة مسبقًا
|
|
|
|
|
|
## 📋 الدعم الشامل
|
|
|
|
|
|
- ✅ **المستندات المعقدة**: الجداول والصور والخطوط المختلطة وتخطيطات الصفحات المتعددة
|
|
|
- ✅ **توافق Microsoft**: معالجة مثالية لخطوط Calibri و Cambria و Arial و Times New Roman
|
|
|
- ✅ **النصوص الدولية**: النص العربي من اليمين إلى اليسار و Unicode والأحرف الخاصة
|
|
|
- ✅ **الملفات الكبيرة**: مستندات تصل إلى 50 ميجابايت مع تعقيد غير محدود
|
|
|
- ✅ **التحقق من الجودة**: تحليل فوري يضمن نتائج تحويل مثالية
|
|
|
|
|
|
## 🎯 مقاييس النجاح الحرجة
|
|
|
|
|
|
✅ **عدد الصفحات**: صفحات DOCX = صفحات PDF (بالضبط)
|
|
|
✅ **نص الجداول**: نفس الحجم والوزن والموضع
|
|
|
✅ **الصور**: عدم فقدان الجودة، وموضع دقيق
|
|
|
✅ **الخطوط**: عرض متسق، وعدم تغيير الحجم
|
|
|
✅ **التخطيط**: عدم وجود تحركات بكسل أو إعادة تدفق
|
|
|
✅ **حجم الملف**: إخراج معقول بدون تضخم
|
|
|
|
|
|
## 🏗️ التطوير المحلي
|
|
|
|
|
|
### باستخدام Docker (موصى به)
|
|
|
```bash
|
|
|
# بناء وتشغيل الحاوية
|
|
|
docker-compose up --build
|
|
|
|
|
|
# سيكون التطبيق متاحًا على http://localhost:7860
|
|
|
```
|
|
|
|
|
|
### التثبيت المباشر
|
|
|
```bash
|
|
|
# تثبيت تبعيات النظام الشاملة (Ubuntu/Debian)
|
|
|
sudo apt-get update
|
|
|
sudo apt-get install libreoffice libreoffice-writer \
|
|
|
fonts-liberation fonts-liberation2 fonts-dejavu fonts-croscore \
|
|
|
fonts-noto-core fonts-opensymbol fontconfig
|
|
|
|
|
|
# تحديث ذاكرة التخزين المؤقت للخطوط
|
|
|
sudo fc-cache -fv
|
|
|
|
|
|
# تثبيت تبعيات Python
|
|
|
pip install -r requirements.txt
|
|
|
|
|
|
# تشغيل تطبيق FastAPI
|
|
|
python main.py
|
|
|
|
|
|
# سيكون التطبيق متاحًا على http://localhost:7860
|
|
|
# وثائق واجهة برمجة التطبيقات على http://localhost:7860/docs
|
|
|
```
|
|
|
|
|
|
لنشر Hugging Face Spaces، يتم تثبيت جميع تبعيات النظام تلقائيًا عبر [packages.txt](file:///d:/New/hugging%20face/pdf-to%200.1/packages.txt) المحسّن.
|
|
|
|
|
|
## 🚀 معايير التنفيذ
|
|
|
|
|
|
يُنفذ هذا المحول المتطلبات من `bb.txt` بدقة مطلقة:
|
|
|
|
|
|
- **حزم الخطوط المحسّنة**: نظام بيئي للخطوط متوافق مع Microsoft بالكامل
|
|
|
- **أمر LibreOffice المحسّن**: جودة:100، تضمين الخطوط، والحفاظ على التخطيط
|
|
|
- **التكوين المتقدم**: registrymodifications.xcu مخصص مع قواعد استبدال الخطوط
|
|
|
- **تميز البيئة**: إعداد LANG و fontconfig وملف تعريف مستخدم LibreOffice المناسب
|
|
|
- **ضمان الجودة**: تحليل المستند والتحقق من صحة PDF ومعالجة الأخطاء الشاملة
|
|
|
|
|
|
## 🎯 تحقيق الهدف النهائي
|
|
|
|
|
|
يُنشئ تحويلات DOCX إلى PDF دقيقة جدًا بحيث لا يستطيع المستخدمون التمييز بين DOCX الأصلي و PDF المحول عند عرضهما جنبًا إلى جنب. **عدم التسامح مع انحرافات التنسيق.**
|
|
|
|
|
|
---
|
|
|
|
|
|
**مبني لـ Hugging Face Spaces** | مستوى مؤسسي • دقة بكسلية • جودة لا تُنازل عنها |