pdf / README.md
fokan's picture
Upload 48 files
943fd62 verified
---
title: محول DOCX إلى PDF المتقدم - دقة 99%+ للعربية
emoji: 📄
colorFrom: gray
colorTo: blue
sdk: docker
app_file: Dockerfile
pinned: false
---
# 🚀 محول DOCX إلى PDF المتقدم - دقة 99%+ للتنسيق العربي
محول من الجيل الجديد مع **تقنيات متقدمة لضمان دقة 99%+ في التنسيق العربي** - يتضمن معالجة مسبقة ذكية، مراقبة لاحقة، وتقارير جودة شاملة.
## 🎯 التقنيات المتقدمة الجديدة
### 🔧 معالجة DOCX مسبقة ذكية
- **كشف المشاكل تلقائياً**: يحدد TextBoxes، SmartArt، والأشكال المعقدة
- **إزالة العناصر المشكلة**: يحول العناصر المشكلة إلى تنسيقات متوافقة
- **تحسين بنية الجداول**: يصلح الجداول المتداخلة ومشاكل دمج الخلايا
- **حماية Placeholders**: يضمن بقاء {{name}}, {{date}} في مواضعها الدقيقة
### ⚙️ إعدادات LibreOffice محسنة
- **70+ معامل تصدير PDF**: تكوين JSON محسن لأقصى جودة
- **بدون ضغط**: يحافظ على جودة الصور والنصوص الأصلية
- **تضمين الخطوط**: جميع الخطوط مضمنة للعرض المتسق
- **إعدادات RTL متخصصة**: تكوين خاص لاتجاه النص العربي
### 🔍 مراقبة لاحقة بـ PyMuPDF
- **تحقق من موضع العناصر**: يؤكد أن كل عنصر في الموضع الصحيح
- **تحقق من الأحرف العربية**: يتحقق من دقة عرض النص RTL
- **فحص بنية الجداول**: يضمن الحفاظ على تخطيط الجداول
- **تتبع Placeholders**: يراقب موضع المحتوى الديناميكي
## ✨ الميزات المحسنة للعربية
- **🔤 تميز الخطوط**: توافق كامل مع الخطوط العربية (Traditional Arabic→Amiri، Arabic Typesetting→Noto Naskh، Simplified Arabic→Noto Naskh)
- **📊 كمال الجداول**: يحافظ على المساحة الدقة للخلايا والحدود والمحاذاة وتنسيق النص
- **🖼️ أقصى جودة للصور**: الحفاظ على 600 DPI بدون ضغط مدمر
- **🌍 دعم العربية RTL**: عرض مثالي للنص من اليمين إلى اليسار مع خطوط Amiri و Noto
- **🔍 التحقق من الجودة**: تحليل فوري للمستند والتحقق من التحويل
- **🛠️ تشخيص متقدم**: تحليل شامل للأخطاء مع إرشادات استكشاف الأخطاء المحددة
- **⚡ أداء محسن**: تكوين LibreOffice محسن للمستندات المعقدة العربية
## 🛠️ حلول المشاكل الشائعة
**تم حل المشاكل التالية:**
- ❌ تراكب النصوص العربية وعدم وجود فراغات كافية
- ❌ فقدان المحاذاة اليمنى (Right-to-Left) في النص العربي
- ❌ استبدال الخطوط الأصلية بخطوط غير داعمة للعربية
- ❌ تشوه الجداول أو اختفاء البنية التنظيمية للوثيقة
- ❌ تغيير مواقع قوالب التعبئة الديناميكية (مثل {{name}}, {{date}})
- ❌ حجم الصفحة أو الهامش غير مناسب للطباعة بشكل مرتب (A4)
## 🚀 الاستخدام
### واجهة الويب
1. افتح متصفحك وانتقل إلى `http://localhost:7860`
2. قم برفع ملف [.docx](file:///d:/New/hugging%20face/pdf-to%200.1/.docx) باستخدام منطقة السحب والإفلات
3. انقر على "تحويل إلى PDF" وانتظر اكتمال التحويل
4. قم بتنزيل ملف PDF المُنشأ باستخدام زر التنزيل
### استخدام واجهة برمجة التطبيقات
يمكنك أيضًا استخدام واجهة برمجة التطبيقات REST مباشرة:
```bash
# تحويل ملف DOCX
curl -X POST "http://localhost:7860/convert" \
-H "accept: application/json" \
-H "Content-Type: multipart/form-data" \
-F "file=@/path/to/document.docx"
# التحقق من الصحة
curl -X GET "http://localhost:7860/health" -H "accept: application/json"
# وثائق واجهة برمجة التطبيقات
# انتقل إلى http://localhost:7860/docs للحصول على وثائق واجهة برمجة التطبيقات التفاعلية
```
## 🔧 التميز التقني
- **ال-backend**: LibreOffice المحسن مع إعدادات تصدير PDF بجودة قصوى وواجهة برمجة تطبيقات FastAPI REST
- **ال-frontent**: واجهة HTML/CSS/JavaScript حديثة مع تغذية راجعة للتحقق في الوقت الفعلي
- **نظام الخطوط**: حزم خطوط شاملة تشمل:
- خطوط Liberation (Arial/Times/Courier/Calibri/Cambria متوافقة)
- خطوط Croscore (Arimo/Tinos/Cousine للتوافق الإضافي)
- خطوط DejaVu و Noto للدعم الدولي
- fontconfig متقدم مع قواعد استبدال الخطوط من Microsoft
- **ضمان الجودة**: تحليل هيكل المستند والتحقق من صحة PDF
- **معالجة الأخطاء**: تحليل الأخطاء الذكي مع إرشادات استكشاف الأخطاء المحددة
- **البيئة**: محسّن لـ Hugging Face Spaces مع جميع التبعيات المُعدة مسبقًا
## 📋 الدعم الشامل
-**المستندات المعقدة**: الجداول والصور والخطوط المختلطة وتخطيطات الصفحات المتعددة
-**توافق Microsoft**: معالجة مثالية لخطوط Calibri و Cambria و Arial و Times New Roman
-**النصوص الدولية**: النص العربي من اليمين إلى اليسار و Unicode والأحرف الخاصة
-**الملفات الكبيرة**: مستندات تصل إلى 50 ميجابايت مع تعقيد غير محدود
-**التحقق من الجودة**: تحليل فوري يضمن نتائج تحويل مثالية
## 🎯 مقاييس النجاح الحرجة
**عدد الصفحات**: صفحات DOCX = صفحات PDF (بالضبط)
**نص الجداول**: نفس الحجم والوزن والموضع
**الصور**: عدم فقدان الجودة، وموضع دقيق
**الخطوط**: عرض متسق، وعدم تغيير الحجم
**التخطيط**: عدم وجود تحركات بكسل أو إعادة تدفق
**حجم الملف**: إخراج معقول بدون تضخم
## 🏗️ التطوير المحلي
### باستخدام Docker (موصى به)
```bash
# بناء وتشغيل الحاوية
docker-compose up --build
# سيكون التطبيق متاحًا على http://localhost:7860
```
### التثبيت المباشر
```bash
# تثبيت تبعيات النظام الشاملة (Ubuntu/Debian)
sudo apt-get update
sudo apt-get install libreoffice libreoffice-writer \
fonts-liberation fonts-liberation2 fonts-dejavu fonts-croscore \
fonts-noto-core fonts-opensymbol fontconfig
# تحديث ذاكرة التخزين المؤقت للخطوط
sudo fc-cache -fv
# تثبيت تبعيات Python
pip install -r requirements.txt
# تشغيل تطبيق FastAPI
python main.py
# سيكون التطبيق متاحًا على http://localhost:7860
# وثائق واجهة برمجة التطبيقات على http://localhost:7860/docs
```
لنشر Hugging Face Spaces، يتم تثبيت جميع تبعيات النظام تلقائيًا عبر [packages.txt](file:///d:/New/hugging%20face/pdf-to%200.1/packages.txt) المحسّن.
## 🚀 معايير التنفيذ
يُنفذ هذا المحول المتطلبات من `bb.txt` بدقة مطلقة:
- **حزم الخطوط المحسّنة**: نظام بيئي للخطوط متوافق مع Microsoft بالكامل
- **أمر LibreOffice المحسّن**: جودة:100، تضمين الخطوط، والحفاظ على التخطيط
- **التكوين المتقدم**: registrymodifications.xcu مخصص مع قواعد استبدال الخطوط
- **تميز البيئة**: إعداد LANG و fontconfig وملف تعريف مستخدم LibreOffice المناسب
- **ضمان الجودة**: تحليل المستند والتحقق من صحة PDF ومعالجة الأخطاء الشاملة
## 🎯 تحقيق الهدف النهائي
يُنشئ تحويلات DOCX إلى PDF دقيقة جدًا بحيث لا يستطيع المستخدمون التمييز بين DOCX الأصلي و PDF المحول عند عرضهما جنبًا إلى جنب. **عدم التسامح مع انحرافات التنسيق.**
---
**مبني لـ Hugging Face Spaces** | مستوى مؤسسي • دقة بكسلية • جودة لا تُنازل عنها