# راهنمای استفاده از dots.ocr Space ## نصب و راهاندازی ### 1. آپلود به Hugging Face Space 1. فایلهای پروژه را به یک Hugging Face Space جدید آپلود کنید 2. مطمئن شوید که Space از نوع Gradio است 3. GPU را در تنظیمات Space فعال کنید (توصیه میشود: T4 یا بالاتر) ### 2. استفاده از رابط کاربری بعد از راهاندازی Space: 1. تصویر سند خود را آپلود کنید 2. نوع پرامپت را انتخاب کنید: - **Full Layout + OCR**: تحلیل کامل با bounding box، دستهبندی و متن - **OCR Only**: استخراج ساده متن - **Layout Detection Only**: فقط تشخیص چیدمان - **Custom**: پرامپت سفارشی 3. دکمه "Process Document" را بزنید 4. نتیجه را در قالب JSON دریافت کنید ### 3. استفاده از API #### روش Python: ```python from gradio_client import Client # آدرس Space خود را وارد کنید client = Client("YOUR_USERNAME/YOUR_SPACE_NAME") # پردازش تصویر result = client.predict( image="path/to/your/image.jpg", prompt_type="Full Layout + OCR (English)", custom_prompt="", api_name="/predict" ) print(result) ``` #### استفاده از اسکریپت آماده: ```bash # نصب کتابخانه pip install gradio_client # اجرای اسکریپت python api_example.py \ --image your_document.jpg \ --space-url YOUR_SPACE_URL \ --prompt-type "Full Layout + OCR (English)" ``` ### 4. استفاده از cURL: ```bash curl -X POST "YOUR_SPACE_URL/api/predict" \ -H "Content-Type: application/json" \ -d '{ "data": [ {"path": "base64_encoded_image_or_url"}, "Full Layout + OCR (English)", "" ] }' ``` ## فرمت خروجی ### Full Layout + OCR: ```json [ { "bbox": [x1, y1, x2, y2], "category": "Text", "text": "محتوای متن..." }, { "bbox": [x1, y1, x2, y2], "category": "Table", "text": "