--- title: PDF to HTML Converter emoji: 📄 colorFrom: blue colorTo: purple sdk: docker pinned: false license: mit --- # 📄 PDF to HTML Converter แปลง PDF เป็น HTML ที่รักษา layout เหมือนต้นฉบับ พร้อม embedded fonts, images, CSS ในไฟล์เดียว ## ✨ Features - ✅ **รักษา Layout** - HTML ที่ได้เหมือน PDF ต้นฉบับ - ✅ **Embed ทุกอย่าง** - Fonts, Images, CSS, JavaScript อยู่ในไฟล์เดียว - ✅ **ข้อความเลือกได้** - Select/Copy ข้อความได้ - ✅ **เปิดได้ทุก Browser** - ไม่ต้องติดตั้งอะไรเพิ่ม - ✅ **ปรับแต่งได้** - Zoom, DPI, Font Format ## 🚀 วิธีใช้งาน 1. **อัปโหลด PDF** - ลากไฟล์หรือคลิกเลือก 2. **ปรับตั้งค่า** (optional) - Zoom: ความคมชัด (1.5 = 150%) - DPI: ความละเอียด (144 แนะนำ) - Embed Fonts: ฝัง fonts ไว้ใน HTML - Embed Images: ฝังรูปภาพเป็น Base64 3. **กด "แปลงเป็น HTML"** 4. **ดาวน์โหลด** ไฟล์ HTML ## ⚙️ Options | Option | Default | Description | |--------|---------|-------------| | Zoom | 1.5 | ความคมชัด (0.5 - 3.0) | | DPI | 144 | ความละเอียด (72 - 300) | | Embed Fonts | ✅ | ฝัง fonts ใน HTML | | Embed Images | ✅ | ฝังรูปภาพเป็น Base64 | | Font Format | woff | woff, woff2, ttf, svg | ## 🔧 เทคโนโลยี - **[pdf2htmlEX](https://github.com/pdf2htmlEX/pdf2htmlEX)** - แปลง PDF เป็น HTML - **[Gradio](https://gradio.app)** - Web UI Framework - **[Hugging Face Spaces](https://huggingface.co/spaces)** - Hosting ## 📋 Tabs ### 📄 PDF → HTML แปลง PDF เป็น HTML ที่รักษา layout ทั้งหมด ### 📝 ดึงข้อความ ดึงเฉพาะข้อความจาก PDF (ไม่รักษา layout) ## ⚠️ ข้อจำกัด - ไฟล์ขนาดใหญ่ (>50 หน้า) อาจใช้เวลานาน - PDF ที่เป็นรูปภาพ (scanned) จะไม่มีข้อความให้ดึง - บาง fonts พิเศษอาจแสดงผลไม่ถูกต้อง - ขนาดไฟล์ HTML อาจใหญ่กว่า PDF (เพราะ embed ทุกอย่าง) ## 🐳 Local Development ```bash # Clone git clone https://huggingface.co/spaces/YOUR_USERNAME/pdf2html # Build Docker docker build -t pdf2html . # Run docker run -p 7860:7860 pdf2html # Open http://localhost:7860 ``` ## 📁 Files ``` ├── app.py # Main Gradio application ├── requirements.txt # Python dependencies ├── Dockerfile # Docker configuration with pdf2htmlEX └── README.md # This file ``` ## 🔗 Links - [pdf2htmlEX GitHub](https://github.com/pdf2htmlEX/pdf2htmlEX) - [Gradio Documentation](https://gradio.app/docs/) - [Hugging Face Spaces Docs](https://huggingface.co/docs/hub/spaces) ## 📄 License MIT License --- Made with ❤️ using Gradio & pdf2htmlEX